欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
解读|2019年10篇计算机视觉精选论文(上)渑池会

解读|2019年10篇计算机视觉精选论文(上)

作者 | 神经小兮2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,我们精选了 2019 年十大 CV 研究论文,帮你了解该领域的最新趋势。我们看到,近年来,计算机视觉(CV)系统已经逐渐成功地应用在医疗保健,安防,运输,零售,银行,农业等领域,也正在逐渐改变整个行业的面貌。而今年,CV 领域依然硕果累累,诞生了多篇优秀论文。我们选择了其中十篇论文,以供大家参考、学习,了解该领域的最新趋势与前沿技术。这十篇论文涵盖了卷积网络的优化,计算机视觉中的无监督学习,图像生成和机器生成图像的评估,视觉语言导航,使用自然语言为两个图像标注变化等。以下是我们精选的 10 篇论文目录,先一睹为快:1.EfficientNet: Rethinking Model Scaling for Convolutional Neural NetworksEfficientNet:卷积神经网络模型缩放的反思2.Learning the Depths of Moving People by Watching Frozen People通过观看静止的人来学习移动的人的深度3.Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation增强的跨模态匹配和自我监督的模仿学习,用于视觉语言导航4.A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction非视线形状重构的费马路径理论5.Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object DetectionReasoning-RCNN:将自适应全局推理统一到大规模目标检测中6.Fixing the Train-Test Resolution Discrepancy修复训练测试分辨率差异7.SinGAN: Learning a Generative Model from a Single Natural ImageSinGAN:从单个自然图像中学习生成模型8.Local Aggregation for Unsupervised Learning of Visual Embeddings视觉聚合的无监督学习的局部聚合9.Robust Change Captioning强大的更改字幕10.HYPE: A Benchmark for Human eYe Perceptual Evaluation of Generative ModelsHYPE:人类对生成模型的 eYe 感知评估的基准接下来,我们将从核心思想、关键成就、未来技术应用等方面,详细介绍这 10 篇论文。限于篇幅,我们将解读分为上、中、下三个篇章,欢迎大家持续关注后续内容推送。1《EfficientNet:卷积神经网络模型缩放的反思》论文地址:https://arxiv.org/pdf/1905.11946.pdf摘要 卷积神经网络(ConvNets)通常是在固定资源预算下开发的,如果有更多资源可用,则会进行扩展以获得更高的精度。在本文中,我们系统地研究了模型缩放,并发现仔细平衡网络的深度,宽度和分辨率,可以带来更好的性能。基于此观察结果,我们提出了一种新的缩放方法,该方法使用简单而高效的复合系数来均匀缩放深度/宽度/分辨率的所有维度。我们证明了此方法在扩展 MobileNets 和 ResNet 方面的有效性。更进一步,我们使用神经体系结构搜索来设计一个新的基准网络,并对其进行扩展以获得称为 EfficientNets 的模型系列,该模型系列比以前的 ConvNets 具有更高的准确性和效率。特别是,我们的 EfficientNet-B7 在 ImageNet 上达到了最先进的 84.4%top-1 / 97.1%top-5 精度,同时比现有最佳 ConvNet 缩小了 8.4 倍,推理速度提高了 6.1 倍。我们的 EfficientNets 还可以很好地传输并在 CIFAR-100(91.7%),Flowers(98.8%)和其他 3 个传输学习数据集上达到最先进的精度,而参数要少几个数量级。源代码链接:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet.。本文核心思想 CNN 的深度(层数),宽度和输入分辨率应以特定的比例放大,而不是任意放大。此外,由于模型缩放的有效性在很大程度上取决于基线网络,因此研究人员利用神经体系结构搜索来开发新的基线模型,并将其按比例缩放以获得一个称为 EfficientNets 的模型系列。您可以根据可用资源,选择 EfficientNets 中的一种模型。关键成就 EfficientNets 在 8 个数据集中的 5 个上,获得了最优的精度,平均参数减少了 9.6 倍。特别是,具有 66M 参数的 EfficientNet 在 ImageNet 上达到了 top-1 准确率 84.4%,top-5 准确率 97-1%,比之前最先进的 CNN - GPipe(参数557M )小了 8 倍,快了 6 倍。此论文在人工智能界的荣誉 该论文在机器学习领域的顶尖会议 ICML 2019 上被重点介绍。未来的研究领域 作者在 Google AI 博客上表示,他们希望 EfficientNets「充当未来计算机视觉任务的新基础」。有哪些可能的业务应用程序?这项研究的结果对于商业环境中的计算机视觉应用非常重要,因为提出的方法可以更快,更便宜地从 CNN 获得更准确的结果。在哪里可以获得实现代码?作者已发布了其 TensorFlow EfficientNet 实现的源代码:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet 。还可用 PyTorch 实现:https://github.com/lukemelas/EfficientNet-PyTorch2通过观看静止的人来学习移动的人的深度论文地址:https://arxiv.org/pdf/1904.11111.pdf摘要 我们提出了一种在单目摄像机和人都可以自由移动的情况下,预测密集深度的方法。现有的用于从单目视频恢复动态非刚性物体的深度的方法,对物体的运动施加了强烈假设,并且可能仅恢复稀疏的深度。在本文中,我们采用数据驱动的方法,从新的数据来源中学习人物深度先验:成千上万的人们模仿人体模型的互联网视频,即以各种自然姿势冻结,而手持摄像机则在现场浏览。因为人是静止的,所以可以使用多视图立体重建来生成训练数据。在推理时,我们的方法使用来自场景的静态区域的运动视差线索来指导深度预测。我们通过移动手持摄像机捕获的复杂人物动作的真实世界序列展示了我们的方法,显示了对前沿的单目深度预测方法的改进,并显示了使用我们预测的深度产生的各种 3D 效果。本文的核心思想 这项研究解决了在一个有人类主体的自然场景中,当主体和单个摄像机同时移动时,映射深度的挑战。作者使用 YouTube 上模仿人体模型的人的视频数据库 Mannequin Challenge(人体模型挑战数据集)训练了一个深度神经网络,该深度可以通过现有的立体声技术进行映射。该网络以 RGB 图像、人类区域掩码和环境初始深度作为输入,然后输出包括环境和人类在内的整个图像的稠密深度图。假设人类在移动而场景的其余部分是静止的,则通过视频中两个帧之间的运动视差来估计初始深度。关键成就 提出的模型与现有方法相比,能够为人类及其周围环境以明显更高的精度,重新创建移动场景的深度图。引入了 Mannequin Challenge 数据集,这是 2,000 个 YouTube 视频的集合,在这些视频中,当摄像机绕着场景转圈时,人们在其中姿势不动。此论文在人工智能界的荣誉 该论文在计算机视觉和模式识别的领先会议 CVPR 2019 上获得了最佳论文奖(荣誉奖)。未来的研究领域是什么?扩展模型以适用于移动非人类物体,例如汽车和阴影。一次将两个以上的视图合并到模型中,以消除暂时的不一致。有哪些可能的业务应用程序?产生精确的 3D 视频效果,包括合成景深,可感知深度的修补以及将虚拟对象插入 3D 场景。使用多个框架扩展视野,同时保持准确的场景深度。在哪里可以获得实现代码?代码和模型在 GitHub 上地址为:https://github.com/google/mannequinchallenge。3用于视觉语言导航的,增强跨模态匹配和自我监督模仿学习论文地址:https://arxiv.org/pdf/1811.10092.pdf摘要 视觉-语言导航(Vision-language navigation,VLN)任务是指在真实的三维环境中让具有实体的智能体进行导航并完成自然语言指令。在这篇论文中,我们研究了如何解决这个任务中的三个重点挑战:跨模态参照,不适定反馈,以及泛化问题。我们首先提出了一种新的强化跨模态匹配(RCM)方法,它可以通过强化学习的方式同时促进局部和全局的跨模态参照。具体来说,我们使用了一个匹配指标,它成为了鼓励模型增强外部指令和运动轨迹之间匹配的固有反馈;模型也使用了一个推理导航器,它用来在局部视觉场景中执行跨模态参照。在一个 VLN benchmark 数据集上进行的评估结果表明,我们提出的 RCM 模型大幅超越已有模型,SPL 分数提高了 10%,成为了新的 SOTA。为了提高学习到的策略的泛化性,我们还进一步提出了一个自监督模仿学习(SIL)方法,通过模仿自己以往的良好决策的方式探索未曾见过的环境。我们证明了 SIL 可以逼近出更好、更高效的策略,这极大程度减小了智能体在见过和未见过的环境中的成功率表现的差别(从 30.7% 降低到 11.7%)。本文的核心思想 视觉语言导航需要一台机器来解析语言指令,将这些指令与视觉环境匹配,然后根据语言指令中的子短语来导航该环境。 为了解决这一艰巨的任务,研究人员介绍了一种新颖的跨模态匹配方法,该方法利用外部奖励和内在奖励来进行强化学习:它包括一个推理导航器,该导航器从自然语言指令和本地视觉场景中学习,以推断出要重点关注的短语以及查找的位置。该 agent 配备有一个匹配的注释程序,该注释程序根据从中重构原始指令的可能性来评估执行路径。另外,细粒度的内在奖励信号会鼓励代理更好地理解文本输入,并对选择不符合指令的轨迹进行惩罚。 本文还介绍了一种自我监督的模仿学习(SIL)方法,用于探索以前看不见的环境:导航器执行多次滚动,然后由匹配的注释器确定良好的轨迹,随后将其用于导航器模仿。关键成就 RCM 框架在以下方面优于 R2R 数据集上的最新视觉语言导航方法:将 SPL 分数从 28% 提高到 35%;成功率提高了 8.1%。此外,使用 SIL 模仿 RCM agent 先前在训练集上的最佳体验,会导致平均路径长度从 15.22m 下降到 11.97m,并且对 SPL 度量的结果甚至更好(38%)。此论文在人工智能界的荣誉 该论文获得了三项「强烈接受」(Strong Accept)同行评审,并在计算机视觉和模式识别的顶尖会议 СVPR 2019 上被重点介绍。未来的研究领域是什么?使用 SIL 方法探索其他看不见的环境。有哪些可能的业务应用程序?引入的框架可以在许多实际应用中使用,包括:按照指示在家庭或办公室中移动的家用机器人;私人助理接受口头指示并在复杂的环境中导航以执行某些任务。

在桥下

你们要答辩了吗?来看看计算机专业答辩前一定要做的七大准备

在疫情的影响下,学校都迟迟没有开学,高考通知推迟了,但是大四毕业生的答辩可不见得会推迟,这可急坏了这一届的毕业生。下面我们就来看看,计算机专业的大四毕业生,在答辩前一定要做好的七大准备。基础知识的准备答辩的时候,老师会随机的提问一些基础知识,一般不会太难,而且都是本专业非常重要的课程中的重要知识点。这些知识主要涉及到数据库、算法、计算机网络、计算机组成原理、操作系统等课程。在答辩前,可以根据自己的答辩老师所教的课程,重点复习一下这些知识。计划好答辩演讲的过程,制作答辩使用的PPT毕业答辩的时候,一般都会要求学生进行演讲,所以一定要准备好演讲用的ppt。PPT的制作相当于是毕业生演讲的目录,应事先计划好演讲内容的先后顺序,并将合适的内容放到PPT中,答辩的时候才能胸有成竹。同时,赏心悦目的PPT,也能为你小小加分哦。准备好毕业设计的项目,保证能进行演示计算机专业的毕业设计大部分毕业生会选择做软件项目,也有的同学会做的硬件方面的项目。但无论做的是什么,一定要在答辩前将自己毕业设计的项目调好,老师经常会在答辩的时候要求毕业生演示毕业设计的项目。注意毕业论文的格式排版和结构。一般学校里都会提供毕业论文的模版,论文一定要按照模版的要求来写,不要私自改动论文的格式,同时也要注意将论文的目录等调整得大方美观。论文结构主要指正文的结构,软件项目的论文,一般需要遵循软件设计的流程,从需求分析,到总体设计,详细设计与实现,再到系统测试。在查重网站上,对自己的论文进行查重,达到学校要求的查重率学校对于论文都有查重率的要求,不过本科毕业一般要求不高。但还是要在论文提交之前,通过查重网站查重,如果重复率过高的话,对一些重复的语句进行改写,以达到要求。熟悉毕设项目以及毕业论文,扩展相关的知识内容答辩的时候,最忌的便是对自己的毕设项目和论文生疏,很容易让老师怀疑你作弊。因此,虽然自己做的内容已经足够熟悉了,但还是建议毕业生在答辩前进一步熟悉。同时,应该对毕设项目涉及到的一些知识点进行扩展,很多老师喜欢根据毕业生的项目来提相关问题。按照学校要求打印好资料打印资料基本算是最后一步了,不过也有很多毕业生会在这上面花费不少时间,资料打印一遍又一遍,还是不符合要求。因此,一定要注意弄清楚学校对资料打印字体,装订方式等的要求,避免白费功夫。答辩前,准备好了这些,就可以安安心心的的等着答辩的到来了。如果还是有些不放心,给个小建议,可以跟往届毕业的学长学姐,打听一下你的答辩老师提问的喜好,特别不喜欢毕业生的什么行为,让自己可以准备得更充分。

激光师

必看,10篇定义计算机视觉未来的论文

译者 | Major编辑 | 赵雪导语:如果你没能参加 CVPR 2019 , 别担心。本文列出了会上人们最为关注的 10 篇论文,覆盖了 DeepFakes(人脸转换), Facial Recognition(人脸识别), Reconstruction(视频重建)等等。1.Learning Indivial Styles of Conversational Gesture (学习对话姿势中的个体风格)原文链接:https://www.profillic.com/paper/arxiv:1906.04160摘要:对于给定的语音音频输入,它们会生成合理的姿势,来配合声音并合成讲者的相应视频。使用的模型/架构:语音到姿势转换模型(Speech to gesture translation model)。采用一个卷积音频编码器下采样 2D 语谱图并转换为 1D 信号。接着翻译模型 G 预测一个相应的 2D 姿势时序栈。回归到真实姿势的 L1 提供一个训练信号,与此同时,采用一个对抗判别器 D ,确保所预测姿势和讲者风格一致。模型精确度:研究人员对基准和实际姿势序列的语音和姿势转换结果进行了定量比较(作者们展示的表格表明新模型损耗较低, PCK 较高)。使用的数据集: 从 Youtube 上查询得到的针对讲者的姿势数据集。总共采用了 144 小时的视频。其中,80% 用于训练,10% 用于验证,10% 用于测试集,这样每段源视频只出现在一个数据集中。2.Textured Neural Avatars(神经元模型贴图)原文链接:https://www.profillic.com/paper/arxiv:1905.08776摘要:研究人员提出了一个学习全身神经元贴图的系统(即深层网络),通过不同的身体姿势和相机位置产生一个人的全身效果图。这个自由视角渲染的人体神经元模型无需 3D 显式形状建模。使用的模型/架构:神经元贴图系统概览。输入姿势对应为一个 “骨骼” 光栅堆栈(一个骨骼对应一个通道)。输入一个全卷积网络(生成器)进行处理,产生肢体定位映射堆栈和肢体协调映射堆栈。这些堆栈用来在肢体协调映射堆栈指定的位置采样身体纹理图,从而产生 RGB 图像。此外,最后的身体定位堆栈图也对应了背景可能性。在学习过程中,遮罩和 RGB 图像与真实姿势进行比较,产生的损失通过采样操作后向传播到全卷积网络和纹理上,使它们进行更新。模型精确度:就 SSIM(自相似度)指标而言,表现得比其他两个模型更好;在 FID( Frechet 感知距离)指标上的表现比 V2V 表现更差。使用的数据集: CMU Panoptic 数据集的 2 个子集我们自己使用 7 台摄像机对 3 个对象采集的多角度序列,其视角范围大约在 30 度。还有另一文章和 Youtube 上的 2 个单眼短序列。3.DSFD: Dual Shot Face Detector(DSFD: 双向人脸检测器)原文链接:https://www.profillic.com/paper/arxiv:1810.10220摘要:作者提出了一个创新的人脸检测神经网络,有3个全新的贡献,解决了人脸识别的三个关键方面,包括更好的特征学习、渐进的损失设计,以及基于数据增强的主角指定。使用的模型/架构:DSFD 框架在一个前向 VGG/ResNet 架构的顶层采用了一个特征增强模块,从原有的特征中产生增强特征,该框架还采用了两个损失层,分别是针对原有特征的名为 first shot PAL 的损失层,和针对增强特征的名为 second shot PAL 的损失层。模型精确度:在流行的 benchmark(WIDER FACE 和 FDDB )上进行的大量实验表明了与现有的检测器如 PyramiBox 和 SRN 相比,DSFD 具有优越性。使用的数据集:WIDER FACE 和 FDDB4.GANFIT: Generative Adversarial Network Fitting for High Fidelity 3D Face Reconstruction (GANFIT:匹配高保真3D人脸重建的对抗生成网络)原文链接:https://www.profillic.com/paper/arxiv:1902.05978摘要:文中提出的深度匹配方法可以从一个图像重建高质量纹理和几何特征,可准确进行身份重现。文中其它地方的重建采用一个 700 浮点数规模的向量表示,并无须采用任何特效进行渲染 ( t 产生的纹理通过模型重建,而没有从图像中直接提取特征 )。使用的模型/架构:采用一个差分渲染器进行 3D 人脸重建。成本函数主要通过预训练人脸识别网络上的身份特征来确定,并通过梯度下降优化将误差一路返回到潜在参数来优化。端到端可微结构使我们能够使用从计算上来说既廉价又可靠的一阶导数进行优化,因此使用深层网络作为生成器(即统计模型)或作为成本函数具有了可能性。模型精确度:采用点面距离从 MICC 数据集上获得精确性数据。下表给出的均方差 ( Mean )和标准差( Std. )是该模型最低的。使用的数据集: MoFA-Test、MICC、Wild ( LFW ) 数据集中带标签的面部、BAM 数据集。5.DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation, Segmentation and Re-Identification of Clothing Images (DeepFashion2:服装图像检测、动作评估、分割和重新识别的通用基准)原文链接:https://www.profillic.com/paper/arxiv:1901.07973摘要:Deepfashion 2 提供了一个用于服装图像检测、动作评估、分割和重新识别的通用基准。使用的模型/架构:Match R-CNN 包含了三个主要的组件:特征提取网络 ( FIN )、感知网络( PN )和匹配网络( MN )。模型精确度:与真实服装相比,Match R-CNN 达到了前 20 的精确度(低于 0.7 ),说明检索基准很有挑战性。使用的数据集:DeepFashion2 数据集包含了 491K 各类图像,涵盖商业销售库存服装和消费者中的19 类流行服装。6.Inverse Cooking: Recipe Generation from Food Images(反向烹饪:从食物图像生成配方)原文链接:https://www.profillic.com/paper/arxiv:1812.06164摘要:Facebook 研究人员采用AI从食物图像中生成食谱。使用的模型/架构:配方生成模型-作者用图像编码器提取图像特征。由成分解码器( Ingredient Decoder)预测成分,并用成分编码器( Ingredient Encoder)编码到成分嵌入中。烹饪指令解码器通过处理图像嵌入、成分嵌入和先前预测的单词,生成食谱标题和烹饪步骤序列。模型精确度:用户研究结果表明,相对于最先进的图像-配方检索方法,他们的系统具有优势。(优于人工评估和基于检索的系统,获得 49.08% 的 F1 ,良好的 f1 分数意味着错判假阳性和假阴性较低)。使用的数据集:他们在大规模 Recipe1M 数据集上对整个系统进行评估。7.ArcFace: Additive Angular Margin Loss for Deep Face Recognition(ArcFace:用于深度人脸识别的附加角度边缘损失)原文链接:https://arxiv.org/pdf/1801.07698.pdf摘要:ArcFace 可以获得更具鉴别力的深度特征,并以可重现的方式在 MegaFace Challenge 中有出色的表现。使用的模型/架构:为增强类内紧凑性和类间差异性,本文提出附加角度边缘损失(ArcFace),在取样和中心之间加入了一个测地距离边缘。这是出于提高人脸识别模型的识别能力考虑。模型精确度:综合实验报告表明,ArcFace 始终优于当前最新的模型.使用的数据集:采用了 CASIA、VGGFace2、MS1MV2 和 DeepGlint-Face (包括 MS1M-DeepGlint 和 Asian-DeepGlint ) 作为训练集,以确保与其他模型进行公平的比较。使用的其它数据集包括:LFW、CFP-FP、AgeDB-30、CPLFW、CALFW、YTF、MegaFace、IJB-B、IJB-C、Trillion-Pairs、iQIYI-VID8.Fast Online Object Tracking and Segmentation: A Unifying Approach (快速在线对象跟踪和分割:归一化方法)原文链接:https://www.profillic.com/paper/arxiv:1812.05050摘要:通过利用二进制分割任务增强损失,这种名为 SiamMask 的方法改进了用于对象跟踪的流行的全卷积 Siamese 方法的离线训练过程。使用的模型/架构:SiamMask 的目标是视觉跟踪和视频分割的交叉点,实现更高的实用性。与传统的对象跟踪器相似,它依赖于简单的边界框初始化并在线操作。与 ECO 等最先进的跟踪器不同,SiamMask 能够生成二进制分割遮罩,从而更准确地描述目标对象。SiamMask 有两种变体:三分支结构、两分支结构(有关更多详细信息请参阅论文)。模型精确度:论文中给出了 SmiaMask 的定量结果,分别针对 VOT(视觉对象跟踪)和DAVIS( Densely 标引视频分割)序列。SiamMask 即使在速度很快或有干扰的情况也能产生精确的分割遮罩。使用的数据集:VOT2016、VOT-2018、DAVIS-2016、DAVIS-2017和 YouTube-VOS。9.Revealing Scenes by Inverting Structure from Motion Reconstructions (在动作重建中插入结构再现场景)原文链接:https://www.profillic.com/paper/arxiv:1904.03303摘要:微软的研究团队和合作研究人员从点云中重建了场景的彩色图像。使用的模型/架构:该方法基于一个作为输入的级联 U-NET,从包含点深度,可选颜色和 SIFT描述符的特定视点渲染点的二维多通道图像,并从该视点输出场景的彩色图像。他们的网络有3个子网络——VISIBNET、 COARSENET 和 REFINENET。网络输入是一个多维的 ND 阵列。本文探讨了网络变量,输入的是深度、颜色和筛选描述符的不同子集。这 3 个子网络具有相似的架构。它们是具有对称跳跃连接的编码器和解码器层的 U-UNet 。解码器层末端的额外层有助于高维输入。模型精确度:本文表明,可以从存储的有限信息量和稀疏的三维点云模型体系结构中重建高质量图像(有关更多详细信息,请参阅论文)。使用的数据集:在700 多个户内和户外 Sfm 重建图像上进行,这些图像是从 NYU2 的MagaDepth 数据集中的 50 多万多角度图像中产生的。10.Semantic Image Synthesis with Spatially-Adaptive Normalization (空间自适应正则化语义图像合成)原文链接:https://www.profillic.com/paper/arxiv:1903.07291摘要:把涂鸦变成令人惊叹的照片写实的风景!Nvidia Research 利用生成对抗网络创建高度逼真的场景。艺术家可以使用画笔和颜料筒工具设计河流、岩石和云等专属于自己的风景。使用的模型/架构: 在 SPADE 中,首先将遮罩影射到嵌入空间上,然后进行卷积以产生调制参数 γ 和 β 。与以前的条件归一化方法不同,γ 和 β 不是向量,而是具有空间维度的张量。将产生的 γ 和 β 相乘并按顺序添加到归一化激活元素中。在 SPADE 发生器中,每个正则层采用分割遮罩来对层活动建模,(左侧)是采用 SPADE 的一个残差模块,(右侧)发生器包含了一系列带有上采样层的 SPADE 残差模块。模型精确度:这个体系结构通过较少的参数移除主图像到图像转换网络的降采样层,以实现更好的性能。我们的方法成功地在动物到体育活动的不同场景中生成了逼真的图像。使用的数据集:COCO-Stuff、ADE20K、Cityscapes 和 Flickr Landscape原文链接:https://hackernoon.com/top-10-papers-you-shouldnt-miss-from-cvpr-2019-deepfake-facial-recognition-reconstruction-and-more-d5ly3q1w(*本文为 AI科技大本营原创文章,转载请联系微信 1092722531)

徐谓

本科毕业设计和论文怎么过?(计算机专业)

毕业设计和论文是每个毕业生最后要途径的一个过程中,目的是学校为了检验这几年学生在学校学习的成果,最后毕业设计和论文好的人还会被评为优秀毕业生,但是很多人都说这个不会做,那个也不会做,先不着急,和小编一起来看一看怎么过吧!和老师打好关系。先不说其他的,在学校读了四年书,至少先要和老师打好关系吧。因为说不定你答辩的时候评委老师正好是你熟悉的,如果是这样,就不会太难为你的,当然在答辩的时候也不要套近乎,因为不只是你认识的老师在,还有其他专业的老师同样也在。选好并且选对毕业课题。选择毕业课题在选对老师的同时,课题的选择也是非常重要的。选择课题应该尽量接近你能够接受的范围之内,而且一些课题的选择都有好几个其他专业的同时选择,最好选择人多的,这样如果你不会做,还可以几个同学一起学习。自己做的设计不要出问题。在调试自己的设计时,不要出现bug或者其他的系统问题。一旦到了真正的答辩时间,在台上讲解的时候,都要每一个步骤很详细的讲解,这时候如果出现问题自己又不会处理,那就可能很尴尬。论文格式很重要。除了毕业设计,还有毕业论文。写毕业论文最主要的目的是为了对你做的设计进行解析,你的创作思路在论文里面体现出来。指导老师先会看你的论文,论文里格式非常重要,比如:字体、字号、字形都有很严格的要求,包括论文里的顺序,还有不要忘记论文的目录。对自己做的东西要熟悉。一般的毕业设计和论文都是自己花时间拿下来的,小部分同学会请教别人,或者让其他会做的同学帮助自己做完一部分,当最后做完成之后,自己要花时间亲自看一遍,至少要知道一些基本的知识。根据上一届的要求去做。无论你是在写论文还是做毕业设计,先去了解一下本专业上一届的毕业生是怎么毕业的。他们的要求和这一届如果在学校领导没有说改变的情况下,基本是相同的。因此,论文格式可以按照上一届的论文去改。答辩之前先自己练习一遍,知道自己要讲什么。在真正要答辩的时候,先准备在自己的草稿本上先酝酿,开头语,中间过程,结束语,目的是为了在真正答辩的时候由于紧张不知道要说什么,这时候可以拿出草稿本,直接在上面念一遍。答辩过程中要谦虚。在整个过程中,除了要讲解自己的设计外,评委老师会对你做出的毕业设计提出几个问题。如果你平时脾气不好,这时候赶快收收你的脾气,回答问题的时候一定要谦虚,语气不要过重,要有一种无时无刻在向你们学习的态度。查看原文 >>产品建议及投诉请联系:shouji@.com

礼也

MIT论文:通用计算机时代即将终结

计算机产业在过去几十年里经历了一段显著的增长和稳定时期,这很大程度上象征着技术和经济的胜利。一方面,图灵和冯·诺依曼等计算机科学家实现的技术突破助推了计算机作为通用技术的崛起;另一方面,自1965年被提出以来,摩尔定律驱动着通用技术产业在处理器性能提升和市场需求增长之间实现良性的经济循环。如今,同样是来自技术和经济的力量正在推动计算机产业向着相反方向发展——计算机时代正在告别通用,转向专用。正如来自麻省理工学院(MIT)和亚琛大学的两位研究人员近日发表联合署名的论文称,通用计算机时代即将终结。他们在论文中论证指出,摩尔定律的逐渐失效以及深度学习和数字货币挖矿等新应用需求的出现,正助推计算机行业从当前的普遍使用通用微处理器,转向一个青睐专用微处理器的时代。论文的两位作者分别是MIT计算机科学和AI实验室的研究科学家兼哈佛大学的客座教授Neil Thompson,以及亚琛工业大学的研究生Svenja Spanuth。正如论文作者指出,“通用计算机芯片的崛起举世瞩目,殒落可能也将同样惹人注目”。转变何以发生?文章指出,通用计算机时代当前面临三大问题:新增用户数量逐渐见顶、制造成本不断攀升、以及性能提升速度不断放缓,后两者也就是对应开头所指的经济和技术。正是这三个特征助推了计算机时代的转变。1)首先来看经济问题。简而言之,缩小晶体管尺寸的成本变得极其高昂,这令过去几十年驱动通用计算机时代盛行的摩尔定律日渐式微。晶体管密度稳步翻番,推动处理器性能大幅提升。这正是摩尔定律的核心所在。自1965年被提出以来,摩尔定律在过去几十年里驱动推动了通用计算模型的兴起和兴盛。过去为什么通用处理器大受青睐,经济因素是一方面重要的原因——摩尔定律在过去几十年大幅提升晶体管的性价比。开发和制造定制芯片的固定成本在3000万到8000万美元之间。因此,即使对需要高性能微处理器的用户而言,采用专用架构的好处也荡然无存:一方面是缩小通用处理器中晶体管的尺寸会消除定制解决方案能提供的任何初始性能提升,另一方面是缩小晶体管尺寸的成本可以分摊到数百万个处理器上。但如今,摩尔定律带来的计算经济学正在发生变化:随着基础半导体材料的物理限制开始凸显出来,缩小晶体管尺寸的成本变得极其高昂。论文作者指出,制造芯片的固定成本正在变得异常高昂,这必然会打消半导体制造商力求生产更小尺寸的晶体管的积极性,也会令半导体制造产业整体的规模经济趋向恶化。数据显示,在过去的25年里,制造一家先进芯片制造厂的成本每年增长11%。2017年,半导体行业协会估计新建一家芯片制造厂要花费约70亿美元。以芯片巨头英特尔为例,由于建造和运营新芯片制造厂的费用节节攀升,英特尔的固定成本有史以来第一次超过其可变成本。这从根本上改变了缩小晶体管的成本/效益。芯片制造商的固定成本不断抬高是一个方面,还有一个方面是前者还导致了半导体制造商的数量骤减,从2002年的25家减少到今天的4家:英特尔、台积电(TSMC)、三星和格罗方德。Thompson和Spanuth通过一系列复杂的数学模型量化计算专用处理器的成本/收益,考虑到了开发定制芯片的固定成本、芯片数量、定制实现所带来的加速以及处理器提升的速度。由于后者与摩尔定律联系在一起,因此缓慢的步伐意味着即使预期的提升比较适中,更容易证明使用专用芯片的合理性。论文作者声称:“因此,对于许多(但并非全部)应用而言,现在使用专用处理器在经济上是可行的,至少在硬件方面是这样。换一个角度来看,在2000年至2004年期间,市场规模约83000个处理器的应用将需要专用处理器性能提升100倍才划算。而在2008年至2013年,这种处理器只需要提升2倍就行。”2)再者是技术问题。简而言之,如深度学习、数字货币挖矿等一些新应用的需求是通用计算无法满足的,专用处理器才能在能源效率和性能上满足这些需求,这也是促进专用处理器的另一个驱动因素。Thompson和Spanuth指出,从整体性能和性价比两个方面衡量,都说明了通用处理器的技术进步大幅放缓。从性能来看,由于大量技术挑战的存在,2004/2005年成为性能提升的转折点。自从2005年之后,整体性能提升的速度平均每年放缓22%。从性价比看,美国劳工统计局(BLS)的一份报告量化计算显示,微处理器性价比的提升幅度从2000年至2004年的每年48%下降到2004年至2008年的每年29%,继而下降到2008年至2013年的每年8%。在这样的状况下,通用计算机处理器显然无法满足新出现的一批应用需求。比如,移动设备、物联网(IoT)等平台在能源效率和成本方面有很高要求,而且需要大批量部署;要求更苛严的低批量应用(比如军用和航空硬件)也需要特殊用途的设计;还有涵盖几乎各种移动环境(移动、桌面、嵌入式、云计算和超级计算等)的深度学习——这些都推动了计算从通用处理器走向专用处理器。其中,深度学习及其青睐的硬件平台GPU是计算从通用处理器走向专用处理器的一个最明显的例子,也是让这个行业真正面临分水岭的标志。GPU被视为一种半专用的计算架构,由于能够比CPU更有效地进行数据并行处理,已成为训练深度神经网络的事实上的平台。论文指出,虽然GPU现在还被用来加快科学工程应用,但让进一步的专门化成为可能的却是深度学习这种高容量应用。当然,GPU已经在桌面游戏领域拥有成熟的业务,GPU最初是针对桌面游戏这种应用设计的。2018年11月的TOP500排名显示,专用处理器(主要是英伟达GPU)而不是CPU首次成为性能提升的主要来源。论文作者还对排名表进行了回归分析,结果显示,搭载专用处理器的超级计算机每瓦特所能执行的计算次数几乎是只使用通用处理器的超级计算机的五倍!3)还有一个问题是用户红利见顶,也就是新增用户的数量正在减少。这又主要来自于两个方面:对于通用处理器的需求增速正在放缓,以及部分通用处理器的用户正转向专用处理器。对于通用处理器的需求增速正在放缓,这方面很好理解。如前述所说,通用处理器的性能提升速度正在放缓,因此通用处理器的更新换代频率越来越低。通用处理器的用户正转向专用处理器,这是通过两种途径瓦解通用计算机的周期:一方面,它减少了通用处理器的用户数量;另一方面,它将很多用户“锚定”在了专用处理器市场,即使通用处理器的性能提升再次加速,用户也会依旧停留在专用处理器的市场。上述途径也正呼应了论文论证的中心。比如,深度学习是一个主要贡献者,它涵盖了大量的移动环境,也因此驱动了专用处理器市场份额的大幅增长。结果是什么?摩尔定律的慢慢消亡揭示了过去的创新、市场扩张和再投资这个良性循环。但随着更多的专用芯片开始蚕食计算机行业的份额,这个周期变得支离破碎。由于较少的用户采用使用最新制造工艺的节点,为芯片制造筹集资金变得更困难,这进一步减缓了技术进步。其影响是,计算机行业分散成了多个专门领域。影射到现实,我们正在告别此前的计算机时代,在那里几乎所有人都面对着同一种通用的计算机平台,处理器性能提的感受是广泛的;当前我们正在慢慢转向一个新的计算机时代,不同的用户面对不同的计算机平台,处理器性能的提升也只能被一部分用户群体感受到。论文作者表示,由于规模和对专用硬件的适用性,其中一些领域(比如深度学习)将会处于快车道。然而像数据库处理这些领域虽然广泛使用,但可能会成为一潭死水,因为这种类型的计算并不需要专用芯片。另外,气候建模等其他领域由于应用面太狭小,用不着自己的定制芯片,不过它们依然有望从中得益。论文作者预测,云计算会为较小、较偏冷的社区提供众多基础设施,在某种程度上减弱这种差异性的影响。更多的专用云资源(比如GPU、FPGA以及谷歌的TPU)越来越普遍,这意味着富人和穷人能够在更平等的平台上同台竞技。(更多精彩财经资讯,请下载华尔街见闻App)

王峰

计算机毕业设计基于asp.net教师论文管理系统

教师界面的系统功能模块如图所示:管理员界面的系统功能模块如图所示:业务流分析教师论文管理系统工作流程为:系统启动并系统界面,根据不同权限的用户进行分别操作。教师用户可以对教师信息进行添加、对论文信息进行管理等权限,系统管理员有对系统管理的所有功能进行操作的权限。本系统的业务流程如图2所示:数据流分析教师论文管理系统的数据流程:对本系统操作的数据源有学生用户和教师用户两种,首先由教师用户将成绩信息保存到数据库中,然后再进行发布。整个系统的数据流程图如图所示:数据字典列表——数据流:数据字典列表——数据处理:数据字典列表——数据存储:管理员数据项:教师数据项:学生数据项:论文数据项:备注:本文章为六月雪毕业设计网所有

地狱篇

本科毕业设计和论文怎么过?(计算机专业)

毕业设计和论文是每个毕业生最后要途径的一个过程中,目的是学校为了检验这几年学生在学校学习的成果,最后毕业设计和论文好的人还会被评为优秀毕业生,但是很多人都说这个不会做,那个也不会做,先不着急,和小编一起来看一看怎么过吧!和老师打好关系。先不说其他的,在学校读了四年书,至少先要和老师打好关系吧。因为说不定你答辩的时候评委老师正好是你熟悉的,如果是这样,就不会太难为你的,当然在答辩的时候也不要套近乎,因为不只是你认识的老师在,还有其他专业的老师同样也在。选好并且选对毕业课题。选择毕业课题在选对老师的同时,课题的选择也是非常重要的。选择课题应该尽量接近你能够接受的范围之内,而且一些课题的选择都有好几个其他专业的同时选择,最好选择人多的,这样如果你不会做,还可以几个同学一起学习。自己做的设计不要出问题。在调试自己的设计时,不要出现bug或者其他的系统问题。一旦到了真正的答辩时间,在台上讲解的时候,都要每一个步骤很详细的讲解,这时候如果出现问题自己又不会处理,那就可能很尴尬。论文格式很重要。除了毕业设计,还有毕业论文。写毕业论文最主要的目的是为了对你做的设计进行解析,你的创作思路在论文里面体现出来。指导老师先会看你的论文,论文里格式非常重要,比如:字体、字号、字形都有很严格的要求,包括论文里的顺序,还有不要忘记论文的目录。对自己做的东西要熟悉。一般的毕业设计和论文都是自己花时间拿下来的,小部分同学会请教别人,或者让其他会做的同学帮助自己做完一部分,当最后做完成之后,自己要花时间亲自看一遍,至少要知道一些基本的知识。根据上一届的要求去做。无论你是在写论文还是做毕业设计,先去了解一下本专业上一届的毕业生是怎么毕业的。他们的要求和这一届如果在学校领导没有说改变的情况下,基本是相同的。因此,论文格式可以按照上一届的论文去改。答辩之前先自己练习一遍,知道自己要讲什么。在真正要答辩的时候,先准备在自己的草稿本上先酝酿,开头语,中间过程,结束语,目的是为了在真正答辩的时候由于紧张不知道要说什么,这时候可以拿出草稿本,直接在上面念一遍。答辩过程中要谦虚。在整个过程中,除了要讲解自己的设计外,评委老师会对你做出的毕业设计提出几个问题。如果你平时脾气不好,这时候赶快收收你的脾气,回答问题的时候一定要谦虚,语气不要过重,要有一种无时无刻在向你们学习的态度。查看原文 >>产品建议及投诉请联系:shouji@.com

本末

为什么我会狠狠批评旅行带电脑写论文的研究生?

作者系重庆大学新闻学院张小强教授及其所带博士、硕士团队这篇文章起源于上面的朋友圈,一个学生跟我说他(她)要去北京接最好的朋友一起去香港参加毕业典礼,还背着电脑完成我催了几次的论文。他认为我会赞赏他,可是我狠狠地批评了他。为什么批评他?对他来说,旅行还带着电脑写论文,说明他“刻苦”,时刻不忘老师的任务。可是对作为导师的我来说,这就是另外一回事。这个行为说明他没有把论文而是把自己的旅行摆在第一位。当然,这个案例里他的理由倒也情有可原,毕竟我们都有友情需要,他如果高高兴兴去参加朋友的毕业旅行,我绝不会批评他。他错就错在旅行还“不忘”写论文。我们知道写论文是一件复杂、需要专注来做的事。背着电脑写论文,无非有两个结果:敷衍、心不在焉地做一下,或者他想认真但也难敌美食美景诱惑,这个事情就不可能做好。第二种结果就是电脑只是一种安慰自己或者敷衍老师的摆设,带了但是基本不开机。既然我们已经知道结果不会太好,那为什么还要按照坏结果行事呢?学生不知道的是,小强几十年求学经历也有很多类似经历。在很多很多的寒暑假,给自己立了若干Flag:大学假期的时候要么背个画夹回去想提高水粉画水平、要么带点英语资料,研究生的时候想利用假期学学软件、甚至提高提高写作水平,博士的时候想提高人文知识。因此,每年寒暑假都从图书馆借一大堆重重的书背回去。结果,除了证明自己身有蛮力、背着重物还特能挤火车,没有任何意义。带回去的书从来都没翻开过,画夹倒是用过一次。时间长了,我终于知道那些书不过是安慰剂,仿佛带着书回去吃吃喝喝负罪感小点。开始几次,自己还能骗自己也许会打开它们,后面自己往里装的时候都不相信自己会打开它们,带书成为一种习惯。再后来,我发现自己需要把假期或平时的放松和工作分开。曾经有一阵,我迷上了“星际争霸”联网对战,可是那个时候刚好手里有个写论文的任务。写论文的时候我总不专心,后来我干脆连续玩了几天游戏,游戏之后写论文果然专注多了。现在,不管再忙,我也会在每周抽出半天自由玩耍的时间,让大脑放空。开始新论文选题前,我也习惯放松几天酝酿酝酿再做。这样工作效率会更高。调到学院,我在家的脾气有时候明显变坏,就有工作空间和生活空间不分带来的烦恼。没有了通勤距离的缓冲,这种情绪有的时候会让家人很受伤。小强不主张学生们玩耍和工作(学习)不分的另一个考虑是这样做会消耗我们对工作或学习的兴趣。试想一下,旅行或者其他休闲活动本来很惬意,可是你还要工作或写论文,你会觉得后者有乐趣吗?在旅行的时候工作或学习消费的是你的激情和兴趣。反过来,如果繁重工作或学习之余,你能够玩耍一下,你会感觉很放松,能够提高对生活的兴趣。20几年前学大学英语,一位老教师总跟我们讲一句西谚“只学习不玩耍,聪明的孩子会变傻”。这句话真的很有道理。我身边真的有部分学生,只顾学习,忘了玩耍。虽然学习不错,但是生活的激情被消耗殆尽,我为他们的未来深深担忧。如果玩都不会,指望他们有多少创造力?还有部分学生,是“懒”到宁愿被学习等事务推着走,而不愿放慢脚步在玩耍放松的时候多点顿悟或思考。有的学生花了比我还多的时间,就是论文毫无进展,这就是玩少了的结果。有时候陷入一件事出不来也是很可怕的,对工作和学习我们要进得去也要出得来,否则就会低效率和低层次浪费生命。这句话如果改成“只玩耍,不学习,聪明的孩子会变傻”,我认为它也成立。现在的部分大学生、研究生是很聪明的,但是在学业上应付思想严重,这是他们把玩耍当成了主要目标。而学习则成了让玩耍更有意思的点缀。他们的学习生活,好比在课堂上玩手机,本来让你随便玩手机你很无聊,可是一旦在课堂上、会议上你会觉得玩手机很有意思,这是因为心思不在学习或会议上。一次课堂、一次会议也许真的无聊,玩玩手机可能无伤大雅。但是如果我们的大学生或者研究生们把几年的学业生涯都用作玩累了的“放松”手段,那他们的人生真的出了问题。这样的学生,大学四年或者研究生三年并没有很好地把学业和玩耍分开,导致对学业和生活都失去了兴趣,一切都“佛系”了。他们应付学业、应付玩耍,最后导致他们和生活相互应付。但是更多地学生还不是“佛系”,他们玩耍的时候纠结于时间该用于学业,学习的时候想抵御玩耍的诱惑。“我的主要任务还是学习的责任感”的纠结冲突导致了假期带书带电脑回家的这种局面,是一种“放心不下”又“狠不下心”的表现。这样做最大的意义就是给他们营造一种“我没有在浪费时间”的心理安慰但真的没有实际意义。这样的同学们,需要在假期放下学习、狠心玩耍,因为玩耍是给大脑放松、给身体充电。我的学生,我希望他们认真地玩、认真地学、认真地生活!不要在玩耍的时候还假装背个学习的包袱!当然,有快乐型学习、玩耍型学习,这些概念本身说明学习是不快乐、不轻松的,所以才把学习方式变轻松点。他们的重点依然在“学习”,这也是为了安慰人迷惑人而发明的伪概念。我在给研究生们上课时也强调,写论文本身是艰巨的任务,所以才要他们找个自己最感兴趣的选题。这样才能够用自己的激情克服写作中的困难。但是如果把写论文作为玩耍旅行之余的事务,这就会消耗自己的兴趣和激情给自己制造最大的困难!所以,同学们出门大可不必背电脑!

明日复见

天津大学一名硕士学位论文涉嫌大面积抄袭

高校学术不端事件屡禁不止。近日,澎湃新闻(www.thepaper.cn)接获举报,天津大学一篇硕士学位论文与天津工业大学的一篇硕士学位论文存在大面积雷同的情况。这两篇论文分别是天津大学软件学院软件工程专业2012届硕士毕业生李庆昆的硕士学位论文《基于图像处理技术纤维离线自动识别系统软件的设计》(以下简称“李庆昆论文”)与天津工业大学信息与通信工程学院信号与信息处理专业2007届硕士毕业生刘琳的硕士学位论文《基于图像处理技术纤维自动识别系统软件的设计》(以下简称“刘琳论文”)。刘琳论文封面截图李庆昆论文封面截图刘琳论文完成于2007年1月,李庆昆论文完成于2012年4月。从时间上看,李庆昆论文比刘琳论文完成时间晚了5年。澎湃新闻记者从中国知网下载了上述两篇论文。比对后发现,这两篇论文从标题、摘要、关键词到正文的结构和内容都高度相似,多个段落几乎一字不差。4月10日,天津大学软件学院负责学生工作的相关负责人就澎湃新闻记者的询问表示,他们此前并未接到关于李庆昆论文涉嫌抄袭的正式举报。该负责人稍晚时向澎湃新闻表示,已将李庆昆论文涉嫌抄袭的情况反映给学校,学院也已经成立了临时调查组,将对此事进行进一步调查,“相关进展,会及时通报和处理。”刘琳论文中文摘要截图涉嫌抄袭的李庆昆论文中文摘要截图中文摘要和关键词多处雷同澎湃新闻比对两篇论文后发现,两篇论文均以一款系统软件的设计为研究对象。刘琳论文的标题是“基于图像处理技术纤维自动识别系统软件的设计”,一共21个字。李庆昆论文的标题是“基于图像处理技术纤维离线自动识别系统软件的设计”,一共23个字,只比刘琳论文多了“离线”两个字。刘琳论文的摘要内容为:“纤维检测是通过对各种纤维的识别来检查纺织品的成份及含量,在纺织品的质量评价和性能分析中具有重要意义。“本文采用数字图像处理技术和模式识别理论,研制了纤维图像自动识别系统。该系统实现了对纤维图像现场自动识别,改进了以往人工识别纺织品操作复杂、人为主观误差大的缺点。系统采用微型光电纤维检测仪获取纤维图像,并通过USB总线接口技术接入计算机,采用中值滤波、平滑滤波、锐化等技术对纤维图像进行预处理,生成纤维图像的灰度共生矩阵,提取能量、熵、惯性矩、相关和局部平稳性这吴哥特征,最后采用最近邻域法对纤维种类实现自动分类。“采用可视化编程语言Visual C++ 6.0开发了纤维图像处理和分析的软件。该软件集成了纤维图像处理与分析的算法,包括图像的预处理以及图像的特征提取等算法;内嵌了纤维图像特征数据库管理系统,可以讲提取的图像特征值直接存储于特征数据库中,用于进一步的分析或识别;图像的处理及分析结果均可显示在屏幕上,界面友好,操作方便。”李庆昆论文的中文摘要表述为:“本文采用数字图像处理技术和模式识别理论,研制了纤维图像自动识别系统。纤维检测是通过对各种纤维的识别来检测纺织品的成份及含量,在纺织品的质量评价和性能分析中具有重要意义。它包括通过封闭管道连通的尘笼网、计量装置、开松装置、储棉通道、梳理装置、和电器控制组合的系统;其特征在于:在梳理装置和聚棉装置之间设置有异性纤维检测装置、异性纤维剔除装置,所述纤维检测装置包括透明管道,照明装置,高速摄像机;在计算机内安装有图像识别系统和启动各设备的控制电路和控制软件。“纤维图像自动识别系统实现了对纤维图像现场自动识别,采用微型光电纤维检测仪获取纤维图像,并通过 USB 总线接口技术接入计算机,采用中值滤波、平滑滤波、锐化等技术对纤维图像进行预处理,生成纤维图像的灰度共生矩阵,提取能量、熵、惯性矩、相关和局部平稳性这五个特征,最后采用最近邻域法对纤维种类实现自动分类。该系统改进了以往人工识别纺织品操作复杂、人为主观误差大的缺点。“纤维图像处理和分析的软件采用可视化编程语言 Visual C++ 6.0 进行开发。该软件集成了纤维图像处理与分析的算法,包括图像的预处理以及图像的特征提取等算法;内嵌了纤维图像特征数据库管理系统,可以将提取的图像特征值直接存储于特征数据库中,用于进一步的分析或识别;图像的处理及分析结果均可显示在屏幕上,界面友好,操作方便。“纤维检测软件可以在现场离线使用,该软件的发明摆脱了以往大型检测工具的繁重搬运,给检测人员大大地提供了方便。纤维检测软件把测试结果储存在计算机数据库中,图像处理系统采用先进的图象处理技术,精确地测量、计算纤维的直径和鳞片密度。纤维图像自动识别软件有效提高了检测自动化水平,是一个具有良好经济效益的应用软件。”比对以上两篇论文的中文摘要,李庆昆论文的中文摘要除了多出“它包括通过封闭管道连通的尘笼网、计量装置、开松装置、储棉通道、梳理装置、和电器控制组合的系统;其特征在于:在梳理装置和聚棉装置之间设置有异性纤维检测装置、异性纤维剔除装置,所述纤维检测装置包括透明管道,照明装置,高速摄像机;在计算机内安装有图像识别系统和启动各设备的控制电路和控制软件”,以及最后一段内容外,摘要中的其他内容均可以在刘琳论文中找到雷同表述,区别只在于李庆昆论文略微调整了个别词句的顺序。刘琳论文的关键词共有5个,即纤维检测、模式识别、灰度共生矩阵、软件系统和数字图像处理。李庆昆论文的关键词一共6个,包括纤维图像、数字图像处理、软件系统、纤维检测、灰度共生矩阵和模式识别。比对发现,李庆昆论文的关键词只比刘琳论文的关键词多了一个“纤维图像”,其他5个完全一致。刘琳论文第一章“引言”部分截图正文部分大面积相似刘琳论文正文共分为五章,即引言、纤维数字图像处理、纤维图像自动识别系统设计、系统实验及性能分析、结束语。李庆昆论文的结构分为六章,分别是引言、通用纤维处理技术综述、纤维图像自动识别软件系统的设计、系统实验及性能分析、纤维离线智能识别系统的准确性及实现和结论。澎湃新闻比对发现,两篇论文的正文部分也存在大面积相似的情况。以第一章“引言”为例,刘琳论文在引言的“现状”一节中写道:“B.Xu在纤维的形态测定方面作了很多的工作,他首先提出了一套描述纤维纵向卷曲程度的算法,然后利用几何参数和Fourier描绘子去描述和分析各种纤维截面的几何特征及其形态复杂度,并将其应用到棉纤维截面的测定和分析上,在此基础上他又提出了一种新的测定棉纤维成熟度的方法。“在羊毛纤维的测试分析方面,也有很多学者作过研究。1989年D.Robson利用图像处理技术测定了各种羊毛和羊绒的鳞片结构,提出用面积、圆整度、充满度、形状系数等来描绘各种鳞片的不同的形态特征。1997年D.Robson又提出了纤维宽度、鳞片间距、边缘接触长度等新的特征参数,成功地对羊绒和羊毛纤维进行自动识别。在羊毛细度测试方面,B.P.Baxter等人在1992年开发了一套快速测量羊毛细度的算法和装置,按标准将羊毛切成小段,然后使其均匀分散在玻璃片上,放在测试台上,一边移动一边用图像处理系统进行实时测定,得出羊毛的细度和其他相应的指标。”李庆昆论文也在引言的“现状”一节写道:“B.Xu 在纤维形态测定方面作了很多的工作,他提出了一种描述纤维纵向卷曲程度的算法,又利用了几何参数和Fourier去刻画和分析各种纤维截面的几何特征及其形态的复杂度性质,并且将其应用到棉纤维截面测定和分析上并在以此为基础给出了一种新型棉纤维成熟度测定方法。“1997年D.Robson提出了纤维宽度、鳞片间距、边缘接触长度等新的特征参数,成功对羊绒及纤维进行了自动的识别。在羊毛的细度测量方面,B。 P。 Baxter等人,研发了快速测量羊毛细度的算法和装置,按标准将羊毛切成小段,一边移动一边用图像处理系统来进行实时测定,最终得出羊毛细度。”以上两部分内容,李庆昆论文除了进行简单的字句删改,诸如将“首先”去掉,将“得出羊毛的细度和其他相应的指标”改写成“最终得出羊毛细度”等,其他内容均可以在刘琳论文中找到相同或相似的表述。刘琳论文第二章部分段落截图李庆昆论文第二章部分段落截图再以第二章为例,刘琳论文在第二章的“纤维图像纹理分析”一节写道:“纹理是图像中一个重要而又难以描述的特性,至今还没有公认的定义。有些图像在局部区域内呈现不规则性,而在整体上表象出某种规律性。习惯上把这种局部不规则而宏观有规律的特性称为纹理特性;以纹理特性为主导的图像,常称为纹理图像;以纹理特性为主导特性的区域,常称为纹理区域。由于构成纹理的规律可能是确定性纹理或随机纹理。纹理变化可以出现在不同尺度范围内,若图像中灰度在小范围内相当不平稳、不规则,这种纹理就称为微纹理;若图像中有明显的结构单元,整个图像的纹理是由这些结构单元按一定规律形成的,则称为宏纹理,上述的结构单元称为纹理单元。由此可见,在实际纹理图像的分析中,要针对纹理的类型,采用适当的分析方法研究其变化规律。”李庆昆论文在“纤维图像的纹理分析”一节中也有一段内容表述为:“纹理是图像中一个重要而又难以描述的特性,至今还没有公认的定义。一些图像在局部区域内呈现不规则性,而在整体表现出某种规律性。我们习惯上把这种局部不规则而宏观有规律的特性称之为纹理特性;以纹理特性为主导的图像,常称之为纹理图像;以纹理特性为主导的特性区域,常称之为纹理区域。由于构成纹理的规律可能是确定性纹理或随机纹理。纹理变化可以出现在不同尺度范围中,若图像的灰度在小范围内相对不平稳、不规则,这种纹理就称为微纹理;若图像中有明显的结构单元,整个图像的纹理是根据这些结构单元按一定规律组成的,则称之为宏纹理,上述的结构单元称之为纹理单元。由此可知,在实际纹理图像的分析中,要针对纹理的类型,采用适合的分析方法研究它的变化规律。”以上两段内容,李庆昆论文除了将“称为”改为“称之为”,将“形成”改成“组成”,将“适当”改为“适合”,将“其”改为“它的”之外,其他核心内容都与刘琳论文内容别无两样。刘琳论文第三章开头部分截图李庆昆论文第三章开头部分截图再看第三章,刘琳论文在第三章“纤维图像自动识别系统设计”的开头写道:“模式识别是要把一种研究对象,根据其某些特征进行识别并分类。针对本课题的具体的研究对象,在对大量的纤维纹理图像处理的基础上,抽取出最能表现纹理类别的有意义的特征或属性,然后根据这些特征和属性对纤维纹理进行分类,把其特征或属性相同的数据归属为同一类。“本课题设计的测量识别系统抽取了纤维纹理中能量、熵、惯性矩、相关和局部平稳性这五个特征,通过这五个特征对纤维的类别进行识别判断。整个系统包括纤维图像采集、纤维图像预处理、纤维图像纹理特征提取以及纤维识别分类四大部分。“对于纤维图像自身的特点,本系统的图像采集采用一种微型光电纤维检测仪,利用其中的CCD器件和图像采集卡获取纤维原始图像送入微机中进行处理,采用 VC++6.0设计图像处理及识别程序及用户操作界面,并采用SQL Server2000编制数据库存储纤维特征和用户信息。下面将介绍每个系统的设计部分。”李庆昆论文在第三章“纤维图像自动识别软件系统的设计”开篇写道:“本课题设计的测量识别系统抽取了纤维纹理中的能量、熵、惯性矩、相关以及局部平稳性这五个特征,通过这五个特征以及对纤维的类别进行识别判断。整个系统包括纤维图像采集、纤维图像预处理、纤维图像纹理特征提取以及纤维识别分类四大部分。“模式识别是把一种研究对象,根据某些特征进行识别并且分类。对于本课题具体的研究对象,在对大量的纤维纹理图像处理的基础上,抽取出最能表现纹理类别具有意义的特征或属性,然后根据这些特征或属性对纤维纹理进行分类,把其特征或属性相同的数据归属为同一类。“对于纤维图像自身的特点,本系统中图像采集采用一种微型光电纤维检测仪,利用其中的CCD器件和图像采集卡获取纤维原始图像送入微机中进行处理,采用 VC++6.0设计图像处理及识别程序用户操作界面,并采用SQL Server2000编制数据库存储纤维特征和用户信息。下面将介绍每个系统的设计部分。”以上两部分内容,李庆昆论文除了调整了前两段的顺序,以及将“和”改写为“以及”之外,其他内容包括文中的图示均与刘琳论文毫无区别。刘琳论文第四章所列图例截图李庆昆论文第四章所列图例截图再比如,李庆昆论文第四章第二小节“图像自动识别”里所列的4幅图例与刘琳论文第四章第二小节“自动识别实验”的图例也一模一样。刘琳论文第五章“结束语”截图又如刘琳论文在第五章“结束语”第一段谈及系统的优点时写道:“本系统的设计为天津纺织纤维检验所与天津工业大学共同研究的《适合现场使用的便携式微型光电显微检测仪》项目的开发提供了支持,实现了现场取样纤维的自动识别,与以往的检验方法相比,本系统具有运算速度快、测试精度高、处理数据量大、结果再现性好等特点,且操作简单,可靠性好,避免了不必要的人为误差,方便了执法人员对市场中纺织品的现场检测。”李庆昆论文第六章“结论”部分截图李庆昆论文第六章“结论”第一段也介绍了系统的优点,具体内容为:“与以前的检测技术进行比较,本系统具有如下技术优势:系统运算速度快,数据精度比较高,能一次性处理较多数据量,且输出结果展示性好,操作简单且可靠性好,便于对商品的现场检测。本系统的设计为天津纺织纤维检验所与天津工业大学共同研究的《适合现场使用的便携式微型光电显微检测仪》对项目的开发提供了大力的支持,实现了现场取样纤维的自动识别。”比对以上两段内容发现,李庆昆论文调整了语序,又对个别字词进行了修改,比如将刘琳论文中的“处理数据量大”改为“能一次性处理较多数据量”,将“结果再现性好”改为“输出结构展示性好”等,其基本内容和结论与刘琳论文雷同。天大软件学院回应:已成立调查组进行调查李庆昆论文和刘琳论文有大面积雷同内容,但李庆昆论文的参考文献条目中并未列出刘琳论文。并且,刘琳论文有《独创性声明》。刘琳在这份声明中写明,其所呈交的学位论文是其本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津工业大学或其他教育机构的学位或证书而使用过的材料。由于论文完成时间上,李庆昆论文比刘琳论文晚了5年,完成于2012年4月的李庆昆论文涉嫌抄袭刘琳论文。另外,澎湃新闻从天津大学软件学院官网了解到,李庆昆是该学院软件工程专业2012届的单证工程硕士。所谓“单证”是指通过研究生教育的硕士从学校毕业时拿到硕士学位证,没有硕士学历证。针对李庆昆论文与刘琳论文大面积相似的情况,4月9日下午,澎湃新闻记者致电天津大学软件学院了解求证。软件学院办公室的一名工作人员表示对此事不清楚,让记者通过该院专门负责学生工作的处室作进一步了解。4月10日上午,澎湃新闻从天津大学软件学院负责学生工作的相关负责人处了解到,他们此前并未接到关于李庆昆论文涉嫌抄袭的正式举报。随后这名负责人在简单了解情况后,又给澎湃新闻回电,并表示,已经将李庆昆论文涉嫌抄袭的情况反映给学校,学院也已经成立了临时调查组,将对此事进行进一步调查,“相关进展,会及时通报和处理。”(来源:澎湃新闻)

和不欲出

MIT论文:通用计算机时代即将终结

计算机产业在过去几十年里经历了一段显著的增长和稳定时期,这很大程度上象征着技术和经济的胜利。一方面,图灵和冯·诺依曼等计算机科学家实现的技术突破助推了计算机作为通用技术的崛起;另一方面,自1965年被提出以来,摩尔定律驱动着通用技术产业在处理器性能提升和市场需求增长之间实现良性的经济循环。如今,同样是来自技术和经济的力量正在推动计算机产业向着相反方向发展——计算机时代正在告别通用,转向专用。正如来自麻省理工学院(MIT)和亚琛大学的两位研究人员近日发表联合署名的论文称,通用计算机时代即将终结。他们在论文中论证指出,摩尔定律的逐渐失效以及深度学习和数字货币挖矿等新应用需求的出现,正助推计算机行业从当前的普遍使用通用微处理器,转向一个青睐专用微处理器的时代。论文的两位作者分别是MIT计算机科学和AI实验室的研究科学家兼哈佛大学的客座教授Neil Thompson,以及亚琛工业大学的研究生Svenja Spanuth。正如论文作者指出,“通用计算机芯片的崛起举世瞩目,殒落可能也将同样惹人注目”。转变何以发生?文章指出,通用计算机时代当前面临三大问题:新增用户数量逐渐见顶、制造成本不断攀升、以及性能提升速度不断放缓,后两者也就是对应开头所指的经济和技术。正是这三个特征助推了计算机时代的转变。1)首先来看经济问题。简而言之,缩小晶体管尺寸的成本变得极其高昂,这令过去几十年驱动通用计算机时代盛行的摩尔定律日渐式微。晶体管密度稳步翻番,推动处理器性能大幅提升。这正是摩尔定律的核心所在。自1965年被提出以来,摩尔定律在过去几十年里驱动推动了通用计算模型的兴起和兴盛。过去为什么通用处理器大受青睐,经济因素是一方面重要的原因——摩尔定律在过去几十年大幅提升晶体管的性价比。开发和制造定制芯片的固定成本在3000万到8000万美元之间。因此,即使对需要高性能微处理器的用户而言,采用专用架构的好处也荡然无存:一方面是缩小通用处理器中晶体管的尺寸会消除定制解决方案能提供的任何初始性能提升,另一方面是缩小晶体管尺寸的成本可以分摊到数百万个处理器上。但如今,摩尔定律带来的计算经济学正在发生变化:随着基础半导体材料的物理限制开始凸显出来,缩小晶体管尺寸的成本变得极其高昂。论文作者指出,制造芯片的固定成本正在变得异常高昂,这必然会打消半导体制造商力求生产更小尺寸的晶体管的积极性,也会令半导体制造产业整体的规模经济趋向恶化。数据显示,在过去的25年里,制造一家先进芯片制造厂的成本每年增长11%。2017年,半导体行业协会估计新建一家芯片制造厂要花费约70亿美元。以芯片巨头英特尔为例,由于建造和运营新芯片制造厂的费用节节攀升,英特尔的固定成本有史以来第一次超过其可变成本。这从根本上改变了缩小晶体管的成本/效益。芯片制造商的固定成本不断抬高是一个方面,还有一个方面是前者还导致了半导体制造商的数量骤减,从2002年的25家减少到今天的4家:英特尔、台积电(TSMC)、三星和格罗方德。Thompson和Spanuth通过一系列复杂的数学模型量化计算专用处理器的成本/收益,考虑到了开发定制芯片的固定成本、芯片数量、定制实现所带来的加速以及处理器提升的速度。由于后者与摩尔定律联系在一起,因此缓慢的步伐意味着即使预期的提升比较适中,更容易证明使用专用芯片的合理性。论文作者声称:“因此,对于许多(但并非全部)应用而言,现在使用专用处理器在经济上是可行的,至少在硬件方面是这样。换一个角度来看,在2000年至2004年期间,市场规模约83000个处理器的应用将需要专用处理器性能提升100倍才划算。而在2008年至2013年,这种处理器只需要提升2倍就行。”2)再者是技术问题。简而言之,如深度学习、数字货币挖矿等一些新应用的需求是通用计算无法满足的,专用处理器才能在能源效率和性能上满足这些需求,这也是促进专用处理器的另一个驱动因素。Thompson和Spanuth指出,从整体性能和性价比两个方面衡量,都说明了通用处理器的技术进步大幅放缓。从性能来看,由于大量技术挑战的存在,2004/2005年成为性能提升的转折点。自从2005年之后,整体性能提升的速度平均每年放缓22%。从性价比看,美国劳工统计局(BLS)的一份报告量化计算显示,微处理器性价比的提升幅度从2000年至2004年的每年48%下降到2004年至2008年的每年29%,继而下降到2008年至2013年的每年8%。在这样的状况下,通用计算机处理器显然无法满足新出现的一批应用需求。比如,移动设备、物联网(IoT)等平台在能源效率和成本方面有很高要求,而且需要大批量部署;要求更苛严的低批量应用(比如军用和航空硬件)也需要特殊用途的设计;还有涵盖几乎各种移动环境(移动、桌面、嵌入式、云计算和超级计算等)的深度学习——这些都推动了计算从通用处理器走向专用处理器。其中,深度学习及其青睐的硬件平台GPU是计算从通用处理器走向专用处理器的一个最明显的例子,也是让这个行业真正面临分水岭的标志。GPU被视为一种半专用的计算架构,由于能够比CPU更有效地进行数据并行处理,已成为训练深度神经网络的事实上的平台。论文指出,虽然GPU现在还被用来加快科学工程应用,但让进一步的专门化成为可能的却是深度学习这种高容量应用。当然,GPU已经在桌面游戏领域拥有成熟的业务,GPU最初是针对桌面游戏这种应用设计的。2018年11月的TOP500排名显示,专用处理器(主要是英伟达GPU)而不是CPU首次成为性能提升的主要来源。论文作者还对排名表进行了回归分析,结果显示,搭载专用处理器的超级计算机每瓦特所能执行的计算次数几乎是只使用通用处理器的超级计算机的五倍!3)还有一个问题是用户红利见顶,也就是新增用户的数量正在减少。这又主要来自于两个方面:对于通用处理器的需求增速正在放缓,以及部分通用处理器的用户正转向专用处理器。对于通用处理器的需求增速正在放缓,这方面很好理解。如前述所说,通用处理器的性能提升速度正在放缓,因此通用处理器的更新换代频率越来越低。通用处理器的用户正转向专用处理器,这是通过两种途径瓦解通用计算机的周期:一方面,它减少了通用处理器的用户数量;另一方面,它将很多用户“锚定”在了专用处理器市场,即使通用处理器的性能提升再次加速,用户也会依旧停留在专用处理器的市场。上述途径也正呼应了论文论证的中心。比如,深度学习是一个主要贡献者,它涵盖了大量的移动环境,也因此驱动了专用处理器市场份额的大幅增长。结果是什么?摩尔定律的慢慢消亡揭示了过去的创新、市场扩张和再投资这个良性循环。但随着更多的专用芯片开始蚕食计算机行业的份额,这个周期变得支离破碎。由于较少的用户采用使用最新制造工艺的节点,为芯片制造筹集资金变得更困难,这进一步减缓了技术进步。其影响是,计算机行业分散成了多个专门领域。影射到现实,我们正在告别此前的计算机时代,在那里几乎所有人都面对着同一种通用的计算机平台,处理器性能提的感受是广泛的;当前我们正在慢慢转向一个新的计算机时代,不同的用户面对不同的计算机平台,处理器性能的提升也只能被一部分用户群体感受到。论文作者表示,由于规模和对专用硬件的适用性,其中一些领域(比如深度学习)将会处于快车道。然而像数据库处理这些领域虽然广泛使用,但可能会成为一潭死水,因为这种类型的计算并不需要专用芯片。另外,气候建模等其他领域由于应用面太狭小,用不着自己的定制芯片,不过它们依然有望从中得益。论文作者预测,云计算会为较小、较偏冷的社区提供众多基础设施,在某种程度上减弱这种差异性的影响。更多的专用云资源(比如GPU、FPGA以及谷歌的TPU)越来越普遍,这意味着富人和穷人能够在更平等的平台上同台竞技。(更多精彩财经资讯,请下载华尔街见闻App)