近日,北大物理学院光学所的18位博士生在线完成了毕业论文预答辩工作受到疫情影响北大今年的博士生预答辩工作也显得格外特殊虽然北京大学已经线上开学月余但博士生和导师们无法在实验室、会议室碰面仍然困扰着大家为了保证今年应届博士毕业工作顺利身处五湖四海的博士毕业班同学和导师们都想办法利用网络技术带来的便利克服距离带来的重重挑战解决数据材料等诸多问题完成了毕业论文的关键一步线上答辩会:我准备好啦博士生预答辩是博士生培养的重要环节。防疫教学两手抓,北京大学物理学院现代光学所三月如期举办了远程视频博士毕业生预答辩会。经过充分的前期准备和临床协调,顺利完成了线上预答辩。答辩前答辩秘书提前10天通知提前测试视频软件同学们和导师远程试讲、修改报告答辩当天导师学生登录网络打开视频会议软件调试麦克风、摄像头准备屏幕共享答辩开始!虽然博士预答辩会从会议室搬到了线上,但是要求始终如一的严格,博士预答辩分为四个小组进行,各指导委员会成员全体参加了会议,对每位毕业生研究工作系统性和创新性,论文结构和内容等认真审核。视频会议过程中,为了保证会议效果,主持人根据现场情况协调安排。答辩学生报告时,答辩人打开摄像头,使答辩显得更正式,又增加了现场感。同时,关闭其他人员的麦克风避免干。答辩期间如遇卡顿,提示旁听人员关闭摄像头,答辩人重新进入解决卡顿现象。在光学所师生的共同努力下,本场特殊的线上预答辩会得以圆满结束。克服困难线上开学,居家上课的我们想必都想念过宿舍里成摞的文献和参考书都怀念过图书馆丰富的馆藏都惦记着学校高速的校园网而对于毕业班研究生而言实验室里的研究成果办公室电脑里的资料更是毕业征程上的不可或缺面对从家到学校遥远的距离机智的老师和学生们是这样解决的光学所博士生曹启韬主要研究非线性光学微腔中对称性破缺,包括回音壁微腔光场手征自发对称破缺研究、自发手征对称性破缺微腔激光、微腔表面对称破缺诱导的非线性光学效应等。在上述领域已取得多个重要的研究成果。疫情期间,他按照正常学习工作安排,每天坚持在家学习并进行博士论文撰写等工作。面对网络条件限制和资料查阅困难,他使用VPN远程连接实验室电脑,阅读文献并参与研究组内同学老师的学术讨论。博士生孙风潇主要开展在超导腔、腔光力、玻色-爱因斯坦凝聚等系统中,对宏观量子态相干与纠缠的调控性质的理论研究。居家期间,孙风潇远程连接北京大学物理学院的服务器,进行计算和数据处理工作,以解决家用电脑配置运行速度不够快、无法运行大量的计算程序的问题。光学所博士生王非凡刚刚结束在美国的半年交流,居家开始准备毕业论文。和导师面对面讨论交流的缺少,使得她一时间手足无措。其导师得知这一情况,每周和她讨论;实验室的同学们也通过学校的公共课平台和她交流,最终克服了毕业论文的总体结构构思上的困难。对毕业论文规划较晚的同学,不能返校导致对毕业论文影响颇大。博士生韩猛在导师的帮助下,远程登陆学校电脑,阅读和使用里面的资料数据。同时,导师一直与韩猛保持深入交流并对其论文提出了很多重要的修改意见。同学们更是伸出援手,同样今年毕业的博士生靳剑钊和王慕雪还无私地向韩猛分享了latex模板,助论文写作一臂之力。不同以往的毕业季停课不停学,停课不停研自新型冠状病毒疫情在多地发生后学校积极采取多项措施保障预毕业研究生培养工作的有序平稳开展全校各研究生培养单位制定了在疫情防控期间研究生培养及预毕业生工作方面的工作计划和安排学校及时发布《关于疫情防控期间预计7月毕业博士研究生学位论文全面审查(即预答辩)组织工作的通知》指导各院系开展预毕业研究生在线预答辩工作马克思主义学院思想政治教育研究所采取视频答辩和在线审议的方式,顺利完成了2020年思想政治教育专业博士学位论文的预答辩工作。为了做好线上预答辩,思想政治教育研究成立预答辩工作筹备小组,就答辩议程进行了多次沟通,并设计了预答辩工作流程和应急预案。还预先进行了视频互动演练,并多次测试了平台功能和网络环境,最终保障预答辩会议顺利进行。首次采用在线预答辩,需要克服技术难点、保证工作重点,教育学院组建了视频会议技术支持小组,制作了考生、秘书和评委视频会议系统使用手册;成立了答辩秘书工作群组,并对在线秘书统一培训,重点演示了在线匿名投票方法,为预答辩做好了充分的准备。近日,教育学院已圆满完成预答辩9场37人次,主席主持、考生汇报、评委提问、匿名投票、秘书协调、技术小组幕后保障,所有工作有条不紊,效果堪比现场。经济学院春季学期首场线上学位论文全面审查于近日完成。会议历时3个多小时,一共有5名参加预答辩的博士生同学,按照事先规定好的顺序和流程,利用线上系统的共享功能,依次进行了PPT展示,答辩委员提问,最后由答辩委员会通过现场讨论,经由预答辩秘书形成了对参加预答辩的博士生同学的审查意见。“本次网络视频预答辩完全遵照博士学位论文预答辩的要求、标准和流程规范进行。”参加预答辩的经济学院博士生韩晨宇说,“参与此次网络视频答辩是一种全新的体验,在答辩过程中与答辩委员会的老师们在线视频交流,感觉非常亲切,收获了很多宝贵的意见。感谢学院的精心组织,感谢各位老师和答辩秘书的辛勤工作,保证了此次预答辩的顺利完成。”各个研究生培养单位紧锣密鼓进行学位论文全面审查(即预答辩)工作预毕业研究生、导师、指导组成员多方联动,严格要求,精益求精视频预答辩程序严谨,步骤完备做好书面记录工作,严禁录音录像及时录入管理系统,做好备案工作关于2019-2020学年第二学期研究生学位论文答辩审批与学位审核工作安排的通知已于近日发布为尽可能降低疫情对研究生深造和就业的影响保障符合条件的研究生及时获得学位学校决定本学期毕业生的学位审核工作分两个批次开展将于7月3日和8月14日先后召开两次学位评定委员会会议审议学位克服困难,接受挑战在此种特殊情况我们戮力同心、共克时艰相约那场毕业典礼
导读自从国内某知名大学导员研究拉粑粑压水花引起热议后,网上也相继诞生了一批“屎尿屁专家”。虽然研究的内容有些不可描述,但是贴近生活,还能发掘生活中有趣的规律与哲理,让我们哈哈大笑的同时也在潜移默化地锻炼科研思维。其实生活中有很多这样的例子,比如小编偶然的机会看到一篇湖南大学的博士生毕业论文,题目叫《基于计算流体力学的虹吸式流道形状优化设计》,洋洋洒洒的写了167页,看摘要觉得非常厉害,下载了正文才发现后面重点研究的是抽水马桶?好奇心驱使我仔细阅读,然而最后是跪着看完的···那么作者到底做了什么能让小编如此膜拜?下面就让小编肤浅地为大家讲解一下这位博士的研究过程,搬好小板凳~基础理论首先来复习一下高中知识,大家还知道虹吸现象吗?简单来说是利用曲管将液体经过高处液面的地方引向低处的现象。如图1所示,一般来讲只要A、B之间有高度差,管内充满液体就能产生虹吸,使水在软管内流动,最终使A、B液面等高。图1 简单虹吸现象虹吸式流道是抽水马桶实现冲洗功能的核心结构,利用虹吸现象产生负压,使水流以较高速度流动,最终结果就是带走污物。研究目的及方法,万事开头难!虽然原理简单,但是要是应用到马桶上还是比较复杂的。流道内部流动的状况直接影响到工作性能,基于虹吸式流道内部流动状况的形状优化设计方法成为当前节水研究中最为关注的问题之一,这也是作者的切入点。那么问题来了,要想研究马桶必须要获得马桶的结构。市面上各种马桶形态千奇百怪,作者总结了主要有三大类:图2 马桶主要类型要进行深入研究只有三个马桶是不够的,作者购买了11款典型的坐便器作为分析对象。前面也说过我们想要知道内部流动状况,实际的马桶在冲水时我们是没办法观察到流场的,现在的主流研究方法之一就是数值模拟,用计算流体力学(简称CFD)方法可以模拟流道内的流体力学特征,如各处的速度、压力、气泡分布等。“逆向工程”,学术圈的“盗版”技术然而做模拟的前提是有几何模型,但是现在不知道几何参数,而且这种复杂的结构直接测量显然是不可能的,去问厂商?这应该涉及到内部技术,所以不会有厂商轻易透露。作者采用了一种非常直截了当、简单粗暴的方法,就是借助逆向工程技术进行几何重构。首先将完整的坐便器进行对称切割,再利用三维激光扫描仪对其进行扫描、测量,通过逆向工程软件lmageWere进行必要的后处理,得到抽水马桶形状的点云。图3 切割马桶,扫描得到点云有了点云就可以重建几何模型啦!使用软件Pro/ENGINEERWildfire 3.0重建坐便器CAD模型,图4是以虹吸式流道为例,通过得到的关键设计点(a)构建三维模型(b,c)。图4 利用关键点重建三维模型不得不说,这技术,马化腾都不得不佩服!坐便器内部的几何结构非常复杂,正是这些几何结构影响了不同品牌坐便器的性能,所以在需要确定要研究哪些几何参数。在AutoCad中测量在流体动力学上可能具有影响的参数,进行二维截面的统计分析,具体统计参数如图5。图5 数据统计分析图对11款坐便器都进行参数标定就可以提取到非常多的特征参数,如表1、2所示。表1 各特征点与进口距离分布表(mm)表2 虹吸式流道角度(°)和管径(mm)数值模拟,用0和1还原事物的本质?接下来终于可以顺利搭建CFD模型了。为了减少计算量,作者搭建了简化的二维几何模型,如图6所示。图6 简化的二维几何模型划分网格:图7 划分的网格然后设定边界条件和初始条件,由于流动过程属于湍流,考虑多种因素选择RNGk–ε模型。这又是一个典型的多相流问题,使用VOF方法求解气液两相流动的自由面(这里看不明白也没关系)。万事俱备,开始计算!现在搞模拟的被问的最多的一个问题就是:我怎么相信你的模拟结果是准确的?所以还需要做模型验证,通过实验来考察模拟结果的准确性。所以作者后来也开展了PIV实验,至于实验是怎么做的也非常有意思,我们后面会提到,先看模拟结果和实验结果对比:图8 完全虹吸阶段的流道内实验(a)和速度场实验数据和计算数据如图8所示,两者结果一致。实验和计算的最大速度值出现在相同图中标记的区域,分别为2.96m/s和2.94m/s,出现的时间都是在冲洗开始之后的1.8秒。再来看一定时间范围内的流场,图9是模拟结果和实验结果对比,可以看出模拟结果是非常贴近实验结果的,说明CFD模型是足够准确的。图9计算与实验的五个发展阶段的流态对比:启动阶段(a),溢流阶段(b),半虹吸阶段(c),完全虹吸阶段(d),断流(e)透过模拟和实验,作者发现抽水过程分为五个阶段:启动阶段、溢流阶段、半虹吸阶段、完全虹吸阶段和断流。(a)启动阶段的流态特征为水越过水封点开始从流道右侧溢流;(b)在溢流阶段,水箱中的水流入盆面,液面升高,促使流道内的水不断溢流;当溢流的水在流道的收缩口区域首次产生封闭水柱时,此时刻的虹吸并不明显,故称之为半虹吸状态;(c)随后产生的完全虹吸与半虹吸的区别主要在于,前者在流道的出水段产生了接近满管流的流动状态,气体以气泡的形式被水挟带出流道,并且流速快速增加;(d)当盆面的水不足于持续供应流道中的虹吸时,流道内的水柱发生断流,虹吸现象随之结束。好了,现在我们知道CFD模拟结果是准确的了,而且对整个冲水过程也有了整体理解,现在可以做一些优化。要知道一旦建立起CFD模型,在做几何优化时只需要调整几何模型结构和网格,就可以重新计算得到结果了,相对来讲比较方便快捷。作者调整了很多结构参数,也定义了很多评价标准,如截面负压、累计负压、用水量等,这里我们只展示一个方面的优化。图10是未优化前流道的压力云图(a)和速度流线图(b),标记区域的最大负压值达到-3.2×103 Pa。流线图中呈现出明显的大尺度漩涡,速度主要集中在1.03~2.22 m/s。从流态上观察,整个流动过程几乎都是溢流过程,没有强烈的虹吸现象发生。图10 原有流道1.700s时的压强(a),速度流线(b),新设计流道1.550s时的压强(c),速度流线(d)对曲率参差不齐的轮廓进行重建修改,使之更光滑后模拟结果如图10(c)、(d)所示,可以看到标记区域中最大负压值增加到-4.04×103Pa。流线显示漩涡相对减少,尺度变小,速度则相对原始流道增加到了1.51~2.83 m/s。观察到的虹吸现象比原来发生的更早,更强烈,这说明新设计的流道性能更好。其他方面的优化这里就不做展示啦,我们继续向下跟着作者的思路走~神经网络,还有你不能干的事情吗?尽管我们现在能够依靠CFD模拟做一些局部改进和优化,但是流道的几何实在是太复杂多变了,做系统的分析与优化只依靠CFD是不可以的,因为单次计算往往需要数个小时,而若做实验,因为需要打造模具、调试装置等花费的时间更长,还要砸很多钱。现在我们已经有了较为丰富的模拟或实验获得的流场数据,依靠神经网络来建立设计变量与目标之间的函数看起来十分可行,只要得到函数关系,我们改变某一变量便能迅速得到结果。相信看过前面讲人工智能的推送应该对神经网络有了初步认识,这里不做过多介绍。作者挑选了两个较为重要的结构参数:出水流道直径和弯道半径作为输入,累积负压(虹吸性能的一个较佳评判标准)作为输出。训练神经网络需要选择大部分数据作为训练样本来“调教”,选一小部分数据作为测试样本,来验证训练结果的泛化能力。作者最初选用的是L-M神经网络。但是研究发现隐藏层数太少,训练样本拟合程度不高,结果也预测不准确,而增加隐藏层数后训练样本数据拟合的非常好,但是预测结果与测试样本的偏差较大,即出现了过拟合现象,丧失了泛化能力。这可能是在训练神经网络时使网络记住了不必要的细节,网络将包含噪声的数据都记录下来,这样对于新的数据不能给出正确的输出,也即不具备很好的泛化能力。于是作者采用了贝叶斯正则化方法,建立贝叶斯神经网络模型,以避免网络的过度拟合问题,提高网络的泛化能力,为虹吸式流道的优化设计提供较好的虹吸性能预测功能。图11两种神经网络结果对比图11是贝叶斯神经网络和表现较好的L-M神经网络对比,可以看出贝叶斯网络虽然训练样本拟合能力较差,但是使用测试样本对未在训练样本中出现的输入进行测试时,显示出很好的泛化能力。基于神经网络,我们得到了累积负压和弯管半径R、出水段直径D之间的函数关系,如图12所示。图12 贝叶斯神经网络仿真的结果总结回顾,但远没有结束现在已经讲了不少东西了,为了理清思路,我们来总结回顾一下前面的工作。实际上我们完全已经构建了一个基于CFD和神经网络的优化设计平台,如图13示,这一整套方法可对马桶结构进行优化而避免长时间的运算和复杂的实验。图13 基于CFD和ANN的形状优化设计平台PIV实验,光影下捕捉海量信息但是我们还是需要验证我们的CFD计算结果,以及神经网络模型是否准确,所以开展实验,将实验结果和平台得到结果进行对比。在最后,我们将重点放在作者是如何进行实验的。图14 PIV实验系统作者采用的是粒子图像测速法(Particle Image Velocimetry,PIV),原理是在流体介质中均匀散布跟随性、反光性良好、比重与流体相当的示踪粒子,通过脉冲激光系统和透镜形成片光源透射到待测流场区域,在时间同步器协调控制下,CCD相机利用示踪粒子对激光的散射作用,记录极小时间间隔的两次脉冲激光曝光时的粒子图像,形成一对PIV底片,通过后处理就可以得到粒子的位移的大小和方向,对于非稳态流动过程,对同一位置可拍摄多对曝光图片,这样便能够全面地反映出整个流动过程的流动状态。PIV系统要求实验对象要透光,所以作者制作了有机玻璃的流道替换原来的陶瓷结构。图15 脉冲激光投射状况,竟然有点魔幻图16、17为实验结果,图16中反光的像素为流动过程中的水和空气充分混合产生的大量气泡,17为后处理得到的速度场和流线图。图16脉冲激光投射下间隔40 ns的双曝光图像图17 PIV实验结果的速度场和流线图PIV实验对CFD模型的验证在最开始我们已经讨论过了,这里不再赘述。前面也提到过开展实验费时又费钱,流道的几何结构复杂多变,制作许多上面这种有机玻璃模型太难了,所以作者基于几何相似准则和动力相似准则开发了一套简单易行的可调整实验模具,在能得到准确结果的前提下大大节约了时间和成本。这套模具使用了两块有机玻璃板,板上有数个定位孔,在需要弯曲成形的部位插入螺钉,相邻的螺钉加紧弹性塑料板,则可以形成需要的形状,最后再做好密封,如图18示。图18 可调变流道装置有了这个装置,就不需要再制作有机玻璃模具,想要啥形状很快就能做出来,而且做结构优化调整也很方便。接下来开展一系列实验,图19是虹吸过程5个阶段的实验实拍图。图19 虹吸过程的5个阶段实验实拍上图的实验是对结构做出优化调整后的节水实验,采用的国标方法,用PP球测试冲洗效果。实验结论这里就不详细复述了,有兴趣的可以看源文献。结语怎么样?是不是没想到研究马桶还有这么多手段?看完之后有没有受到启发?其实作者这套方法在其他领域也有很好的应用,如流化床的研究往往也是通过PIV实验+数值模拟来进行的,还需要编写算法来处理海量数据。希望这篇推送能激发你的科研兴趣,无论是数值模拟、还是PIV实验,亦或是神经网络!后台回复“虹吸”获取源文献和《GB6952-2015 卫生陶瓷》国家标准~不知道大家还对什么感兴趣?欢迎留言!参考文献:[1]彭志威.基于计算流体力学的虹吸式流道形状优化设计[D].湖南大学,2009.文章转载已获授权
昨天,顶级计算图形学机构 ACM SIGGRAPH 颁发了 2019 年最佳博士论文奖。获奖者闫令琪博士毕业于加州大学伯克利分校(UC Berkeley),目前已是加州大学圣巴巴拉分校(UCSB)的一名助理教授。他的博士论文颁奖词是这么说的:「他的论文每章都可以自成一篇博士论文。」从高考状元到计算机科学「学神」,闫令琪博士的学术成就与贡献还不止于此。英伟达最新的 RTX 系列显卡使用的「光线追踪技术」就是源自于闫令琪等人的研究。从高考状元到 CS 学神闫令琪于 2018 年 9 月起任加州大学圣巴巴拉分校助理教授,在此之前他在 2018 年获得了加州大学伯克利分校的博士学位,导师为 Ravi Ramamoorthi。在 2013 年,他获得了清华大学计算机系学士学位。在伯克利毕业之前,人们对闫令琪的印象或许更多的是「2009 年安徽省阜阳高考状元」,他的高考分数为 695 分,名列全省第二。他曾在总结自己高中学习方法时表示:目标性、计划性、劳逸结合是几个重点。「首先要清楚自己的实力。」要想有一个理想的分数,就不能无谓失分,在平时练习时,不要放过任何一个小错误。例如数学选择题,一旦做错了一道题,就要逼迫自己去多做几题「长记性」。时间分配上,闫令琪认为在校时间要合理利用,不能一味注重数理化,而忽视了语文和英语;一天的劳累学习后,回到家里可以适当放松,劳逸结合才能有好的学习效果。闫令琪特别提到不要做无用功。例如数学大题中的三角函数、立体几何等题没有太多花样,对于这类题,只要知道思路,无需浪费太多时间。对于数学试卷的最后一题,要会在做题的同时总结方法;而对于基础题注重运算能力,切勿粗心而丢分。据说,闫令琪在高中时代是一个特别会玩的学生。紧张的高考前夕,他每天玩游戏的时间都在 1 个小时以上,而他当时的目标就是考取清华大学计算机系。进入 UC Berkeley 之后,闫令琪的主要研究方向是基于物理的真实感图形渲染及其相关的数学和物理理论,具体包括基于微观细节的材质观测和建模、离线和实时光线追踪、信号的采样和重建、高效的光线传播和散射等等。作为一名优秀的研究者,他开创并启发了一系列下一代计算机图形学的研究方向,如高度细致的渲染和实时光线追踪。闫令琪曾于 2018 年因开创性的研究被授予 C.V. Ramamoorthy 杰出科研奖 —— 这是历史上首位获奖的华人。此外,他的科研成果还被直接应用于电影和游戏业,曾帮助影片《猩球崛起 3:终极之战》于 2018 年获得奥斯卡最佳视觉效果奖提名。最佳博士论文奖有着开创新领域的贡献,闫令琪获得最佳博士论文奖着实让人感到实至名归。ACM SIGGRAPH 对于闫令琪的论文有很高的评价:闫令琪的论文以统一、综合的视角介绍了计算机图形渲染视觉外观建模。每个章节都能独立成为一篇博士论文的主题。该研究生成的惊艳视觉图像,成为了近期 SIGGRAPH 大会上的亮点,也为产业带来了极大的实用性影响。闫令琪发表过 7 篇有关图形学的 SIGGRAPH 和 ACM Transactions 一作论文,这是前所未有的。该论文为三大领域提供了突破性贡献:镜面微观结构或者微光(glints)建模、皮毛反射(fur reflectance)和快速在论文第二章中,闫令琪开发了一个动物皮毛模型,并用测量与模拟方法进行了测试(简化、泛化了该模型),作者也展示了如何用它完成全局光照计算。该技术被 Weta Digital 用于电影「猩球崛起 3:终极之战」。第三章节内容有关全局光照,展示了对蒙特卡洛渲染去噪方法的重大突破,也介绍了其他基于滤波的去噪方法。这些以及其他相关的研究启发了当前蒙特卡洛采样方法和去噪管道,包括英伟达最新的软件(Optix5,2017)和硬件(RTX GPU,2018),使得实时光线追踪首次成为可能。英伟达 RTX 系列芯片可以实现前所未有的视觉体验,我们还记得黄仁勋在 GTC 大会上的介绍:它可以在游戏中呈现不同材质的反光,以及反光的反光,实现电影级的效果。闫令琪在解决这一领域的开放问题上做了许多工作,他从全新的方向解决计算机图形的问题,超越了传统认为不可能的范围。在这个过程中,他打开了新的子领域,变革了我们当前对渲染、视觉外观、生成全新图像的的认知。闫令琪已经发表了十几篇有关图形学的 SIGGRAPH 和 Transactions 论文。SIGGRAPH 社区以 2019 ACM SIGGRAPH 博士论文奖表彰他取得的卓越成就,也期待未来他能作出更多惊艳的成果。开天辟地的研究让我们看看闫令琪的博士论文《Physically-based Modeling and Rendering of Complex Visual Appearance》究竟讲了什么:论文链接:https://sites.cs.ucsb.e/~lingqi/publications/thesis_final.pdf在这篇论文中,我们主要研究物体渲染,这种渲染能够根据 3D 模型和场景合成图像。当前最先进的渲染技术仍要面临两个基本的挑战:真实感和速度。渲染结果能看出来是人工生成的,过于完美,反而失真;而且渲染过程太慢,无论是对于离线还是交互式应用程序来说。此外,更佳的真实感和更快的速度本质上就是矛盾的,因为当渲染试图产生保真度更高的详细结果时,计算复杂度会大量增加。为了兼顾二者,本文引入了细节渲染和外观建模的概念,准确展示和复现从微米级到整体外观的丰富视觉世界,并将稀疏光线采样与快速高维滤波相结合,从而实现实时性。为了使渲染更加真实,我们首先强调的是细节。但是,渲染具有大量细节的复杂表面绝非易事。传统上,表面的微观结构是通过平滑的正态分布近似得到的,但这样容易忽略细节,比如在现实世界中容易观察到的微光效果。虽然建模实际的表面微观结构是可能做到的,但使用蒙特卡洛点采样方法会导致成本高昂的问题:能量会集中在微小亮点上,而这种微小亮点只占据了像素的极小部分。相反,我们使用完全不同的确定性方法来计算蒙特卡洛最终会收敛到的准确解。我们的方法考虑了通过单个像素看到的表面上高度复杂的法线分布。假设表面分别是由 2D 平面三角形或 4D 高斯元素组成,我们展示了用封闭形式解有效评估这一点的不同方法。我们还展示了如何扩展该方法来准确处理波动光学。我们的研究结果显示,非平滑的塑料、刷过或刮过的金属、金属漆和海浪等材料会产生复杂的、随时间变化的微光。如上所述,尽管渲染细节带来了许多挑战,但我们假设自己知道表面是如何反射光的。然而,现实世界中有大量的自然材料,我们并不知道它们与光交互的准确方式。为了真实地渲染这些材料,我们需要从微观结构中导出准确的外观 / 反射模型来定义它们的光学行为。我们在第四章中通过引入动物皮毛的反射模型证实了这一点。渲染逼真的动物皮毛是计算机图形学领域的一道长期难题。人们在建模人类毛发的几何复杂性方面已经取得了相当大的成就,但毛发纤维的外观 / 反射却还无法很好地理解。基于解剖学文献和测量,我们开发了一个单根毛发纤维反射的双筒模型,其中外筒表示对被多个角质层覆盖的皮层的生物观察,内层表示散射内部结构(被称为延髓),人类毛发纤维中通常不存在这个。我们通过对真实毛发纤维的测量来验证物理模型,并引入了计算机图形学中的第一个数据库,用于 9 个皮毛样本的反射剖面。为了有效进行渲染,我们开发了一种方法来预先计算 2D 延髓散射轮廓,并且用因子化波瓣(factored lobes)来近似反射模型。我们还开发了许多优化方法,在不损失准确率的情况下提升效率和通用性。另外,我们还提出了首个全局光照模型,基于用于表面散射的偶极扩散(dipole diffusion),通过将复杂的光和毛发交互建模为次表面散射,并且用简单的神经网络将毛发纤维的特性转换为散射参数,来近似单个毛发纤维之间的光反弹。然而,如果没有这些细节来改善渲染的真实感,使用当前最先进的蒙特卡洛射线追踪的渲染方法性能依旧低下。物理上正确、无噪声的图像每个像素可能需要数百或数千个光线样本,并且需要很长时间来计算。最近的方法利用了稀疏采样和滤波。滤波方法虽然很快(轴对齐),但需要更多输入样本,或者说输入样本过少速度又会非常慢(剪切)。在第 5 章 [143] 中,我们提出了一种在 GPU 上进行快速剪切滤波的新方法。我们的算法将 4D 剪切滤波器分解为 4 个 1D 滤波器。我们推导出该方法的复杂边界,结果显示每像素复杂度从减少到 O(nl),其中 n 是线性滤波器宽度(滤波器大小为 O (n^2)),l 是(通常非常小)每个像素的光或透镜的每个维度的样本数量(spp 是 l^2)。因此,我们大大减少了剪切滤波开销。论文中,我们展示了如何以交互式的速度渲染景深、柔和阴影和漫射全局光照。论文模型生成场景的静止帧。期待闫令琪博士未来的更多新研究。值得一提的是,去年的 ACM SIGGRAPH 最佳博士论文奖也是由来自加州大学伯克利分校的华人朱俊彦获得,参见:别人的博士生涯!CycleGAN 作者朱俊彦获 SIGGRAPH 杰出博士论文奖。参考链接:https://www.siggraph.org/2019-outstanding-doctoral-dissertation-award-lingqi-yan/https://sites.cs.ucsb.e/~lingqi/
今年8月,杭州师范大学在职教师郭彦努被指涉论文抄袭一事引发关注。最近,后续来了!南京艺术学院:撤销郭彦努艺术学博士学位11月,郭彦努的毕业院校南京艺术学院亦因其论文存在抄袭、剽窃决定撤销她的博士学位。南京艺术学院官网消息显示,该学院研究生处11月9日发布《撤销学位公告》称,郭彦努,女,于2019年6月获得我校艺术学博士学位。经校学术委员会调查核实,认定郭彦努的博士学位论文《祁彪佳的园林世界》和其期刊论文《绍兴石宕园林研究——以羊山石佛寺为例》存在多处抄袭、剽窃现象,情节严重。前述公告称,根据《中华人民共和国学位条例》第十七条、《学位论文作假行为处理办法》(教育部令第34号)第七条、《高等学校预防与处理学术不端行为办法》(教育部令第40号)第二十九条、《南京艺术学院学位授予工作细则》(南艺院发〔2004〕72号)第五条的有关规定,经2020年10月14日校第九届学位评定委员会审议表决通过,决定撤销郭彦努艺术学博士学位,注销其博士学位证书(学位证书编号:1033122019000031),原学位证书作废。此前报道今年8月,杭州师范大学博士郭彦努发表的文章《绍兴石宕园林研究,以羊山石佛寺为例》被指抄袭豆瓣博主“心匠”的文章《深山藏古寺(八),古宕石佛寺》。8月19日,杭州师范大学官方微博发布通报称,对近期关于学校教师郭彦努公开发表文章《绍兴石宕园林研究—以羊山石佛寺为例》(论文署名单位非杭师大)存在抄袭现象的反映,经学校学术道德委员会调查,认为相关情况基本属实,其行为违反学术道德。随后,杭州智慧人才平台发布《关于取消郭彦努E类人才资格的通报》。通报称,根据《杭州市高层次人才分类认定办法(试行)》的有关规定和杭州师范大学对郭彦努公开发表文章存在抄袭现象的调查处理情况,取消郭彦努E类人才资格。来源:中国青年报综合自南京艺术学院官网、澎湃新闻、扬子晚报·紫牛新闻及中青报官微此前报道留言爆料欢迎广大网友爆料,无论是校园新鲜事、突发事、烦心事,还是好人好事、暖心事,欢迎文末留言,并附上您的联系方式。我们会保护您的隐私,如有需要将化名采访。中国青年网青小小一直在你身边。合作电话:010-64098582
近日,华东师范大学召开了研究生教育大会,对于研究生培养,特别是博士的培养制定了新方案,比如扩大本科生直博的比例、鼓励博士提前毕业,促进按期毕业、学校不对博士生科研发表作统一要求等。图源官网我们一起来看看具体的方案内容:1、在招生质量提升方面,指出扩大本科直博生比例,健全科研项目博士生招生培养制度。2、弹性学制改革行动计划方面,指出打破修读年限限制,鼓励优秀博士生提前毕业,此外把学术硕士研究生作为博士生预备阶段。3、博士学位论文质量提升行动计划方面,为破五唯,学校不对博士生科研发表作统一要求,根据双一流建设所需,合理制定符合本学科专业特点和人才培养目标的多元化创新科研成果要求,同时鼓励支持博士生在交叉、冷门、独学、绝学领域选择重大原创性论文选题。4、按期毕业行动计划方面,提高博士论文质量,论文全过程严格管理,促进按期毕业。图源官网对博士培养及毕业提出了新方案,那么势必对导师也有新要求,严格控制导师在读博士生数量和年度招生数量,四年内无新立项项目或成果不达标的导师暂停招生,此外,实行副导师制度,支持导师跨学科、跨单位联合培养指导。同时,为促进博士按期毕业,按期毕业情况将纳入导师考核评估系统中。最后,虽然看似博士毕业容易了,对论文不作统一要求,实则更加注重创新,毕业放权于导师,对导师的要求高了,博士生毕业的要求就不会低,因此可能毕业要求会更高。华东师范大学不是国内高校第一家,已有部分学校实施了相关的政策,大家对此怎么看?欢迎交流!
机器之心发布机器之心编辑部自然语言处理(Natural Language Processing)是人工智能的核心问题之一,旨在让计算机理解语言,实现人与计算机之间用自然语言进行通信。阿尔伯塔大学(University of Alberta)刘邦博士在他的毕业论文《Natural Language Processing and Text Mining with Graph-Structured Representations》中,对基于图结构(graph-structured representations)的自然语言处理和文本挖掘进行了深入研究。这篇博士论文将自然语言处理和文本挖掘的多个核心任务与图结构的强大表示能力结合起来,从而充分利用深度学习的表示能力和文本中的结构信息来解决诸多问题:(1)组织信息(Information Organization):提出了基于树/图结构的短文本/长文本对的分解算法以提高语意匹配任务(semantic matching)。基于文本匹配,进一步提出事件粒度的新闻聚类和组织系统 Story Forest;(2)推荐信息(Information Recommendation):提出了 ConcepT 概念挖掘系统以及 GIANT 系统,用于构建建模用户兴趣点以及长短文本主题的图谱(Ontology)。构建的兴趣图谱 Attention Ontology 有助于对用户与文本的理解,并显著提高推荐系统的效果;(3)理解信息(Information Comprehension):提出了 ACS-Aware Question Generation 系统,用于从无标注的文本中生成高质量的问答对,大大降低问答系统的数据集构建成本,并有助于提高阅读理解系统的效果。论文链接:https://sites.ualberta.ca/~bang3/files/PhD-Thesis.pdf引言自然语言处理(NLP)旨在读取和理解未结构化的自然语言文本来完成不同的任务。「如何表示文本」以及「如何进行计算」是其中的两个核心问题。早期的 NLP 研究中,利用 bag-of-words 模型表示文本,通过统计不同单词的频次来形成文本的向量表示,同时结合统计方法进行文本处理,这丢失了文本的词序信息以及单词之间的联系,本质上是用 one hot encoding 来表示每个单词;在深度学习中,研究者根据单词的共现来学习词向量,每个单词由一个 dense vector 表示,语意相似或联系紧密的词在向量空间中距离更小,再结合 RNN 模型(LSTM,GRU 等)进行文本编码完成各种任务;其后又有研究工作将文本类比图像,编码形成矩阵表示,结合 CNN 类模型进行计算;近年来,预训练语言模型,利用自监督学习训练各类大型语言模型,从而给单词或文本赋予上下文敏感的(context-sensitive),多层的语义向量表示,其采用的模型是多层的 Transformer。自然语言的形式及其语意具有层次性(hierarchical),组合性(compositional)和灵活性(flexible)。已有的研究并未充分利用各类文本中存在的语义结构。图(graph)是一种通用且强大的表示形式,可以表达各种不同对象以及它们之间的联系,无论是在自然语言处理,还是在社交网络,现实世界等各种场景都无处不在。本论文在深度学习强大的表示学习能力的基础上,设计并结合了不同的文本的图结构化表示,并利用图结构计算模型,例如图神经网络(Graph Neural Networks), 去解决不同的自然语言处理和文本挖掘问题。论文包含三大部分:第一部分介绍了文本的聚类和匹配,提出各类匹配问题的结构化算法,并进一步提出 Story Forest 系统用于新闻事件的聚类组织和结构化表示。该系统落地到腾讯 QQ 浏览器热点事件挖掘。第二部分关注文本挖掘,提出了 Attention Ontology 兴趣图谱,挖掘和描述用户不同粒度的兴趣点,建立不同兴趣点之间的联系,并可用于刻画文章主题。这部分工作显著提高了 QQ 浏览器,手机 QQ,微信等应用中的信息流推荐系统的效果。第三部分关注文本生成,提出了 ACS-QG 系统,自动从无标注文本中生成高质量的问答对,可用于问答系统的训练,有助于大大减少数据集创建成本,以及提高机器阅读理解的能力。图 1. 文本表示形式以及计算模型的演化图 2. 论文的组成框架第一部分:文本的匹配与聚类第三章 Story Forest 事件聚类组织系统在信息爆炸的年代,查询并找到有价值的信息,对用户而言并不是非常简单的任务。目前的搜索引擎或者信息流服务,会给用户提供一个文章列表。这些新闻文章会包含大量冗余信息,缺乏结构化的组织。本文提出 Story Forest 系统,对新闻文章做事件(event)粒度的聚类,使得报道同一个现实中的事件的不同文章聚类成一个节点,相关联的事件形成结构化的故事树(story tree), 来表征关联事件之间的时间顺序和发展关系。图 3.「2016 年美国总统大选」的故事树,树中的每一个节点代表一个事件已有的文本聚类方法不能很好地对文章进行事件粒度的聚类效果。本文提出 EventX 聚类算法,它是一种双层聚类算法:在第一层聚类中,利用所有文章中的关键词,形成关键词网络(Keyword Graph)并对其进行图分割,分割后的每一个关键词子图,代表一个大的话题,再利用相似度将每篇文章分配到一个最相似的关键词子图之下;在第二层聚类中,每一个关键词子图下的文章形成一个文章图(doc graph), 相连的边代表两篇文章讲述同一个事件,再对文章图进行社区检测(community detection),从而做了第二次聚类。每一个文章子图里的文章代表一个事件。通过双层聚类,即可以对文章对之间做细粒度的语义比较,又可以控制时间复杂度。在得到事件聚类之后,不同的事件节点通过故事结构组织算法,在线插入到已有的故事树中形成故事结构。如果一个事件不属于任何已有的故事树,则形成一个新的故事。图 4. Story Forest 系统以及 EventX 聚类算法第四章 基于图分解和图卷积的长文本匹配文本匹配是判断两个文本之间的关系或者相关度,是 NLP 中的核心问题,有很多的任务其核心都可视为一个文本匹配任务。根据匹配的源文本和目标文本的长短,我们可以将文本匹配任务分成四大类:长文本匹配任务,例如 Story Forest 系统中,一个核心的任务是判断两个文章是否在讲同一个事件;短-长文本匹配,例如输入 query 搜索匹配的文章;短文本匹配,例如问答对匹配,句子对相似度衡量等;长-短文本匹配,例如文本主题分类等等。图 5. 根据源文本和目标文本的长短,将不同文本匹配任务分成四类本章专注于长文本匹配任务,这是很重要的研究问题,然而在此之前,很少的研究工作专注于此。已有的算法基于 Siamese Neural Network 或者 CNN 来编码句子对或者句子之间的交互,无法很好的处理长文本匹配的任务。因为长文本的长度,导致计算复杂度较高;语言的灵活性,导致文本对之间对应的内容难以对齐;同时编码器也难以准确地编码长文本的语义。本文提出 Concept Interaction Graph 用于分解一篇或者一对文章。其主要思想是「化整为零,分而治之」。CIG 中的每个节点包含几个高度关联的关键字,以及和这些关键字高度相关的句子集。当进行文本对匹配时,每个节点包含来自两篇文章的两个句子集。这样,多个节点代表了两篇文章中的不同的子话题,并囊括了文章中的一部分句子并进行了对齐。节点之间的边代表不同子话题之间的联系紧密度。图 6. 根据文章构建 Concept Interaction Graph 的 toy example基于 Concept Interaction Graph,论文进一步提出通过图神经网络(Graph Neural Networks)对文本对进行局部和全局匹配。具体而言,对每个节点上的文本对,利用编码器进行局部匹配,从而将长文本匹配转化为节点上的短文本匹配;再通过图神经网络来将文章结构信息嵌入到匹配结果中,综合所有的局部匹配结果,来得到全局匹配的结果。图 7. 基于 Concept Interaction Graph 和图卷积神经网络的长文本匹配第五章 基于层次化分解和对齐的短文本匹配对于短文本匹配,论文提出了层次化句子分解(Hierarchical Sentence Factorization)来将句子分解为多层的表达,每一层都包含完整的所有单词,并且语句重排列为「predicate-argument」的顺序。随着层数的增加,一个句子逐渐被分解为更加细粒度的语义单元。因此,利用这种多层次,重排序的句子表示,我们可以对齐两个句子,并结合不同的语义粒度去比较他们的语义距离。图 8. 基于层次化句子分解(Hierarchical Sentence Factorization)的句子匹配这种句子分解技术利用了 Abstract Meaning Representation 来对句子做 semantic parsing。然后,它通过一系列的操作,使得每一层都包含句子中的所有单词。对于每一个语义单元,都是谓词(predicate)在前,参数(argument)在后。这种表示充分展现了自然语言的层次性,组合性,并利用归一化的词序来克服自然语言表达的灵活顺序。基于句子的层次分解,论文进一步提出无监督的 Ordered Word Mover's Distance, 结合了最优传输理论的思想去建模句子之间的语义距离。其效果经试验验证显著优于 Word Mover's Distance。同时,论文也提出了将句子的多语义粒度表达,应用于不同的文本匹配模型中,例如 Siamese Neural Networks 中。实验证明,多粒度的匹配效果,显著优于只利用原句进行匹配的效果。第二部分:文本挖掘第六章 ConcepT 概念挖掘系统概念蕴涵了世界的知识,促进了人类的认知过程。从文档中提取概念并构建它们之间的联系对于文本理解以及下游任务有着重要的作用。认识「概念」(concept)是人类认识世界的重要基石。例如,当看到本田思域(Honda Civic)或者现代伊兰特(Hyundai Elantra)时,人们可以联想到「油耗低的车」或者「经济型车」这类的概念,并且能进而联想到福特福克斯(Ford Focus)或者尼桑 Versa(Nissan Versa)等车型。图 9. 人类能对事物进行概念化并产生联想过去的研究工作,包括 DBPedia, YAGO, Probase 等等知识图谱或者概念库,从维基百科或者网页文章中提取各种不同的概念。但是这样提取的概念和用户的认知视角并不一致。例如,与其认识到丰田 4Runner 是一款丰田 SUV 或者说是一种汽车,我们更感兴趣是否能把它概念化为「底盘高的汽车」或者「越野型汽车」。类似地,如果一篇文章在讨论《简爱》,《呼啸山庄》,《了不起的盖斯比》等电影,如果我们能认识到它在讨论「小说改编的电影」这个概念,那么会帮助极大。然而,目前的知识图谱等工作目的是建立一个关于这个世界的结构化知识表示,概念提取自语法严谨的文章。因此,它们不能从用户的视角去对文本(例如 query 和 document)进行概念化,从而理解用户的意图。另一方面,目前的工作也主要在于提取长期稳定的概念,难以提取短时间出现的热门概念以(例如「贺岁大片」,「2019 七月新番」)及它们之间的联系。我们提出了 ConcepT 概念挖掘系统,用以提取符合用户兴趣和认知粒度的概念。与以往工作不同的是,ConcepT 系统从大量的用户 query 搜索点击日志中提取概念,并进一步将主题,概念,和实体联系在一起,构成一个分层级的认知系统。目前,ConcepT 被部署在腾讯 QQ 浏览器中,用以挖掘不同的概念,增强对用户 query 意图的理解和对长文章的主题刻画,并支持搜索推荐等业务。目前它已经提取了超过 20 万高质量的基于用户视角的概念,并以每天挖掘超过 11000 个新概念的速度在不断成长。ConcepT 系统的核心算法架构同样适用于英语等其他语言。图 10. ConceptT 概念挖掘流程:从用户搜索点击日志中挖掘概念ConcepT 系统还可以用于给文章打上概念标签。主要包含两种策略:基于匹配的标记算法和基于概率推断的标记算法。图 11. ConcepT 文章标记流程:将文章打上关联的概念标签图 12. ConcepT 系统从用户搜索 query 中提取的概念展示图 13. 在线 A/B test 结果。ConcepT 系统对 QQ 浏览器信息流业务各项指标有明显提升。其中最重要的指标曝光效率(IE)相对提升了 6.01%。图 14. ConcepT 系统对文章打上概念标签。目前每天可处理 96700 篇文章,其中约 35% 可以打上概念标签。我们创建了一个包含 11547 篇文章的概念标记数据用以评测标记的准确率。人工评测发现,目前系统的标记准确度达 96%。第七章 用户兴趣点建模 Attention Ontology上一章中,我们介绍了概念挖掘系统。为了更加全面的刻画用户兴趣点,我们进一步挖掘包括概念(concept)和事件(event),话题(topic)等等在内的多种短语,并和预定义的主题(category)以及实体库中的实体(entity)等形成上下位等关系。我们将这个包含多种节点,多种边关系,用于用户兴趣点或关注点建模的图谱命名为 Attention Ontology。图 15. Attention Ontology,包含五种节点,代表不同语义粒度的用户兴趣点;三种关系,代表节点之间的上下位,包含,以及关联。Attention Ontology 可以解决「推荐不准」和「推荐单调」的问题。例如:当一个用户看了关于「英国首相特蕾莎梅辞职讲话」的文章后,目前基于关键词的推荐系统可能会识别关键词「特蕾莎梅」,从而推荐给用户很多关于特蕾莎梅的文章。然而这大概率并不是用户的兴趣点。这是「推荐不准」的问题,原因在于系统中缺乏或无法识别合适粒度的兴趣点。另一方面,系统也可能继续推荐更多关于「英国首相特蕾莎梅发表演讲」的文章,这些文章与用户已经浏览过的文章产生了冗余,无法带给用户更多有价值的信息,因此用户也不感兴趣。这是「推荐单调」的问题,而这个问题的本质在于缺乏不同兴趣点之间的联系。Attention Ontology 中包含不同粒度的用户兴趣点,并且不同的节点之间有边来表示它们之间的联系。例如根据 Attention Ontology,我们可以认识到「特蕾莎梅辞职讲话」是和「英国脱欧」这一中等粒度的兴趣点相关的。如果用户浏览了「英国脱欧」这一兴趣点下的不同事件的文章,我们便可以识别出用户不是关注「特蕾莎梅」这个人或者「特蕾莎梅辞职演讲」这一个特定事件,而是关心「英国脱欧」这一话题。而另一方面,知道了用户关注这一话题之后,利用不同兴趣点之间的联系,我们可以给用户推荐相关的文章,从而解决推荐不准和推荐单调的问题。为了挖掘不同性质的短语,如概念和事件短语,论文提出了 Query-Title Interaction Graph(QTIG)用于建模 query 文章 title 之间的联系。这种表示结构将不同 query 和 title 之间的对齐信息,词的 tag,词之间的距离,语法依赖等等信息嵌入在节点特征和边的特征中。利用这种表示,论文进一步提出 GCTSP-Net 模型,将短语挖掘问题建模为「节点分类+节点排序」的问题。该模型对 QTIG 进行节点二分类,抽取出属于目标短语的词;再将节点排序建模为一个旅行商问题,寻找一个最优路径将所有的分类为正的节点进行排序。按照得到的路径,将分类为正的节点串联起来,便得到了输出短语。图 16. Query-Title Interaction Graph. 图中绿色节点为属于输出短语的词。每一个节点代表 query 或 title 中的一个独特的词,边代表两个词相邻或者存在语法依赖。论文设计并实现了构建 Attention Ontology 并将其应用在不同应用中的 GIANT 系统。GIANT 系统包含几大模块:首先,根据用户的搜索 query 和点击日志形成的二分图,来进行聚类得到不同的 query-doc clusters。每个 query-doc cluster 包含一个或多个相似的 query,以及他们的 top 点击的文章。对每一个 query-doc cluster, 我们将其转化为 Query-Title Interaction Graph 表示,并利用 GCTSP-Net 抽取潜在的短语。接下来,我们再利用不同的算法去抽取不同短语之间的关系,形成 Attention Ontology。最后,利用 Attention Ontology 去实现多种应用,包括文章的 tagging,query 的概念化,文本的聚类组织等。同时,Attention Ontology 中的节点可用于在用户画像中描述用户的兴趣点。这样可以提高用户和其感兴趣的文章之间的匹配,从而提高推荐系统的效果。图 17. GIANT 系统架构第三部分:文本生成第八-九章 问答对自动生成问题生成是一种非常重要的文本生成问题,它可以应用在问答系统的训练数据生成,对话系统,教育等等应用中。图 18. 问题生成的不同应用及重要性已有的问题生成系统一般给定一句话和一个答案,要求系统生成某个特定的问题。这种系统属于 answer-aware question generation 系统。然而,它们生成的问题质量并不够好。一个核心问题在于,给定输入的句子和一个答案,我们能问出多个不同的并且合理的问题,是「一对多匹配(one-to-many mapping)」,而训练集中每个输入只有一个标准答案,是「一对一匹配(one-to-one mapping)」。图 19. 根据同样的输入可以问不同的问题本文提出 answer-clue-style aware question generation(ACS-QG)任务,将人提问的过程建模成四步:第一,根据输入选择一部分作为答案(answer);第二,选择一部分和答案相关的信息作为线索(clue)在问题中复述或转述;第三,根据答案选择问题的种类(style),例如 who, where, why 等等,共 9 种;第四,根据输入的句子和以上三种信息(答案 answer,线索 clue, 问题种类 style),生成问题。图 20. 根据输入生成问题的过程问题生成的过程可以从语法树的角度去观察:选择答案片段就像是从语法树中覆盖了一部分信息,而选择线索片段(clue)的过程就是在覆盖的信息附近,选择一部分节点作为提示输出到问题中。图 21. 利用语法树建模问题生成过程本文提出的 ACS-QG 系统,可以从无标注的句子中,生成高质量的问答对数据。它由以下模块组成:数据集创建模块,可以从目前已有的问答数据集(例如 SQuAD)中,创建 ACS-QG 任务的训练数据集;输入选择模块,可以从无标注的句子中,合理的选择和创建(answer, clue, style)三元组作为问题生成的输入;问题生成模块,可以利用输入三元组生成问题,这个模块的训练数据来自于第一个数据集创建模块;质量控制模块,用于过滤低质量的问答对。图 22. ACS-QG 问题生成系统实验证明,ACS-QG 系统能生成大量高质量的问答对,并且效果显著优于一系列已有的问题生成算法。第十章 结论和未来工作本论文利用图结构建模了一系列 NLP 问题中的文本数据,并结合深度学习模型,提高了多种任务的效果。论文中的各种研究,对信息的聚类组织,推荐,以及理解有着重要的意义。未来的研究方向包括:长文本理解,多任务协同学习,以及通用的基于图结构的表示,学习与推理。本论文中的研究已经发表在 SIGMOD,KDD,ACL,WWW,TKDD,CIKM 等各类 top conference 中,论文列表可在作者个人主页找到:https://sites.ualberta.ca/~bang3/publication.html
读博士是一件很辛苦的事情,特别是那些在职博士,一边工作还要一边做研究,要照顾自己的家庭还不能够耽误学业,需要付出比别人多几倍的时间和精力,这是需要很大的毅力的。可以说那些读博士的人除了智力比常人超前以外,耐力也比一般人要好。 读博士难,想要从博士毕业更难。因为按照我国现行的博士研究生培养方案和各个高校的培养方案,博士生培养的年限为三到四年,可延期到七年,不过很多人都不能按时毕业,读博五年毕业算是常态。造成博士研究生延期毕业的“罪魁祸首”就是必须要发表不少于3篇的SCI,各个高校对发表SCI期刊的篇数要求不同。 至于SCI期刊论文发表难度有多高?基本上SCI二区以上的论文发上3-6篇就能在一所普通211高校破格评选副教授了。二区以上发上5-8篇就能破格评选教授了。而有的人从讲师到教授估计要二十到三十年时间,基本上十五年左右都算正常速度。正常的科研人员,十五年专职做科研可能也就发不到十篇。 很多博士研究生因为发不出SCI不能够顺利毕业,甚至无法毕业的大有人在。之前28岁的中国科学技术大学博士生刘博士从学校宿舍出走后失联,后来在水库被发现,疑是自杀,原因可能是因为毕业压力太大。刘博士六年未发表一篇论文,没有达到博士毕业的要求,所以要延期一年毕业。发表期刊论文是每个博士生面临的最主要的压力,发不出来就没办法毕业。 清华大学不再将论文发表情况作为博士学位申请的硬性指标可以说大大的解放了博士研究生的学业压力,对于博士研究生来说是一件幸事。学术研究不唯论文论英雄,可以让博士更好的投入到科研中去。论文不应该是为了写而写,这样毫无意义。人类应该把有限的时间致力于真正有用的技术突破上,而不是灌水文章!我很支持取消硬性标准,这是清华自信的体现,有助于抑制科研浮躁之风,学术氛围将会得到很大的改善,学术之风气也会越来越好。 博士不发表论文也可以毕业并不意味着博士水平会掺水,因为博士能够顺利毕业除了参考论文以外,还有导师的把关,外审和答辩委员会的把关。他们不可能说给学生放水,毕竟博士生的水平关乎高校的脸面,更何况是清华大学。 不以发表论文数量作为博士学位申请的硬性指标虽说解放了博士生,但同时也会造成一个极端,那就是博士研究生导师的话语权变得更大。以前一些有能力的人发表完论文以后就可以毕业了,但现在能不能毕业能不能走还是导师说了算。没有了论文的标准,导师的评价就成为了最高的标准。 脱离了论文发表的深渊,同时也会把博士研究生推向唯导师论的深渊。这究竟是好还是坏,还是由时间来评判吧。你认为清华大学不以发表论文数量作为博士学位申请的硬性指标是好还是坏?你支持还是赞同呢?
本文全网版权保护,违规转载洗稿必究!文|冷丝栏目|丝说教育改革根据2016年到2017年的教育部公开的数据,国内100所高校中,浙江大学博士点数量最多,其次是北京大学,清华大学博士点数量仅排名第11位。当然,这个数据并不包括2018年全国高校新增博士点数量。博士点数量多的国内高校有哪些?除了浙江大学和北京大学之外,吉林大学、武汉大学、华中科技大学、复旦大学、四川大学、中山大学、山东大学和中南大学的博士点数量排名第3到第10位。前15名高校(2018年前数据)明眼人已经看出,博士点数量多少与学校办学规模有很大的关系,当然这样的排名未将中国科学院大学计算在内,国科大博士生导师数量国内第一,博士点数量当然不不输于浙江大学和北京大学。就博士生数量而言,一些传统的老牌子高校,比如复旦大学、四川大学、中山大学和山东大学等等,它们都有比较显著的优势。当然,就博士生培养质量来说,清华大学、中国科学技术大学等高校无疑又是处于绝对领先地位。南京大学冷丝在这里提出一个很多人关心的问题:国内博士生培养质量如何?博士论文质量如何?人文科学、理学类等博士论文质量较高,社会科学类博士论文问题多。教育部和学位管理部门每年和每几年都要对博士论文进行抽查,比如,在2015年全国博士学位论文抽检中,各学科论文样本总体合格率为95.79%。其中,历史学100%、理学98.51%、哲学98.44%、农学96.96%、医学96.59%、文学96.43%和工学95.45%。这七个学科门类抽检总合格率在平均线以上。然而,法学是92.21%、管理学90.43%、经济学88.43%、教育学88.03%和艺术学86.52%,这5个门类合格率在平均线以下。陕西师范大学可见,博士学位论文质量存在显著的学科差异,隶属于社会科学范畴的法学、管理学、经济学和教育学4个学科门类合格率全部低于总样本平均合格率,显示社会科学博士学位论文质量问题相对突出。其一,社会科学近40%的抽检不合格论文被指出“缺少问题意识、理论关照和聚焦”以及“论述分析不能与研究问题紧密结合”的问题,与此相关的问题还包括选题没有学理意义、对学科研究现状了解和把握不够深入等,这些都指向博士论文研究和撰写的一项基础工作,即提出“研究问题”。说白了,很多博士论文是为了毕业、拿到博士学位而研究,不是为了解决问题而研究,这样的研究没有意义和价值。山东大学其二,社会科学中60%的不合格论存在被评审专家明确指出文献综述质量差的问题,在管理学和经济学门类,这一比例甚至超过70%。从评阅意见来看,文献综述的问题非常集中。文献梳理的基本工作量和文献的质量不够,包括文献不全面与陈旧、来源期刊不够权威以及外文文献缺乏,因而无法全面和准确呈现本学科领域与论文主题相关的研究基础和现状。其三,超过60的不合格论文在分析推理和论证的合理性、逻辑性方面存在问题,还有很多论文被专家指出概念,理论使用不当,论文思路模糊和结构逻辑混乱,以及论述分析与研究主题关联不紧密的问题,这些都指向作者研究训练的不足和理论思维、分析论证能力方面的缺失。那么,博士生培养和博士论文质量又该如何有保障呢?在博士生培养环节中,学校要加强学术规范、学术写作方面的训练,鼓励培养单位开设学位论文写作、学术规范与学风建设等公共课程,强化基本学术训练。高校必须加强博士生培养过程考核和质量把关。通过相关制度建设,强化和完善论文开题、中期考核、课程论文、预答辩等培养过程中的考核环节。加强博士生导师的质量监督意识,建立适当的责任保障机制。同时,高校必须加强对于抽检不合格论文培养单位和导师的追责,进一步提高以论文抽检合格率作为学位点评估、学位授予权和导师招生资格、研究生教育资源分配的力度。附录100所高校名单:百所高校博士点数量本文全网版权保护,违规转载洗稿必究!敬告|冷丝所有文章首发『百家号』,如有错漏和最新信息,作者将在评论版块及时更正和补充,也请网友批评指正,谢谢您!同时严正声明『非法转载必究』。
本文全网版权保护,违规转载洗稿必究!文|冷丝栏目|丝说教育改革根据2016年到2017年的教育部公开的数据,国内100所高校中,浙江大学博士点数量最多,其次是北京大学,清华大学博士点数量仅排名第11位。当然,这个数据并不包括2018年全国高校新增博士点数量。博士点数量多的国内高校有哪些?除了浙江大学和北京大学之外,吉林大学、武汉大学、华中科技大学、复旦大学、四川大学、中山大学、山东大学和中南大学的博士点数量排名第3到第10位。前15名高校(2018年前数据)明眼人已经看出,博士点数量多少与学校办学规模有很大的关系,当然这样的排名未将中国科学院大学计算在内,国科大博士生导师数量国内第一,博士点数量当然不不输于浙江大学和北京大学。就博士生数量而言,一些传统的老牌子高校,比如复旦大学、四川大学、中山大学和山东大学等等,它们都有比较显著的优势。当然,就博士生培养质量来说,清华大学、中国科学技术大学等高校无疑又是处于绝对领先地位。南京大学冷丝在这里提出一个很多人关心的问题:国内博士生培养质量如何?博士论文质量如何?人文科学、理学类等博士论文质量较高,社会科学类博士论文问题多。教育部和学位管理部门每年和每几年都要对博士论文进行抽查,比如,在2015年全国博士学位论文抽检中,各学科论文样本总体合格率为95.79%。其中,历史学100%、理学98.51%、哲学98.44%、农学96.96%、医学96.59%、文学96.43%和工学95.45%。这七个学科门类抽检总合格率在平均线以上。然而,法学是92.21%、管理学90.43%、经济学88.43%、教育学88.03%和艺术学86.52%,这5个门类合格率在平均线以下。陕西师范大学可见,博士学位论文质量存在显著的学科差异,隶属于社会科学范畴的法学、管理学、经济学和教育学4个学科门类合格率全部低于总样本平均合格率,显示社会科学博士学位论文质量问题相对突出。其一,社会科学近40%的抽检不合格论文被指出“缺少问题意识、理论关照和聚焦”以及“论述分析不能与研究问题紧密结合”的问题,与此相关的问题还包括选题没有学理意义、对学科研究现状了解和把握不够深入等,这些都指向博士论文研究和撰写的一项基础工作,即提出“研究问题”。说白了,很多博士论文是为了毕业、拿到博士学位而研究,不是为了解决问题而研究,这样的研究没有意义和价值。山东大学其二,社会科学中60%的不合格论存在被评审专家明确指出文献综述质量差的问题,在管理学和经济学门类,这一比例甚至超过70%。从评阅意见来看,文献综述的问题非常集中。文献梳理的基本工作量和文献的质量不够,包括文献不全面与陈旧、来源期刊不够权威以及外文文献缺乏,因而无法全面和准确呈现本学科领域与论文主题相关的研究基础和现状。其三,超过60的不合格论文在分析推理和论证的合理性、逻辑性方面存在问题,还有很多论文被专家指出概念,理论使用不当,论文思路模糊和结构逻辑混乱,以及论述分析与研究主题关联不紧密的问题,这些都指向作者研究训练的不足和理论思维、分析论证能力方面的缺失。那么,博士生培养和博士论文质量又该如何有保障呢?在博士生培养环节中,学校要加强学术规范、学术写作方面的训练,鼓励培养单位开设学位论文写作、学术规范与学风建设等公共课程,强化基本学术训练。高校必须加强博士生培养过程考核和质量把关。通过相关制度建设,强化和完善论文开题、中期考核、课程论文、预答辩等培养过程中的考核环节。加强博士生导师的质量监督意识,建立适当的责任保障机制。同时,高校必须加强对于抽检不合格论文培养单位和导师的追责,进一步提高以论文抽检合格率作为学位点评估、学位授予权和导师招生资格、研究生教育资源分配的力度。附录100所高校名单:百所高校博士点数量本文全网版权保护,违规转载洗稿必究!敬告|冷丝所有文章首发『百家号』,如有错漏和最新信息,作者将在评论版块及时更正和补充,也请网友批评指正,谢谢您!同时严正声明『非法转载必究』。
2019年就将过去,在这一年中总会有一些事情让人难以忘记。然而面对那些不开心的事情,还是希望能够被人遗忘,或许这也算是辞旧迎新。不过有时想法是美好的,现实却是残酷的。比如这所985高校,眼看就将迎来新的征程,却又当了一次“网红”。根据媒体报道,近日教育部反馈了2018年度博士学位论文抽检结果,山东大学被抽检博士学位论文82篇,其中4篇学位论文被认定为“问题论文”。此次抽检存疑,已是山东大学连续两年在教育部的抽检中出现了问题,并因此受到了教育部的约谈。看着这样的报道,你会想起什么?相信不少网友会感叹到为何又是你。为何又是你?因为在今年的上半年,山东大学已当了一次网红。如今岁末了,山东大学因学术问题被教育部约谈,真可谓是2019“第一”网红大学。在这里还是有必要澄清一下,媒体的报道有所失实。教育部对高校博士学位论文的抽检是常态工作,即使有问题,教育部也不会点名。此次山东大学的学术问题能够如此精确,是因山东大学研究生院发布了一则“关于进一步提升博士学位论文质量的通知”。通知中明确提到了学校存在的问题,并将开展自查整改工作。因此,这算是自曝家丑。山东大学因为众所周知的原因,今年很红很红。按理说现在的山东大学最不愿意再有负面消息,为何还会自曝家丑呢?这就要从这次学术问题的严重性说起。对于高校来说,一旦连续2年出现“存在问题学位论文”,且比例较高或篇数较多的,那就会被质量约谈。同时,这个抽检结果还将运用到学位授权点合格评估中去。如果在约谈、整改后仍然不达标的,那学位授权都可能被撤销。同时它还会严重影响“双一流”评价结果和办学声誉。因此从某种角度上讲,山东大学的自爆家丑是一个态度上的端正。高校的学术问题,是近年来人们高度关注的问题。学术存疑的高校并非山东大学一家,可是对于山东大学来说,这样的问题真不应该再有。为什么?过去人们只知山东大学是一所招生多,办学好、体型大的985高校。而如今却是一所“网红”大学。当大学成为了网红,还是985高校,负面下的声誉影响实在过于严重。山东大学有着非常悠久的办学历史,是中国近代高等教育的起源性大学。其主体是1901年创办的山东大学堂,是继京师大学堂之后中国创办的第二所国立大学,也是中国第一所按章程办学的大学。在这一百年多年的校史中,是很多学者不断的努力,才有了今天的山大。先辈们积攒下来的声誉,却因一起本可避免的事情,被网友们无限放大,声誉全毁,这多少都令人感到惋惜。尽管山东大学在2019年很“网红”,负面消息更是被网友们恶搞。但是对于那些准高考生而言,山东大学的负面有些被放大了,它并没有很多人说的那样不堪。2个世界一流学科建设学科,2个一级学科国家重点学科,15个学科的学术影响力和贡献能力进入ESI世界排名前1%,这才是真实的山东大学。因此,不要用有色眼镜看山东大学。只要你的分数能够考上山东大学,山东大学就是一个很好的求学平台。目前,山东大学已经在学位授予环节中增加了两个环节。一是“增加论文自审环节”,二是“增加答辩汇报内容”。希望这样的改变,能够让山东大学的学术研讨之风更加浓厚。当然,可能有人会说这是在帮山大洗白,其实并没有,而是真的希望山东大学能够越来越好,能够走出负面,那里有着太多好学生。