欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
7 Papers|GCN大佬公开博士论文;谷歌提出扩展型BERT架构伏尔加

7 Papers|GCN大佬公开博士论文;谷歌提出扩展型BERT架构

机器之心 & ArXiv Weekly Radiostation参与:杜伟、楚航、罗若天本周的重要论文包括谷歌提出的扩展型 BERT 架构 Tapas,以及 GCN 作者的博士论文。目录:SYNTHESIZER: Rethinking Self-Attention in Transformer ModelsInteractive Video Stylization Using Few-Shot Patch-Based TrainingTransferable, Controllable, and Inconspicuous Adversarial Attacks on Person Re-identification With Deep Mis-RankingHow to Train Your Energy-Based Model for RegressionTAPAS: Weakly Supervised Table Parsing via Pre-trainingmemeBot: Towards Automatic Image Meme GenerationDeep Learning with Graph-Structured RepresentationsArXiv Weekly Radiostation:NLP、CV、ML更多精选论文(附音频)论文 1:SYNTHESIZER: Rethinking Self-Attention in Transformer Models作者:Yi Tay、Dara Bahri、Che Zheng 等论文链接:https://arxiv.org/pdf/2005.00743v1.pdf摘要:众所周知,点积自注意力(dot proct self-attention)对于 SOTA Transformer 模型是至关重要且不可或缺的。但有一个疑问,点积自注意力真的这么重要吗?在本文中,来自谷歌研究院的几位作者研究了点积自注意力机制对于 Transformer 模型性能的真正重要点和贡献。通过一系列实验,研究者发现(1)随机对齐矩阵(random alignment matrice)的执行效果出人意料地好;(2)从 token-token(查询 - 键)交互中学习注意力权重并不是那么重要。基于此,研究者提出了 Synthesizer,这是一个无需 token-token 交互即可学习合成注意力权重的模型。本研究提出的 Synthesizer 模型架构图。在 WMT’14 英语 - 德语、WMT’14 英语 - 法语机器翻译任务以及 10 亿语言建模(LM1B)任务上的 NMT 和 LM 效果对比。在摘要式归纳(CNN / 每日邮报)和对话生成(PersonalChat)任务上归纳和对话效果对比。推荐:本研究提出的 Synthesizer 在 MT、语言建模、摘要式归纳、对话生成以及多任务语言理解等一系列任务上的性能均媲美于最原始的(vanilla)Transformer 模型。论文 2:Interactive Video Stylization Using Few-Shot Patch-Based Training作者:Ondej Texler、David Futschik、Daniel Skora 等论文链接:https://ondrejtexler.github.io/res/Texler20-SIG_patch-based_training_main.pdf摘要:在本文中,捷克理工大学和 Snap 公司的研究者提出了一种用于关键帧视频风格化的学习方法,借助这种学习方法,艺术家可以将风格从少数选定的关键帧迁移至序列其他部分。这种学习方法的主要优势在于最终的风格化在语义上有意义,也就是说,运动目标(moving object)的特定部分根据艺术家的意图进行风格化处理。与以往的风格迁移方法相比,本研究提出的学习方法既不需要任何冗长的预训练过程,也不需要大型训练数据集。研究者展示了在仅使用少数风格化范例且隐式保持时序一致性的情况下,如何从零开始训练外观转换网络。由此得出的视频风格化框架支持实时推理、并行处理以及任意输出帧的随机访问。此外,这种学习方法还可以合并多个关键帧中的内容,同时不需要执行显式混合操作。研究者验证了这种学习方法在各种交互场景中的实用性,在这些场景中,用户在选定关键帧中绘画,并且绘画风格可以迁移至已有的记录序列或实时视频流中。利用本研究中学习方法的风格化序列范例。具有关键帧的视频风格化设置。完整帧训练方法与本研究中少样本 Patch 训练方法的效果比较。推荐:本研究中少样本 Patch 训练方法的亮点在于它可以在与帧无关的模式下运行,这对当前严重依赖随机访问和并行处理的专业视频编辑工具非常有利。论文 3:Transferable, Controllable, and Inconspicuous Adversarial Attacks on Person Re-identification With Deep Mis-Ranking作者:Hongjun Wang、Guangrun Wang、Liang Lin 等论文链接:https://arxiv.org/pdf/2004.04199.pdf摘要:在本文中,来自中山大学、广州大学和暗物智能科技的研究者们通过提出以一种学习误排序的模型来扰乱系统输出的排序,从而检验当前性能最佳的 re-ID 模型的不安全性。由于跨数据集的可迁移性在 re-ID 域中至关重要,因此作者还通过构建新颖的多级网络体系结构进行半黑盒式攻击,该体系结构将不同级别的特征金字塔化,以提取对抗性扰动的一般和可迁移特征。该体系可以通过使用可微分的采样来控制待攻击像素的数量。为了保证攻击的不显眼性,研究者还提出了一种新的感知损失,以实现更好的视觉质量。在四个最大的 re-ID 基准数据集(即 Market1501、CUHK03、DukeMTMC 和 MSMT17)上进行的广泛实验不仅显示了该方法的有效性,而且还为 re-ID 系统的鲁棒性提供了未来改进的方向。Market-1501 和 CUHK03 上 AlignedReID 被攻击前后的 Rank-10 结果。绿色代表正确匹配。红色代表错误匹配。整体架构图。多阶段判别器图示。推荐:本文的亮点在于将将 SOTA 行人再识别系统精度降至 1.4%,并已被 CVPR 大会接收为 Oral 论文。论文 4:How to Train Your Energy-Based Model for Regression作者:Fredrik K. Gustafsson、Martin Danelljan、 Thomas B. Schon 等论文链接:https://arxiv.org/pdf/2005.01698v1.pdf摘要:近年来,基于能量的模型(Energy-based Model,EBM)在计算机视觉领域越来越流行。虽然这些模型通常用于生成图像建模,但最近的研究已经将 EMB 应用于回归任务(Regression Task),并在目标检测和视觉跟踪领域实现 SOTA。但是训练 EBM 不是一件简单的事情。另外,生成式建模(Generative Modeling)可以利用多种多样的方法,但将 EBM 应用于回归任务没有获得充分的研究。因此,如何训练 EBM 实现最佳的回归性能目前尚不清楚。在本文中,来自瑞典乌普萨拉大学和苏黎世联邦理工学院的研究者对这些问题展开了详实研究,提出了一种噪声对比估计(Noise Contrastive Estimation, NCE)的简单高效扩展,并与 1D 回归和目标检测任务上的 6 种流行方法进行了性能对比。对比结果表明,本研究提出的训练方法应被认为实最佳。研究者还将他们的方法应用到视觉跟踪任务上,在 5 个数据集上实现新的 SOTA。对于边界框回归等任务,本研究提出以噪声对比估计的简单高效扩展(文中表示为 NCE+)来训练基于能量的模型(EBM)。1D 回归实验训练方法的 D_KL 和训练成本对比。图左:用于 1D 回归实验的四种表现最佳方法的详细比较;图右:COCO-2017 Val 数据集上,用于目标检测实验的四种表现最佳方法的详细比较。四种方法均分别为 ML-IS、KLD-IS、NCE 和本研究提出的 NCE+。推荐:本研究中的跟踪器在 LaSOT 目标跟踪数据集上实现了 63.7% 的 AUC,在 TrackingNet 目标跟踪数据集上实现了 78.7% 的 Success。论文 5:TAPAS: Weakly Supervised Table Parsing via Pre-training作者:Jonathan Herzig、Pawe Krzysztof Nowak、Julian Martin Eisenschlos 等论文链接:https://arxiv.org/pdf/2004.02349.pdf摘要:谷歌在本文中提出了一种扩展型的 BERT 架构。该架构可对问题与表格数据结构进行联合编码,最终得到的模型可直接指向问题答案。并且,这种新方法所创建的模型适用于多个领域的表格。要想得到优良的模型,优质的数据自然是不可或缺的。谷歌首先使用了数百万个维基百科表格对模型进行预训练,然后又在三个学术级表格问答数据集上进行实验,结果表明新方法的准确度表现极具竞争力。不仅如此,谷歌开源了模型训练和测试代码,还公开分享了他们在维基百科数据上得到的预训练模型。本研究提出的 Tapas 模型以及对于问题 “排名前二的总天数(total number of days for the top two)” 的示例模型输出。问题 “查询(query)” 的编码以及使用 Tapas 特定嵌入的简单表格。表格(左)与对应的问题示例(右)。问题 5 是会话式。推荐:谷歌的这篇论文将 BERT 模型应用到了基于表格的问答场景中,为弱监督式的表格解析性能带来了显著提升。论文 6:memeBot: Towards Automatic Image Meme Generation作者:Aadhavan Sadasivam、Kausic Gunasekar、Yezhou Yang 等论文链接:https://arxiv.org/pdf/2004.14571v1.pdf摘要:近日,来自美国亚利桑那州立大学的研究者对 meme 图生成方法进行了改进提升。在这篇论文中,研究者提出了一种根据给定的输入语句来生成匹配图片的方法。这是一项很有挑战性但有趣的 NLP 任务。通过对 meme 图生成机制的深入了解,研究者决定将 meme 图生成与自然语言翻译相结合。在自然语言翻译工作中,为了将输入的语句转换为目标语言,必须对语句的完整含义进行解码,分析其含义,然后将源语句的含义编码为目标语句。类似地,此处也可以通过将源语句的含义编码为一对图像和标题,传达与源语句相同的含义或情感,从而将语句翻译成「梗」。受到这种方法的启发,研究者提出了一种端到端的编码 - 解码模型「memeBot」,面向任意给定的语句来生成 meme 图。同时在训练的过程中,他们制作出了首个大型 meme 图字幕数据集。memeBot 示意图。memeBot 模型架构图。对于给定输入序列,通过结合模板选择模块(template selection mole)选择的和标签生成 transformer(caption generation transformer)生成的表情包标签来创建新的表情包。附录 A:实验中所用 meme 字幕数据集包括的模版和图像。推荐:在制作沙雕表情包这件事上,AI也略胜一筹。论文 7:Deep Learning with Graph-Structured Representations作者:Thomas Kipf论文链接:https://pure.uva.nl/ws/files/46900201/Thesis.pdf摘要:近日,GoogleAI 大脑团队研究科学家、GCN 作者、阿姆斯特丹大学机器学习博士生 Thomas Kipf 宣布其博士论文《深度学习图结构表征》(Deep Learning with Graph-Structured Representations)可以下载了。在论文中,作者提出了利用结构化数据进行机器学习的新方法,这些方法主要基于结构化表示以及图表示的神经网络模型计算,由此当从具有显式和隐式模块结构的数据学习时可以提升泛化性能。GCN 作者 Thomas Kipf 宣布公开其博士论文(178 页)。论文部分目录。推荐:这篇博士论文涵盖了深度学习领域的一系列新兴主题,如图卷积网络和结构发现等。ArXiv Weekly Radiostation机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:本周 10 篇 NLP 精选论文是:1. A Survey on Dialog Management: Recent Advances and Challenges. (from Yinpei Dai, Huihua Yu, Yixuan Jiang, Chengguang Tang, Yongbin Li, Jian Sun)2. Topological Sort for Sentence Ordering. (from Shrimai Prabhumoye, Ruslan Salakhutdinov, Alan W Black)3. Exploring Controllable Text Generation Techniques. (from Shrimai Prabhumoye, Alan W Black, Ruslan Salakhutdinov)4. CODA-19: Reliably Annotating Research Aspects on 10,000+ CORD-19 Abstracts Using Non-Expert Crowd. (from Ting-Hao 'Kenneth' Huang, Chieh-Yang Huang, Chien-Kuang Cornelia Ding, Yen-Chia Hsu, C. Lee Giles)5. AdapterFusion: Non-Destructive Task Composition for Transfer Learning. (from Jonas Pfeiffer, Aishwarya Kamath, Andreas Rücklé, Kyunghyun Cho, Iryna Gurevych)6. Extracting Headless MWEs from Dependency Parse Trees: Parsing, Tagging, and Joint Modeling Approaches. (from Tianze Shi, Lillian Lee)7. Soft Gazetteers for Low-Resource Named Entity Recognition. (from Shruti Rijhwani, Shuyan Zhou, Graham Neubig, Jaime Carbonell)8. Cross-lingual Entity Alignment for Knowledge Graphs with Incidental Supervision from Free Text. (from Muhao Chen, Weijia Shi, Ben Zhou, Dan Roth)9. TORQUE: A Reading Comprehension Dataset of Temporal Ordering Questions. (from Qiang Ning, Hao Wu, Rujun Han, Nanyun Peng, Matt Gardner, Dan Roth)10. Structured Tuning for Semantic Role Labeling. (from Tao Li, Parth Anand Jawale, Martha Palmer, Vivek Srikumar)本周 10 篇 CV 精选论文是:1. The AVA-Kinetics Localized Human Actions Video Dataset. (from Ang Li, Meghana Thotakuri, David A. Ross, Joo Carreira, Alexander Vostrikov, Andrew Zisserman)2. Adversarial Training against Location-Optimized Adversarial Patches. (from Sukrut Rao, David Stutz, Bernt Schiele)3. Streaming Object Detection for 3-D Point Clouds. (from Wei Han, Zhengdong Zhang, Benjamin Caine, Brandon Yang, Christoph Sprunk, Ouais Alsharif, Jiquan Ngiam, Vijay Vasudevan, Jonathon Shlens, Zhifeng Chen)4. StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization of Domain Translation and Stereo Matching. (from Rui Liu, Chengxi Yang, Wenxiu Sun, Xiaogang Wang, Hongsheng Li)5. Dual-Sampling Attention Network for Diagnosis of COVID-19 from Community Acquired Pneumonia. (from Xi Ouyang, Jiayu Huo, Liming Xia, Fei Shan, Jun Liu, Zhanhao Mo, Fuhua Yan, Zhongxiang Ding, Qi Yang, Bin Song, Feng Shi, Huan Yuan, Ying Wei, Xiaohuan Cao, Yaozong Gao, Dijia Wu, Qian Wang, Dinggang Shen)6. CONFIG: Controllable Neural Face Image Generation. (from Marek Kowalski, Stephan J. Garbin, Virginia Estellers, Tadas Baltruaitis, Matthew Johnson, Jamie Shotton)7. Self-Supervised Human Depth Estimation from Monocular Videos. (from Feitong Tan, Hao Zhu, Zhaopeng Cui, Siyu Zhu, Marc Pollefeys, Ping Tan)8. Occlusion resistant learning of intuitive physics from videos. (from Ronan Riochet, Josef Sivic, Ivan Laptev, Emmanuel Dupoux)9. Multi-Head Attention with Joint Agent-Map Representation for Trajectory Prediction in Autonomous Driving. (from Kaouther Messaoud, Nachiket Deo, Mohan M. Trivedi, Fawzi Nashashibi)10. Enhancing Geometric Factors in Model Learning and Inference for Object Detection and Instance Segmentation. (from Zhaohui Zheng, Ping Wang, Dongwei Ren, Wei Liu, Rongguang Ye, Qinghua Hu, Wangmeng Zuo)本周 10 篇 ML 精选论文是:1. Partially-Typed NER Datasets Integration: Connecting Practice to Theory. (from Shi Zhi, Liyuan Liu, Yu Zhang, Shiyin Wang, Qi Li, Chao Zhang, Jiawei Han)2. Time Dependence in Non-Autonomous Neural ODEs. (from Jared Quincy Davis, Krzysztof Choromanski, Jake Varley, Honglak Lee, Jean-Jacques Slotine, Valerii Likhosterov, Adrian Weller, Ameesh Makadia, Vikas Sindhwani)3. Successfully Applying the Stabilized Lottery Ticket Hypothesis to the Transformer Architecture. (from Christopher Brix, Parnia Bahar, Hermann Ney)4. Interpreting Rate-Distortion of Variational Autoencoder and Using Model Uncertainty for Anomaly Detection. (from Seonho Park, George Adosoglou, Panos M. Pardalos)5. Physics-informed neural network for ultrasound nondestructive quantification of surface breaking cracks. (from Khemraj Shukla, Patricio Clark Di Leoni, James Blackshire, Daniel Sparkman, George Em Karniadakiss)6. Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability. (from Hojjat Aghakhani, Dongyu Meng, Yu-Xiang Wang, Christopher Kruegel, Giovanni Vigna)7. Plan2Vec: Unsupervised Representation Learning by Latent Plans. (from Ge Yang, Amy Zhang, Ari S. Morcos, Joelle Pineau, Pieter Abbeel, Roberto Calandra)8. Demand-Side Scheling Based on Deep Actor-Critic Learning for Smart Grids. (from Joash Lee, Wenbo Wang, Dusit Niyato)9. APo-VAE: Text Generation in Hyperbolic Space. (from Shuyang Dai, Zhe Gan, Yu Cheng, Chenyang Tao, Lawrence Carin, Jingjing Liu)10. EDD: Efficient Differentiable DNN Architecture and Implementation Co-search for Embedded AI Solutions. (from Yuhong Li, Cong Hao, Xiaofan Zhang, Xinheng Liu, Yao Chen, Jinjun Xiong, Wen-mei Hwu, Deming Chen)

其无耻也

写好一篇博士论文的技巧与方法都在这里

论文,是检测一个学生对学业的掌握程度,也是在另一个层面衡量教学和人才的标准。当你本、研经历了论文的历练之后,又该如何写好博士期间的论文呢?对于论文的格式,百度百科给的步骤是这样的。中英文摘要——目录——正文,正文一般包括:导言(研究背景,文献综述)——提出问题——分析问题——解决问题(对策建议)——参考文献——附录——致谢——学术成果。这样写是最中规中矩的,也是最不会出错的,既然明白了步骤那么对于内容和选题该如何选择呢?一、首先,选题十分重要,题目大小要合适。对于论文的选题有一大忌讳,就是一定切记做大,选题要适中,主要的一点,就是一定要会“小题大做”。小的选题容易驾驭,也容易从细微之处分析,可以写得更好,文章的每一个立意会站得住,文章也会更丰满。但是要避讳“小题小写”,不要把论文写得跟工作总结,甚至不如工作总结,这样还不如不写。因为论文要求的是严谨深刻,不是简单了事。可以尝试全方位,多角度地去剖析一个问题,争取做到立意严明,有迹可循,论证有力,层次清晰,语言规范。学会多用具体材料,图表、公式来证明表达自己的观点。这样,不仅可以使论文具有充分说服力,也可以弥补字数不足的问题。二、其次,写论文最忌讳的就是千篇一律,一千个人眼中只有一个哈姆雷特是非常不可取的,所以论文的研究角度要有新意。一定要注意研究角度的与众不同,选择新奇的角度进行科学研究是论文的亮点。三、然后,撰写论文的核心部分,正文阶段要更加的谨慎,因为它是作者理论水平和创造能力的集中体现,它决定着论文水平的高低和质量。对于正文的部分,一定要做到1、论点严谨,深刻,有新意。并且论点必须是可以论证的。2、论点必须要有材料的支撑,能够证明论点成立。3、论证必须根据论题的需要选择不同的论文结构形式,不同的论证结构形式,决定了本论部分的结构。4、论证要严密且合乎逻辑,使他人无法驳倒。四、最后,结论是对论文全文的总结,是对整篇论文中分析、论证的问题综合性概括,是论文的精华所在。结论应当完整清晰,不可含糊其词、不可与本论相矛盾,要与绪论呼应;对成果的评价要恰如其分;语言简洁、干净利落。博士圈里流行一句话“the best dissertation is a done dissertation”(最好的毕业论文就是写完的毕业论文)。所以在写论文的时候可以量力而行,适当的调整自己的期许,让自己不至于完不成而影响毕业。所以对于论文最主要的就是放平心态,认真的去找材料,立新意,然后完成它。关于国内在职博士、国外留学博士、硕士等报考事宜,欢迎关注公号在职研微厅

红缨刀

浅谈博士论文写作方法

一、关于博士论文的选题 选一个好的题目,是写好学位论文的第一步,也是相当关键的一步。要选择自己特别关注、最感兴趣的问题,觉得有感悟、有体会,有新意,有话要说,有话可说,非说不可,围绕一个专题展开全面、系统的论述,才有可能写出一篇较好的博士论文。 博士论文的题目,一般可以叫做《××××论》或者《××××研究》,比如《刑事第二审程序研究》或《死刑程序控制论》等。 博士生撰写学位论文,一般说来我不主张由老师命题。因为老师给出的命题,也许并不是你们想写的问题,平时对它思考的不多,硬要去写不一定能写好。选题最好 是经过了自己的思考,有感而发,有话想说,才能写好。但不是绝对的,如果博士生自己实在找不到一个好的选题,请老师帮助,老师也可以根据该生的具体情况, 推荐一个较为合适的选题,但也要经过学生的仔细思考,认为适合自己,才可以确定。 博士论文的题目不宜过小。太小的题目无法展开,也不像一篇博士论文。二、关于收集资料 确定了选题后,就要立即着手去收集资料,收集资料是个逐渐积累的过程,要尽量多浏览有关的专著、论文和报刊文章。从中吸取营养,或者找到灵感。建议每人都 买一个扫描笔,携带方便且效率很高,非常有用。你所需要的资料,常常是散见于各种书籍中,一本书中也许只有一小段或者几句话是你将来要引用的,可以用扫描 笔把它输入电脑中,记下它的出处,以后可随时调用,那就很方便了。 资料的收集要随时留意,有时也许在偶然间会遇到很好的材料,就要留心把它记下来。比如,有一次我在太原市双塔寺烈士陵园看到一个倒塌的残旧石碑,上面刻有 明朝万历年间驻太原按察使写给后代子孙的遗训,题为《近溪隐君家训》,上面写有“干公道事,做老成人,说实在话”等内容,使我眼前一亮,惊叹:这不正是我 们宣传的“大庆精神”吗?这可是一个极其难得又极有价值的资料,遂赶紧把它记了下来。回京后,不久在《北京晚报》上看到介绍《近溪隐君家训》的报道,还刊 登了那块残旧石碑的照片。可见那位记者也很识货,他也认为这是一个极好的资料。后来,我在论述法律的社会性和继承性时,就引用了这个资料,说明即使是工人 阶级的道德观念,与某些正直清廉的封建官吏的道德观念也有某种相通之处。这个资料就派上了用场,而且极有说服力。撰写博士论文,还要特别要注重对外文资料 的收集。要收集最新的资料,新的立法、新的观点、新的见解、新的数据。 关于外文资料的收集,要注意区分是新的资料还是旧的。比如外国人要引用我国的刑事诉讼法,如果引用的是1979年的法条,那显然就是过时了的,已被修改过 的陈旧的法条,作为论据,其可靠性就大打折扣了。今年我审阅西南政法大学某学生的一篇博士论文,是论述陪审制的,他在这方面就做得非常好。作者在法国留 学,查阅了外国的许多最新资料,校正了国内一些学者的不准确解释,这篇论文就很有价值。收集外文资料,要尽可能看外文版的原文,因为翻译过来的资料总会或 多或少地失真。当然,一个人很难懂得许多国家的语言,因此,当遇到有些问题自己无法解决时,可借助其他专家的帮助。比如,前些年我在评述有关法的定义时, 发现《共产党宣言》中的一句译文不准确,造成对法的定义很48难理解。这句话的中译文是:“正像你们的法不过是被奉为法律的你们这个阶级的意志一样”在汉 语中,“法”与“法律”本来就是同义词,因而从语法或逻辑上来讲,这句中译文就成了同义反复,由此使我对这句话的翻译产生了疑问。但我不懂德文,便去请教 德语专家石立坚教授,请他查对一下《共产党宣言》的德文版和俄文版在此处是用的什么词语。查对的结果,发现在中文译为“法”和“法律”的两处,在俄文和德 文中都是对应地使用了两个不同的词语,前者表示权利、权力、法权等等,后者则表示规律、定律、法、法则、法律等等的意思,更为确切的表述是“写进了法律 中”。这样,问题便清楚了。这一句话,中文应该译为“正像你们的权利不过是被写进了法律中的你们这个阶级的意志一样”,或“正像你们的权利不过用法律形式 表现出来的你们这个阶级的意志一样”,这就使人们容易理解了。据此,我写了一篇《对〈共产党宣言〉中一段译文和法的定义的商榷》,发表在《中国法制报》 上,由此撼动了以往对“法”的定义。但必须说明,此文中涉及外语的内容,是请教了德语专家石立坚教授才弄通的。如果你们遇到诸如此类的问题,也应向有关专 家请教。任何人都不可能全知全能,要不耻下问。 三、围绕学位论文的选题,要争取陆续撰写和发表几篇文章 确定好选题后,按照选题的内容,逐步展开研究,一部分一部分地搞明白。成熟一章,就可以把它写出来,先把它作为一篇论文送出去发表,力争在撰写学位论文的 过程中逐步形成几篇相对独立的小论文。学位论文的写作过程,本身就是一个思考不断成熟、认识不断深化的过程。随着占有的资料越来越充分,自己的思路也渐渐 清晰,就要把已经梳理清楚,思考比较成熟的这部分形成书面的文字,进一步整理成可以发表的文章。这样既完成了博士论文的写作,又形成了在研期间的科研成 果。 特别应该提醒大家:切忌只是一味地堆积资料而不去梳理、运用。否则,资料收集了一大堆却迟迟不动手写作,到最后才去动手时,“灵感”早就消失了,那就很难写出一篇有灵性、有创见又能引人入胜的好文章。 四、注重理论联系实际 一篇好的博士论文,一定要注重理论联系实际。反过来说,切忌搞成华而不实、“空对空”的抽象概念演绎。为此,需要强调几点:1.博士论文中一定要有一些实际的案例引用的案例必须是真实的,不能自己杜撰或编造案例。刑事诉讼法学是一门应用科学,具有极强的实用性,因此,撰写博士 论文,不应脱离现实只凭“想当然”去任意发挥,而要针对现实,着眼于解决实际问题。比如,最近在2007年第3期《中国法学》上看到一篇文章,作者是北京 大学法学院陈永生副教授,他的文章提到50个冤假错案,都是他多年来留意收集的实际案例,他从中抽取出20个典型案例,分析冤案形成的原因,就很有说服 力。对于引用的案例,可以是已经判决生效的,也可以是一审已经判决但尚未生效的,也可以是在侦查阶段、审查起诉阶段尚未进入审判程序的案件。收集案例有多 种渠道,但不管是从哪里得到的,都应是真实的,不得虚构或增减任何情节。分析真实的案例,才能对健全诉讼法制起到有益的作用。 近几年我评阅了不少博士论文,发现有一些论文竟没有引用一个案例,尽是说一些想当然的空泛的议论,这样的论文就不大好,至少可以说它对立法、司法都没有多大益处。这是需要提醒大家注意的。2.博士论文中,应当引用一些必要的数据,作为对重要观点的支撑 引用的数据可以是综合的,也可以是局部的。比如,《中国法律年鉴》每年都刊登公检法机关发布的比较全面的数据,政府某些部门举办的新闻发布会也会发布若干 数据;某些学者或课题组的调查报告也可能提供许多重要数据。你们到基层单位实习或者搞专题调研,更要留心收集各种数据,或许会很有用处。总之,数据的来源 是广泛的,问题是自己要多留心收集这些数据。 在引用数据时还应注意:必须对若干数据进行比对,有时可能会发现几个数据彼此有冲突,或者有较大的差异,甚至有的部门在不同时间发布的若干数据也许对不上茬口。遇到此类情况就要认真核对,去伪存真,不可再引用的几个数据之间发生明显的矛盾。3.论文中要注意选择恰当的量化词 论文在涉及对某些问题的判断时,往往需要使用一些相对模糊的量化词,例如“许多”、“很多”、“绝大部分”、“大部分”、“多数”、“少数”、“个别”、“极少”等等,要注意选择恰当的量化词,尽可能把握好分寸,避免用词不当而造成一些不应有的失误。 五、关于对引文、脚注的要求 我在评阅博士论文和硕士论文时,经常发现在引文和脚注中出现种种不应该发生的问题。为此,有必要特别提醒大家注意以下几点: 1.引文务必准确,不能有错漏,并且应当尽量引用原著和第一手资料 比如论文中引用马克思、毛泽东、邓小平领袖人物或权威学者的话,就一定要从原著中摘引。引用其他文章中的论点也要尽量来自第一手资料。有时发现某篇论文引 用毛主席的话,下面的脚注却注明是转引自某刊物发表的一篇论文,读者一看就知道他根本没有看过原著,表明其治学态度不严谨。如果别人所引的话不准确甚至断 章取义,他也只会是以讹传讹,那就很不严肃了。2.引文要忠实于原著,不能断章取义 如果引述的内容文字太长,中间可以用省略号删节,但不能更改原文,更不能断章取义。曾发现有的论文引述他人的论述很不准确,与原文核对,人家根本没有讲过他所引述的话,这叫做“强加于人”。假如人家知道了这种情况,甚至可以把他告上法庭。 3.引用外国法律的条文,必须与原文核对准确无误 我曾发现有的论文引用外国法律很不准确,拿原文一对照,在他标注引用的某一条中,根本找不到他所引述的文字,有的引文竟与原文的意思大相径庭,这岂不闹出了笑话!这些都是文章的“硬伤”。4.论文中涉及的外国人名,要参照统一的规范化译名。例如,意大利刑法学家贝卡里亚,很容易误写为“贝卡利亚”,但正确的译名是“贝卡里亚”。此类错误所在多有,要注意校正过来。 5.论文写好后要认真校对(包括正文和引注)。谁也不可能保证在一篇论文中一个错别字也没有,但错漏不可太多。可以让同学帮助互相校对,校改几遍再交给老 师。还要注意引文与文章主体的契合程度,即引文是否能够恰当地、有力地支撑你的观点,增强论文的说服力。如果引文与论文所要论述的内容关系不大,宁可删除 引文,不必画蛇添足。六、关于论文的开篇和结尾 论文的开头非常重要,古人就将文章的开头称为“凤头”,可见开头在文章结构中所占的份量。一篇博士论文,一般不宜开头就直接写第一章,通常要有绪论,写明 选题的意义、研究目的、研究方法,有什么创见,还存在哪些疑难问题等等。论文的开篇应开门见山,言简意赅,亮明自己的观点,并且要争取能够吸引读者愿意看 下去。 一篇博士论文,自然要分为若干章节,全面、系统地逐层阐述作者的观点。但是在最后一章写完之后,一般不宜直接打住。要注意首尾呼应,通常在最后一章之后, 应有一段结束语与开篇呼应,对前面提出的问题,在文尾要有个交代,用总结性的文字将全文收场。也就是说,话不能只说一半。一篇论文不仅要提出问题、分析问 题,还要最终解决问题。 如同文章的开头一样,结尾在全文结构中所起的作用也不可小觑。结尾要言尽意止,不要拖泥带水。七、关于对博士论文中语言文字的要求 写文章不同于口头的陈述,它是以书面语言来表达作者想要说明的问题。书面语言一般要比口语化的表述更为洗练,因而书面语言运用的好坏,是评价论文优劣的一个非常重要的形式要素。在此强调以下几点: 1.博士论文文字应清爽、通畅,切忌病句连篇,并且要善于运用各种不同的表达方式 例如,《红楼梦》中塑造了无数光辉鲜亮的人物形象,就是从正面、反面、侧面等多种角度去写,有时是直接写某件事、有时就写得隐晦曲折,有时又一语双关。同 样的话,从不同人的口里说出来,所用的语言就完全不同。这样,文字的表述就显得灵活多变而不死板。文字功夫是一种硬功夫,需要长期的磨炼,但博士生的书面 语言一定要能够基本上过关,否则很难写出一篇好论文来。 2.要尽量避免使用长句子 我所带过的学生中,有人习惯于使用长句子,一句话往往长达数十个字,中间的意思又转了好几道湾,读起来让人颇感费力,想半天也很难理解作者究竟想要表达什 么意思。我曾多次指出这个毛病,硬是把它校正了过来。须知,汉语的优势就在书面语言极为洗练,通常是使用短句子。像《史记》一类的古书就不用说了,你们看 鲁迅、毛泽东和邓小平等人的著作,很少使用长句子。短句子生动活泼,读起来铿锵有力。学会使用短句子,这也是一种硬功夫,值得我们去体会和磨炼。3.在表达某些问题时,还要注意选择恰当的词汇 比如,今年我评阅了十多篇博士论文,其中有三篇涉及秘密侦查或技术侦查手段,作者强调“秘密侦查手段的主要特点是具有欺骗性”。我就给他们提出,这样的提 法似有不妥,应当避开“欺骗性”这种提法。这是因为,我国刑事诉讼法第43条明确规定:“严禁刑讯逼供和以威胁、引诱、欺骗以及其他非法的方法收集证 据。”为了对付严重的刑事犯罪,各国都在运用秘密侦查或技术侦查手段。如果你把这些手段都说成具有“欺骗性”,那还怎能允许使用?在倡导依法治国的今天, 要使秘密侦查行为纳入法制化的轨道,就不宜把这种手段界定为具有“欺骗性”。可以改用“隐蔽性”、“隐秘性”或者改用其他的表述方式。所以,在撰写博士论 文时,对于书面语言要反复斟酌,选择适当的词语来表述。 八、关于博士论文的写作方法 一般来说,论文有两种写法:一为“立论式”,二为“驳论式”。博士论文通常应采用立论式,即以我为主,全面、系统地论述某一专题。但是,要想讲透一些问 题,还要注意在立中有驳,既要对某些不同的观点展开有理有据的辩驳。论文中要有一些争议的东西,而不能只是平铺直叙。从学术发展的客观规律看,真理只有在 不同观点的争鸣中才能愈辩愈明。恩格斯在《费尔巴哈与德国古典哲学的终结》(即“费尔巴哈论”)中强调指出:要想跟上时代的步伐去探索真理,只有在“同和 他才智相当的人们的友好或敌对的接触中”才能得出自己的思想。因此,在论文写作中要勇于争论,有争论才能使文章生动活泼。当然,争论必须遵守论战的规则,关键是要尊重对方的人格,不可搞成人身攻击。要准确地引用别人 的观点,绝对不可歪曲人家的原意,更不能随意扣帽子、打棍子,那样只会反过来损伤自己。一定要充分地摆事实,讲道理。所谓“有理不在言高,言高未必有 理”,重在以理服人。其实,“立”和“驳”是一个事物的两个方面,结合起来使用,会起到殊途同归的效果。反驳对立的观点,目的是为了将自己的观点更鲜明地树立起来。这样才能使问题越说越透,道理越说越明,文章才更有看头。九、关于博士论文的文体 博士论文,是就一个专门问题进行的议论、评论,其重点在于议论。要求在占有大量资料的基础上,经过自己的独立思考,充分地讲清道理,切忌写成文学性或者艺 术性的文章。比如,曾有个硕士研究生想以《刑事诉讼美》作为学位论文题目,我就说这个题目不好,它似乎成了一篇美学论文,而不是法学论文。有的论文开头就 写“镜头一”、“镜头二”好像是写电视剧本,看起来相当怪异。这样的文体也不行。总之,对待博士论文的写作,必须要抱有严谨的态度,还要有严谨的文风。一 定要以严肃、洗练、平实的笔触来阐释法律问题。十、博士论文的字数 一篇博士论文,要严格控制论文的字数。最少要有15万字,一般不宜超过20万字。今年我评阅的几篇博士论文,有的写到40多万字,还有一篇长达60万字, 这就太长了,老师批阅的难度也大大增加。最好是将博士论文精炼到15万至20万字,如果还有许多话要说,可在学位论文通过之后,再适当增加内容,或可成为 一部专著出版。 当然,博士论文的字数也不能太少,我曾见到一篇博士论文只写了8万字,内容甚是单薄,好比只是开列了一个简单的提纲,可见作者没有用心去深入钻研,在预答辩时就被老师们给否定了。这个教训也应该记取。 十一、关于论文的写作进度 如同对待任何事情一样,一旦接受了任务,就要提前动手,赶前不赶后,免得以后突然遇到什么特殊情况,冲击了既定的计划。博士论文选好题目后,就要及时进入 “临战状态”,早思考,早动手,确保按期完成任务。要严格按照学校要求的进度,一步一步地安排好论文的写作,切忌到了火烧眉毛的时候才开始动笔。 对于刚入学的一年级博士生来说,一进校就应当开始规划三年的学习,以学位论文作为三年学习的主线。早作规划更主动,要围绕自己的兴奋点,选择一个专题作为 主攻方向,在三年学习中不断扩充知识,围绕这个专题,一篇一篇地写若干文章,作为在研期间的科研成果。随着认识的不断深化,还可检验这个题目有没有写成毕 业论文的意义。当然,在研期间发表的文章,不限于学位论文的选题,作为练笔,可以撰写无数的小论文,但作为主线,还是要围绕学位论文的选题来深入钻研。所 以,一入学就要有个规划,先开始考虑,用一年的时间反复掂量,第二学年开学后敲定。 据我这些年接触到的许多博士生反映,撰写学位论文是一件苦差事,写好一篇博士论文很不容易。但是正如古人所说:“世上无难事,只要肯登攀。”我的体会是: 做学问,一方面要靠自身的努力,另一方面,还要看他的悟性高低和学习是否得法。至于评价一篇文章的好坏,则是要看它能不能达到五个“度”———要有广度、 深度、高度、厚度和力度。这是我多年治学的经验总结,也是对博士学位论文提出的目标,希望你们朝着这个方向去努力。在撰写论文的过程中遇到什么问题,随时 与老师交流,老师给予必要的指导自是责无旁贷。大家完成论文之后可以提前去知网论文查重网进行知网论文检测。

有间

阿尔伯塔大学博士毕业论文:基于图结构的自然语言处理

机器之心发布机器之心编辑部自然语言处理(Natural Language Processing)是人工智能的核心问题之一,旨在让计算机理解语言,实现人与计算机之间用自然语言进行通信。阿尔伯塔大学(University of Alberta)刘邦博士在他的毕业论文《Natural Language Processing and Text Mining with Graph-Structured Representations》中,对基于图结构(graph-structured representations)的自然语言处理和文本挖掘进行了深入研究。这篇博士论文将自然语言处理和文本挖掘的多个核心任务与图结构的强大表示能力结合起来,从而充分利用深度学习的表示能力和文本中的结构信息来解决诸多问题:(1)组织信息(Information Organization):提出了基于树/图结构的短文本/长文本对的分解算法以提高语意匹配任务(semantic matching)。基于文本匹配,进一步提出事件粒度的新闻聚类和组织系统 Story Forest;(2)推荐信息(Information Recommendation):提出了 ConcepT 概念挖掘系统以及 GIANT 系统,用于构建建模用户兴趣点以及长短文本主题的图谱(Ontology)。构建的兴趣图谱 Attention Ontology 有助于对用户与文本的理解,并显著提高推荐系统的效果;(3)理解信息(Information Comprehension):提出了 ACS-Aware Question Generation 系统,用于从无标注的文本中生成高质量的问答对,大大降低问答系统的数据集构建成本,并有助于提高阅读理解系统的效果。论文链接:https://sites.ualberta.ca/~bang3/files/PhD-Thesis.pdf引言自然语言处理(NLP)旨在读取和理解未结构化的自然语言文本来完成不同的任务。「如何表示文本」以及「如何进行计算」是其中的两个核心问题。早期的 NLP 研究中,利用 bag-of-words 模型表示文本,通过统计不同单词的频次来形成文本的向量表示,同时结合统计方法进行文本处理,这丢失了文本的词序信息以及单词之间的联系,本质上是用 one hot encoding 来表示每个单词;在深度学习中,研究者根据单词的共现来学习词向量,每个单词由一个 dense vector 表示,语意相似或联系紧密的词在向量空间中距离更小,再结合 RNN 模型(LSTM,GRU 等)进行文本编码完成各种任务;其后又有研究工作将文本类比图像,编码形成矩阵表示,结合 CNN 类模型进行计算;近年来,预训练语言模型,利用自监督学习训练各类大型语言模型,从而给单词或文本赋予上下文敏感的(context-sensitive),多层的语义向量表示,其采用的模型是多层的 Transformer。自然语言的形式及其语意具有层次性(hierarchical),组合性(compositional)和灵活性(flexible)。已有的研究并未充分利用各类文本中存在的语义结构。图(graph)是一种通用且强大的表示形式,可以表达各种不同对象以及它们之间的联系,无论是在自然语言处理,还是在社交网络,现实世界等各种场景都无处不在。本论文在深度学习强大的表示学习能力的基础上,设计并结合了不同的文本的图结构化表示,并利用图结构计算模型,例如图神经网络(Graph Neural Networks), 去解决不同的自然语言处理和文本挖掘问题。论文包含三大部分:第一部分介绍了文本的聚类和匹配,提出各类匹配问题的结构化算法,并进一步提出 Story Forest 系统用于新闻事件的聚类组织和结构化表示。该系统落地到腾讯 QQ 浏览器热点事件挖掘。第二部分关注文本挖掘,提出了 Attention Ontology 兴趣图谱,挖掘和描述用户不同粒度的兴趣点,建立不同兴趣点之间的联系,并可用于刻画文章主题。这部分工作显著提高了 QQ 浏览器,手机 QQ,微信等应用中的信息流推荐系统的效果。第三部分关注文本生成,提出了 ACS-QG 系统,自动从无标注文本中生成高质量的问答对,可用于问答系统的训练,有助于大大减少数据集创建成本,以及提高机器阅读理解的能力。图 1. 文本表示形式以及计算模型的演化图 2. 论文的组成框架第一部分:文本的匹配与聚类第三章 Story Forest 事件聚类组织系统在信息爆炸的年代,查询并找到有价值的信息,对用户而言并不是非常简单的任务。目前的搜索引擎或者信息流服务,会给用户提供一个文章列表。这些新闻文章会包含大量冗余信息,缺乏结构化的组织。本文提出 Story Forest 系统,对新闻文章做事件(event)粒度的聚类,使得报道同一个现实中的事件的不同文章聚类成一个节点,相关联的事件形成结构化的故事树(story tree), 来表征关联事件之间的时间顺序和发展关系。图 3.「2016 年美国总统大选」的故事树,树中的每一个节点代表一个事件已有的文本聚类方法不能很好地对文章进行事件粒度的聚类效果。本文提出 EventX 聚类算法,它是一种双层聚类算法:在第一层聚类中,利用所有文章中的关键词,形成关键词网络(Keyword Graph)并对其进行图分割,分割后的每一个关键词子图,代表一个大的话题,再利用相似度将每篇文章分配到一个最相似的关键词子图之下;在第二层聚类中,每一个关键词子图下的文章形成一个文章图(doc graph), 相连的边代表两篇文章讲述同一个事件,再对文章图进行社区检测(community detection),从而做了第二次聚类。每一个文章子图里的文章代表一个事件。通过双层聚类,即可以对文章对之间做细粒度的语义比较,又可以控制时间复杂度。在得到事件聚类之后,不同的事件节点通过故事结构组织算法,在线插入到已有的故事树中形成故事结构。如果一个事件不属于任何已有的故事树,则形成一个新的故事。图 4. Story Forest 系统以及 EventX 聚类算法第四章 基于图分解和图卷积的长文本匹配文本匹配是判断两个文本之间的关系或者相关度,是 NLP 中的核心问题,有很多的任务其核心都可视为一个文本匹配任务。根据匹配的源文本和目标文本的长短,我们可以将文本匹配任务分成四大类:长文本匹配任务,例如 Story Forest 系统中,一个核心的任务是判断两个文章是否在讲同一个事件;短-长文本匹配,例如输入 query 搜索匹配的文章;短文本匹配,例如问答对匹配,句子对相似度衡量等;长-短文本匹配,例如文本主题分类等等。图 5. 根据源文本和目标文本的长短,将不同文本匹配任务分成四类本章专注于长文本匹配任务,这是很重要的研究问题,然而在此之前,很少的研究工作专注于此。已有的算法基于 Siamese Neural Network 或者 CNN 来编码句子对或者句子之间的交互,无法很好的处理长文本匹配的任务。因为长文本的长度,导致计算复杂度较高;语言的灵活性,导致文本对之间对应的内容难以对齐;同时编码器也难以准确地编码长文本的语义。本文提出 Concept Interaction Graph 用于分解一篇或者一对文章。其主要思想是「化整为零,分而治之」。CIG 中的每个节点包含几个高度关联的关键字,以及和这些关键字高度相关的句子集。当进行文本对匹配时,每个节点包含来自两篇文章的两个句子集。这样,多个节点代表了两篇文章中的不同的子话题,并囊括了文章中的一部分句子并进行了对齐。节点之间的边代表不同子话题之间的联系紧密度。图 6. 根据文章构建 Concept Interaction Graph 的 toy example基于 Concept Interaction Graph,论文进一步提出通过图神经网络(Graph Neural Networks)对文本对进行局部和全局匹配。具体而言,对每个节点上的文本对,利用编码器进行局部匹配,从而将长文本匹配转化为节点上的短文本匹配;再通过图神经网络来将文章结构信息嵌入到匹配结果中,综合所有的局部匹配结果,来得到全局匹配的结果。图 7. 基于 Concept Interaction Graph 和图卷积神经网络的长文本匹配第五章 基于层次化分解和对齐的短文本匹配对于短文本匹配,论文提出了层次化句子分解(Hierarchical Sentence Factorization)来将句子分解为多层的表达,每一层都包含完整的所有单词,并且语句重排列为「predicate-argument」的顺序。随着层数的增加,一个句子逐渐被分解为更加细粒度的语义单元。因此,利用这种多层次,重排序的句子表示,我们可以对齐两个句子,并结合不同的语义粒度去比较他们的语义距离。图 8. 基于层次化句子分解(Hierarchical Sentence Factorization)的句子匹配这种句子分解技术利用了 Abstract Meaning Representation 来对句子做 semantic parsing。然后,它通过一系列的操作,使得每一层都包含句子中的所有单词。对于每一个语义单元,都是谓词(predicate)在前,参数(argument)在后。这种表示充分展现了自然语言的层次性,组合性,并利用归一化的词序来克服自然语言表达的灵活顺序。基于句子的层次分解,论文进一步提出无监督的 Ordered Word Mover's Distance, 结合了最优传输理论的思想去建模句子之间的语义距离。其效果经试验验证显著优于 Word Mover's Distance。同时,论文也提出了将句子的多语义粒度表达,应用于不同的文本匹配模型中,例如 Siamese Neural Networks 中。实验证明,多粒度的匹配效果,显著优于只利用原句进行匹配的效果。第二部分:文本挖掘第六章 ConcepT 概念挖掘系统概念蕴涵了世界的知识,促进了人类的认知过程。从文档中提取概念并构建它们之间的联系对于文本理解以及下游任务有着重要的作用。认识「概念」(concept)是人类认识世界的重要基石。例如,当看到本田思域(Honda Civic)或者现代伊兰特(Hyundai Elantra)时,人们可以联想到「油耗低的车」或者「经济型车」这类的概念,并且能进而联想到福特福克斯(Ford Focus)或者尼桑 Versa(Nissan Versa)等车型。图 9. 人类能对事物进行概念化并产生联想过去的研究工作,包括 DBPedia, YAGO, Probase 等等知识图谱或者概念库,从维基百科或者网页文章中提取各种不同的概念。但是这样提取的概念和用户的认知视角并不一致。例如,与其认识到丰田 4Runner 是一款丰田 SUV 或者说是一种汽车,我们更感兴趣是否能把它概念化为「底盘高的汽车」或者「越野型汽车」。类似地,如果一篇文章在讨论《简爱》,《呼啸山庄》,《了不起的盖斯比》等电影,如果我们能认识到它在讨论「小说改编的电影」这个概念,那么会帮助极大。然而,目前的知识图谱等工作目的是建立一个关于这个世界的结构化知识表示,概念提取自语法严谨的文章。因此,它们不能从用户的视角去对文本(例如 query 和 document)进行概念化,从而理解用户的意图。另一方面,目前的工作也主要在于提取长期稳定的概念,难以提取短时间出现的热门概念以(例如「贺岁大片」,「2019 七月新番」)及它们之间的联系。我们提出了 ConcepT 概念挖掘系统,用以提取符合用户兴趣和认知粒度的概念。与以往工作不同的是,ConcepT 系统从大量的用户 query 搜索点击日志中提取概念,并进一步将主题,概念,和实体联系在一起,构成一个分层级的认知系统。目前,ConcepT 被部署在腾讯 QQ 浏览器中,用以挖掘不同的概念,增强对用户 query 意图的理解和对长文章的主题刻画,并支持搜索推荐等业务。目前它已经提取了超过 20 万高质量的基于用户视角的概念,并以每天挖掘超过 11000 个新概念的速度在不断成长。ConcepT 系统的核心算法架构同样适用于英语等其他语言。图 10. ConceptT 概念挖掘流程:从用户搜索点击日志中挖掘概念ConcepT 系统还可以用于给文章打上概念标签。主要包含两种策略:基于匹配的标记算法和基于概率推断的标记算法。图 11. ConcepT 文章标记流程:将文章打上关联的概念标签图 12. ConcepT 系统从用户搜索 query 中提取的概念展示图 13. 在线 A/B test 结果。ConcepT 系统对 QQ 浏览器信息流业务各项指标有明显提升。其中最重要的指标曝光效率(IE)相对提升了 6.01%。图 14. ConcepT 系统对文章打上概念标签。目前每天可处理 96700 篇文章,其中约 35% 可以打上概念标签。我们创建了一个包含 11547 篇文章的概念标记数据用以评测标记的准确率。人工评测发现,目前系统的标记准确度达 96%。第七章 用户兴趣点建模 Attention Ontology上一章中,我们介绍了概念挖掘系统。为了更加全面的刻画用户兴趣点,我们进一步挖掘包括概念(concept)和事件(event),话题(topic)等等在内的多种短语,并和预定义的主题(category)以及实体库中的实体(entity)等形成上下位等关系。我们将这个包含多种节点,多种边关系,用于用户兴趣点或关注点建模的图谱命名为 Attention Ontology。图 15. Attention Ontology,包含五种节点,代表不同语义粒度的用户兴趣点;三种关系,代表节点之间的上下位,包含,以及关联。Attention Ontology 可以解决「推荐不准」和「推荐单调」的问题。例如:当一个用户看了关于「英国首相特蕾莎梅辞职讲话」的文章后,目前基于关键词的推荐系统可能会识别关键词「特蕾莎梅」,从而推荐给用户很多关于特蕾莎梅的文章。然而这大概率并不是用户的兴趣点。这是「推荐不准」的问题,原因在于系统中缺乏或无法识别合适粒度的兴趣点。另一方面,系统也可能继续推荐更多关于「英国首相特蕾莎梅发表演讲」的文章,这些文章与用户已经浏览过的文章产生了冗余,无法带给用户更多有价值的信息,因此用户也不感兴趣。这是「推荐单调」的问题,而这个问题的本质在于缺乏不同兴趣点之间的联系。Attention Ontology 中包含不同粒度的用户兴趣点,并且不同的节点之间有边来表示它们之间的联系。例如根据 Attention Ontology,我们可以认识到「特蕾莎梅辞职讲话」是和「英国脱欧」这一中等粒度的兴趣点相关的。如果用户浏览了「英国脱欧」这一兴趣点下的不同事件的文章,我们便可以识别出用户不是关注「特蕾莎梅」这个人或者「特蕾莎梅辞职演讲」这一个特定事件,而是关心「英国脱欧」这一话题。而另一方面,知道了用户关注这一话题之后,利用不同兴趣点之间的联系,我们可以给用户推荐相关的文章,从而解决推荐不准和推荐单调的问题。为了挖掘不同性质的短语,如概念和事件短语,论文提出了 Query-Title Interaction Graph(QTIG)用于建模 query 文章 title 之间的联系。这种表示结构将不同 query 和 title 之间的对齐信息,词的 tag,词之间的距离,语法依赖等等信息嵌入在节点特征和边的特征中。利用这种表示,论文进一步提出 GCTSP-Net 模型,将短语挖掘问题建模为「节点分类+节点排序」的问题。该模型对 QTIG 进行节点二分类,抽取出属于目标短语的词;再将节点排序建模为一个旅行商问题,寻找一个最优路径将所有的分类为正的节点进行排序。按照得到的路径,将分类为正的节点串联起来,便得到了输出短语。图 16. Query-Title Interaction Graph. 图中绿色节点为属于输出短语的词。每一个节点代表 query 或 title 中的一个独特的词,边代表两个词相邻或者存在语法依赖。论文设计并实现了构建 Attention Ontology 并将其应用在不同应用中的 GIANT 系统。GIANT 系统包含几大模块:首先,根据用户的搜索 query 和点击日志形成的二分图,来进行聚类得到不同的 query-doc clusters。每个 query-doc cluster 包含一个或多个相似的 query,以及他们的 top 点击的文章。对每一个 query-doc cluster, 我们将其转化为 Query-Title Interaction Graph 表示,并利用 GCTSP-Net 抽取潜在的短语。接下来,我们再利用不同的算法去抽取不同短语之间的关系,形成 Attention Ontology。最后,利用 Attention Ontology 去实现多种应用,包括文章的 tagging,query 的概念化,文本的聚类组织等。同时,Attention Ontology 中的节点可用于在用户画像中描述用户的兴趣点。这样可以提高用户和其感兴趣的文章之间的匹配,从而提高推荐系统的效果。图 17. GIANT 系统架构第三部分:文本生成第八-九章 问答对自动生成问题生成是一种非常重要的文本生成问题,它可以应用在问答系统的训练数据生成,对话系统,教育等等应用中。图 18. 问题生成的不同应用及重要性已有的问题生成系统一般给定一句话和一个答案,要求系统生成某个特定的问题。这种系统属于 answer-aware question generation 系统。然而,它们生成的问题质量并不够好。一个核心问题在于,给定输入的句子和一个答案,我们能问出多个不同的并且合理的问题,是「一对多匹配(one-to-many mapping)」,而训练集中每个输入只有一个标准答案,是「一对一匹配(one-to-one mapping)」。图 19. 根据同样的输入可以问不同的问题本文提出 answer-clue-style aware question generation(ACS-QG)任务,将人提问的过程建模成四步:第一,根据输入选择一部分作为答案(answer);第二,选择一部分和答案相关的信息作为线索(clue)在问题中复述或转述;第三,根据答案选择问题的种类(style),例如 who, where, why 等等,共 9 种;第四,根据输入的句子和以上三种信息(答案 answer,线索 clue, 问题种类 style),生成问题。图 20. 根据输入生成问题的过程问题生成的过程可以从语法树的角度去观察:选择答案片段就像是从语法树中覆盖了一部分信息,而选择线索片段(clue)的过程就是在覆盖的信息附近,选择一部分节点作为提示输出到问题中。图 21. 利用语法树建模问题生成过程本文提出的 ACS-QG 系统,可以从无标注的句子中,生成高质量的问答对数据。它由以下模块组成:数据集创建模块,可以从目前已有的问答数据集(例如 SQuAD)中,创建 ACS-QG 任务的训练数据集;输入选择模块,可以从无标注的句子中,合理的选择和创建(answer, clue, style)三元组作为问题生成的输入;问题生成模块,可以利用输入三元组生成问题,这个模块的训练数据来自于第一个数据集创建模块;质量控制模块,用于过滤低质量的问答对。图 22. ACS-QG 问题生成系统实验证明,ACS-QG 系统能生成大量高质量的问答对,并且效果显著优于一系列已有的问题生成算法。第十章 结论和未来工作本论文利用图结构建模了一系列 NLP 问题中的文本数据,并结合深度学习模型,提高了多种任务的效果。论文中的各种研究,对信息的聚类组织,推荐,以及理解有着重要的意义。未来的研究方向包括:长文本理解,多任务协同学习,以及通用的基于图结构的表示,学习与推理。本论文中的研究已经发表在 SIGMOD,KDD,ACL,WWW,TKDD,CIKM 等各类 top conference 中,论文列表可在作者个人主页找到:https://sites.ualberta.ca/~bang3/publication.html

劳我以生

这些北大博士生的毕业论文,完成了关键一步!

近日,北大物理学院光学所的18位博士生在线完成了毕业论文预答辩工作受到疫情影响北大今年的博士生预答辩工作也显得格外特殊虽然北京大学已经线上开学月余但博士生和导师们无法在实验室、会议室碰面仍然困扰着大家为了保证今年应届博士毕业工作顺利身处五湖四海的博士毕业班同学和导师们都想办法利用网络技术带来的便利克服距离带来的重重挑战解决数据材料等诸多问题完成了毕业论文的关键一步线上答辩会:我准备好啦博士生预答辩是博士生培养的重要环节。防疫教学两手抓,北京大学物理学院现代光学所三月如期举办了远程视频博士毕业生预答辩会。经过充分的前期准备和临床协调,顺利完成了线上预答辩。答辩前答辩秘书提前10天通知提前测试视频软件同学们和导师远程试讲、修改报告答辩当天导师学生登录网络打开视频会议软件调试麦克风、摄像头准备屏幕共享答辩开始!虽然博士预答辩会从会议室搬到了线上,但是要求始终如一的严格,博士预答辩分为四个小组进行,各指导委员会成员全体参加了会议,对每位毕业生研究工作系统性和创新性,论文结构和内容等认真审核。视频会议过程中,为了保证会议效果,主持人根据现场情况协调安排。答辩学生报告时,答辩人打开摄像头,使答辩显得更正式,又增加了现场感。同时,关闭其他人员的麦克风避免干。答辩期间如遇卡顿,提示旁听人员关闭摄像头,答辩人重新进入解决卡顿现象。在光学所师生的共同努力下,本场特殊的线上预答辩会得以圆满结束。克服困难线上开学,居家上课的我们想必都想念过宿舍里成摞的文献和参考书都怀念过图书馆丰富的馆藏都惦记着学校高速的校园网而对于毕业班研究生而言实验室里的研究成果办公室电脑里的资料更是毕业征程上的不可或缺面对从家到学校遥远的距离机智的老师和学生们是这样解决的光学所博士生曹启韬主要研究非线性光学微腔中对称性破缺,包括回音壁微腔光场手征自发对称破缺研究、自发手征对称性破缺微腔激光、微腔表面对称破缺诱导的非线性光学效应等。在上述领域已取得多个重要的研究成果。疫情期间,他按照正常学习工作安排,每天坚持在家学习并进行博士论文撰写等工作。面对网络条件限制和资料查阅困难,他使用VPN远程连接实验室电脑,阅读文献并参与研究组内同学老师的学术讨论。博士生孙风潇主要开展在超导腔、腔光力、玻色-爱因斯坦凝聚等系统中,对宏观量子态相干与纠缠的调控性质的理论研究。居家期间,孙风潇远程连接北京大学物理学院的服务器,进行计算和数据处理工作,以解决家用电脑配置运行速度不够快、无法运行大量的计算程序的问题。光学所博士生王非凡刚刚结束在美国的半年交流,居家开始准备毕业论文。和导师面对面讨论交流的缺少,使得她一时间手足无措。其导师得知这一情况,每周和她讨论;实验室的同学们也通过学校的公共课平台和她交流,最终克服了毕业论文的总体结构构思上的困难。对毕业论文规划较晚的同学,不能返校导致对毕业论文影响颇大。博士生韩猛在导师的帮助下,远程登陆学校电脑,阅读和使用里面的资料数据。同时,导师一直与韩猛保持深入交流并对其论文提出了很多重要的修改意见。同学们更是伸出援手,同样今年毕业的博士生靳剑钊和王慕雪还无私地向韩猛分享了latex模板,助论文写作一臂之力。不同以往的毕业季停课不停学,停课不停研自新型冠状病毒疫情在多地发生后学校积极采取多项措施保障预毕业研究生培养工作的有序平稳开展全校各研究生培养单位制定了在疫情防控期间研究生培养及预毕业生工作方面的工作计划和安排学校及时发布《关于疫情防控期间预计7月毕业博士研究生学位论文全面审查(即预答辩)组织工作的通知》指导各院系开展预毕业研究生在线预答辩工作马克思主义学院思想政治教育研究所采取视频答辩和在线审议的方式,顺利完成了2020年思想政治教育专业博士学位论文的预答辩工作。为了做好线上预答辩,思想政治教育研究成立预答辩工作筹备小组,就答辩议程进行了多次沟通,并设计了预答辩工作流程和应急预案。还预先进行了视频互动演练,并多次测试了平台功能和网络环境,最终保障预答辩会议顺利进行。首次采用在线预答辩,需要克服技术难点、保证工作重点,教育学院组建了视频会议技术支持小组,制作了考生、秘书和评委视频会议系统使用手册;成立了答辩秘书工作群组,并对在线秘书统一培训,重点演示了在线匿名投票方法,为预答辩做好了充分的准备。近日,教育学院已圆满完成预答辩9场37人次,主席主持、考生汇报、评委提问、匿名投票、秘书协调、技术小组幕后保障,所有工作有条不紊,效果堪比现场。经济学院春季学期首场线上学位论文全面审查于近日完成。会议历时3个多小时,一共有5名参加预答辩的博士生同学,按照事先规定好的顺序和流程,利用线上系统的共享功能,依次进行了PPT展示,答辩委员提问,最后由答辩委员会通过现场讨论,经由预答辩秘书形成了对参加预答辩的博士生同学的审查意见。“本次网络视频预答辩完全遵照博士学位论文预答辩的要求、标准和流程规范进行。”参加预答辩的经济学院博士生韩晨宇说,“参与此次网络视频答辩是一种全新的体验,在答辩过程中与答辩委员会的老师们在线视频交流,感觉非常亲切,收获了很多宝贵的意见。感谢学院的精心组织,感谢各位老师和答辩秘书的辛勤工作,保证了此次预答辩的顺利完成。”各个研究生培养单位紧锣密鼓进行学位论文全面审查(即预答辩)工作预毕业研究生、导师、指导组成员多方联动,严格要求,精益求精视频预答辩程序严谨,步骤完备做好书面记录工作,严禁录音录像及时录入管理系统,做好备案工作关于2019-2020学年第二学期研究生学位论文答辩审批与学位审核工作安排的通知已于近日发布为尽可能降低疫情对研究生深造和就业的影响保障符合条件的研究生及时获得学位学校决定本学期毕业生的学位审核工作分两个批次开展将于7月3日和8月14日先后召开两次学位评定委员会会议审议学位克服困难,接受挑战在此种特殊情况我们戮力同心、共克时艰相约那场毕业典礼

遂行不辍

博士论文究竟是怎么写出来的?本科生也可以借鉴!

博士论文写作的方法与技巧!博士论文是攻读博士学位研究生所撰写的论学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在研究方向,开辟新的研究领域。那么,写博士论文需要注意哪些问题呢? 四条准则助你快速写好论文! 一、选题尽量选择对自己又长久研究价值的选题。博士论文毕竟是阶段性的研究成果,这个成果虽然很重要,但不一定都能作为自己今后开展研究工作的出发点。从长计议,应当尽量选择围绕此问题,能长久做下去,作为自己写作博士生学位论文的选题。二、正确引用参考文献学术论文虽然是在吸收前人的研究成果基础上更上一层楼,但是学术论文引用也要有个度,不能过度引用,这也是学术规范的一个基本要求。一篇博士论文的参考文献太多,大量引用别人的成果,那就没有多少是自己写的了。写博士论文难免会有学术文献的引用,但需要把握好度,这个是最基本的。让读者读起来能决定论文是自己辛辛苦苦写出来的,而不是从前人那里抄袭来的。三、树立良好的学风和文风唯实求是,端正学风。博士是最高学位。博士研究生作为高层次人才,任何时候都应珍视自己的学术声誉,不能为达到某种目的而违背学术道德。博士论文的写作者应努力以平易通俗的文字、平实亲切的笔触,可触可感的事例,简洁明快的数字以及形象生动的图表阐述自己的理论观点。不仅应当理论性强,立论扎实,言之有理,而且还应当争取做到行文流畅,逻辑谨严,语句生动,言之有趣。这对博士生来说,虽然是一个更高的要求,然而却是一个经过刻苦努力后能够达到的目标。四、注重积累,打牢功底厚实的学术底蕴是写好博士论文不可或缺的条件。打牢学术功底,这对每一个博士研究生来说,至关重要。博士研究生能否取得高水平的学术研究成果,在很大程度上取决于博士研究生自身的学识和素质的高低。因此,博士论文的写作者必须注重积累,努力提高自身的学术修养。小茶杯论文查重经验分享:论文查重怎么查?每一个系统都有自己独特的优势,在特定时期选择合适的系统才是硬道理,在确定系统安全的情况下、初稿时期选择性价比高的检测系统、像Paperccb就是不错的选择

失吾道者

90后在读博士帮你捋清论文写作思路!金字塔原理优化行文结构

来源:募格课堂 作者:雅丹宝宝,90后在读博士,乐观开朗,积极向上,是一只奋斗在科研路上的小蜗牛。学术论文,它不仅是硕博学生呈现给导师、外审专家、同行的科研成果,更是一个体现作者思维的过程。对于这一过程,我们的理想状态是“想清楚、说明白、知道写什么、怎么写”。但是,在现实中,硕博论文往往出现问题意识不强、思维不明晰、材料堆积、观点罗列等问题。究其原因,首先是“没想清楚”带来了思维混乱,而思维混乱进一步导致了“写不明白”。也就是说,“想清楚、写明白”是这一思维过程的关键。要如何才能做到呢?《金字塔原理》为我们提供了理清思路、高效写作的方法。一、为什么要用金字塔原理进行硕博论文写作简单的说,金字塔原理就是,一切论述都围绕“塔尖”的中心论点展开,这就好比硕博论文,通篇都是围绕所研究的核心问题、核心论点展开。进一步的,金字塔原理在总体结构、内部结构等更为细致的方面,也为硕博论文写作提供了借鉴。(一)金字塔原理的总体结构与硕博论文写作契合 从总体上来看,金字塔原理可以概括为4个方面:第一,结论先行,即文章只有一个中心思想,并且放在文章的最前面;第二,以上统下,即每一层次上的思想都是对相对应的下一层次思想的总结和概括;第三,归类分组,即每一组的思想必须属于同一逻辑范畴;第四,逻辑递进,即每一组中的思想必须按照逻辑顺序排列。而这种结论先行、自上而下的表达,纵向总结概括、横向归类分组的方式,是硕博论文阐述、论证研究问题的有效途径。(二)金字塔原理的内部结构与硕博论文写作契合 金字塔的内部结构,首先表现为不同层级,通过疑问/回答式对话,将阐述的思想纵向相关;其次表现为横向上的分组,各组思想按逻辑顺序形成横向关系,以演绎推理/归纳推理的方式回答上一层次的疑问。其形式大体如下:上图这种清晰的表达,符合硕博论文的写作要求,即围绕研究主题,对思想进行组织,纵向提出疑问、横向对其回答。与此同时,横向上不仅要回答上一层次引出的论点,还要保证符合逻辑。二、“想明白”——如何构建金字塔结构的硕博论文构建金字塔结构的硕博论文,需要遵循“界定问题——结构化分析问题——分析/找到解决方案——组成金字塔结构进行论述”的思路,即是否有问题?问题在哪?为什么这个问题会存在?应该怎么做?并将以上的思维过程,组成金字塔结构进行论述。(一)如何界定问题?问题,是现状与目标之间的差距。但是这个“差距”并不是凭空产生的,而是源于某一背景,即在一系列的条件下产生。在硕博论文写作之前,围绕研究主题收集的材料,阐述研究背景,但是在背景之中我们看到了非理想现象(R1),而我们的期望结果是(R2),如何从R1到R2就构成了我们的研究问题。(二)如何结构化的分析问题?“结构化分析问题”,是从“界定问题”到“找到解决方案”的中间环节,通过此阶段,可以找到问题产生的原因。在分析原因的过程中,要带有一定的“方向感”,也就是对可能的原因进行假设,以此为切入点对问题进行分析。伴随着材料的收集,证明这些假设原因是否能够确立。(三)如何找到解决方案?“解决问题只不过是通过对问题的表述,使解决方案不言自明”。所以,解决方案源于前文对问题进行不断的逻辑分析的过程。通过分析,展现导致非期望结果(R1)的内在结构,如果问题是该结构造成的结果,那么,解决方案就在于对该结构进行调整。(四)如何组成金字塔结构进行论述?金字塔结构的硕博论文,主要包括:引出核心研究问题的序言、纵向上疑问/回答式的对话、横向上演绎/归纳推理。首先,思考序言的叙述方式,即引出核心研究问题的方式要符合思维逻辑,并引发下文需要论述的疑问;其次,明晰纵向上主题与子主题之间的关系,引导疑问/回答式对话;最后,阐述横向上各层级子主题之间的关系,进行逻辑。三、“写清楚”——论文序言及主体的具体写法序言和主体是一篇硕博论文的主要组成部分,如果能够对这两部分进行清晰、细致的阐述,将能够回答文章的核心问题,而结论自然是水到渠成的。那么,如何将其写清楚?(一)论文序言的具体写法 序言的撰写,应遵循“背景——冲突——疑问——答案”的思路,在具体的写作中,四者的顺序是可以根据需要进行调整的。序言的写作可以如下图所示:背景描述:阐述与文章主题相关的内容,但其应具有一个重要的特征,即能够将关键点锁定在特定的时间、空间,在特定背景中提出冲突。冲突:某种不利的、非预期的变化,为提出疑问奠定了基础。疑问:接下来会怎么样?是整篇文章需要回答的问题。答案:提出对上述疑问的回答,并依据金字塔原理纵、横构建全文结构。(二)论文主体的具体写法纵横结构:论文主体部分,其实就是对序言部分“初始疑问”的具体回答、对“答案”的具体阐述,主要通过纵、横结构展开。纵向上,从初始疑问出发,通过疑问/回答的方式,层层提出疑问。并且,上一层次是对下一层次思想的概括、总结,下一层次是对上一层次思想的解释、支持。对纵向上提出的层层疑问,需要横向结构进行回答。并且,横向上的每一组的思想,都必须属于同一逻辑范畴,比如是原因分析,则必须各要素是一致的原因分析。标题:硕博论文属于体量较大的文章,需要通过标题进行清晰表述,一般情况下,通过各级标题形成的目录,可以展示全文的主要思想和分析逻辑。在具体写作中,需要注意以下三点:第一,标题代表了该组横向结构的整体思想,组中的所有思想需要共同解释、支持标题;第二,标题提炼精髓,应简明扼要,并且,相同的观点、建议等,使用相同的句型;第三,每组标题应提前集中介绍,即大标题下应有一段话,集中介绍下面标题的主要内容。行文:具体到每一段的书写,需要注意行文结构,其主要包括:各部分之间的承上启下、上下文之间的过渡、文末总结。承上启下主要是,总结前一部分中的中心思想,和下一部分的主要论点相结合,并用在下一部分的起始句中;上下文之间的过渡主要是,用简短的文字介绍每一关键句要点,明晰已经论述和下一步论述内容,也保证了论点与论点之间的连接流畅;文末总结,即阐明所传达的重要性信息。总的来看硕博论文就是将解决问题的思维的过程进行呈现,我们依据一定的原理进行构建、书写,不仅有助于高效、优质的完成论文写作,也将助力于系统思维的形成。金字塔原理的应用,可以体现在论文整体构建、逐层分析、字里行间等各个方面,从而有助于将硕博论文“想清楚、写明白”。

多襄丸

研究生学位论文外盲审之论文结构不成体系问题

同学们的学位论文送外盲审之后,专家经常会提出一种问题——论文结构混乱,进而同学们的学位论文会因为此项问题导致分数过低,甚至出现论文不合格无法参加答辩。下面笔者就常见的学位论文结构混乱问题进行一下讲解,如有不足之处请多多海涵。图片未作者原创转载请说明chu'c01头重脚轻问题大在第一二章中出现前人研究和概念模型的篇幅大于自己所做内容的篇幅,这样就是我们经常说的头重脚轻。出现这种情况会导致自己研究的内容显得过少,导致科研工作量展现不足。也就是业界所说的“太水”。出现这种情况是很严重的,外盲审的分数几乎不会太高,自己科研部分如果做得再不足的情况下,被毙掉的可能性是非常大的。怎么才能避免头重脚轻的问题呢?首先对自己第一章的内容要进行精炼,无关紧要的赘述不要过多,点到为止,分析前人研究部分要透彻。多写对自己研究成果有支撑的内容,减掉过多的无关内容,这才是关键。在第二章自己内容的部分,基础概念建议不要特别多,可支撑自己的研究部分的基础概念写足,写细,跟自己研究部分无关的概念还是不要写为好,不要为了凑字而过量地去增加无用的内容。想要避免头重脚轻的问题,就需要进行精炼,精炼后的论文质量会得到一定的提升,自然对你的外盲审分值也会有很大的帮助。02章节独立无关联有的同学在自己第三章和第四章出现了两个独立的研究成果,根本不相关。无关联性章节的论文送审是非常危险的,即使你科研做得很好,被专家抓到这一点,把你的论文毙掉,也是合情合理的。因为独立性,是科研成果不成体系的表现,说你不合格是可以的。但是同学们毕竟做了很多的努力,大多数专家在审核硕士学位论文的时候,有的时候会手下留情,让你通过,但是在博士学位论文,这种情况是绝对不允许的,一旦被发现,就是毙掉,绝不姑息。学位论文成体系很重要,奉劝同学们尽量避免,顺利毕业。如何避免章节独立无关联这种情况呢?在开题的时候就要与导师沟通好,进行仔细斟酌,是科研的过程中要与导师频繁沟通,严格把握好研究方向,循序渐进,才能成体系,切忌自己独断独行,毕竟导师的视野和经验要比我们这个入门的小童鞋丰富的多。03独创部分概念过多有的同学为了避免字数不足,在自己所做成果的章节的前部分添加了过多的基本概念以及研究背景,这样做笔者是不赞成的。因为自己所研究成果部分可以写支撑你成果的基本概念,只需要写关键部分即可,过多的部分在第二章已经进行说明了,在这里如果写得过多就会出现与前面重复的现象。也会凸显自己所做部分过少,让盲审专家认为你在灌水,这样是会严重影响你外盲审的分值。如何避免这种现象的产生呢?在自己科研成果部分的章节写支撑自己成果的基本概念的时候点到为止,不需要过多赘述,因为在第二章已经进行了详细的说明。自己平时多做实验,将实验部分尽量完善,自己做的部分多多益善,有益的成果阅读,工作量越足,这样才会得到专家的认可。04总结综上所述,论文体系结构问题是外盲审专家所关注问题的重中之重,稍有不慎,后果惨重。一篇合格的学位论文先成体系结构,再到文章内容。如果你的结构好,内容不足,可能会出现被告知补充实验,小修或大修,不涉嫌造假基本上是不会被毙掉,但是你的学位论文体系出现大问题,被毙掉的概率非常大,所以同学们一定要谨慎去思考和建立自己论文的体系结构,切忌不要图快,踏踏实实稳稳当当才是最重要的。最后祝各位同学科研顺利,早日顺利答辩毕业。

担架队

史上最全的硕博论文指导方略

现在很多说个毕业生也开始面临着论文的写作,虽然说很多硕士毕业生在大学期间对于论文有一些的接触,但是像这种硕博论文大多都是研究性的主题,其专业的性质较强,那么,他们在写作时又与普通本科毕业的学术论文有哪些差异呢?下面我们为大家详细的介绍一些关于硕博论文写作的指导方略,让大家可以有条不紊的进行下去。1.论文构思的要求一般在写硕博论文是一定要围绕人文的主题展开,而且要保证,论文写作是条理清晰,脉络明确,尽可能的有一条贯穿线让整个论文的联系紧密起来,而且硕博论文在写作过程当中,如果掌握了全局的构思,一定能够达到结构的完整。2.论文写作提纲硕博论文在写作过程中,尽可能的要有一个提纲,在提纲的帮助下只要自己掌握一些文的写作结构就一定能够把自己所选取的材料整合起来,并有一定的逻辑关系,让整篇论文看起来比较有层次感。3.标准格式与写作我们对论文写作的其他方面有了关注度之后,那么在论文写作时也要注意一定的论文写作格式要求一般学校都会规定其论文表达的具体格式,只要大家按照学校的要求写就一定没有问题,而且在论文写作时尽可能的要让自己的语句表达通顺,而且也要有一定的外延和内涵部分,让整个论文看起来有深度。4.论文摘要我们在论文创作过程中难免要有一部分的摘要内容,而这些内容一定要尽可能的凸显论文的新见解,也可以是表达自己的论文结论或者意义,其摘要的内容也要结构严谨,表达简明,尽可能的保证自己的文字简练,内容充分概括。这些就是有关硕博论文的写作指南,大家尽可能的要把自己学科领域中所具有的常识内容表达清楚,不要对论文内容作诠释和评论,而是要通过论述、论据的方式充分的展现自己的观点。

鲜矣

研究生学位论文外盲审之论文结构不成体系问题

同学们的学位论文送外盲审之后,专家经常会提出一种问题——论文结构混乱,进而同学们的学位论文会因为此项问题导致分数过低,甚至出现论文不合格无法参加答辩。下面笔者就常见的学位论文结构混乱问题进行一下讲解,如有不足之处请多多海涵。图片未作者原创转载请说明chu'c01头重脚轻问题大在第一二章中出现前人研究和概念模型的篇幅大于自己所做内容的篇幅,这样就是我们经常说的头重脚轻。出现这种情况会导致自己研究的内容显得过少,导致科研工作量展现不足。也就是业界所说的“太水”。出现这种情况是很严重的,外盲审的分数几乎不会太高,自己科研部分如果做得再不足的情况下,被毙掉的可能性是非常大的。怎么才能避免头重脚轻的问题呢?首先对自己第一章的内容要进行精炼,无关紧要的赘述不要过多,点到为止,分析前人研究部分要透彻。多写对自己研究成果有支撑的内容,减掉过多的无关内容,这才是关键。在第二章自己内容的部分,基础概念建议不要特别多,可支撑自己的研究部分的基础概念写足,写细,跟自己研究部分无关的概念还是不要写为好,不要为了凑字而过量地去增加无用的内容。想要避免头重脚轻的问题,就需要进行精炼,精炼后的论文质量会得到一定的提升,自然对你的外盲审分值也会有很大的帮助。02章节独立无关联有的同学在自己第三章和第四章出现了两个独立的研究成果,根本不相关。无关联性章节的论文送审是非常危险的,即使你科研做得很好,被专家抓到这一点,把你的论文毙掉,也是合情合理的。因为独立性,是科研成果不成体系的表现,说你不合格是可以的。但是同学们毕竟做了很多的努力,大多数专家在审核硕士学位论文的时候,有的时候会手下留情,让你通过,但是在博士学位论文,这种情况是绝对不允许的,一旦被发现,就是毙掉,绝不姑息。学位论文成体系很重要,奉劝同学们尽量避免,顺利毕业。如何避免章节独立无关联这种情况呢?在开题的时候就要与导师沟通好,进行仔细斟酌,是科研的过程中要与导师频繁沟通,严格把握好研究方向,循序渐进,才能成体系,切忌自己独断独行,毕竟导师的视野和经验要比我们这个入门的小童鞋丰富的多。03独创部分概念过多有的同学为了避免字数不足,在自己所做成果的章节的前部分添加了过多的基本概念以及研究背景,这样做笔者是不赞成的。因为自己所研究成果部分可以写支撑你成果的基本概念,只需要写关键部分即可,过多的部分在第二章已经进行说明了,在这里如果写得过多就会出现与前面重复的现象。也会凸显自己所做部分过少,让盲审专家认为你在灌水,这样是会严重影响你外盲审的分值。如何避免这种现象的产生呢?在自己科研成果部分的章节写支撑自己成果的基本概念的时候点到为止,不需要过多赘述,因为在第二章已经进行了详细的说明。自己平时多做实验,将实验部分尽量完善,自己做的部分多多益善,有益的成果阅读,工作量越足,这样才会得到专家的认可。04总结综上所述,论文体系结构问题是外盲审专家所关注问题的重中之重,稍有不慎,后果惨重。一篇合格的学位论文先成体系结构,再到文章内容。如果你的结构好,内容不足,可能会出现被告知补充实验,小修或大修,不涉嫌造假基本上是不会被毙掉,但是你的学位论文体系出现大问题,被毙掉的概率非常大,所以同学们一定要谨慎去思考和建立自己论文的体系结构,切忌不要图快,踏踏实实稳稳当当才是最重要的。最后祝各位同学科研顺利,早日顺利答辩毕业。