欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
硕士论文写作的八个基本步骤你知道吗?大团圆

硕士论文写作的八个基本步骤你知道吗?

以下是硕士论文写作的基本步骤、几个关键环节和引文规范问题。第一节写作八步严格地说,在用笔或在电脑上打字写作之前,许多步骤是论文写作所必需的,这在某种程度上比实际写作重要得多。许多过来的人都认识到,在准备一篇大的论文时,完成它是非常重要的。一旦真的准备好了,写作的时间就只有几天到几周。第一步是确定论文的主题。题目是否恰当对论文的成功有很大的影响。甚至可以说,一个好的话题是成功的一半。虽然你可以在你的专业里就任何一门学科写点东西,但是你必须考虑你是否能有新的想法、新的发现、新的观点、新的研究方法、新的材料等等。注意不要选择太大的题目,而不能够在这个相对狭窄的范围内展开。根据众多硕士学位论文的选题经验,本层次论文的选题可以从以下几个方面来考虑:本专业的研究空白、争议热点各抒己见、比较性课题,本专业的选题从其他专业的角度来看这是一种跨学科或边缘效应的选题,而具有新插入角度的老课题在本专业刚刚出现新问题。第二步是收集或《文献检索》,围绕选题阅读相关研究资料和理论基础。这一步的工作很辛苦,可能要花很多时间和精力才能找到信息。这一步是非常必要的。没有这一步,你的论文内容很可能会完全或在很大程度上重复别人所做的工作,这等于无所事事、有所发现的过程,也是启发思想、产生思想火花的过程。如果你不采取这一步骤,你将切断你的新思想、新观点和新材料的来源。这也是为下一步做角度、角度、材料准备。第三步是对课题提出自己的理论假设,或者具体的问题和要研究的核心问题。选题是指论文写作的总体方向和范围。如果你真的想写,你会遇到两种具体的问题。第一类属于观点:我的具体观点是什么?你可以想象一种或几种观点,但它们只是一种假设。通过大量的证据和材料,通过严格的论证和适当的论证框架结构,可以证明你的假设是成立的,从而构成本文的主体。第二类属于实践方面:我应该具体说明哪些问题?你可以提出许多原因和各种环境条件的影响,它们是否与所论证的问题有关,在多大程度上,这需要科学的调查数据和经验分析。无论是哪种情况,都涉及到论文的中心思想或论辩主题,必须明确并贯穿整个论文。由于硕士论文字数比较长,一个常见的问题是作者无法把握全文,无法写作,这无形中脱离了自己原来的假设或具体问题,说了很多与中心思想或示范主题无关的内容,最后得到“加勒比盗窃案”的结果。第四步是决定采用何种研究方法。人文社会科学的研究方法大致可分为思辨研究和实证研究两大类。后者可分为定性研究和定量研究。为了探究社会事实或社会现象,人们采取了不同的研究取向。不同的研究方向有不同的研究方法、不同的研究假设、不同的数据收集方式和不同的结果判断标准。然而,各种研究方法在本文写作中显示出越来越多的兼容性和内在联系。一般来说,根据课题和讨论的具体问题,一种研究方法可以作为主要方法,另一种方法可以作为补充。同时,也需要一些历史、文化、政治等方面的经济投机研究方法。在文科硕士论文中,作者直接对论文进行的定量分析一般规模较小,适应范围有限,更多的是利用他人而非自己直接调查的结果。这是因为研究经费有限,作者进行社会调查的能力有限。一些主要用于逻辑分析的定量分析数据有时会给论文增加一些权重。但是,它必须根据实际需要来做,而不是为了显示研究方法的多样性。例如,如果一个非常宏观的话题原本适合于投机研究,那么添加一个微观定量的调查结果来证明任何事情都是自欺欺人的。这是写一篇好论文要把握的一个具体问题。第五步是论文的框架设计。一般性文章的写作也需要这一步,但对于硕士论文来说,这一步更为必要,要求也更为详细。一般来说,硕士论文应该有主题的第一章,主题的第一章,主要章节和结论。在写作之前,章节应该有一个总的布局逻辑,使结构合理。各章之间有逻辑联系,防止盲目写作、淹没主题、无知。这一步很少一次完成,而且往往会根据资料的收集和调查中遇到的新情况而改变。但正如建筑师在建房前一定要有图纸一样,在写硕士论文的层面上,文章的总体框架不仅能保存在大脑中,而且一般能形成一篇文字,内容比较详细,最好具体到“节”上但“节”的层次不应固定在开头,这样写作时就容易知道了。在论文框架设计阶段,由于写作章节的设计,除了导师的指导外,这是一个在正式写作之前广泛征求其他专家意见的好机会。通过论文框架的设计,可以看出文章的价值或存在的问题。第六步是对获得的文献、调查资料和各种论据进行分析和归类,充实到每一章中,然后进行解释和论证。这实际上是论文写作本身,所以本文的描述意在让作者了解论文写作的过程。各种材料和论据不是用来证明论据或解释具体问题的。只有通过作者对材料的组织和论证引文、修改、增减,才能使其充满活力、极为自然、自足,有效地服务于自己的课题。在这一步中,我们有时需要复习所学的基本专业知识如社会调查统计知识,采用严谨的数据组织方法,密切关注已确定的理论假设或具体问题,调动所学的各种知识,并通过积极的这是主要的、消极的、设计的、反驳的、隐喻的等结论来论证观点或问题,完成论文。第七步,必要时重新估量选题,修正论证对象的范围。这是与第六步同时出现的另一种情形,即通过较为广泛地征求意见和本人的思考,感到原来的选题对自己不适当,或难以完成,那么就要及时调整论文写作的计划,改变选题或调整选题。由于前面已经对本专业的学术研究有过较多的思考和文献检索,即使改变选题,花费的时间一般也不会很多。选题不当、难以完成的另一种情况不在于选题本身,而在于选题论证的范围过大。解决这个问题并不难,把论证对象的范围缩小就是了,这时作者一定要舍得“割爱”,割舍那些用不上的材料。硕士论文写作中,论证对象范围过小的情况很少见,因为二三万字的论文,但也要注意选题范围太小的问题。第八步,对论文从技术上进行规范化的检查和调整。章节设计的技术问题(含目录)、文中的引证标示、注释及编号、文后的参考文献编排,以及不属于论文本身的内容提要(包括英文提要)、关键词等等,都要按照规范化的要求进行检查和调整。这些虽然属于技术性问题,但也反映出作者的治学态度。特别是引证,凡是使用了别人观点的地方,都必须注明材料来源,不能含糊不清,更不能将别人的研究成果变成自己的。标明的材料来源也要十分清楚,论著名称、作者或编者、出版社或发表的刊物名称、出版或发表时间等等,一应具全。有时,一篇较有水平的论文,答辩时提出批评的主要问题是引证的不规范,由于这个原因使论文的评价低一档,这很不值得。论文降重、论文查重,智能降重,毕业论文,学客行免费论文查重,降重软件,学客行论文查重,学客行论文免费查重软件 ,学客行论文降重(来自官网:学客行论文查重,文章由学客行论文查重搜集整理攻略。)

第一鬼

论文中实证分析有哪些方法和软件

什么是实证分析论文?中学的时候,我们要写说明文、议论文、记叙文等,大学后,我们要写各种各样论文,如课程论文、EI论文、SCI论文、毕业论文……那么,论文到底是什么?论文就是指学术研究者通过收集资料、数据,用不同的研究方法如案例分析法、统计分析法验证理论假设,并把研究的课题、过程、得出的研究结论详细清楚地叙述出来,用以指导社会实践生产等。从狭义上来说,运用统计分析法(如方差分析、T检验、回归分析等)对构建的模型或提出的理论假设进行验证,得出研究结论的论文可以称为实证分析论文。实证分析论文的一个基本步骤为:根据已有的经济理论或经济行为构建模型,根据研究模型设计问卷量表,搜集统计数据,运用统计分析软件对数据进行分析,检验提出的假设或模型是否为真,最后修正模型得出研究结论。为什么要使用SPSS?写论文时如何选择合适的统计分析工具?一要看论文研究目的、应用方面,二要看论文模型的研究深度,三要看个人统计知识的基础。目前使用较多的统计软件有Eviews,SAS,Excel,AMOS,SPSS等等。Eviews通常在金融、经济行业中使用,适用于计量经济学,处理国民经济,GDP等时间序列和截面数据;SAS功能强大,但使用条件要求高,要求会编程知识,非统计专业人员难以掌握;Excel作为基础的办公软件,图标制作简单,图形工具强大,但是像直方图、曲线图这类的简单分析结果并不专业,得出的结论不能深入讨论,而excel在统计方法上的运用却是大部分人并未掌握的,操作起来并不比SPSS等软件简单,不能运用在大型统计分析方面;AMOS是在结构模型中使用,更多运用在论文中的因子分析部分辅助SPSS对模型的验证,对问卷进行验证性因子分析,检验问卷的结构效度和拟合度,提高论文深度和意义。SPSS是一款用途广泛,操作简便的基础统计分析软件,通过对数据的采用方差分析、T检验、卡方检验、相关分析、回归分析等方法,找出数据背后潜在的规律和本质,可以运用在各行各业,如市场研究、医学行业、金融行业等。对企业管理者来说,利用SPSS分析数据是制定有效管理措施、挖掘用户画像的基础;对学术研究者来说,SPSS是检验模型,推断事物发展方向不可或缺的工具。SPSS功能虽然没有SAS多,诞生在界面简洁易操作,输出结果清晰易懂,是众多非统计专业和统计专业人员的首选。因此,SPSS是帮助毕业生分析问卷数据、写好实证研究论文最常见的统计软件。但由于SPSS只能识别量化数据,不能识别文本,输入问卷数据时需对选项赋值,所以论文研究常设计量表收集数据。问卷与量表的区别将在下面具体讲解。

猎云号

实证研究的选题经验分享

1.前言如果你想选择一个好的题目,就要抱着对自己和后人负责的态度。当然,除了抽象地理解一个好选题的特性,我们还应该懂得如何在庞杂的文献中找寻自己未来的研究方向。其实,这些经验也是在不断的文献积累中逐步获得的。每当你读新文章时都应该问自己:“它到底做了什么贡献?我可以继续做些什么?”下面我们先来回顾下前辈们是如何讲述他们的选题经验,再结合一些例子讲讲我个人的实践经验。2. 前辈的总结哥伦比亚大学的经济学教授 Don Davis 在“Ph.D. Thesis Research: Where do I Start?” (《博士论文研究:我从哪里开始》)一文中针对博士论文选题给出了一条重要建议:选择你长期感兴趣的话题。这样做不仅有利于激励你完成博士阶段的研究,更是在职业生涯初期为你提供一个可以挖掘和拓展的主题性研究领域。一言以蔽之,博士阶段的选题要避免“竭泽而渔”。Davis ( 2001 ) 还谈到了“ 有趣” ( interesting )选题的几个“参照指标” (indicators)。第一,“有趣”是一个很主观的词,难以统一标准,但总有些依据存在。笔者在这里补充一点,在学术界,“有趣”是一个既基本又苛刻的要求。说它基本是因为 几乎所有导师都会告诉学生要选一个有趣的题目,说它苛刻是因为每个人心中对“有趣” 都有不同的标准。第二,如果作者要让大家觉得选题有趣,那么选题在多大程度上对现实世界有影响就至关重要,简而言之就是选题要有“现实意义”。第三,证明一个问题的 “现实意义”可以通过学术领袖的工作来印证。如果有几位知名学者对你的选题做过相关 研究,那么我们有理由相信,这个选题是重要的。第四,当你证明了自己在做一个重要的 选题之后,要说服读者你的选题是有新意且非常重要的。特别是对实证类选题而言,在前 人的模型中加入一些变量显然不能作为“新意”的代名词。即便使用了全新的数据和方法, 如果实证结果不能给读者带来耳目一新的感觉,如果实证的主题依然老旧,那么这类选题 还是不成功的。普林斯顿大学的经济学教授 Avinash Dixit (1994) 对选题的“现实意义”有自己的理解。他的首要建议就是不要太多顾及选题的社会意义,相反地,他鼓励学生尝试那些看似无用但非常吸引人的题目。显然,Dixit 的观点与 Davis 有很大不同。当然,经济学文献中互相矛盾的理论和实证发现比比皆是,在谈论如何选题时,出现这样的分歧也一点不意外。Dixit 主张兴趣第一,不断尝试,在实践中找到适合自己的方向。针对兴趣,Dixit 还提出了一个非常重要的建议:很多想法和理论上的技巧会突然出现在你脑海里。但是,不要被动等待它们出现,要鼓励自己主动找寻这类想法。所以,要对任何与你研究相关的想法和资料保持高度的兴趣和敏感。只有这样,新的想法和选题才会不断涌现。这一点,作为有一定科研经验的读者应该会感同身受。虽然经济学家在选题是否一定要有“现实意义”存在不同看法,但多数人在谈论选题时都会反复提到“有趣”这个词。原加州大学伯克利分校的经济学教授、现任 Google 首席经济学家的 Hal R. Varian (1997) 在讨论如何构建经济学模型中也提到,在写模型之前一定要确认研究的问题是否有趣。为此,他用了经济学中最常见的概念之一——机会成本。当你选择一个题目做研究时,其实还有其他备选的题目,所以做当前题目的预期收益一定要超过你的机会成本。他认为要检验一个题目是否有趣和重要,关键在于是否提供了新的洞见(insight)。一个很形象的检验方法是,读者看了文章要发出惊叹:“啊,这篇文章解释了如此重要的问题!”总结起来,Dixit 和 Varian 是高屋建瓴地看待选题,展现了大师境界。Davis 的建议很 接地气,适合研究生选题时候参考。虽然语言表达不同,某些观点也有区别,但三位经济 学家都强调选题要新颖要有趣。略微遗憾的是,他们的经验之谈中“战略”居多,“战术” 较少。下文将结合我在实践中的经验教训,提出更细致的操作性建议。我的实践经验由于经验和水平的差距,我对选题的理解与学界前辈们无法同日而语。作为一家之言与大家分享,仅供批判和参考。第一,选题要在大量阅读的基础上。尽管在如何读文献、读多少文献的问题上,经济学家看法各异,但我认为初学者还是应该养成勤读文献的好习惯。我们可以按照个人的研究,将经济学文献大致细分为几个领域,把论文分类归入文件夹。这些文献也包括没有正式发表的工作论文(Working papers) 。寻找文献的过程可以从各领域的文献手册(Handbook)、Journal of Economic Literature (JEL)、Journal of Economic Perspectives (JEP) 等入手,找出前人的文献综述,按图索骥查到文献的发展脉络。然后,通过文献索引查出目前最活跃的作者,根据作者的个人网站查询最新的文献综述及前沿研究。比如,在最近一段时期,哪些作者发表的重要论文最多、被引用最多,那么这些作者就应该被视作最活跃的作者。同时,可以关注 NBER (National Bureau of Economic Research) 每周的工作论文更新,看看这些作者是否也在 NBER 经常发表工作论文。最后,将这些作者定为重点关注对象,时刻关心他们的最新研究。这种关心要做到细致入微,包括知道他们最新论文的投稿状态和正在写作的论文。因为有些写作团队效率非常高,如果你不了解具体情况,遇到选题近似或者重复时,你的论文还没写到一半,他们的文章可能已经被发表。所以,大量阅读除了能提供坚实的文献基础,还能避免选题撞车。第二,选题要符合作者的能力。寻找到一个好的题目,除了了解本领域的发展,还要理解为什么有些问题没人做。那些没有人碰的题目到底是受制于数据还是方法,你本人有能力解决这些吗?事实上,别人做不了的,很可能也是你做不了的。当然,在确认了上述问题之后,如果你有信心解决前人束手无策的问题,那么完全可以尝试挑战自我。这类文章一旦成功,贡献将是普通论文无法比拟的。现实中,一些看起来很“高大上”的题目,往往不是初学者轻易能驾驭的。比如,制度与增长的关系是一个很好的话题,可我们能想象一个年轻的学生去写,结果会如何。这便是老师们通常说的,选题不要太大的原则。虽然这是一个老生常谈的话题,我还是想补充一点,凡事没有绝对。如果一个初学者确实有很深的文献功底,又有很好的数据和方法做支撑,同时非常清楚写出来的论文会是什么层次和质量,老师们应该放手让他去尝试。关于这点,我的看法与 Dixit (1994) 关于选题应该以个人兴趣为重类似:学生的论文总有从不成熟到成熟的过程,应该以兴趣为先,允许错误和失败。第三,选题要有明确的导向性。目前的实证研究,大体有三类选题导向:问题导向、数据导向、方法导向。第一种导向,层次最高,初学者往往难以做到。所以,能做到数据和方法导向,也应该被鼓励。在灯光数据普及前,对增长的研究常常受困于内生性问题。现在这方面的数据多了,双重差分和断点回归等方法也普及了,解决内生性的难度就相应降低了。所以,从技术角度说,如今研究制度对增长的影响,难度比 Acemoglu et al. (2001) 初步探索时期要低些。可是,无论文献如何发展,我们都不会抹煞 Acemoglu et al. (2001) 的功绩,因为在当时的条件下,这类选题是非常珍贵的,研究结果也有着深远的影响。大多数人都难以把问题、数据和方法三者兼顾。换言之,一篇论文诞生后,三个方面总有缺憾。这时,我认为问题是第一位的。读者和审稿人对一个重要的、稀缺的问题,多少会表现得宽容些。现实中,不少论文是数据驱动的。作者往往在获得了一些宝贵数据后才下决心要做一 篇雄文。在大数据成为热点的今天,如果研究者所占有的资源中包括了稀缺的大数据,而 不加以善待和利用,就是对资源的浪费。所以,数据驱动型的论文本身没有错。如果有错, 就是数据拥有者没有把故事讲好,没有把经济学理论(或者直觉)与数据结合好,没有把 问题实质研究透。出现这类情况,我认为可以归结于人的惰性。当数据优势太大时,研究 者往往会忽略问题的重要性。选题时也往往会片面强大数据的独一无二,而轻视了经济学 研究的基本要求。我们做数据分析,归根到底是为了理解经济体的运行规律和人做决策时 的规律。稀缺数据可以给予实证分析更精确的答案,更多因果性的结论,还有更多深层次 和异质性的启示。如果做不到这些,那么即使手握宝贵数据,也难以选得好题目。第四,选题要有自己的态度。所谓自己的态度就是在前人的研究基础上,明确自己的贡献,对过往研究有准确的评价。这个评价必须是客观公正的,在批判前人的时候要非常注意措辞。批判是需要的,但鉴于审稿人可能是你批判的对象,所以要把握尺度做到对事不对人。凡是涉及到批判的部分都要有理有据且措辞文雅。如果选择了一个老生常谈的题目,那么态度就显得尤为重要。如果你没有鲜明的态度, 审稿人会认为这篇文章没有什么贡献和进步,属于邯郸学步,审稿结果就很可能是负面的。同时,审稿人会从投稿人的态度中判断其对文献的熟悉程度和对经济学理论、方法、数据 的掌握程度,从而对文章质量进行评估。第五,选题最好有“源于生活,高于生活”的追求。如今的研究五花八门,数据新奇, 思路开阔。这些当然不是坏事,但我觉得源自生活的选题,可能会更有生命力。比如,时 下大学生就业难和专业不对口等现象比较普遍,它们就属于劳动经济学中的“过度教育”或 者“教育与岗位错配”。做这些研究贴近生活,同时具有科研意义。又比如,一些学者研究 放开二胎生育对妇女参与劳动力市场的影响,也很贴合热点,既有政策意义又有学术价值。近期,不少学者纷纷把目光投向了污染对经济和人们生活的影响,这也是他们有了切肤之 痛后,逐步尝试用经济学方法来研究和解释现实问题。总之,我们身边的很多事,都值得 研究。虽然我不主张扎堆搞热点研究,但多关注身边发生的变化,从中寻找有趣和有意义 的研究课题是值得提倡的。这条建议与 Dixit(1994)和 Varian(1997)的观点不谋而合。最后,选题也要有分享的精神。这是我个人的体会,可能与大部分导师要求学生严守选题的要求相矛盾。现实中,不少人觉得选题特别难,不愿意分享自己的想法。特别是自己发现了一个不错的方向,往往不自觉就“保密”起来。我的看法恰恰相反,选题和思路不需要过度保密。真正好的选题,别人听过也未必能轻易剽窃。在一个良性的环境中,讨论可以带来更多的视角和意见,丰富选题的意义,纠正可能出现的偏差。同时,更多人的讨论,也许更有利于促成合作。我们不能讳疾忌医和闭门造车。把选题和初步思路与合适的人分享,并不会损害个人的利益,相反可以提高自己的研究水平。退一步,如果你有很多好的想法,但受制于时间和精力无法把这些想法全部转化成科研成果,那么与别人分享,促成他们更多更好的研究也是对文献总量的贡献。有很多选题可以分享,说明你的思维没有枯竭。靠保守秘密,靠护着选题,其实已经棋输一招。总结起来,选题的指导思想是要找到一个有趣而又意义的题目。这种意义可以是基于个人兴趣的(Dixit,1994),也可以基于社会价值(Davis,2001)。实现这个目标的基础是:1、有一定的文献积累;2、带着“问题”和“兴趣”找选题;3、清楚个人能力的边界;4、对生活充满奇心;5、学会交流与分享。

问仁

实验研究工作流程详解:如何把你的机器学习想法变成现实

选自stintran作者:DUSTIN TRAN机器之心编译参与:李泽南、Smith从研究思想的提出到实验的具体实现是工程中的基础环节。但是这一过程常常被一些明显的小瑕疵所影响。在学术界,研究生需要辛苦的科研——大量的编写代码,撰写说明以及论文创作。新的工程项目经常需要全新的代码库,而且通常很难把过去应用过的代码直接延伸到这些新项目当中去。基于此种情况,哥伦比亚大学计算机科学博士生及 OpenAI 研究者 Dustin Tran 从其个人角度概述了从研究思想到实验过程的步骤。其中最关键的步骤是提出新观点,这往往需要大量时间;而且至少对作者来说,实验环节不仅是学习,更是解决无法预测的问题的关键所在。另外,作者还明确说明:这个工作流程仅适用于实验方面的研究,理论研究则需要遵循另外的流程,尽管这两者也有一些共同点。机器之心对该工作流程进行了编译介绍,你有什么想法呢?不妨在评论中与我们分享。找对问题在真正开始一个项目之前,如何让你的想法「落地」成为更正式的议题是非常关键的。有时它很简单——就像导师会给你分配任务;或者处理一个特定的数据集或实际问题;又或是和你的合作者进行谈话来确定工作内容。更为常见的是,研究其实是一系列想法(idea)不断迭代所产生的结果,这些想法通常是通过日常谈话、近期工作、阅读专业内和专业外领域文献和反复研读经典论文所产生的。我的所有尚未探索过的研究思想的主文档我发现了一种方法非常有用——即保持一个单一的主文档(master document),这通常需要很多工作。首先,它有一个项目列表来排列所有的研究想法、问题和题目。有时它们可以是比较高层面的问题,就像「用于强化学习的贝叶斯/生成方法」、「解决机器学习领域的公平性问题」;也可以是一些很具体的议题,比如「处理 EP 中记忆复杂度的推理网络」、「规模偏置的与对称的 Dirichlet 先验的分析」。我经常努力把项目列表写得更加简明:子内容通过一些链接进行展开。然后,根据接下来要做的工作来对 idea 清单进行分类。这通常会给我的后续研究指明方向。我也可以根据其方向是否和我的研究观点一致、其必要性和有效性随时修改这些项目的优先级。更重要的是,这个列表清单不仅仅是关于后续观点的,更是关于接下来我更愿意研究什么内容的。从长远角度来考虑,这对于找到重要问题和提出简单新颖的解决方法是有重要贡献的。我经常访问这个清单,重新安排事务,添加新想法,删除不必要的议题。最终当我可以详细说明一个 idea 的时候,它就可以成为一篇比较正式的论文了。一般来说,我发现在同一个位置(同一个格式)迭代 idea 的过程可以使正式论文写作中的衔接和实验过程都变得更加流畅。管理一个项目我们为近期的 arXiv 预印本搭建的 repository我喜欢在 GitHub 存储库中维护研究项目。不管一个「单元」的研究是多少,我都会将其定义成某种相对自我包含的东西;比如,它可能会连接到一篇特定的论文、一个已被应用的数据分析或目前一个特定主题。GitHub 存储库不仅可用于跟踪代码,而且还可用于跟踪一般的研究进程、论文写作进度或尝试其它合作项目。但项目的组织方式一直以来都是一个痛点。我比较喜欢以下的结构,该结构来自 Dave Blei,可参阅:http://www.cs.columbia.e/~blei/seminar/2016_discrete_data/notes/week_01.pdf-- doc/-- 2017-nips/-- preamble/-- img/-- main.pdf-- main.tex-- introction.tex-- etc/-- 2017-03-25-whiteboard.jpg-- 2017-04-03-whiteboard.jpg-- 2017-04-06-stin-comments.md-- 2017-04-08-dave-comments.pdf-- src/-- checkpoints/-- codebase/-- log/-- out/-- script1.py-- script2.py-- README.mdREADME.md 为自己和合作者保持了一个需要去做的事的列表,这让面临的问题和前进的方向变得明确。doc/包含所有的记录事项,每个子目录都包含一个会议纪要或是文献提交,main.tex 是主要文档,每一章节都是不同文件,如 introction.tex,让每个章节分开可以让多人同时处理不同的章节,避免合并冲突。有些人喜欢在主要实验完成后一次写出完整论文,但我更喜欢把论文作为目前想法的记录,并且让它和想法本身一样,随着实验的进展不断推进。etc/是其他与前面的目录无关的内容。我通常用它来存储项目中讨论留下的白板内容的图片。有时候,我在日常工作中获得了一些灵感,我会将它们都记录在 Markdown 文档中,它也是一个用于处置对于工作的各种评论的目录,如合作者对于论文内容的反馈。src/是编写所有代码的位置。可运行的脚本都是直接写在 src/上的,类和实用程序写在了 codebase/上。下面我将详细说明一下(还有一个是脚本输出目录)。编写代码我现在写所有代码的工具都是 Edward,我发现它是快速实验现代概率模型和算法的最佳框架。Edward 链接:http://edwardlib.org/在概念层面上,Edward 的吸引力在于语言遵循数学:模型的生成过程被转化为每行 Edward 代码;随后希望写出的算法被转化为下一行……这种纯净的转换过程免去了在未来试图将代码拓展为自然研究问题时的麻烦:例如,在之前使用了不同的方法,或者调整了梯度估值,或尝试了不同的神经网络架构,或是在大数据集中应用了其他方法等等。在实践层面上,我总是从 Edward 的现有模型示例(在 edward/examples 或 edward/notebooks)中受益,我将预置算法源代码(在 edward/inferences)作为一个新文件粘贴到我的项目中的 codebase/目录中,然后进行调整。这样从零开始就变得非常简单了,我们也可以避免很多低级细节上的缺失。在编写代码时,我一直遵循 PEP8(我特别喜欢 pep8 软件包:https://pypi.python.org/pypi/pep8),随后尝试从脚本共享的类和函数定义中分离每个脚本;前者被放在 codebase/中以备导入。从第一步开始维护代码质量总是最好的选择,这个过程非常重要,因为项目会随着时间不断膨胀,同时其他人也会逐渐加入。Jupyter 记事本。许多人在使用 Jupyter 记事本(链接:http://jupyter.org/)用作可交互式代码开发的方法,它也是嵌入可视化和 LaTeX 的简单方法。对于我来说,我并没有将它整合到自己的工作流中。我喜欢将自己所有的代码写入 Python 脚本中,然后运行脚本。但 Jupyter 等工具的交互性值得称赞。实验管理在好的工作站或云服务商做投资是必要的事。GPU 这样的特性基本上普遍可用,而我们应该有权限并行运行许多工作。我在本地计算机完成脚本编写之后,我主要的工作流是:1. 运行 rsync 同步我本地计算机的 Github Repository(包含未授权文档)到服务器的 directory。2. ssh 到服务器。3. 开始 tmux 并运行脚本。众事驳杂,tmux 能让你超脱此进程,从而不需要等待它的结束才与服务器再次交互。在脚本可行之后,我开始用多个超参数配置钻研实验。这里有一个有帮助的工具 tf.flags,它使用命令行论证增强一个 Python 脚本,就像下面这样为你的脚本增加一些东西:flags = tf.flagsflags.DEFINE_float('batch_size', 128, 'Minibatch ring training')flags.DEFINE_float('lr', 1e-5, 'Learning rate step-size')FLAGS = flags.FLAGSbatch_size = FLAGS.batch_sizelr = FLAGS.lr然后,你可以运行下面这样的终端命令:python script1.py --batch_size=256 --lr=1e-4这使得提交超参数更改的服务器任务变得容易。最后,说到管理实验时输出的任务,回想一下前文中 src/目录的结构:-- src/-- checkpoints/-- codebase/-- log/-- out/-- script1.py-- script2.py我们描述了每个脚本和 codebase/。其他三个目录被用于组织实验输出:checkpoints/记录在训练中保存的模型参数。当算法每固定次数迭代时,使用 tf.train.Saver 来保存参数。这有助于维护长时间的实验——你可能会取消一些任务,后来又要恢复参数。每个实验的输出都会存储在 checkpoints/中的一个子目录下,如 20170524_192314_batch_size_25_lr_1e-4/。第一个数字是日期(YYYYMMDD),第二个是时间(HMS),其余的是超参数。log/存储用于可视化学习的记录。每次实验都有属于自己的和 checkpoints/中对应的子目录。使用 Edward 的一个好处在于,对于日志,你可以简单地传递一个参数 inference.initialize(logdir='log/' + subdir)。被追踪的默认 TensorFlow 摘要可以用 TensorBoard 可视化。out/记录训练结束后的探索性输出;例如生成的图片或 matplotlib 图,每个实验都有自己的和 checkpoints/中对应的子目录。软件容器。virtualenv 是管理 Python 安装环境的必备软件,可以减少安装 Python 的困难程度。如果你需要更强大的工具,Docker containers 可以满足你的需要。Virtualenv 链接:http://python-guide-pt-br.readthedocs.io/en/latest/dev/virtualenvs/Docker containers 链接:https://www.docker.com/探索、调试和诊断TensorBoard 是可视化和探索模型训练的一种优秀工具。因为 TensorBoard 具有良好的交互性,你会发现它非常易于使用,因为这意味着不需要配置大量 matplotlib 函数来了解训练。我们只需要在代码的 tensor 上加入 tf.summary。Edward 默认记录了大量摘要,以便可视化训练迭代中损失的函数值、渐变和参数的变化。TensorBoard 还包括经过时间的比较,也为充分修饰的 TensorFlow 代码库提供了很好的计算图。对于无法只用 TensorBoard 进行诊断的棘手问题,我们可以在 out/目录中输出内容并检查这些结果。调试错误信息。我的调试工作流非常糟糕。对此,我在代码中嵌入打印语句并通过消去过程来寻找错误。这种方法非常原始。虽然还没有尝试过,但我听说 TensorFlow 的 debugger 功能非常强大提升研究理解不断考研你的模型与算法,通常,学习过程会让你对自己的研究和模型有更好的了解。这可以让你回到制图板上,重新思考自己所处的位置,寻求进一步提升的方法。如果方法指向成功,我们可以从简单的配置逐渐扩大规模,试图解决高维度的问题。从更高层级上看,工作流在本质上就是让科学方法应用到真实世界中。在实验过程中的每一次迭代里,抛弃主要想法都是不必要的。但另一方面,这一切的理论基础必须稳固。在这个过程中,实验并不是孤立的。合作、与其他领域的专家沟通、阅读论文、基于短期以及长期角度考虑问题、参加学术会议都有助于拓宽你看待问题的思路并能帮助解决问题。说明本工作流主要用于实证研究,但其中的一些方法是值得其他任务参考的。主文档结构的模板可以参考:https://github.com/stinvtran/latex-templates参考文献1. Gelman, A., & Shalizi, C. R. (2012). Philosophy and the practice of Bayesian statistics. British Journal of Mathematical and Statistical Psychology, 66(1), 8–38.2. Pearl, J. (2000). Causality. Cambridge University Press.3. Wainwright, M. J., & Jordan, M. I. (2008). Graphical Models, Exponential Families, and Variational Inference. *Foundations and Trends in Machine Learning, 1(1–2), 1–305.

淚眼俠

如何动手写一篇实证论文文章?实证论文写作经验分享

摘要:同学们在论文写作过程中,常常把握不好写文章的重点、难点、顺序以及相关规范等问题。在这篇文章中,笔者将与同学们一起分享如何动手写实证文章的个人经验。第一个经验是,时刻要想着自己的观点,即文章的重点是命题或观点,要有能推进某一个领域某个方面的理论认识。第二个经验是,观点是搭在架子上的。写文章的难点是搭架子,这个架子由三部分组成:理论框架图、研究设计图和研究路线图,架子上搭的东西是问题和假说。第三个经验是,写文章的顺序是先做文献综述以发现和提出问题,然后借助模型、跑数据看结果,结果不错就可以考虑进入写作了。第四个经验是,写文章要符合相关规范,保证文章内容完整,从题目、摘要到参考文献等,该有的都要有。平常和学生交流,他们常常抱怨,写一篇实证论文,抓不住重点,有种无从下手的感觉。任教这么多年,我在文献阅读与写作的教学实践中发现,同学们开始论文写作时,通常都会遇到下面这些阻碍:内容不完整、架子搭不起来,不知道先做干什么后干什么,该有的没有。正是这些阻碍,导致要么是比较灰心,不愿意再尝试,要么是费了很大力气,收效甚微。概括起来,主要有四方面的问题:第一种是没有观点,没有观点的文章是无法做到目标明确、重点突出的。第二种是搭不起架子,内容都是散乱堆砌在一起。第三种是想动手之后,搞不清楚先做什么后做什么。最后一种是对写论文考虑不够全面,即按期刊发表的要求来看,文章内容上是有缺失的,搞不清楚一篇文章到底应包括哪些部分。在这篇文章中,我将探讨聚焦于以下几个关键词:实证文章写作、年轻朋友、初次尝试写作,在此基础上从大的方面讲讲写一篇实证论文需要注意的地方,需要做哪些准备等。在我看来,这个大的方面有四个:第一是观点,第二是搭架子,第三是行动顺序,第四是内容完整性。个人觉得,以上四个方面注意到了,尤其是一篇文章的观点搞定了,一篇文章能够写出来也就八九不离十了。其他一些方面(如模型、变量与指标、估计方法等)都是一些细节,可以具体做的过程中着手解决。希望我的分享,能够帮助大家严肃、冷静地面对论文写作中的千头万绪,不至于灰心。从不会到会,从不熟练到熟练,都有一个过程;很多时候,这个过程都是反复的,需要有毅力和耐心。一、观点最重要!众所周知,写一篇文章,最重要的是要有观点。那么,什么是观点?从问题来看,观点就是针对某个问题所给出的正面回答,它是对某个领域、某个问题在认识上的推进。从命题来看,结论是根据分析结果对命题或假说进行检验,然后经过论证得出的。可以说,结论是就是暂时可以接受的命题(这是证伪意义上的)。观点有两个特点:一是问题导向性,即观点都是针对问题的。什么是问题?问题是理论预期与事实现状的差距。从这个角度来看,观点要能针对这个“差距”提出具体的判断和看法。二是针对性,即观点都是针对已有认识而存在。在这个方面,既要搞清楚别人的问题和命题,也要搞清楚自己的问题和命题,做到知己知彼。观点是一篇文章的核心,所有的准备工作都是围绕这个核心展开,提出和检验都是针对这个观点的;不仅如此,还需要对其进行论证。前人的观点,别人和自己的观点都是知识谱系中的一部分。在我看来,“今生”看到的是观点,观点的“前世”是命题和问题。因此,在一篇实证论文准备阶段,要下力气的地方就是把与观点有关的内容讲清楚:第一个与观点有关的是问题,第二个与观点有关的是命题,第三个与观点有关的是如何检验命题,并给出检验结果及相关推断,第四个是讨论。观点是开放性的,要将观点置于争论的场景。前面的三个方面是最基本的了。也就说,在准备环节需要准备、检查的方面至少包括:①关注的问题是什么?②针对这个问题,提出的新的命题或假说是什么?③检验这个新命题的思路和方法是什么?目前看来,最需要准备做的工作就是把问题和命题提出来(因为最后得出的观点,就是检验命题的结果),而这是需要在文献综述环节完成的。当然“打磨”和“雕琢”还有赖于阅读、思考和检验的反复循环。具体而言,在论文写作的准备环节,需要从观点的四种形态来把握、检查自己的前期准备工作,这四种形态依次是:问题、命题、实证结果、讨论。①观点的第一种存在形态:问题。新观点都是因问题而起,观点都是对某个困惑的解答。个人认为,从问题这一形态来把握观点,有两点益处:一是观点是有问题导向的,观点直接指向“某个理论预期与事物现状的差距”,它有针对性。二是观点生长于认识分歧点,观点是为了解释、解决或改善认识分歧点或不满意而存在的,它有具体性。从这个角度来看,研究者首先应从问题的角度来审视自己的观点,所支持的观点对应的问题是什么,这个问题内在的分歧点是什么?我们平常所讲的找准问题,其实讲的就是能不能找准这个差距和分歧点。因此,把握观点的第一个关键点就是明了其问题针对性,作者在这一点上要将自己观点与分歧点的联系勾勒和显示出来。显然,从文献入手来梳理和归纳已有研究的认识及分歧是必要的,也是基础性的。②观点的第二种存在形态:命题。命题是研究者提出的针对于问题(或差距、分歧点、不满意)的另一种不同的猜想。个人认为,从命题这一形态来把握观点,才真正给问题的认识和解决注入了研究者自己的理念和血液。可以说,命题是研究者对问题或分歧点给出的正面解答。问题与命题的显著区别是:问题呈现出来的是差距和分歧,而命题给出了针对差距和分歧的具体解。一些初学者搞不定的地方就是,问题部分找不准差距和分歧点,命题部分提不出具体的猜想式回答。简言之,命题是“实”的,而不是“空”的。对研究者而言,观点从问题到命题,是惊人的一跳。把握观点的第二个关键点就是针对某个分歧点提出新的理论性猜想,其难点是选准理论或提出新的理论视角。同样,通过文献综述工作,有助于形成这种猜想,实现这惊人一跳,即找到改善不满意的可能方向。③观点的第三种存在形态:实证结果。从实证结果来看,观点是检验后、暂时接受的命题。计量模型、数据、变量和回归这些忙活了半天,目的就是为了检验,就是试图从实证角度检验所提出的命题或假说。实证结果至少在两个方面有助于观点的成立:第一,它是经验性,它是基于反映现实世界的数据的。第二,它从一个方面(如统计意义上)暂时接受了新命题,它是具体的,至少在统计意义上排除“不显著”的可能性。也就是说,实证结果是支持观点进而论证观点的一个有效路径。如果新命题阶段是观点的出生阶段,那么,到了实证结果阶段,才算是把观点“坐实”了。从这个角度来说,经常没事多用软件跑跑数据、看看结果是必要的。实证结果阶段是从数据、经验、统计等意义上支持了新的命题。因此,把握观点的第三个关键点就是尽可能更加全面地搜集支持新命题的经验证据。④观点的第四种存在形态:讨论。观点的第四种存在形态是说它处于讨论阶段。这个讨论有两层意思:第一层意思是指在该研究的内部,既要探讨基于数据实证结果的其他可能性竞争性解释,还要从文献、数据检验(包括稳健性检验)和数据变量等方面全面统筹这些工作的匹配性和合理性。第二层意思是指该研究的外部,有必要将该研究的内容、结果及结论拿出来和其他人(如老师和同学)交流、探讨,注重观点的可沟通性,看看别人从经验上是否可以理解和接受该研究所提出的观点。因此,把握观点的第四个关键点,就是要从竞争性的角度审视自己的观点,同时对那些“损害”新命题的负面证据和可能给出合理解释。在我看来,准备写一篇实证文章,要随时随地把观点的四种形态拎出来,审视一下自己所做的准备和工作,问一下自己准备是否充分。小结一下:从这部分探讨的内容来看,大家可以发现,我所讲的观点与大家通常上所讲的有明显区别:(1)我讲的观点是在认知和证伪的语境下,观点需要经历不同的阶段,它有一个认识的螺旋式上升过程。(2)我所讲的观点是明确、具体的,既能看清楚与已有认识的联系,也能看清楚其新颖性。(3)我所讲的观点是可以检查的,即整个认知和研究过程可以从“技术环节”上检查和审视。训练题目:可以拿出一篇自己感兴趣的实证论文,尝试归纳概括一下这篇论文观点的四种形态。具体而言:(1)这篇论文的观点所针对的问题是什么?(2)这篇论文所提出的新命题是什么?(3)这篇论文实证结果是什么?(4)在讨论环节对该文观点有挑战性的观点还有哪些?二、搭架子搭架子的目的就是论证观点,在实证论文中就是提出并检验命题。在一篇文章中,观点是论证出来。就实证论文而言,论证观点的思路和过程是:提出问题和命题,然后实证检验,进而讨论最后得出结论。搭架子首先要搞清楚一篇文章的目标和重点,一篇文章的目标是要推进某个领域或对某个事物的认识,而重点就是要提出和检验一个或多个命题。因此,搭架子就是要围绕目标和重点展开。一般而言,搭架子包括三个部分:提出问题、提出假说、构建研究设计。相对而言,搭架子体现的是专业的研究能力了。从观点的四种形态来看,第一种形态(问题阶段)是在文献综述下完成的。接下来的三种形态,最为紧要的是命题阶段和检验阶段。其中,命题阶段,对应的是理论框架图或分析框架图。检验阶段,对应的是研究设计图。从具体准备和行动的角度来讲,还有一个研究技术路线图,它要在具体研究部署上落实理论框架图和研究设计图里面的考虑和想法。观点是搭在架子上的,写文章的难点就是搭架子。通常来讲,写文章就是讲观点、论证观点,可以将这种套路称为传统范式。而目前实证论文的要求则是提出问题和命题,并检验命题,论证是在提出命题和检验命题的过程完成的,这符合实证研究的证伪范式,可以将这种套路称为新范式。从形式上看,传统范式与新范式的区别在于:新范式有明确的架子,而传统范式的架子,要么是没有,要么是隐藏起来的。搭架子有助于检查研究者的思考和研究过程是否合理,当然也有助于别人来认识和了解文章的思路、内容及观点。对于初学者而言,需要想着找架子并把架子搭起来是必要的。从个人经验来看,搭架子要明白两点:一是架子上搭的东西是什么,架子上搭的是命题。二是架子有哪几类。具体而言,搭架子的架子通常有三类:①理论框架图或分析框架图。②研究设计图。③研究技术路线图。对于每位研究者或者作者而言,都需要问一下自己:这三个架子:是什么、有什么用,怎么来搭建。很多时候,尽管在文中没有呈现出这三个图,但在脑海里还是应该有的。第一、是什么。①分析框架图或理论示意图(相对而言,分析框架图有些时候可以是概念性的,即没有明确的理论直接对应),一般来讲都是在讲基于某个理论对某个事物或研究对象的行为逻辑的认识和理解,通常把这种行为逻辑用机理或机制来表示。其中,有三点需要重视:首先,这个图瞄准的是针对某个具体研究对象的命题。可以这样来讲,理论示意图或分析框架图是对所考察问题或命题的理论猜想。其次,这个图里要有理论,只不过理论示意图中的理论更加明确。本质是在讲理论,选择理论很重要。最后,所使用的工具是概念或变量,用它们之间的逻辑联系来阐释作用机制。②研究设计图体现的是借助数据和模型检验命题的思路和方法。也就是说,一个研究设计图中至少要包括三个元素:第一个元素是待检验的命题(一个或多个);第二元素是检验命题的素材,如数据或案例等;第三个是检验命题的思路和方法。③研究技术路线图是实施步骤,体现的是工作部署。技术路线图的核心和基础是研究设计,要体现出问题、命题以及对命题的检验。技术路线图对瞄准研究目标的工作步骤进行分解,即技术路线图要做到:其一是目标导向,所有的工作环节都要指向目标,都是为实现目标服务的,工作环节之间要有逻辑性和递进性。其二是要体现整个研究工作的重点和难点,按重点分节或分块,使得路线图体现出阶段性和层次性。第二、有什么用。这三个图对于把文章写出来尤其是把观点讲明白、讲清楚是十分重要的。它们起的作用是“指导”,指导作者如何展开具体的检验命题工作。具体而言:①理论框架图的指导作用是,选出一个更适合的理论(或理论视角)来缩小分歧或改善不满意,同时也借助理论将命题的内在逻辑呈现和提炼出来,供计量分析进一步检验。②研究设计图的指导作用是,将命题、计量模型、数据及变量与指标统筹起来考虑如何实施对命题的检验工作。③研究技术路线是在时间顺序上,根据研究条件对研究设计进行部署和安排。因为不可能一口气就能把所有工作都干完,这就涉及一个工作步骤的问题。研究技术路线图首先应该显示的是将对命题检验的工作进行分解的考虑和部署。这个图的作用:一是对研究工作分出节点来。二是对命题的分解,即一个核心命题可以分为几个子命题。三是对单个命题的检验,要能体现出检验思路。第三、怎么搭。当然,以上三个图都要有一段文字(这绝对是必要的!)来阐述图中的内容及其关系,而不是一个光秃秃的图,让读者自己来猜。此外,搭架子需要注意的是:(1)核心是命题及其检验。命题是焦点,它是观点的主体和核心。上述三个图都是关于问题的新命题或新假说展开的,也就是说,上述三个图都是针对观点的第二个形态即“命题”展开的。(2)提醒自己是否在思维上做到简洁直观。如果这三个图在脑海里还是比较乱,不清晰,甚至图中的字数都很多,则需要完善。(3)查缺补漏,看看自己是否有遗漏,还缺什么条件等。关于上述提及的这些需要注意点,都可以找一些范文来研读、揣摩体会。由搭架子想起的,还有两个事情:一个是理论基准问题,另一个是研究工具和手段问题。从上面的阐述来看,在写论文搭架子的过程中,可以发现,如果平时学习过程中不重视理论和方法的学习和积累,真的动手起来,就会捉襟见肘了——没有理论基准,要画个理论示意图是困难的,没有研究工具和手段,即使能提出一个好的命题,也无从下手。显然,这两点都是要在平时留意并下大功夫的。训练题目:(1)可以拿出一篇自己感兴趣的实证论文,假设自己是作者,尝试“复原”一下这篇论文的三个图:理论框架图、研究设计图和研究技术路线图。(2)以三个图中的某一个图为例(如理论框架图),搜寻三篇都有理论框架图的实证论文,比较分析一下作者在构思和“创作”理论框架图上的同与不同。三、行动顺序观点和搭架子都要落实在行动上。写文章有千头万绪,究竟从哪里开始才算合理和高效的,又该如何一步一步有条不紊地进行呢?行动顺序,可以分为准备和写作两个阶段。根据我的认识,这两个阶段在行动顺序上有四个要求:第一、行动顺序要符合认知理性。即思考、研究和写作都是为了更好地提出猜想并对猜想进证伪。第二、行动顺序要符合实证检验的思路。文章最终的观点起始于问题,途经问题、命题和检验,终于讨论,准备和写作过程都要对观点的四个阶段保持敏感性。第三、行动顺序要符合反复检验的特点。实证研究是一个反复干的循环过程。第四,行动顺序要是在理论分析框架等三个图的指导下进行的。第一个阶段是准备阶段。总的来看,准备阶段的工作思路是:提出问题——提出命题——初步检验——深入考察——得出结论。如前所述,文章的核心是观点,观点的“前世今生”分别是问题、命题和实证结果。而一篇文章的问题和假说从哪里来,主要是从文献综述来。那么,工作的起点就是围绕自己感兴趣的一个领域进行阅读,然后提出问题和命题(或假说),即主要依靠文献综述提出问题和命题。随后,针对该命题,先用计量模型和软件跑一下数据,这是第二步,即初步检验命题——用计量模型和软件跑数据。如果估计结果差不多。根据文献综述和跑出来的实证结果,在脑海里构思理论分析框架等三个图,然后根据这三个图开始思考和布局研究设计,这是第三步,即统筹考虑文献综述、问题和命题、数据检验结果后,开始谋篇布局。这是一个比较全面的整体性考虑。第二个阶段是写作阶段。根据我的个人经验,整个写作可以分为六步:第一步,写综述,提出问题和命题;第二步:写研究设计和实证分析部分;第三步,写引言和结论部分,对综述做修订;第四步,审视全文,写摘要;第五步,补充引用、注释和参考文献;第六步,聚焦观点,全面修改完善。这六步是为了概括起来方便而已,当然仁者见仁了,各有各的写作习惯。关于行动顺序,年轻朋友常常问:从哪里开始,要注意什么?我的个人体会就是:第一、一切始于文献综述。文献综述很重要,它不仅有助于界定“差距”、揭示分歧点、提出新的猜想,而且还为实证检验环节的模型、变量、指标及估计方法输送“炮弹”。显然,如果没有夯实文献综述工作的地基,则后续环节都很被动了。给年轻朋友的一个忠告就是,不要以为文献综述就是走过场,可以混过去。第二、判断一篇文章可以“进入”写作环节的标准就是假说是否形成。这个形成有两层意思:一是针对差距和分歧点,提出了新的猜想,这个猜想是具体的,有理论针对性。二是这个新的猜想经过了数据和模型的初步检验。第三、写一篇实证论文最容易忽视的环节就是讨论阶段。很多年轻朋友认为有了文献综述、实证分析就大功告成了,实则不然。同样重要的是讨论,它担负的是排除竞争性假说的重任。第四、整个行动是有反复的,而不是单向流程,其中,有些环节,要反复做。做实证研究、写论文如同打铁——加热、捶打、放置于冷水中淬火,然后再反复。概而言之,在具体行动上,有必要问问自己:(1)文献综述扎实吗?(2)假说搞定了吗?(3)讨论是否充分?(4)还需要把哪些工作再反复做一下?四、内容完整在这里,我将根据期刊论文发表的标准来概括一篇实证文章所应该包含的内容,具体见表1的左列。从内容完整性来看,一篇论文至少应包括“引言”等六部分,即使最后一部分里包括的注释等都是不可或缺的,都是这个“作品”应有的。接下来,我将讲讲文章结构及内容与观点四个阶段的关系。文章的目的是提出问题、进行实证检验最终得出结论。可以从观点的四种型态来检查内容的完整性。了解文章内容完整性的要求是必要的。第一、了解认识一篇文章应包括哪些内容或部分,既是开始准备时要考虑的,也是做好之后检验的必备。第二、在准备的过程中,要随时提醒自己,以避免遗忘有关内容部分。一篇实证论文包括的内容很多,百密都有一疏,因此谨慎和细心的态度是必要的。表1给出了文章每一部分的具体位置和功能。具体而言,引言的功能是“提出问题及命题并论证观点”;文献综述及假说提出的功能是“发现问题与提出命题”;研究设计的功能是“检验命题”;实证分析的功能是分析与讨论“实证结果”(其中“(四)进一步讨论”与观点的第四种型态对应);“结论及政策建议”的功能是得出“结论”。其他的功能是辅助性的。可以看出,每一部分都和观点的四种型态有关。脑海里有了表1,大家对一篇实证文章的大致格式、具体作用和篇幅就可以做到心中有数。对于初学者而言,总结出以上这些内容,其用意有这么几个:一、通过这些归纳和梳理,有助于大家先从形式上进行模仿、照猫画虎。二、帮助其明白这些内容在文中所扮演的功能和位置。同时,初学者自己也应该找到一些自己感兴趣的论文,揣摩与体会文中有关内容的好与不好;同时,对好的表述或呈现方式进行总结,以备己用。本篇文章很长,能看到这里的同学们都是很有耐心的,希望以上经验能对你有所帮助,收藏起来慢慢看,你一定能够写好一篇实证论文的

天君

实证研究选题经验分享

最新电影《模拟游戏》讲述了图灵这位数学天才传奇而结局悲凉的一生。每个时代, 天才总是孤独的,平凡人羡慕天才们超凡的智慧与想象力,却难以企及。除了极少数如图 灵般的天才开创了某一个领域,甚至某一个学科,大部分科研工作者的劳动都是在极其狭 小的领域中或前人的成果上进行的。他们劳动的价值,有时难以用短期眼光来衡量。有些 论文,也许在几十年中都没有人引用。有些研究,除了作者本人,甚至没有第二个人知晓。然而,他们依然坚定地工作着。正如图灵坚信他的机器可以破译德国的 Enigma 密码,坚信他的理论一定是正确的一样,大部分科研人员都执着地认为自己的工作虽然在很长时间内不会对外界产生影响,但终有一天,后人会去翻看他们留下的论文、 笔记、手稿、采访记录——一切可以留下的、解释他们对世界看法的点点滴滴。说了那么多,只为了解释一点:如果你想选择一个好的题目,就要抱着对自己和后人负责的态度。当然,除了抽象地理解一个好选题的特性,我们还应该懂得如何在庞杂的文献中找寻自己未来的研究方向。其实,这些经验也是在不断的文献积累中逐步获得的。每当你读新文章时都应该问自己:“它到底做了什么贡献?我可以继续做些什么?”下面我们先来回顾下前辈们是如何讲述他们的选题经验,再结合一些例子讲讲我个人的实践经验。01、前辈的总结哥伦比亚大学的经济学教授 Don Davis 在“Ph.D. Thesis Research: Where do I Start?” (《博士论文研究:我从哪里开始》)一文中针对博士论文选题给出了一条重要建议:选择你长期感兴趣的话题。这样做不仅有利于激励你完成博士阶段的研究,更是在职业生涯初期为你提供一个可以挖掘和拓展的主题性研究领域。一言以蔽之,博士阶段的选题要避免“竭泽而渔”,Davis (2001) 还谈到了“ 有趣”( interesting )选题的几个“参照指标”(indicators)。第一,“有趣”是一个很主观的词,难以统一标准,但总有些依据存在。笔者在这里补充一点,在学术界,“有趣”是一个既基本又苛刻的要求。说它基本是因为 几乎所有导师都会告诉学生要选一个有趣的题目,说它苛刻是因为每个人心中对“有趣” 都有不同的标准。第二,如果作者要让大家觉得选题有趣,那么选题在多大程度上对现实世界有影响就至关重要,简而言之就是选题要有“现实意义”。第三,证明一个问题的 “现实意义”可以通过学术领袖的工作来印证。如果有几位知名学者对你的选题做过相关 研究,那么我们有理由相信,这个选题是重要的。第四,当你证明了自己在做一个重要的选题之后,要说服读者你的选题是有新意且非常重要的。特别是对实证类选题而言,在前 人的模型中加入一些变量显然不能作为“新意”的代名词。即便使用了全新的数据和方法, 如果实证结果不能给读者带来耳目一新的感觉,如果实证的主题依然老旧,那么这类选题 还是不成功的。普林斯顿大学的经济学教授 Avinash Dixit (1994) 对选题的“现实意义”有自己的理解。他的首要建议就是不要太多顾及选题的社会意义,相反地,他鼓励学生尝试那些看似无用但非常吸引人的题目。显然,Dixit 的观点与 Davis 有很大不同。当然,经济学文献中互相矛盾的理论和实证发现比比皆是,在谈论如何选题时,出现这样的分歧也一点不意外。Dixit 主张兴趣第一,不断尝试,在实践中找到适合自己的方向。针对兴趣,Dixit 还提出了一个非常重要的建议:很多想法和理论上的技巧会突然出现在你脑海里。但是,不要被动等待它们出现,要鼓励自己主动找寻这类想法。所以,要对任何与你研究相关的想法和资料保持高度的兴趣和敏感。只有这样,新的想法和选题才会不断涌现。这一点,作为有一定科研经验的读者应该会感同身受。虽然经济学家在选题是否一定要有“现实意义”存在不同看法,但多数人在谈论选题时都会反复提到“有趣”这个词。原加州大学伯克利分校的经济学教授、现任 Google 首席经济学家的 Hal R. Varian (1997) 在讨论如何构建经济学模型中也提到,在写模型之前一定要确认研究的问题是否有趣。为此,他用了经济学中最常见的概念之一——机会成本。当你选择一个题目做研究时,其实还有其他备选的题目,所以做当前题目的预期收益一定要超过你的机会成本。他认为要检验一个题目是否有趣和重要,关键在于是否提供了新的洞见(insight)。一个很形象的检验方法是,读者看了文章要发出惊叹:“啊,这篇文章解释了如此重要的问题!”总结起来,Dixit 和 Varian 是高屋建瓴地看待选题,展现了大师境界。Davis 的建议很 接地气,适合研究生选题时候参考。虽然语言表达不同,某些观点也有区别,但三位经济 学家都强调选题要新颖要有趣。略微遗憾的是,他们的经验之谈中“战略”居多,“战术” 较少。下文将结合我在实践中的经验教训,提出更细致的操作性建议。02、我的实践经验由于经验和水平的差距,我对选题的理解与学界前辈们无法同日而语。作为一家之言与大家分享,仅供批判和参考。第一,选题要在大量阅读的基础上。尽管在如何读文献、读多少文献的问题上,经济学家看法各异,但我认为初学者还是应该养成勤读文献的好习惯。我们可以按照个人的研究,将经济学文献大致细分为几个领域,把论文分类归入文件夹。这些文献也包括没有正式发表的工作论文(Working papers) 。寻找文献的过程可以从各领域的文献手册(Handbook)、Journal of Economic Literature (JEL)、Journal of Economic Perspectives (JEP) 等入手,找出前人的文献综述,按图索骥查到文献的发展脉络。然后,通过文献索引查出目前最活跃的作者,根据作者的个人网站查询最新的文献综述及前沿研究。比如,在最近一段时期,哪些作者发表的重要论文最多、被引用最多,那么这些作者就应该被视作最活跃的作者。同时,可以关注 NBER (National Bureau of Economic Research) 每周的工作论文更新,看看这些作者是否也在 NBER 经常发表工作论文。最后,将这些作者定为重点关注对象,时刻关心他们的最新研究。这种关心要做到细致入微,包括知道他们最新论文的投稿状态和正在写作的论文。因为有些写作团队效率非常高,如果你不了解具体情况,遇到选题近似或者重复时,你的论文还没写到一半,他们的文章可能已经被发表。所以,大量阅读除了能提供坚实的文献基础,还能避免选题撞车。第二,选题要符合作者的能力。寻找到一个好的题目,除了了解本领域的发展,还要理解为什么有些问题没人做。那些没有人碰的题目到底是受制于数据还是方法,你本人有能力解决这些吗?事实上,别人做不了的,很可能也是你做不了的。当然,在确认了上述问题之后,如果你有信心解决前人束手无策的问题,那么完全可以尝试挑战自我。这类文章一旦成功,贡献将是普通论文无法比拟的。现实中,一些看起来很“高大上”的题目,往往不是初学者轻易能驾驭的。比如,制度与增长的关系是一个很好的话题,可我们能想象一个年轻的学生去写,结果会如何。这便是老师们通常说的,选题不要太大的原则。虽然这是一个老生常谈的话题,我还是想补充一点,凡事没有绝对。如果一个初学者确实有很深的文献功底,又有很好的数据和方法做支撑,同时非常清楚写出来的论文会是什么层次和质量,老师们应该放手让他去尝试。关于这点,我的看法与 Dixit (1994) 关于选题应该以个人兴趣为重类似:学生的论文总有从不成熟到成熟的过程,应该以兴趣为先,允许错误和失败。第三,选题要有明确的导向性。目前的实证研究,大体有三类选题导向:问题导向、数据导向、方法导向。第一种导向,层次最高,初学者往往难以做到。所以,能做到数据和方法导向,也应该被鼓励。在灯光数据普及前,对增长的研究常常受困于内生性问题。现在这方面的数据多了,双重差分和断点回归等方法也普及了,解决内生性的难度就相应降低了。所以,从技术角度说,如今研究制度对增长的影响,难度比 Acemoglu et al. (2001) 初步探索时期要低些。可是,无论文献如何发展,我们都不会抹煞 Acemoglu et al. (2001) 的功绩,因为在当时的条件下,这类选题是非常珍贵的,研究结果也有着深远的影响。大多数人都难以把问题、数据和方法三者兼顾。换言之,一篇论文诞生后,三个方面总有缺憾。这时,我认为问题是第一位的。读者和审稿人对一个重要的、稀缺的问题,多少会表现得宽容些。现实中,不少论文是数据驱动的。作者往往在获得了一些宝贵数据后才下决心要做一 篇雄文。在大数据成为热点的今天,如果研究者所占有的资源中包括了稀缺的大数据,而 不加以善待和利用,就是对资源的浪费。所以,数据驱动型的论文本身没有错。如果有错, 就是数据拥有者没有把故事讲好,没有把经济学理论(或者直觉)与数据结合好,没有把 问题实质研究透。出现这类情况,我认为可以归结于人的惰性。当数据优势太大时,研究 者往往会忽略问题的重要性。选题时也往往会片面强大数据的独一无二,而轻视了经济学 研究的基本要求。我们做数据分析,归根到底是为了理解经济体的运行规律和人做决策时 的规律。稀缺数据可以给予实证分析更精确的答案,更多因果性的结论,还有更多深层次 和异质性的启示。如果做不到这些,那么即使手握宝贵数据,也难以选得好题目。第四,选题要有自己的态度。所谓自己的态度就是在前人的研究基础上,明确自己的贡献,对过往研究有准确的评价。这个评价必须是客观公正的,在批判前人的时候要非常注意措辞。批判是需要的,但鉴于审稿人可能是你批判的对象,所以要把握尺度做到对事不对人。凡是涉及到批判的部分都要有理有据且措辞文雅。如果选择了一个老生常谈的题目,那么态度就显得尤为重要。如果你没有鲜明的态度, 审稿人会认为这篇文章没有什么贡献和进步,属于邯郸学步,审稿结果就很可能是负面的。同时,审稿人会从投稿人的态度中判断其对文献的熟悉程度和对经济学理论、方法、数据 的掌握程度,从而对文章质量进行评估。第五,选题最好有“源于生活,高于生活”的追求。如今的研究五花八门,数据新奇, 思路开阔。这些当然不是坏事,但我觉得源自生活的选题,可能会更有生命力。比如,时 下大学生就业难和专业不对口等现象比较普遍,它们就属于劳动经济学中的“过度教育”或 者“教育与岗位错配”。做这些研究贴近生活,同时具有科研意义。又比如,一些学者研究 放开二胎生育对妇女参与劳动力市场的影响,也很贴合热点,既有政策意义又有学术价值。近期,不少学者纷纷把目光投向了污染对经济和人们生活的影响,这也是他们有了切肤之 痛后,逐步尝试用经济学方法来研究和解释现实问题。总之,我们身边的很多事,都值得 研究。虽然我不主张扎堆搞热点研究,但多关注身边发生的变化,从中寻找有趣和有意义 的研究课题是值得提倡的。这条建议与 Dixit(1994)和 Varian(1997)的观点不谋而合。最后,选题也要有分享的精神。这是我个人的体会,可能与大部分导师要求学生严守选题的要求相矛盾。现实中,不少人觉得选题特别难,不愿意分享自己的想法。特别是自己发现了一个不错的方向,往往不自觉就“保密”起来。我的看法恰恰相反,选题和思路不需要过度保密。真正好的选题,别人听过也未必能轻易剽窃。在一个良性的环境中,讨论可以带来更多的视角和意见,丰富选题的意义,纠正可能出现的偏差。同时,更多人的讨论,也许更有利于促成合作。我们不能讳疾忌医和闭门造车。把选题和初步思路与合适的人分享,并不会损害个人的利益,相反可以提高自己的研究水平。退一步,如果你有很多好的想法,但受制于时间和精力无法把这些想法全部转化成科研成果,那么与别人分享,促成他们更多更好的研究也是对文献总量的贡献。有很多选题可以分享,说明你的思维没有枯竭。靠保守秘密,靠护着选题,其实已经棋输一招。总结起来,选题的指导思想是要找到一个有趣而又意义的题目。这种意义可以是基于个人兴趣的(Dixit,1994),也可以基于社会价值(Davis,2001)。实现这个目标的基础是:1、有一定的文献积累;2、带着“问题”和“兴趣”找选题;3、清楚个人能力的边界;4、对生活充满好奇心;5、学会交流与分享。

龙行天

撰写一篇学术论文的大致步骤

很多写作论文的人都知道,要完成一篇较大的论文,准备时间少则数月,多则数年,一旦真正准备好了,动手写作的时间不过数天到数周。以下是达晋编译简单总结出来的,撰写一篇论文的大致步骤。第一步,确定论文的选题。从广义上说,只要有新观点、新发现、新角度、新研究方法、新材料等,选任何本专业范围内的题目都能够写出东西来。但有些作者是第一次写学术论文,缺乏经验,也缺乏深厚的知识积累,对选题难以把握。如果选题过大,可能无法在这个相对狭小的范围内展开。所以,选题是否得当,对于论文写作有很大的影响。以达晋编译对论文的选题经验来看,选题可从本专业的研究空白、发生争议的话题、对比性的话题、以其他专业角度研究本专业的话题、有新角度插入的老话题、刚冒出来的本专业新问题等方面来考虑。第二步,围绕已经确定的论文选题,回顾相关的理论和研究,或者叫文献检索。这一步的工作是较为艰苦的,需要有思想准备。因为有些中文学术资料在网上没有,需要手工查找,花费的时间和精力可能很大。拉丁文资料,特别是英文资料虽然由于网络传播的方便条件,相对好查询,但是不少资料即使找到了目录,真正能够阅读到,仍需要作者不懈的努力。全面搜集资料既可以避免重复了别人已经做过的工作,也可以从中启发思路、产生观点,为下一步做观点、角度、材料上的准备。第三步,提出自己关于选题的理论假设,或要研究的具体问题。选题是指准备写的论文的大体方向和范围,在动手写作时,通常会遇到两种情况,一是具体观点是什么,可以先设想出一个或几个观点,再通过许多证据、材料来论证这些假设是否是成立的,从而形成论文的主体;二是具体论证什么问题,可以提出许多原因、各种环境条件的影响,它们是不是与所论证的问题相关,相关到什么程度,这需要通过科学的调查和分析。无论是哪一种情况,都涉及论文的核心思想或论证主题,应当明确,且贯穿论文的始终。第四步,决定采用哪些研究方法。科学研究方法大体可以归为两大范畴,即思辨研究和实证研究,后者又可分为定性研究、定量研究两种具体的研究方法。虽然不同的研究取向有不同的研究方法,不同的研究假设、收集资料的方式和对结果的判断标准,但是各种研究方法在如今的论文写作中,已经越来越多地呈现相容和内在的连接,作者可以根据自己的选题和讨论的具体问题,以一种研究方法为主,辅以其他的方法。例如,以逻辑分析为主的论文,适当采用一些定量分析的数据,有时会给文章增添一些分量。第五步,设计论文的框架结构。一般情况下,一篇论文要有绪章、入题的第一章、主体章节,以及结束语。章节的设置在写前要有个大体的布局逻辑,使之结构合理;章和章之间有一种逻辑联系,防止盲目写下去,淹没主题,不知所云。这一步很少有一次完成的,往往会根据收集材料的情况、调查访问中遇到的新情况,经常变动。但到了写论文这个层次上,大体的文章框架不能仅仅存于脑子中,一般要形成文字,相对细致一些,具体到“节”更好,便于写作时心中有数。第六步,对已经取得的文献资料、调查材料和各种论据进行分析、归类,分别充实到各章节中,再进行解释、论证。各种材料和论据,不是天生就可以证明论点或说明具体问题的,需要通过作者对材料的组织和论证,才能使其变得富有生命力,极其自然、有力地为自己所论的题目服务。往往需要温习一下学过的逻辑学或社会调查统计的知识,用正确的逻辑思维和严谨的数据组织方式,紧紧围绕已经确定的理论假设或具体问题,调动自己所学的各种知识,通过正论、反论、设论、驳论、喻论等手法,论证观点或问题,得出结论,完成论文。第七步,对论文从技术上进行规范化的检查和调整。章节设计的技术问题、文中的引证标示、注释及编号、文后的参考文献编排,以及不属于论文本身的内容提要、关键词等,都要按照规范化的要求进行检查和调整。这些虽然属于技术性问题,但也反映出作者的治学态度。特别是引证,凡是使用了别人观点的地方,都应当注明材料来源,不能含糊不清,更不能将别人的研究成果变成自己的。标明的材料来源也要十分清楚,论著名称、作者或编者、出版社或发表的刊物名称、出版或发表时间等。

五尾狐

心理学笔记-心理学概论(1)

本文将会介绍心理学的基本定义,研究心理学的六大视角,心理学的应用途径以及心理研究的几种方法。1.基本定义心理学是一门用科学的方法研究人的行为和心理过程的学科。研究对象:人的行为和心理过程研究方法:实证研究其中实证研究的基本流程为提出假设(确定操作性定义)-》收集客观数据-》分析结果(接受或拒绝假设)-》发表,评论和重复验证结果2.基本视角研究心理学的基本视角分为六种,通过这六种视角的学习也可以基本了解心理学发展的过程2.1 现代生物学视角现代生物学视角包括两个基本分支 神经科学和进化心理学2.2 现代认知视角从现代认知的视角来看人的思想和行为都是其独特认知模式的结果。基本分支包括构造主义,机能主义和格式塔心理学2.2.1 构造主义主张通过内省来研究人的心理。其代表人物冯特的结构主义将人的心理分为感觉,意象和激情三个部分。2.2.2 机能主义强调意识的作用和功能,一样主张通过内省来研究人的心理。其代表人物是詹姆士。2.2.3 格式塔心理学又叫完形心理学,强调经验和行为的整体性。代表人物考夫卡、苛勒。2.3 行为主义视角行为主义的代表人物华生,斯金纳。研究内容包括程序学习,行为治疗和生物反馈。2.4 全人识角全人视角包括心理动力学,人本主义和特质与气质心理学。2.4.1 心理动力学通过精神分析来研究人的心理,强调无意识心理是人的行为的动力,主要研究无意识与异常行为。代表人物弗洛伊德。2.4.2 人本主义强调人格,自我的概念,自我实现和自尊。代表人物马斯洛,罗杰斯。2.4.3 特质与气质心理学强调差异源与持久的特征和内在的倾向性。2.5 发展视角2.6 社会文化视角3.心理学的应用途径实验心理学心理学教学应用心理学4.心理研究的五种方法4.1 实验法实验法是唯一可以检验因果关系的方法4.2 相关研究4.3 问卷调查问卷调查适合确定人的态度,偏好以及其他特征。4.4 自然观察4.5 个案研究在心理学的研究过程中被试与主试都是人。因此要注意情感偏差与期望偏差干扰研究结果。可以通过双盲实验或者增加安慰剂组来预防。

蝴蝶鱼

《实证论文写作八讲》新书首发

01内容简介本书从实证论文“是什么“出发,在“功能—动作—对象”的框架下探讨和剖析了实证研究与论文写作的思路和方法。全书共分为八讲,其中第一讲和第八讲是本书的绪论和尾章,其余六讲分别对应了实证论文的六个核心组成部分,即摘要、引言、文献综述、研究设计、实证分析和结语。本书有三个特点:其一,重视创新,始终把实现研究创新作为实证论文写作的目标,从创新的角度来统筹全局,将论证文章的创新性贯穿在八讲之中;其二,强调功能,从“证伪假说”这一功能入手把握实证研究和论文写作的实质,抓住了它,就抓住了核心;其三,讲究拆解,通过拆解论文写作的动作和对象,借助示例和课后习题,帮助研究者在论文写作中更好地实现证伪假说的功能。本书适合经济学及相关专业的本科生、研究生阅读使用,相信对实证研究和论文写作感兴趣的广大读者也能从本书中得到启发。02作者简介刘西川,华中农业大学经济管理学院教授,浙江大学农业经济管理专业博士、工商管理专业博士后。研究方向为农业金融、合作金融、 中小企业融资与金融扶贫,担任国家自然科学基金项目通讯评议人,同时是《经济研究》《管理世界》《金融研究》《财贸经济》《中国农村经济》等期刊匿名审稿人。多年讲授“文献阅读与写作”课程,并从2018年开始运营“刘西川阅读写作课”微信公众号。03目录展示第一讲实证论文写作:路在何方一、什么是科学研究,什么是论文写作二、论文写作到底难在哪里 三、破解写作难题的思路与方法 四、本书的主要内容 思考与练习第二讲如何写摘要一、摘要写作常见问题二、什么是摘要三、摘要写作的三个步骤四、好摘要的标准及检查完善五、小结思考与练习第三讲如何写引言一、引言写作常见问题二、什么是引言三、引言的内容与结构四、示例五、小结思考与练习第四讲如何写文献综述一、文献综述写作常见问题二、什么是文献综述三、文献综述的内容与结构四、文献综述写作的要点与步骤五、小结思考与练习第五讲如何写研究设计一、研究设计写作常见问题二、什么是研究设计三、怎样完成研究设计四、研究设计写作的要点与检查标准五、小结思考与练习第六讲如何写实证分析一、实证分析写作常见问题二、什么是实证分析三、实证分析的前期准备四、如何做实证分析五、实证分析写作的要点及示例六、小结思考与练习第七讲如何写结语一、结语写作常见问题二、什么是结语三、结语由五部分构成四、结语写作的要点及其他五、小结思考与练习第八讲实证论文写作:路在脚下一、研究是一个过程,需要反馈二、实证论文的核心是假说 三、引言很重要但不好写四、文献综述与提出假说 五、研究设计先要遵循规范 六、实证分析做的是“排除法” 七、结语是更开放的讨论 八、还需要交代的地方思考与练习后记04推荐语 我对西川兄新著《实证论文写作八讲》的出版期盼已久。这部凝结了作者数年心血的力作创造性地搭建了一个由“功能—动作—对象” 构成的实证论文写作框架,使得抽象的学术论文写作具备了可拆解、可复制、可比较的特性,学习抑或讲授实证论文写作方法由此更具可操作性!阅读这部著作,一定能让你受 益无穷!——张正平,北京工商大学经济学院教授作为微信公众号“ 刘西川阅读写作课”的读者,推荐本书的原因有二:第一,本书将为实证论文写作提供必要指引;第二,同时也是更重要的,本书将为科学研究提供有效范式。——胡冰川,中国社会科学院农村发展研究所研究员论文写作一直是博士生苦恼的事情:实证论文写作的目标和标准是什么?实证研究和论文写作的本质又是什么?如何完成实证论文的写作?刘西川老师的《实证论文写作八讲》对此进行了详细的解答,“手把手”教大家做实证研究、写实证论文。——冷萱,西南财经大学经济与管理研究院2020级博士生作为一名“科研小白”,看完刘老师的《实证论文写作八讲》后有种豁然开朗的感觉,全然没有了大四写毕业论文时的茫然无措。本书内容详实,文风简洁,干货满满,从论文选题到最终完成,其间会遇到的大部分问题都能从书中找到有效的解决方案,是你我必备的论文写作工具书,非常值得一读再读。——闫华,华中农业大学经济管理学院2019级硕士生我是幸运的,在本科阶段就能有幸聆听刘老师的论文写作课,即便后来没有从事科研工作,他所讲授的一些思维方式与写作方法仍让我受用至今。刘老师擅长通过案例或比喻将抽象的概念具象化,同时又能有条理地将一些“道”拆解为“术”。相信刘老师的新书能够帮助更多的同学提高论文写作能力。——黄胜蓝,浙江理工大学经济管理学院2015级本科生来源:刘西川阅读写作课 2020-12-20

生火甚多

社会科学研究方法大梳理!

本文转载自【微信公众号:社科学术圈,ID:shkxquan】经微信公众号授权转载,如需转载与原文作者联系-1-社会科学的研究步骤在每一个环节都需要理论的指导。其中,在检验研究假设结束之后,需要与现有的文献对话,再次发现新问题,开始新一轮的研究过程。在这个环节之中,资料分析作为重要一环,对于社会科学的研究极为重要。-2-资料分析的方式分类教育研究包含多样化的研究方法及分类。一般情况下,按照认识论基础,研究方法可以分为定量研究、定性研究和混合研究。也有部分学者按照研究目的、手段等对研究方法进行分类。比如别敦荣和彭阳红将研究方法分为:理论思辨、经验总结、历史研究、调查研究、比较研究、数学分析、质的研究和个案研究;在国内,根据刘良华对研究方法的分类大体上有三个基本类型:实证研究(量化的、质化的)、思辨研究(又称理论研究)、实践研究(常以教育对策、教育反思、教育改革形式显现)。实证研究是基于“事实”的方式进行论证并有规范的研究设计和研究报告。陈向明指出,“研究方法”一般包含三个层面:第一,方法论,即指导研究的思想体系,其中包括基本的理论假定、原则、研究逻辑和思路等;第二,研究方法或方式,即贯穿于研究全过程的程序与操作方式;第三,具体的技术和技巧,即在研究的某一阶段使用的具体工具、手段和技巧等。文中所采取的分类是按照陈向明定义中的第三个层面为标准进行的分类。在实际的研究过程中大多数时候是以一种研究方法为主,其他为辅,交叉使用的。以下内容是介绍每一种具体的方式。那么资料搜集上来了?该如何分析呢?-3-具体的资料分析方式| 思辨分析1. 历史研究方法历史研究法是运用历史资料,按照历史发展的顺序对过去事件进行研究的方法。亦称纵向研究法,是比较研究法的一种形式。在政治学领域中,它着重对以往的政治制度、政治思想、政治文化等的研究。历史研究的目的在于解决政治制度的现状及其演变趋向。但不是断章取义地分析政治制度的现状,而是系统地研究它们以往的发展及其变迁的原因。历史研究法主要是研究政治制度的发展历史,从各种事件的关系中找到因果线索,演绎出造成制度现状的原因,推测该制度未来的变化。2. 比较研究方法比较研究法就是对物与物之间和人与人之间的相似性或相异程度的研究与判断的方法。比较研究法可以理解为是根据一定的标准,对两个或两个以上有联系的事物进行考察,寻找其异同,探求普遍规律与特殊规律的方法。按属性的数量,可分为单向比较和综合比较。按时空的区别,可分为横向比较与纵向比较。按目标的指向,可分成求同比较和求异比较。按比较的性质,可分成定性比较与定量比较。按比较的范围,可分为宏观比较和微观比较。3. 文献研究方法文献研究法主要指搜集、鉴别、整理文献,并通过对文献的研究形成对事实的科学认识的方法。文献法是一种古老而又富有生命力的科学研究方法。文献法的一般过程包括五个基本环节,分别是:提出课题或假设、研究设计、搜集文献、整理文献和进行文献综述。文献法的提出课题或假设是指依据现有的理论、事实和需要,对有关文献进行分析整理或重新归类研究的构思。研究设计首先要建立研究目标,研究目标是指使用可操作的定义方式,将课题或假设的内容设计成具体的、可以操作的、可以重复的文献研究活动,它能解决专门的问题和具有一定的意义。| 话语分析话语分析作为一种专门的学科研究对象的出现,特别是在法语领域的出现,一般来说,是语言学发展过程中,特别是自20世纪60年代末以来,必然会出现的现象。这个新领域与语言学保持着复杂的关系,而这种关系又是经济被重新定义的。话语分析作为一种活动,正如它的内涵一样,它存在的前提是:特殊对象的生成、观念系统的状态、新颖恰当的研究对象的方法论的框架系统的状态。批评话语分析(critical discourse analysis),以下简称CDA是当代语言学研究的一个新兴分支。批判话语分析的主要方法:系统功能语法分析、语篇体裁交织性分析、话语历史背景分析。例如:如果有一部有关第三世界的纪录片始终把第三世界的穷人当做及物动词性的宾语,那就必然给读者、听者留下这样的印象:穷人是被动的牺牲品,而不是斗争的参与者。例如:对何人使用何种称谓,体现着作者(讲话者)的态度。情态是人际功能的体现形式之一,主观情态反应话语生成者与陈述者的亲近性,而客观情态则模糊了个体和团体的观点。| 内容分析内容分析法:是一种对于传播内容进行客观,系统和定量的描述的研究方法。其实质是对传播内容所含信息量及其变化的分析,即由表征的有意义的词句推断出准确意义的过程。内容分析的过程是层层推理的过程。内容分析法的信度指两个或两个以上的研究者按照相同的分析维度,对同一材料进行评判结果的一致性程度,它是保证内容分析结果可靠性、客观性的重要指标。ROST content mining是一款免费的大型内容分析研究性工具平台,主要功能包括:辅助各学科进行研究,协助完成文本分析和内容分析方面的研究,凡是需要分析论文、微博、博客、论坛、网页、书籍、聊天记录、电子邮件、本地文本类格式文件、数据库中各类文本字段的学科,都可以使用本软件,分析方法目前支持:分词、字频统计、词频统计、聚类、分类、情感分析(含简单和复杂)、共现分析、同被引分析,依存分析、语义网络、社会网络、共现矩阵等分析方法。| 质性研究一种在社会科学及教育学领域常使用的研究方法,通常是相对量化研究而言。质性研究实际上并不是一种方法,而是许多不同研究方法的统称,由于他们都不属于量化研究,被归成同一类探讨。其中包含但不限于民族志研究,人类学研究,论述分析,访谈研究等。1. 民族志研究民族志,是一种写作文本,是人类学独一无二的研究方法,是建立在人群中田外野地工作基础下第一手观察和参与之上的关于习俗的撰写。民族志内容主要为相关人的访问内容、档案记录的检视、与衡量与访问内容的可信度,从此内容,可找出特定团体与组织之间的关联,并为关心大众以及专业的同行撰写整个故事的来龙去脉。而民族志学家则记录人们的日常生活。研究的焦点放在人类思想和行为中较可预测的型态上。为了真实纪录,1930年代后,民族志的产生通常需要相当冗长时间的实际体验。2. 口述史研究口述史亦称口碑史学。口述史在国际上是一门专门学科,即以搜集和使用口头史料来研究历史的一种方法,或由此形成的一种历史研究方法学科分支。1948年,美国哥伦比亚大学的艾伦内文斯(Allan Nevins)教授在该校创立了口述史研究中心,第一次使用了“口述史”这个概念。标志着现代口述史学术领域的成立口述历史是通过有准备、以音像设备为工具的采访,记述人们口述所得的具有保存价值和尚未得到过的原始资料。3. 行动研究行动研究是一种适合于广大教育实际工作者的研究方法。它既是一种方法技术,也是一种新的科研理念、研究类型。行动研究是从实际工作需要中寻找课题,在实际工作过程中进行研究,由实际工作者与研究者共同参与,使研究成果为实际工作者理解、掌握和应用,从而达到解决问题,改变社会行为的目的的研究方法。它是一种行动研究理论与实践相结合,在于资料收集、合作探讨、自我反省、多方总结最后解决问题的方法;一种主题明确、思路清晰的解决问题的方法。4. 扎根理论研究扎根理论研究法是由哥伦比亚大学的AnselmStrauss和BarneyGlaser两位学者共同发展出来的一种研究方法。是运用系统化的程序,针对某一现象来发展并归纳式地引导出扎根的理论的一种定性研究方法。5. 个案研究个案研究(case study)也称个案调查。对某一特定个体、单位、现象或主题的研究。这类研究广泛收集有关资料,详细了解、整理和分析研究对象产生与发展的过程、内在与外在因素及其相互关系,以形成对有关问题深入全面的认识和结论。个案研究的单位可以是个人、群体、组织、事件或者某一类问题,由此而产生人员研究个案,各生活单位或社会团体个案、传播媒介个案,以及各种社会问题个案等。6. 文本分析从文本的表层深入到文本的深层,从而发现那些不能为普通阅读所把握的深层意义。新批评细读法“新批评”细读法不是一种自我感兴趣的印象式批评,而是一种“细致的诠释”,是对作品作详尽分析和解释的批评方式。其操作过程大致分为以下三个步骤:首先是了解词义,然后是理解语境,再次是把握修辞特点。叙述学分析法叙述是人类社会性活动中的一个重要部分。“叙述学”分析法,主要是故事分析(包括故事序列分析,故事类型分析等等),与叙述视角分析(包括叙述者的人称、位置、可信度;叙述者的声音、叙述的速度等)。| 社会网络分析社会网络分析用于描述和测量行动者之间的关系或通过这些关系流动的各种有形或无形的东西,如信息、资源等。根据分析的着眼点不同,社会网络分析可以分为两种基本视角:关系取向和位置取向。关系取向关注行动者之间的社会性粘着关系,通过社会联结本身——如密度、强度、对称性、规模等——来说明特定的行为和过程。位置取向则关注存在于行动者之间的、且在结构上相处于相等地位的社会关系的模式化(patterning),它讨论的是两个或以上的行动者和第三方之间的关系所折射出来的社会结构,强调用“结构等效”来理解人类行为。| 引文分析引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。引文分析的主要内容:引文年代分析、引文量分析、集中和离散规律分析、引文类型分析、引文语种分析、引文国别分析。引文分析的主要作用是:测量学科的影响和重要性、研究学科结构、研究学科信息发布、确定核心期刊、研究文献老化规律等。| 统计学分析1. 统计描述它研究如何用科学的方法去搜集、整理、分析经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的关系和变动规律,也是进一步学习其他相关学科的基础。2. 方差分析方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。3. 二元相关因果关系分析方法之一种。二元线性回归分析法是在一元回归基础上的延伸,式中y是因变量;x1、x2是自变量;a、b1、b2是回归系数。二元线性回归法适用于分析有两个主要自变量的预测,一般运用计算机进行计算。4. 元分析元分析(meta-analysis)统计方法是对众多现有实证文献的再次统计,通过对相关文献中的统计指标利用相应的统计公式,进行再一次的统计分析,从而可以根据获得的统计显著性等来分析两个变量间真实的相关关系。元分析程序输入参数包括:各个观察到的相关系数(已有研究文献中变量间的相关统计分析,从而可以根据获得的统计显著性等来分析两个变量间真实的相关关系。5. 多元回归“多元回归”在工具书中的解释:1、研究一个依变量、依两个或两个以上自变量的回归。2、亦称为多元线性回归,是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律。3、建立多个变量之间线性或非线性数学模型数量关系式的统计方法。在肥料试验中广泛应用。6. 多元变量分析多元分析,是指同时考虑多个反应变量的统计分析方法。其主要内容包括两个均值向量的假设检验、多元方差分析、主成分分析、因子分析、聚类分析和典范相关分析等。7. 因子分析因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。8. 主成分分析主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。9. 聚类分析聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。10. 非参数检验非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。11. 结构方程模型结构方程模型(Structural·Equation·Modeling, SEM)是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟,可惜国内了解的人并不多。在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。