欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
经济学的实证应用正正之旗

经济学的实证应用

我们是一个文明古国,有着几千年的辉煌历史。近百年来,由盛而衰,一度成为世界上最贫穷落后之一。改革开放,是中国真正走上了通向繁荣昌盛的道路。改革开放建立了一个有效市场经济体制,加速发展经济,提高人民生活水平。但是,要完成这一历史使命绝非易事,我们不仅仅需要从自己的实践中总结教训,也要从别人的实践中获取经验,市场经济对我们来说是全新的,但是市场经济在发达国家有几百年历史,市场经济的理论,也在不断的发展完善,并形成了一个现代经济学理论体系。归纳出来的许多理论反映的是人类社会的普遍行为,这些理论是全人类共同财富,在当今信息共享的时代,我们没有任何理由继续将自己隔离在知识的门槛之外,要想迅速稳定的发展经济,我们必须学习和借鉴世界各国的先进经济学理论与知识。除了经济学,宏观经济学,微观经济学等基本原理之外,还有产业组织理论,国际经济学,发展经济学,货币金融学,公共财政,劳动经济学,计量经济学等重要领域。本号仅以简明通俗,谦虚的语言来阐述深奥的经济学原理,并辅以每日的市场实证观测,以方便与向前辈学者探讨学习,初学者的理解与掌握。许多发达经济体都在竭力从当前的全球金融危机中恢复过来,经济体自然包含家庭,换言之,家也必要竭力解决财务危机。简单说,就是上下奉养,老幼安居。我们需要对过去的危机进行研究,亦需要对未来的幸福生活充满向往。过去是数据模型,现在是迭代算力,未来是贡献收益。金融时间序列分析考虑的是资产价值随时间演变的理论与实践。带有高度经验性的学科,然而区别与其他分析的主要特点,在于解读了理论与时间的差异要素。例如,资产收益率的波动与资产价格并无联动关系。将不确定性列入统计理论与方法就是其核心之密。至于异方差与序列相关存在的时间的相合协方差估计,波动率建模的方法,金融因子,状态空间模型等等课题我们留待后续慢慢梳理。人们是否对经济学感性,取决于知识是否提高生产力。随着科技研发的日益成熟,产业链条的日益完善,以发达经济体的统计数据显示,工薪水平对比历史停滞,购买力下降。而对比整体GDP的增长速度,从表面上看,产业组织受益而组织成员受苦,这似乎不符合逻辑。从深层次的经济体系去探究,事实并非如此。从私产经济学劳动经济学的角度,资产陷于画地为牢自产自足的囚徒困境。解放路径在于理解并应用与公有经济学金融经济学计量经济学视野。让一部分人先富起来,带动剩下的人富裕,并不是仅限于建设公共设施,核心在于建设公平公正透明的金融市场,将产业组织的资源公有化,比如说上市IPO,创造财富价值的资源分摊大众合法持有。如此,虽个人工薪水平滞涨等同于为了产业组织的发展无私贡献付出,但是得到了由此付出而获取的产业组织良性发展繁荣资产增长的红利。劳动收入加财务收入二合一,收入实际上是增长的,实现家庭财务自由。简单说,生产力不单指体力,也包含智慧。而知识就是财富,所言非虚。你所看到的世界是你所能够理解的,偏见是掩耳盗铃,对经济学理解的深度及应用,决定着生活质量。实证宏观经济学的应用在于理解时间序列计量体系。不难理解,用国学语境而言,实证指知行合一,形而上下不离,认知维度的拔高,人生信而不迷。

关于爱

经济学研究中的数学滥用?一个恐怕永远无解的问题

来源:金融界网站此前,《管理世界》的文章《经济学研究中“数学滥用”现象及反思》曾引发激烈的讨论,事实上广大经济学研究者早已对经济学中研究的数学方法使用尤其是越俎代庖成为研究的核心和亮点的现象有了诸多不满,对数学滥用类似的问题讨论,也不是时到今日才开始的反思。现代经济学从某种程度上来说就是在一套又一套数学模型提出、被质疑、修改和继续被质疑的进程中发展起来的。从整体角度来说,其实我们根本无法说清,数学究竟是成就了今日的经济学,还是摧毁了今日的经济学。经济学的数学化进程大致开始于19世纪中期之后,人们开始借鉴物理学中数学模型的使用方法,将其用来分析现实中比较复杂的经济现象,比较有代表性的就是微积分的引入及其边际研究方法轰轰烈烈地展开。此后大量数学领域的知识被逐渐引入了经济学科之中,包括线性代数、泛函分析、随机过程理论等等,尽管并没有人说经济学问题一定要使用数学方法来进行表达,但是20世纪40年代之后数学模型还是成为了这一学科里公认的表达规范。一方面对于经济学者来说,数学基础成为了必备的研究技能,比如萨金特时至今日依然每个学期都要去旁听数学课,另一方面许多数学学科今日的兴起,比如统计学,实际上也与经济学研究的蓬勃发展相辅相成。然而数学与经济学的结合其实是一种天作之合,因为数学表达本身的逻辑性和简洁性,可以帮助我们更好地对经济关系进行阐述和分析,通过严谨化的表达得出一般化或者公理化的结论,也有助于不同地域、领域的学者进行交流,并为经济学理论可靠性的实证检验,提供了科学的分析基础。从这个角度来说,经济学的数学化是这个学科科学化水平提升的标志之一,本身是无可厚非的。不过本领域对数学化的质疑其实从未断绝(当然,只是一直被压制)。很多学者认为,理论经济学公理并不反映真实世界的运行逻辑,只是一种数学的机械主义游戏,而这也是经济学领域外人士对经济学理论研究最大的质疑所在。比如经济学传统里往往使用经济人理性、信息完全对称等假设,来获得许多漂亮的结论,在很多人看来,这与现实谬之千里,结论自然很不可靠。但弗里德曼等人对此却持有不同看法,在他看来理论假设的不真实不一定影响经济理论模型的可靠性,如果这个理论依然可以对现实进行分析和预测,那么它的假设真实与否就没什么讨论的必要。不过后来人们给弗里德曼的这个观点扣上了一顶工具主义的大帽子,因为这很容易被解读为投机取巧,学者们也会本能地规避那些无法使用简洁的理论进行描述而事实上又恨重要的问题,最终把经济学分析引入研究者自己头脑风暴的死胡同,变成所谓的“黑板经济学”(也就是只在黑板上成立的经济学)。因此很多人调侃经济学者无法预测08年金融危机时,整个经济界几乎是一片哑然,而克鲁格曼之所以能拿到诺奖,也是因为他的模型可以用来解释97金融风暴。人们对经济学的解释性始终充满期待,但也始终对这样的解释性充满疑虑,这恐怕是经济学发展永远的矛盾所在。经济学者在使用经济模型时,面临的问题在于,我们究竟允许我们的经济学理论有多大程度上的不真实,时至今日这个问题依然没有被解决,也在某种程度上成为经济学中数学滥用的发端。萨缪尔森认为经济学之所以可以和数学合璧(从经济学发展史角度来说,经济学数学化的奠基人就是萨缪尔森本人),是因为经济学本身的特征就是数量化的。因为经济变量本身存在着严肃的逻辑关系,找寻其中的因果性并用经济学的语言表达出来,其实是经济学研究最核心的目标所在。但是同样地,在经济中有很多因素是呈现非数量特征的,用经济学语言来说就是“对信息集的偏离”,这些因素在模型中无法解释,很多研究者也偷懒将其作为一个常数处理。这就使得经济学中的分析很容易流于机械化的表面,学者们甚至会有动机用数学上的相关性取代严谨的因果性,来进行讨论,这无疑摧毁了经济学分析的根基。而后来行为经济/金融学的兴起,也同经济学传统研究存在这样的问题有关。更为糟糕的是,我们尽管长时间地对经济学中的数学滥用进行质疑,但实际上我们很难说清楚到底什么是数学滥用。最近这次争议的发端就是罗默的那篇《经济增长理论中的数学滥用》一文,值得一提的是,这位经济学诺奖界的村上春树对数学滥用进行批判的例子,是他老师卢卡斯的两篇文章。在他看来,数学滥用现象主要包括脱离理论基础的非正式用语与符号、不符合现实与直觉的假定以及错误的数理模型推演几种形式。这些说法看上去都没什么问题,但是问题在于,我们恐怕永远无法界定,数学使用和滥用之间的分界线。人们之所以要在经济学领域中引入数学,无非是因为数学能让我们的表达更简洁、精确,或者从某种程度上显得更加优美。但是经济学界一直有声音认为,我们可以用文字说清楚的事情,并不一定非要用数学进行分析。可是,我们究竟如何判断什么样的问题只用文字来说,而什么样的问题就必须引入数学工具呢?并没有一个可行或者可借鉴的分析标准存在,我们也很难知道究竟是数学表达还是文字表达,更符合经济学的本意,因为从符号学角度来说两者都只不过是信息的承载者和阐述的工具而已。文初提到的《经济学研究中“数学滥用”现象及反思》这篇文章,认为数学滥用的主要形式包括论模型假设不符合现实或根据结论修改假设、数学模型过度运用、实证研究与经济理论相脱节、实证过程不规范四个方面。但问题在于四点中的第四点说明研究者用错了数学,而前三点正是我们在前文中所讨论的究竟我们能容忍经济学假设与现实存在多大差异和我们有什么标准来判断经济学研究的数学应用是否适度上。所以这样的讨论其实是将100多年以来经济学者对数学方法的一次炒冷饭式的总结,时至今日我们仍然不知道数学究竟应该多大程度地进入经济学,就像我们也不知道经济学应该多大程度地入侵其他社会学科一样。我们提出了问题,但始终没有办法解决问题,这一点倒是蛮符合大多数经济学研究的特点的。所以大家轰轰烈烈地批判一下就好了,在可见的未来,你们想搞经济学研究,发经济学论文,还是要搞各种奇奇怪怪的模型去忽悠审稿人的。附:《一个经济学学生的疑惑:经济学是不是已经沦为以经济题材为背景的数学应用学?》我来自上海财经大学,是一名大三的经济学学生,三年的学习中,始终有一个问题困扰着我,至今仍未得到解决。那就是——经济学到底怎么了?回看到目前为止大学前两年4个学期的课程,每个学期学分最高的课程分别是:数学分析1(6分)、数学分析2(6分)、概率论与数理统计(6分)、计量经济学(3分),清一色的数学,除此之外的数学课程还包括:数学分析3、线性代数,由数学与经济学相结合的课程则有:中级微观经济学、中级宏观经济学、博弈论、国际经济学。那抛开数学,真正能让我作为一个经济学学生应该掌握的经济学知识的课程呢?只有一门:政治经济学。除了学校的课程安排,据我所知,无论是学校招收研究生还是与经济金融相关的公司招聘的时候,即使毫无经济学学习的背景,数学系学生的抢手程度甚至远大于经济学专业的学生。我想知道,经济学到底怎么了?我承认我数学不好,不喜欢数学,所以在被数学虐了千百遍之后我的脑子里产生了既可笑又可怕的想法:诺贝尔因为大家都知道的原因唯独没有设立数学家,而数学家并不甘心,从而攻下了诺贝尔经济学奖。说句可能有些偏激的话,如今我在学习的并不是我高考报名时所想象的那样,把数学作为一种工具的经济学,现在的经济学根本就是以经济学为背景题材的数学应用题所集成的学科。之所以这样说是因为尽管我对高等数学比较头疼,可是我基本的逻辑还是有的。而不管在教科书中还是在实际应用中,一些把经济学问题抽象为数学推导的过程在我看来毫无逻辑。如若果真如此,那即使数学演绎的过程再繁琐,所用到的模型再复杂又有何用处呢?数学在经济学领域中的滥用已经太过了,如果说数学的应用让经济学研究前进了50年,那也许数学的滥用一定会让经济学研究停滞100年。我觉得也许错的并不是我,而是经济学。之前提到过,在教科书中的叙述以及在实际中的应用中,数学的演算确实越来越复杂,但内含的逻辑却毫无章法可循,对此我想各举一个例子:教科书:经济学领域中的模型不论复杂还是简单都绕不过经济学最基本的两个前提假设:理性人假设和完全信息假设,这想必大家都知道。在这两个前提假设的基础之上,西方经济学界建立了各种各样的模型、进行推导、得出结论。我想说,这本身就是一个问题。我还记得学习高中物理时,因为数学能力有限,所以题目中经常会给出类似“假设摩擦力为零,假设斜面光滑”之类的假设,尽管实际上并不存在假设说的所谓光滑斜面,但这样一来却可以让我们在数学能力有限的情况下锻炼我们的物理思维能力。而等我们学习了相关的高等数学之后,我们便可以拿掉这样的假设,通过同样的思想,进行完整的运算。但经济学呢?似乎经济学家们已经完全忘记了“理性人和完全信息”是作为假设的存在,反而将其奉为真理,在这基础之上乐此不疲地开发模型、得出结论、发现与实际不符······这是在开完笑吗?如果说我定一个前提假设说“人类全部死光了”之后得出结论“经济就不存在了”从逻辑上来说并没有什么问题可是这样的结论有用吗?我想说的是假设是一种简化问题的过程,通过假设我们可以首先在一定假设限制下得出一个较为简单的结论,之后通过一定手段将假设还原,回归到实际的结果中来。想想我之前提到的物理学,不就是从实际中发现问题,进行光滑斜面的假设,再通过摩擦系数,真真切切的将假设还原到现实之中,得到真正的结果。那经济学呢?有谁将在假设条件下开发的模型成功地还原到现实中来了?没有,因为没有这两条如此强的假设,他们的模型根本站不住脚。经济学的发展难道不是为了解决实际的经济问题而是任由这些所谓的“经济学家”任性地开发模型争夺诺贝尔奖?希望不是这样吧。之前所说的总结起来就是“经济学假设的未还原”问题,这并不是一个逻辑上的问题,只是一个基于利益、名声等因素考虑过后,作为一个实实在在需要生存的人所不得不做出的选择。很多人都知道这样得出的结论不靠谱,但问题是现在的学术界就认这个东西,而且理性人假设也是前人所做的奠基,即使以后被推翻也无关己事。真正设计到逻辑问题的是“理性人假设”,关于这个假设本身的荒谬我想以后再谈,现在就算我承认这个假设,我想从逻辑层面展现一下有关理论的逻辑是多么混乱。理性人假设说的是人类会追求自身利益最大化,这句话本身就是错的,或者说是矛盾的。因为实际上根本没法做到自身利益最大化。举个例子,对小孩子来说,玩能得到最大的利益,而小时候玩的太疯了会影响学习,学习不好意味着长大之后在求职结婚甚至在吃饭问题上都面临诸多困难,所以小孩要好好读书,做到将来自身利益最大化,但一旦好好读书,小时候的利益又有了损失。类似这样的情况,我倒想知道,怎么做到自身利益最大化。很明显自身利益最大化的致命逻辑缺陷就在于对于时间,它没有区分。再比如对于一家只生产一种商品的企业,经济学原理告诉我们一种商品的价格升高销量就会下降,但是对企业来说,一件商品的利润与销量的乘积一定会有一个最大值,而企业做的最优决策就是确定乘积最大时的利润。这样是不是做到了自身利益最大化?不见得吧,利润与销量乘积的最大值是在现有的情况下定义的,但如果说我的企业在短时间内给出明显低于市场的定价,将竞争对手都挤死,之后作为一个垄断生产商,那时的利润到底和原先相比究竟是高是低很难说清楚吧。这样一说应该很明显了,自身利益最大化根本就是一个悖论,因为它根本没有对时间做出一个有效的区分,更甚者,利益的实现所涉及到的是未来的时间,而实际上谁也不知道未来会发生什么,就比如也许小孩子玩疯了长大一无所成但也许偏偏就因为玩启发了他的创造力呢?根本就不需要什么实证或者推导,从逻辑上来说理性人假设本身就是个悖论,根本不能作为一个前提假设不是吗?另外一个例子是在经济的实际应用方面,是有关学校食堂优化的问题,我想明天再来和大家分享。我的见识不多,基础也不扎实,我的很多想法都可能是错的。所以写这篇文章是希望能在数学的统治下找到和我不谋而合或是想背而行的想法,尽管我也找到很多经济学家提出类似想法的论文和书刊,给我很大的启发但我觉得很难说得上系统更提不上是一种理论。所以我希望能听到更多人的声音,无论是赞同还是反对,我只希望能不带立场地找寻经济学的真理,希望大家能够支持!也许这篇文章发在行为经济学板块能得到更多认同,但我明白发在这里能听到更多理性的反对的声音,这样能让我更多地思考,所以我希望大家能把真实的想法一起分享。附:(一些我觉得有些想法的书,也希望大家能推荐好书)保罗·罗默《经济增长理论中的数学滥用》托马斯·索维尔《被掩盖的经济真相》方宇军《经济学的新思维 : 兼及西方经济学的评判》丹·艾瑞里《怪诞行为学》赵凡禹《经济学会撒谎》迈克尔·舍默《当经济学遇上生物学和心理学》德曼《失灵 : 为什么看起来可靠的模型最终都会失效》萨维奇《平均值缺陷》布拉斯兰、迪诺《数字唬人 : 用常识看穿无所不在的数字陷阱》琼斯《谁说图表不会说谎》达莱尔·哈夫《统计数字会撒谎》

声侔鬼神

超详细|如何写好计量经济学实证分析论文?

本文转载自【微信公众号:社科学术圈,ID:shkxquan】经微信公众号授权转载,如需转载与原文作者联系经济学研究的主要目的是用经济理论解释所预测到的经济现象,预测经济走势,并提出政策建议。计量经济学是检验经济理论,解释、预测经济现象的最主要数量化方法。其重要性是因为绝大多数经济现象不能像自然科学那样通过实验反复观测获得数据,从而得出科学结论。经济学分析只能通过实际经济系统运行得到的观测数据进行分析,这样的分析称为实证分析,因此,实证分析在经济学研究中显得更加突出。实证分析就是用数据来描述客观经济现象,找到蕴含在数据中的规律与特征,为经济学研究提供依据。对刚刚使用计量方法进行研究的人而言,要写一篇有实证研究的报告或论文常常会遇到各种各样的困难,在此就计量经济学实证分析论文的研究给大家提供一些建议。 一、用理论或逻辑表述提出研究选题在进入模型之前,这是提出问题的部分,即告诉读者为什么要研究这个问题。比如,认为现有的理论不能解释某一现象,或者要澄清对某一问题的认识,又或者是质疑现有理论等等。在这一步,就是要让读者相信你的问题“要么重要,要么有趣,要么两者都有”。例如,环保政策是否会带来环境的改善,汇率变更如何影响进出口贸易等等。对该问题的描述可以通过经济理论的表述进行分析,也可以依据经济现象的逻辑关系进行表述,区别在于经济理论严谨但复杂,逻辑分析简单但不够严谨。对于选题的方向依据经济计量分析的用途可以按下述方向选择。1.经济变量关系分析,即结构分析。通常是解释某些经济学现象。2. 经济学假说的检验,即验证经济理论。就是要检验相关经济学假设或理。3.预测经济学现象,即经济预测。就是预测某些经济学指标的未来趋势。4.政策选择,即政策评价。就是通过政策模拟找到最远经济政策。二、建构实证计量模型通过经济理论分析或逻辑分析已经确定了选题的内在逻辑,因此就可以使用数学模型来表达我们的选题。在确定模型时要理清如下几点。1. 确认计量模型中解释变量和被解释变量之间的内在联系或因果关系;2. 对可以使用的计量模型进行选择性评价,对模型是否适宜研究该问题进行讨论,为实证分析中模型的改进提供理论依据;3. 依据上述分析确定初步的理论经济计量分析模型。在此提醒二点:第一,应该对本领域的实证分析范式有所了解,即通过阅读相关文献了解这一类模型的实证分析方法;第二,除研读相关经济理论之外,应比较三至五篇有实证分析的文献中的实证计量模型;第三,应初步调查是否有相关的数据,若无数据则无法进行实证分析。三、数据资料收集与处理数据收集可以从数据库(主要是学校购买的数据库)寻找,也可以从统计年鉴等出版物收集,还可以向已使用相关数据的论文作者询问收集。如果进行共同研究,可以与合作者共享他们的数据。此外,因特网也是一个有效的数据收集来源地。对数据的收集与使用要注意以下几点。1. 对数据的精确性一定要按经济学定义严格查核。模型中的变量是经济学变量,但实际经济系统中提供的统计指标不一定与模型中的经济学变量严格对应。如 C-D 生产函数中的资本存量 K,可以使用原值,也可以使用净值,选择不同,结论亦会有差异。2. 对于时间序列数据,如果是价值量数据还需要进行可比价处理,即处理为同一时期价格计量的价值量指标。只有这样不同时期的数据才具有可比性,研究结论才是可信的。3. 如果数据中有异常值需要进行特殊处理。如没有理由剔除,应选择虚拟变量进行表述。4. 如果使用季节时间序列数据就必须进行季节调整,因为许多季节数据不可直接相比。5. 数据处理完毕后可以使用电子表格软件对数据列表绘图,以验证数据的逻辑合理性,对不合理的数值要有所处理;不论要用的是横截面数据还是时间数列,数据量越大越好,如果能够使用面板数据( PanelData)就更好;6. 对资料数值作一些描述统计分析是实证分析的前期准备。通常通过图表列描述各统计指标的各项统计量(样本平均值、变异数、变量间的样本相关系数等) 。四、参数估计与模型取舍估计方法的选择既不能片面强调复杂性也不能过于简单,而是要根据实际问题的需要确定最恰当的方法。在模型的参数估计过程中要依据经济理论检验、统计检验、经济计量检验的结论不断对模型进行修正,直到找到最佳模型。1. 若采用了比较复杂的计量方法,则要说明为什么简单的方法不适合。计量方法的好坏不在其复杂程度,而在于它是否能够帮我们得到正确的估计值,以了解数据中所包含的真正信息。2. 回归模型的设定,尤其是函数形式与解释变量的取舍,可在估计过程中不断的修正。对被解释变量和解释变量均可尝试诸如对数、指数、幂函数等不同的函数形式。这些函数形式的选择,以经济理论上的考虑最为重要,不能单只为了提高模型的估计效果,而盲目的选择一些不合理的函数形式。经济理论分析需要的弹性分析、半弹性分析、边际分析就决定了模型的函数形式。3. 解释变量的选取( 1)解释变量是用来解释被解释变量的,因此,要么解释变量是原因,要么解释变量是被解释变量的先行指标。也就是说,解释变量是原因在先,被解释变量是结果在后,有一定的先后顺序。( 2)要注意解释变量的相关性,不能将一大堆彼此相关性很高的变量放进回归式内,如此会造成严重的多重共线性问题;( 3)经济理论所牵涉到的变量如果是无法观察到的,做实证研究时必须采用替代变量( Proxy),研究者要对所选用的替代变量的合理性加以说明。( 4)虚拟变量的定义要清楚而合理,使用要小心;( 5)如果解释变量有观测误差等数据缺陷,需要探讨可能造成的计量问题。4. 横截面数据要重点关注异方差( Heteroscedasticity)问题,时间数列数据则要重点关注自相关( Autocorre-lation)问题。要确定时间数列的稳定性( Stationarity) 。5. 模型参数的稳定性要注意,可以使用 Chow Test 判断是否存在断点。五、实证分析报告的写作实证分析的论文与一般经济学论文具有相通之处,此处仅仅就计量分析论文的特殊性进行展开表述。1. 绪论说明研究的性质、范围和目的,并从不同角度或一个比较宽广的视野(历史、社会、文献、问题严重性等)来解释研究的重要性。2.文献回顾对和主题有直接和间接关系的文献做一个简单、清楚、有系统的回顾,和主题有直接关系但有不同结果的文献,更是要有比较完整的解释。对该选题的模型使用要进行总结和归纳,提出本文模型使用的特点与新意。3. 模型设定经济计量模型必须是可以进行实证分析的模型,因此用来研究经济学问题的计量模型一定是可以应用样本数据进行参数和相应统计量的估计的模型。这些模型可以通过数理经济学的模型推导而来,也可以在简单的逻辑关系上构建。对模型中所涉及的变量均须给与明确的定义,对解释变量和被解释变量之间的关系要详尽的说明,也要解释对模型中主要系数(或由这些系数所导出之弹性、乘数等)可能数值的大小及符号有怎样的理论预期,这些说明正是文章所要通过模型解决的经济学问题。4. 数据收集与处理对数据的种类、性质、来源出处、数据修订的方式、数据中可能有的错误和缺失,都要有详细的说明,最好也能将资料的基本统计量表列出来。5. 实证分析结果的报告( 1)模型估计结果可以选择公式法和表格法进行表述。如果模型比较简单,解释变量少,可以使用公式法表述。这样简洁明了,清晰易懂。如果解释变量较多,可以选择表格法进行表述。但都要把回归系数及其主要检验统计量标示在相应位置。每一系数估计值旁标示标准误( s.e. )或 t 统计量,也可加列 p 值,对于显著的估计值也可附加星号标记以提醒读者。显示模型整体表现的统计量,如 R2(线性回归模型),F 统计量,都应列出。对于时间序列数据模型 Durbin-Watson 统计量必须列出。( 2)对主要回归系数(或由回归系数所导出之弹性、乘数等)估计值的大小、符号及显著与否要详加讨论,对于显著的估计值更要和理论预期值比较,若有明显的矛盾,则要探讨原因。( 3)对重要回归系数若是得不到显著的估计值,则要探讨其中原因。绝不能对不显著的估计值做出过度的解释,尤其不能宣称不显著的估计值支持或不支持某些特定结论。我们要知道估计值不显著,就是表示所使用的数据不能够提供足够的信息,若是没有足够的信息,当然不能够也不应该做出任何确切的结论。( 4)所有具有政策意义的重要论点都要经过假设检验的探讨其显著性。( 5)若要根据估计模型对数据外的时期或状况进行预测,则态度必须保守谨慎,尽可能设想预测可能不准的原因。( 6)所有列举的统计数字应尽量保持统一的小数点位数(小数点后三位数或四位数均可),如果有很小或很大的数字,则可以用科学表示法表示(例如 1.2345 × 10-4),尽可能显示出三至五位有效数字。6. 结论与政策建议对全文的研究结论进行综合,用一句简短的语言表述你的研究结论。然后对该结论给予相应的说明。一篇实证分析论文的结论一定要来源于你实证分析模型,要相应的统计检验的支持。重要的核心研究结论有2-3条已经很了。一定不可直接引用流行的但你文中未作为重点研究的结论作为你论文的结论。对应的政策建议也应该由你的研究结论产生的对所有重要结果做一个完整的总结,并经由理论或数据中不尽完美处的讨论,指明未来研究的方向。

恶人湖

实证研究的选题经验分享

1.前言如果你想选择一个好的题目,就要抱着对自己和后人负责的态度。当然,除了抽象地理解一个好选题的特性,我们还应该懂得如何在庞杂的文献中找寻自己未来的研究方向。其实,这些经验也是在不断的文献积累中逐步获得的。每当你读新文章时都应该问自己:“它到底做了什么贡献?我可以继续做些什么?”下面我们先来回顾下前辈们是如何讲述他们的选题经验,再结合一些例子讲讲我个人的实践经验。2. 前辈的总结哥伦比亚大学的经济学教授 Don Davis 在“Ph.D. Thesis Research: Where do I Start?” (《博士论文研究:我从哪里开始》)一文中针对博士论文选题给出了一条重要建议:选择你长期感兴趣的话题。这样做不仅有利于激励你完成博士阶段的研究,更是在职业生涯初期为你提供一个可以挖掘和拓展的主题性研究领域。一言以蔽之,博士阶段的选题要避免“竭泽而渔”。Davis ( 2001 ) 还谈到了“ 有趣” ( interesting )选题的几个“参照指标” (indicators)。第一,“有趣”是一个很主观的词,难以统一标准,但总有些依据存在。笔者在这里补充一点,在学术界,“有趣”是一个既基本又苛刻的要求。说它基本是因为 几乎所有导师都会告诉学生要选一个有趣的题目,说它苛刻是因为每个人心中对“有趣” 都有不同的标准。第二,如果作者要让大家觉得选题有趣,那么选题在多大程度上对现实世界有影响就至关重要,简而言之就是选题要有“现实意义”。第三,证明一个问题的 “现实意义”可以通过学术领袖的工作来印证。如果有几位知名学者对你的选题做过相关 研究,那么我们有理由相信,这个选题是重要的。第四,当你证明了自己在做一个重要的 选题之后,要说服读者你的选题是有新意且非常重要的。特别是对实证类选题而言,在前 人的模型中加入一些变量显然不能作为“新意”的代名词。即便使用了全新的数据和方法, 如果实证结果不能给读者带来耳目一新的感觉,如果实证的主题依然老旧,那么这类选题 还是不成功的。普林斯顿大学的经济学教授 Avinash Dixit (1994) 对选题的“现实意义”有自己的理解。他的首要建议就是不要太多顾及选题的社会意义,相反地,他鼓励学生尝试那些看似无用但非常吸引人的题目。显然,Dixit 的观点与 Davis 有很大不同。当然,经济学文献中互相矛盾的理论和实证发现比比皆是,在谈论如何选题时,出现这样的分歧也一点不意外。Dixit 主张兴趣第一,不断尝试,在实践中找到适合自己的方向。针对兴趣,Dixit 还提出了一个非常重要的建议:很多想法和理论上的技巧会突然出现在你脑海里。但是,不要被动等待它们出现,要鼓励自己主动找寻这类想法。所以,要对任何与你研究相关的想法和资料保持高度的兴趣和敏感。只有这样,新的想法和选题才会不断涌现。这一点,作为有一定科研经验的读者应该会感同身受。虽然经济学家在选题是否一定要有“现实意义”存在不同看法,但多数人在谈论选题时都会反复提到“有趣”这个词。原加州大学伯克利分校的经济学教授、现任 Google 首席经济学家的 Hal R. Varian (1997) 在讨论如何构建经济学模型中也提到,在写模型之前一定要确认研究的问题是否有趣。为此,他用了经济学中最常见的概念之一——机会成本。当你选择一个题目做研究时,其实还有其他备选的题目,所以做当前题目的预期收益一定要超过你的机会成本。他认为要检验一个题目是否有趣和重要,关键在于是否提供了新的洞见(insight)。一个很形象的检验方法是,读者看了文章要发出惊叹:“啊,这篇文章解释了如此重要的问题!”总结起来,Dixit 和 Varian 是高屋建瓴地看待选题,展现了大师境界。Davis 的建议很 接地气,适合研究生选题时候参考。虽然语言表达不同,某些观点也有区别,但三位经济 学家都强调选题要新颖要有趣。略微遗憾的是,他们的经验之谈中“战略”居多,“战术” 较少。下文将结合我在实践中的经验教训,提出更细致的操作性建议。我的实践经验由于经验和水平的差距,我对选题的理解与学界前辈们无法同日而语。作为一家之言与大家分享,仅供批判和参考。第一,选题要在大量阅读的基础上。尽管在如何读文献、读多少文献的问题上,经济学家看法各异,但我认为初学者还是应该养成勤读文献的好习惯。我们可以按照个人的研究,将经济学文献大致细分为几个领域,把论文分类归入文件夹。这些文献也包括没有正式发表的工作论文(Working papers) 。寻找文献的过程可以从各领域的文献手册(Handbook)、Journal of Economic Literature (JEL)、Journal of Economic Perspectives (JEP) 等入手,找出前人的文献综述,按图索骥查到文献的发展脉络。然后,通过文献索引查出目前最活跃的作者,根据作者的个人网站查询最新的文献综述及前沿研究。比如,在最近一段时期,哪些作者发表的重要论文最多、被引用最多,那么这些作者就应该被视作最活跃的作者。同时,可以关注 NBER (National Bureau of Economic Research) 每周的工作论文更新,看看这些作者是否也在 NBER 经常发表工作论文。最后,将这些作者定为重点关注对象,时刻关心他们的最新研究。这种关心要做到细致入微,包括知道他们最新论文的投稿状态和正在写作的论文。因为有些写作团队效率非常高,如果你不了解具体情况,遇到选题近似或者重复时,你的论文还没写到一半,他们的文章可能已经被发表。所以,大量阅读除了能提供坚实的文献基础,还能避免选题撞车。第二,选题要符合作者的能力。寻找到一个好的题目,除了了解本领域的发展,还要理解为什么有些问题没人做。那些没有人碰的题目到底是受制于数据还是方法,你本人有能力解决这些吗?事实上,别人做不了的,很可能也是你做不了的。当然,在确认了上述问题之后,如果你有信心解决前人束手无策的问题,那么完全可以尝试挑战自我。这类文章一旦成功,贡献将是普通论文无法比拟的。现实中,一些看起来很“高大上”的题目,往往不是初学者轻易能驾驭的。比如,制度与增长的关系是一个很好的话题,可我们能想象一个年轻的学生去写,结果会如何。这便是老师们通常说的,选题不要太大的原则。虽然这是一个老生常谈的话题,我还是想补充一点,凡事没有绝对。如果一个初学者确实有很深的文献功底,又有很好的数据和方法做支撑,同时非常清楚写出来的论文会是什么层次和质量,老师们应该放手让他去尝试。关于这点,我的看法与 Dixit (1994) 关于选题应该以个人兴趣为重类似:学生的论文总有从不成熟到成熟的过程,应该以兴趣为先,允许错误和失败。第三,选题要有明确的导向性。目前的实证研究,大体有三类选题导向:问题导向、数据导向、方法导向。第一种导向,层次最高,初学者往往难以做到。所以,能做到数据和方法导向,也应该被鼓励。在灯光数据普及前,对增长的研究常常受困于内生性问题。现在这方面的数据多了,双重差分和断点回归等方法也普及了,解决内生性的难度就相应降低了。所以,从技术角度说,如今研究制度对增长的影响,难度比 Acemoglu et al. (2001) 初步探索时期要低些。可是,无论文献如何发展,我们都不会抹煞 Acemoglu et al. (2001) 的功绩,因为在当时的条件下,这类选题是非常珍贵的,研究结果也有着深远的影响。大多数人都难以把问题、数据和方法三者兼顾。换言之,一篇论文诞生后,三个方面总有缺憾。这时,我认为问题是第一位的。读者和审稿人对一个重要的、稀缺的问题,多少会表现得宽容些。现实中,不少论文是数据驱动的。作者往往在获得了一些宝贵数据后才下决心要做一 篇雄文。在大数据成为热点的今天,如果研究者所占有的资源中包括了稀缺的大数据,而 不加以善待和利用,就是对资源的浪费。所以,数据驱动型的论文本身没有错。如果有错, 就是数据拥有者没有把故事讲好,没有把经济学理论(或者直觉)与数据结合好,没有把 问题实质研究透。出现这类情况,我认为可以归结于人的惰性。当数据优势太大时,研究 者往往会忽略问题的重要性。选题时也往往会片面强大数据的独一无二,而轻视了经济学 研究的基本要求。我们做数据分析,归根到底是为了理解经济体的运行规律和人做决策时 的规律。稀缺数据可以给予实证分析更精确的答案,更多因果性的结论,还有更多深层次 和异质性的启示。如果做不到这些,那么即使手握宝贵数据,也难以选得好题目。第四,选题要有自己的态度。所谓自己的态度就是在前人的研究基础上,明确自己的贡献,对过往研究有准确的评价。这个评价必须是客观公正的,在批判前人的时候要非常注意措辞。批判是需要的,但鉴于审稿人可能是你批判的对象,所以要把握尺度做到对事不对人。凡是涉及到批判的部分都要有理有据且措辞文雅。如果选择了一个老生常谈的题目,那么态度就显得尤为重要。如果你没有鲜明的态度, 审稿人会认为这篇文章没有什么贡献和进步,属于邯郸学步,审稿结果就很可能是负面的。同时,审稿人会从投稿人的态度中判断其对文献的熟悉程度和对经济学理论、方法、数据 的掌握程度,从而对文章质量进行评估。第五,选题最好有“源于生活,高于生活”的追求。如今的研究五花八门,数据新奇, 思路开阔。这些当然不是坏事,但我觉得源自生活的选题,可能会更有生命力。比如,时 下大学生就业难和专业不对口等现象比较普遍,它们就属于劳动经济学中的“过度教育”或 者“教育与岗位错配”。做这些研究贴近生活,同时具有科研意义。又比如,一些学者研究 放开二胎生育对妇女参与劳动力市场的影响,也很贴合热点,既有政策意义又有学术价值。近期,不少学者纷纷把目光投向了污染对经济和人们生活的影响,这也是他们有了切肤之 痛后,逐步尝试用经济学方法来研究和解释现实问题。总之,我们身边的很多事,都值得 研究。虽然我不主张扎堆搞热点研究,但多关注身边发生的变化,从中寻找有趣和有意义 的研究课题是值得提倡的。这条建议与 Dixit(1994)和 Varian(1997)的观点不谋而合。最后,选题也要有分享的精神。这是我个人的体会,可能与大部分导师要求学生严守选题的要求相矛盾。现实中,不少人觉得选题特别难,不愿意分享自己的想法。特别是自己发现了一个不错的方向,往往不自觉就“保密”起来。我的看法恰恰相反,选题和思路不需要过度保密。真正好的选题,别人听过也未必能轻易剽窃。在一个良性的环境中,讨论可以带来更多的视角和意见,丰富选题的意义,纠正可能出现的偏差。同时,更多人的讨论,也许更有利于促成合作。我们不能讳疾忌医和闭门造车。把选题和初步思路与合适的人分享,并不会损害个人的利益,相反可以提高自己的研究水平。退一步,如果你有很多好的想法,但受制于时间和精力无法把这些想法全部转化成科研成果,那么与别人分享,促成他们更多更好的研究也是对文献总量的贡献。有很多选题可以分享,说明你的思维没有枯竭。靠保守秘密,靠护着选题,其实已经棋输一招。总结起来,选题的指导思想是要找到一个有趣而又意义的题目。这种意义可以是基于个人兴趣的(Dixit,1994),也可以基于社会价值(Davis,2001)。实现这个目标的基础是:1、有一定的文献积累;2、带着“问题”和“兴趣”找选题;3、清楚个人能力的边界;4、对生活充满奇心;5、学会交流与分享。

推动经济学研究回归现实

2008年全球金融危机后十余年来发生的一系列事件,如长时期经济增长缓慢、传统的财政和货币政策未能有力复苏经济、国际贸易摩擦不断增加等,引起了人们对经济学的广泛质疑。2019年,英国伦敦政治经济学院人类学系教授大卫·格雷伯(David Graeber)在美国《纽约时报》刊发了题为《反对经济学》的文章。该文章表示,在以管理大规模经济体为职责的人当中,“经济学学科不再适用于其目的”的这种感觉日益强烈,经济学开始成为一种旨在解决不复存在的问题的科学。对于这样的质疑,美国彭博社专栏作家、前纽约州立大学石溪分校金融学系助理教授诺亚·史密斯(Noah Smith)反驳道,抨击经济学界基本已经抛弃的概念,无助于指明未来应该做什么。那么,近半个世纪以来,经济学的主要发展趋势是什么?对经济学的批评主要集中于何处?如何才能更好地发展经济学?本报记者就这些问题采访了相关学者。 主流经济学遭受质疑据美国新学院经济学副教授桑杰·G.雷迪(Sanjay G. Reddy)介绍,20世纪中期,随着经济学变得更加科学化,经济学经历了“数学化”阶段。这一时期出现了大量借鉴数学的经济学理论,计量经济学的实证性统计学方法也得到了显著发展。同时,一些怀疑经济学理论或计量经济学能否产出明确成果的声音逐渐出现。由于采用不同模型或数据分析重要的经济学问题时,可能得出不同的结论,经济学给出可靠研究结果的能力也因此受到了质疑。所以,过去20年里,经济学学科出现了两个方面的转向:一是理论的去优先化,二是“认同革命”(identification revolution)及更广泛层面上的实证转折。不过,近期有迹象显示,经济学界正在恢复对重大问题的关注和探讨,这在很大程度上源于政治经济学和制度分析的“回归”。美国威拉姆特大学经济学系教授梁燕表示,20世纪70年代的理性预期学说、80年代主流的货币主义和新凯恩斯主义大体上奠定了现代经济学说的基础,其后的经济学发展着重于建立数学模型。2008年全球金融危机促使一些经济学家反思主流经济学说的局限性,如美国经济学家海曼·P.明斯基(Hyman P.Minksy)的“金融不稳定假说”受到了一定关注,但这场危机并未完全动摇主流经济学的地位。重新审视经济学理论基础雷迪谈到,对主流经济学的批评有许多派别。“另类”经济学家常批评主流经济学模型的理想化特性,如对消费者和企业的强调、将一般均衡理论作为一种解释性概念、对各种简单化假定的使用等。许多“另类”经济学学派聚焦于削弱这些理想化特性,或为经济学模型建立其他基础,如引入制度的角色、政治经济学学说、社会规范和文化、不平衡过程(disequilibrium process)概念等。他们的信念基础是经济学需要利用更丰富的理论概念和实证工具来理解现实。梁燕说,经济学内部的自我批评并不激烈,主流经济学根深蒂固。尽管2008年全球金融危机驱使一些经济学家质疑市场有效性理论,如行为经济学对理性预期学说发起挑战,但主流经济学的地位依然不可动摇。美国经济学家保尔·克鲁格曼(Paul Krugman)等一些学者虽然质疑主流经济学的政策见解,但他们仍拥护主流经济学的基本理论。而来自外界的批评主要集中于为什么主流经济学未能预见或防止2008年全球金融危机的发生,即为何主流经济学信奉的有效市场、理性预期无法解释现实经济问题,这确实值得经济学家反思。出于对市场有效性的信奉,主流经济学家提倡政府少干预经济。然而,在市场取得很大发展的同时,经济发展不断被需求不足或金融不稳定导致的危机所打断,经济不平等现象越来越严重。当下,新冠肺炎疫情更是暴露了美国实体经济空心化、企业债务压力巨大、社会保障薄弱等问题,疫情期间及随后的经济疲软将会进一步促进经济学界对经济理论和政策手段的探讨。在美国康奈尔大学教授、世界银行前首席经济学家考希克·巴苏(Kaushik Basu)看来,对经济学进行评价颇具挑战性。经济学的本质是一种科学与常识的无规律组合。而经济学被完全等同于常识时,就容易产生错误政策。另外,不同于大部分的自然科学,经济学家的言论可能影响现实世界中的经济活动。人们常抱怨经济学家无法预测股票市场崩盘或外汇汇率波动。然而,假设存在能够预知未来的经济学家,如果他们预测股市下个月会崩盘,那么股市立刻就会崩盘,因为人们得知预言后会立即抛售自己手中的股票。如此看来,这场股市危机的原因或许正是经济学家预测了危机。巴苏表示,不可否认,传统经济学以及其他社会科学未能足够好地帮助人们应对当今世界的种种挑战。但是,这并不意味着对以往研究的否定。在不容乐观的经济和政治形势面前,对经济学理论基础的重新审视十分必要。包括经济学在内的许多学科都以假设为基础,这些假设有时极为根深蒂固以至于人们忽略了其中存在的问题。例如,在过去两个多世纪里,作为现代西方主流经济学的思想核心,亚当·斯密“看不见的手”这个概念,被脱离语境地抽取出来、曲解并当作自由市场“正教”的基石。这种误读妨碍了人们对经济运行规律、为何有些经济制度成功而另一些失败以及国家干预的本质和角色等问题的理解。重视跨学科和现实问题研究雷迪说,如今,西方新自由主义政策传统正在遭受质疑,但尚未形成一种完全能够以不同方式理解经济现象、考察现有多种政策选择的“新经济学”。加强各学科之间、学科内部各分支领域之间的互动,超越所谓“经济学帝国主义”或经济学在其他学科领域中的单向应用至关重要。开展一种以理解现实世界问题为目标的跨学科对话,需要谦虚的态度与合作,政治学和其他学科混合研究方法的流行为经济学跳出单一学科、进入跨学科空间提供了参考。值得注意的是,鼓励跨学科研究不意味着可以不精通本学科,而是在生存和知识层面都对经济学研究人员提出了更多要求。梁燕也认为跨学科研究非常重要且有效。长期以来,经济学不太注重向其他社会科学和自然科学(除数学外)学习,但事实上心理学、社会学、历史学、生物学等许多学科都能给经济学有益的启发。而且,心理因素、社会关系、历史事件对经济人的经济活动影响很大。巴苏则提出,经济学研究应超越单纯的统计规律,在更广阔的视野下探究金融如何影响商品供应与服务、经济以何种方式影响政治选择进而反作用于经济本身等问题,并承认塑造经济行为的不仅是价格和监管,还有深刻融入人们心理、影响个人选择的社会规范。梁燕表示,人类经济和自然环境今后都将面临重重挑战,有效发展和应用经济学非常重要。各国都应重视经济学学科建设和人才培养。经济学不能像过去一样从不现实的假设出发寻求完美的模型和预测,而是要面向现实需求,如发展经济学现在就非常注重通过实地考察和实验来评估扶贫项目的有效性。中国经济学家应大胆创新,根据实际经济状况和发展需要来建立和完善经济学理论,不要被传统西方经济学理论禁锢。来源:《中国社会科学报》2020年5月27日第1934期 作者:本报记者 王悠然欢迎关注中国社会科学网微信公众号 cssn_cn,获取更多学术资讯。

翠屏山

超级强大!不会写实证论文?看完你就懂了!

本文转载自【微信公众号:社科学术圈,ID:shkxquan】经微信公众号授权转载,如需转载与原文作者联系导读:跟随世界主流经济学的研究范式,数量化研究已经成为了中国经济研究的主流。经济学,作为社会科学中数量化程度非常高的一门学科,其本身还是脱离不了社会科学本身的限制,经济学的主要使命是帮助我们认识复杂的经济世界,更多时候是对经济现象提出合理解释。一篇严谨的经济学论文,一般需要三个基本的要素:视点(Perspective),参照(Benchmark),以及分析方法 (Analytical Tool)(钱颖一,2002)。学习计量经济学的目的是为了进行实证研究,对于学习计量经济学的人而言,要写一篇有实证研究的计量经济学论文或报告时,选题、建立计量模型、选择计量方法等至关重要。今日为您带来一篇关于计量经济学实证论文写作的全面解析。1什么是论文究竟什么是论文?简单地说,论文就是对新的研究成果的汇报。为什么一位成绩优秀的学生,在撰写毕业论文时可能一筹莫展?这主要是因为,平时上课做题,主要学习已有知识,只需被动消化吸收即可,有固定模式可循;而做研究写论文,则需主动创造 (哪怕是一点点) 新知识。因此,刚起步研究的学生,面临着从学习知识 (学生) 到创造知识 (研究者) 的转型。论文与一般的文章或散文不同,后者可以仅仅表达某种情感,或记录一些事情。经济学论文必须用十分严谨的数理逻辑或统计推断,来一步一步地得到结论,保证每个环节都丝丝入扣、经得起推敲;而不能随便发表议论,或轻率地下结论。而且,论文贵在创新,其价值主要在于其原创性 (originality ) 或新颖性(novelty),即对于已有文献的边际贡献 (marginal contribution),参见下图。▲已有知识与新研究的关系一般来说,规范的实证研究包括以下几个步骤,即准备阶段、选题、探索性研究、收集数据、建立计量模型、选择计量方法、解释回归结果、论文写作、与同行交流、提交论文或投稿,下面分别进行介绍。2准备阶段如果以为今天想做研究,明天就可开始,或许不现实。要开始真正的研究,需要一系列的准备工作。首先,必须掌握一定的经济理论,以获得观察经济现象的必要视角 (perspective)、参照系 (reference 或 benchmark) 与分析工具 (analytical tools)。否则,即使看到经济现象,也可能无从下手分析。正如钱颖一 (2002, p.2) 所指出:我在哈佛大学做博士生的时候,韦茨曼 (Martin Weitzman) 教授问我,受过现代经济学系统训练的经济学家和没有经过这种训练的经济学家究竟有什么区别?他研究比较经济制度,经常去苏联访问,问这个问题是从与苏联经济学家交往中有感而发的。韦茨曼的回答是,受过现代经济学系统训练的经济学家的头脑中总有几个参照系,这样,分析经济问题时就有一致性,不会零敲碎打,就事论事。这正是经济学界常说的 “像经济学家那样思考” (Think like an economist)。当然,爱因斯坦更早就说过类似的话,甚至更为深刻:你能不能观察到眼前的现象取决于你运用什么样的理论,理论决定着你到底能观察到什么。显然,那种认为可以不需要任何理论指导而直接去 “看真实世界” 的想法或许过于天真了。这些经济理论的学习,主要体现在微观经济学、宏观经济学以及经济学的各专业课程上,比如金融学、财政学、发展经济学、产业经济学、劳动经济学等。其次,为了进行实证研究,还必须掌握一定的计量方法与统计软件 (比如 Stata)。即使你收集到相关的数据,但数据也不会 “自己说话”,仍需要使用统计软件,运用适当的计量方法进行统计推断。因此,计量经济学对于实证研究不可或缺。在具备一定的理论功底与计量训练后,即可正式开始做实证研究了。3选题实证研究的第一步就是选题,即选择研究的题目。对于刚起步的研究者,常常不知如何选题。研究者通常知道自己想要研究的领域 (比如,经济增长),但这还不是一个具体的 “研究问题” (research question)。对实证分析而言,研究问题通常是有关 “ X 对 Y 有何作用” 之类的因果关系。如果想研究 “家庭联产承包责任制对农业经济增长的作用”,就更具体了,此处 X 指 “家庭联产承包责任制”,而 Y指 “农业经济增长” 。当然,实证研究也可以只有 Y 而没有 X,比如对于某个统计指标 Y 的测算;但纯粹描述性的研究已比较少见。研究问题可以来源于理论 (比如,检验资产定价模型 CAPM 是否成立),也可来自对经济现象的观察 (比如媒体报道、社会调研);可以研究某政策的效应 (比如新劳动法对失业率的影响),也可以对文献中已有论文进行改进。如果没有任何研究想法,则建议先浏览一些经济学的顶级期刊。比如,经济学中文期刊的 “四大金刚”,即《经济研究》、《经济学(季刊)》、《世界经济》、《管理世界》;以及经济学英文期刊的 “Top 5”,即 American Economic Review,Econometrica,Journal of Political Economy,Quarterly Journal of Economics,Review of Economic Studies。这些顶级期刊都是经济学的一般性期刊 (general interest journal),涵盖经济学的各个领域。如果确定研究经济学的某个领域,比如金融学,还可关注《金融研究》等专业期刊 (field journal)。浏览这些期刊中的论文 (通常技术性较强,故未必从头读到尾),可大致知道当前的经济学者都在研究哪些前沿问题,取得了哪些成果,还有哪些未解之谜;进一步,可以评估他 (她) 们的研究方法是否可靠,以及可能的改善空间。如果能提出好的研究问题,也许你的研究就成功了一半。什么是好的研究问题呢?总的来说,研究问题越具体、越有趣、越新颖、越有可行性,则越好!(1) 具体:简单来说,在以上“ X 对 Y 有何作用” 的句型中,应能明确 X 与 Y 具体是什么。(2) 有趣:你的研究问题为什么重要?别人会感兴趣吗?为什么我们要在乎你的问题 (Why should we care)?知道问题的答案后,能影响人们对世界某方面的看法吗? (3) 新颖:论文的核心价值在于其创新性,即做出了文献中所没有的边际贡献。这种边际贡献可以是研究了新的现象、使用了新的 (更好的) 计量方法,或者使用了新的数据集。做研究的过程是创造新知识的过程,在本质上不同于学习已有 (旧) 知识的过程。(4) 可行:即使你的研究问题很具体、很有趣、很新颖,如果找不到相应的数据,则不可行。对于刚开始选题的学生而言,似乎自己能想到的题目,都已被别人做过了。其实未必。要想做出新的边际贡献,当然可在前人的基础上,继续拓展与改进 (改进计量方法,增加变量,使用新数据等) 。另一方面,也可以完全撇开前人,去研究全新的现象。比如,20世纪70年代末中国农村实行了家庭联产承包责任制改革,这是史无前例的。到了1990年左右,就涌现出一批研究农村改革对中国农业产出影响的论文 (比如,Lin, 1992)。又比如,2014年11月开始实行上交所与港交所之间的 “沪港通”。假以时日 (有了足够的数据后),就可以研究沪港通对中国证券市场的影响。即使是前人已经研究过的现象 (太阳底下没有新的事物),也可用新眼光、新视角去观察。重要的是,要有敏锐的观察力,并 “像经济学家那样去思考” (Think like an economist)。当然,对于刚起步的新手,应尽量避免已经被研究得很烂、或过于富有挑战性的题目。显然,备选的研究问题越多越好,因为能 “存活” 下来的研究想法通常不多。4探索性研究有了潜在的研究问题后,首先需要进行初步的 “探索性研究” (exploratory study),看看它是否具有新颖性与可行性。比如,通过查找文献,考察别人是否已经做过类似研究,并大致了解数据是否可得。(1) 通过文献回顾评估选题的新颖性论文贵在有新意。假设你找到了一个具体、有趣而可行的研究问题,但它究竟有多少新颖性,这就不可避免地需要查阅文献,看看文献中是否已有类似研究。如果别人已做过很相似的研究,则通常须更换题目;除非另辟蹊径,找到很不相同的方法或数据。对于中文论文,可在 CNKI (China National Knowledge Infrastructure) 中搜索。对于英文论文,可在 JSTOR (Journal Storage) 或 EconLit with Full Text (美国经济学会) 输入关键字进行搜索;二者均全文收录了许多经济类英文期刊,但前者有几年滞后。对于二者未覆盖的经济类期刊,可通过一些主要出版社 (集团) 搜索,比如 Elsevier Science Direct, Springer Link, Taylor & Francis, Wiley 等。某些工作论文则可通过百度或谷歌搜索。什么时候开始看文献,即看文献的时机,也很重要。如果从一开始就大量地阅读文献,则可能被文献所淹没,望洋兴叹,自觉渺小。更好的方法是,当自己有了一定的想法之后,再去系统地看文献。这样,才会知道自己究竟要看什么,也更能带着批判的眼光去看。另外,阅读文献的态度也十分重要。虚心地从经典论文中汲取营养,才能站在巨人的肩膀上,但仍应带着某种批判性的眼光。事实上,由于经济现象的复杂性 (经济学还只是软科学),任何论文都有一定缺点 (比如,忽略了某些可能重要的因素),也都有可以改进的空间 (甚至可能推翻作者的结论),故不必太迷信 “权威”。既然经济学还不是科学,获得诺贝尔奖的经济学家可能持有相反的观点,那么又哪来的权威呢?重要的是,使用逻辑与实证的方法对不同的观点进行甄别与质疑。如果认为前人所做的研究已经十全十美,你都赞同,那么,你怎么可能做出新的边际贡献呢?(2) 确定所需数据是否可得在正式开始研究之前,还应大致知道所需要的数据不仅存在,而且可以得到。数据从何而来?一般来说,数据要么是别人提供的 (比如统计局),要么是自己收集的 (比如问卷调查)。寻找数据可以从网络搜索开始 (比如谷歌或百度),也可以询问专家或同行。如果确实不知道该从哪里找数据,还可关注文献中同类研究的数据来源,然后溯本及源。因此,阅读一定文献之后,就应该基本了解该研究领域的常见数据来源了。近年来,一些国际期刊已在其网站公开了发表论文中所用的数据集与估计程序 。5收集与整理数据从数据的来源格式来看,数据可分为电子版与非电子版两大类。对于非电子版的数据,需耐心输入数据 (通常先输入Excel表,再导入Stata中),并注意检查,防止出错。即便下载电子版数据,也应检查可能存在的错误。实证研究的关键材料乃是数据。如果数据质量不高,则 “巧妇难为无米之炊”。无论多么高深的计量方法,如果原始数据质量有问题,也只能是 “垃圾进去,垃圾出来” (garbage in, garbage out)。Zvi Griliches 在 1994 年给美国经济学会做的主席演讲 (presidential address) 指出,由于经济学家不够注意数据的来源及产生过程,经常错误地解释数据,导致研究的进展缓慢;如果不提高数据质量,计量理论方面的重大进展将无用武之地。为此,将数据导入统计软件后,需仔细察看数据 (inspect the data)。一个常见误区是,研究者只知进行回归,却不去熟悉原始数据 (raw data),或增加对数据的感觉 (get a feel for the data)。察看数据的常见方法为,计算变量的主要统计特征 (summary statistics),包括均值、最大值、最小值、标准差、相关系数等,并根据经济常识判断它们是否合理。比如,虚拟变量的最小值与最大值必然为 0 与 1;否则,此变量有误。如果数据有时间维度 (比如时间序列或面板数据),还可画时间趋势图。如果发现在某个时点上的变量取值异常波动,则应考察此数据是否有误;即使数据无误,也应考虑异常波动的原因。总之,在察看数据的过程中,主要观察数据中是否存在不一致 (inconsistent) 的地方;比如,出现了不可能、不现实或可疑的取值。如果发现,则要进行处理 (比如,可能是数据输入错误),这被称为 “数据清理” (data cleaning)。对于大多数从事应用研究的学者而言,主要是使用别人 (比如统计局、世界银行) 提供的数据。即便如此,也应该对数据的质量有一个清醒的判断,并使用相应的计量方法 (至少在做出实证研究的结论时,应考虑数据质量的影响)。在使用别人提供的数据时,还应注意其定义及统计口径,是否是与理论模型中的变量相对应。比如,中国的失业率指的是 “城镇登记失业率”,其统计口径与标准教科书中以及西方国家的失业率概念有很大不同。对于计量的初学者来说,与真实数据打交道也是加深对计量经济学理解的重要途径。只有弄脏你的手 (get your hands dirty),才能真正学会做实证研究。6建立计量模型虽然实证研究可以没有理论模型,但如果有好的理论模型作为基础,则更有说服力。具体来说,回归分析一般只能说明变量之间的相关性,要对变量之间的因果关系做出判断,常常需要依赖于经济理论。因此,即使无法提供完整的理论模型,也应该进行一定的理论分析。最理想的情形是,从理论模型中推导出计量模型 (econometric model),即待估计的回归方程。一般来说,一篇好的实证论文,需要讲一个好的 “故事” (story),然后用数据来证实或检验此故事。对于回归函数的具体形式,可以考虑线性、对数 (变量只取正数且有指数增长趋势)、双对数、非线性 (边际效应不是常数)等。在进行模型设定时,应尽量使用常识 (common sense) 与经济理论 (economic theory) 。比如,将 “人均变量” (如人均消费) 与 “人均变量” (如人均 GDP ) 相匹配;使用实际汇率来解释实际进出口。又比如,考虑 FDI 对经济增长的作用。由于 FDI 起作用需要时间,如果把当年的增长率对当年的 FDI 进行回归,可能没有太大意义。比较适当的做法是,考虑期初的 FDI 对随后五年 (或若干年) 经济增长的作用 (这样做也可缓解双向因果关系)。如果不确定该如何设定计量模型,可借鉴文献中同类研究的模型设定。另外,模型既不能过于简单 (解释变量过少),也不宜过于复杂,而应当保持适当的简洁 (keep it sensibly simple)。在选择解释变量时,“从小到大” (specific-to-general) 的建模方法简单易行,但可能偏差较大 (因为存在遗漏变量);而 “从大到小” (general-to-specific) 的建模方法偏差小,但不易执行。实践中,常采用折衷方案,即选择简单而有解释力的模型。7选择计量方法有了计量模型与数据之后,即可根据数据类型与特点,选择合适的计量方法。比如,被解释变量为虚拟变量,则可使用 Probit 或 Logit;如果是面板数据,则应考虑固定效应、随机效应、时间效应等;如果是时间序列,则须先判断是否含单位根,再决定使用相应的计量方法。对于一般的数据,通常先做 OLS,看看结果,作为一个参照系。做完 OLS 后,可以画残差图,大致看看扰动项是否符合经典假定,然后进行严格的检验。如果有所违背 (比如,存在异方差、自相关),则做相应的处理(使用稳健标准误或 GLS)。对于时间序列,还可检验是否存在结构变动 (邹检验,Chow test)。另外,应该对数据的质量进行检验,判断是否存在多重共线性、极端值、弱工具变量等,并做相应的调整。由于受数据可得性 (data availability) 的限制,遗漏变量几乎不可避免。因此,很有必要在实证论文中对此进行讨论。不外乎以下两种情况。第一,存在遗漏变量,但与解释变量不相关 (需要说明为什么不相关),故可以不做处理。第二,存在遗漏变量,且与解释变量相关,则必须进行处理,例如增加控制变量、寻找代理变量、使用工具变量、使用面板数据等。另一常见问题是内生解释变量。此时,一般需找到有效的工具变量才能得到一致的估计。由于面板数据可以在一定程度上克服遗漏变量问题,故比横截面数据或时间序列更有说服力。因此,如果可以获得面板数据,则应尽力争取。比如,对于中国的宏观变量,如果使用全国的时间序列,则一般样本容量较小。此时,可考虑收集省际面板 (provincial panel) 的相应数据。大多数的实证论文都希望说明 X 对 Y 的因果作用。而从回归分析的相关关系升华到因果关系,是很大的飞跃,需要使用适当的计量方法来识别这种因果关系。总之,在这部分应该说明,为什么所用的计量方法是最恰当的。计量经济学的理论总是建立于一些理想化的假定基础之上,而现实的经济数据通常或多或少地不符合这些假定。因此,尽管计量理论是可以严格证明的一门科学,但实证研究在一定程度上却是一门艺术,常需要在理论与现实之间找到适当的妥协 (be prepared to compromise)。8解释回归结果使用计量方法估计模型后,计算机软件 ( 比如 Stata ) 将输出相应的计量结果。此结果可能较长,包含密密麻麻的表格与数字。如果你尝试了各种不同的计量方法与解释变量 (alternative specifications),则结果就会更复杂。如何看这些结果?简单地说,只能用一个字一个字地看,直到看明白为止。当然,也有诀窍。计量结果可能很复杂,但真正重要的信息通常不多,比如回归系数 (含符号)、 p 值,以及样本容量、拟合优度等。以一元回归为例 (工资对数对教育年限回归) ,回归结果参见下图。▲工资对数对教育年限的回归结果在上图的回归结果中,变量 s (教育年限) 的回归系数符号为正 (与经济理论相符),系数估计值为 0.0966245, p 值为 0.000 (在 1% 水平上具有统计显著性),样本容量为 758,而拟合优度 为 0.2527 (教育年限可解释工资对数约四分之一的变动)。在上图中,左上角的残差平方和、右下角的置信区间,乃至常数项等信息,基本可以不关心 (除非有需要)。在解释回归系数时,还应注意区分统计显著性与经济显著性。“统计显著性” (statistical significance) 主要通过 p 值来考察。如果 p 值小于或等于 0.05,则意味着该系数在统计上显著地不等于零;反之,则在统计上不显著,在统计上可将此系数视为零 (不存在)。“经济显著性” (economic significance) 主要通过系数的绝对值来考察,须特别注意变量的取值单位。在上例中,解释变量教育年限 s 的单位为年,而被解释变量工资对数 lnw 可解释为工资的百分比变化,故 s 的回归系数为 0.0966245 意味着,每增加一年教育,未来工资收入将提高 9.66%,具有很高的经济显著性 (可能过高了)。反之,假如 s 的回归系数为 0.01 或 0.001,则意味着每增加一年教育,未来工资收入只会上升 1% 或 0.1%,显然在经济意义上很不显著。此时,统计上显著而经济上不显著,则意味着解释变量对被解释变量的影响很小 (经济上不显著),尽管这种影响被估计得很精确 (统计上显著)。类似地,在进行计量检验时 (比如,豪斯曼检验),Stata 可能输出很多结果,但最需要关注的只是原假设以及 p 值;因为知道二者就可以进行检验了,而其余信息都是细节。研究者通常花费较长时间收集与整理数据。将数据导入Stata,然后输入相应的回归命令,则是 “见证奇迹的时候” (moment of truth)。如果关键解释变量兼具统计与经济显著性,符号也与理论预期一致,而其他控制变量的符号与显著性也大体与预期相符,则会感到十分欣慰,过去收集整理数据的辛劳也都值了。但有时,所得计量结果未必尽如人意,比如关键解释变量不显著,甚至符号与预期相反。此时应怎么办呢?大致来说,出现这种情况,可能有如下三种原因。(1) 使用计量方法不当。比如,在上述一元回归中,显然遗漏了许多变量,可能存在遗漏变量偏差,导致 OLS 估计不一致。更一般地,如果存在内生性而未加以处理,将导致不一致的估计,使得本应显著的变量变得不显著。(2) 数据质量有问题。如果数据存在较大的度量误差,所用代理变量与真实变量相差较远 (由于真实变量不可观测),或者数据输入中的人为错误,都有可能影响估计的一致性。(3) 经济理论有问题。在排除了以上两种可能性之后,最后一种可能性是,经济理论不正确。经济理论所预期的某种效应可能不存在;或者同时存在其他作用机制,使得净效应的符号相反。实证研究的目的之一就是检验经济理论。如果发现已有理论与经验证据不符,则说明此理论尚有改进空间,甚至需要放弃。正如林毅夫 (2001, p. 75) 所指出:如果发现理论推论和我国经验事实不一致,要坚持的不是现有的理论,而是进一步去了解我国的经验现象, 然后, 根据经验现象构建一个可以解释这个现象的理论。所以, 当发现这种不一致时, 不要死抱理论, 成为现有理论的俘虏, 也不要在巨人的面前而感到自己渺小。其实,这正是对理论发展做出贡献的绝好机会。在计量实践中,研究者经常根据计量结果而调整模型,以期得到更为理想的结果,并且只在论文中汇报最佳的结果,而将寻找此结果的过程隐去。这实际上是 “数据挖掘” (data mining) 的一种形式。数据挖掘既有成本 (缺点),也有收益(优点)。数据挖掘的优点是,可对数据进行各种 “实验”,以期揭示数据中的某种规律性,发现模型设定的错误,以此改进理论或计量模型。数据挖掘的缺点则是,由于它根据数据特征来设定计量模型,故模型设定由数据产生,如果再用此数据去检验由它产生的模型,就不是客观的检验,由此导致偏差。事实上,一定程度的数据挖掘是不可避免的,而这两种形式的数据挖掘的界限并不清晰,正如 Heckman (2000) 指出,“尽管使用数据来检验受到该数据启发的理论存在严重的问题,但如果拒绝从数据中学习并修改理论,则会导致更严重的问题” 。解决数据挖掘所带来的偏差的方法之一是进行稳健性检验,而不是仅汇报最佳的结果。 9诊断性检验任何计量方法都有其适用的前提条件;如果前提不成立,则无法使用此计量方法 (可能导致不一致的估计)。因此,在估计完模型后,应对计量方法的前提条件进行 “诊断性检验” (diagnostic checking) 或作出定性说明。比如,使用工具变量法进行2SLS估计后,应进行弱工具变量检验、过度识别检验 (假设存在过度识别)、解释变量内生性检验;并从定性的角度说明 “排他性约束” (exclusion restriction) 为什么成立。又比如,使用时间序列估计自回归 (AR) 或向量自回归模型 (VAR),则应检验残差是否为白噪声 (无自相关)。即使进行OLS回归,也应说明解释变量为什么外生,或者遗漏变量偏差为什么不重要。10稳健性检验为了使用特定的计量方法,研究者通常需要做一系列的假定。但问题是,论文的主要结果是否对这些假定很敏感?为此,有必要放松论文的某些假定,看结果是否稳健或基本不变,这称为 “稳健性检验” (robustness check) 或 “敏感度分析” (sensitivity analysis)。比如,通过改变样本区间 (或去掉极端值)、函数形式、计量方法、控制变量、变量定义、数据来源等,来考察计量结果的稳定性。在计量实践中,研究者通常会通过数据挖掘,找到 “最佳” 的计量模型。如果仅汇报此最佳模型,则会导致偏差。因此,有必要适当地改变模型的设定,比较其主要结果的变化。显然,只有稳健的结果才有说服力,故稳健性检验已成为高质量实证论文不可或缺的一部分。11论文写作得到较为理想的实证结果之后,即可开始写论文。简单地说,论文就是对研究成果的汇报。为了便于读者更快地从论文中获取信息,经济学论文通常有一定的结构,而论文写作本身也是一门精益求精的艺术。经济学家曼昆曾问过加尔布雷斯 (John K. Galbraith) 写作成功的秘密;加尔布雷斯回答说,他写的所有东西都会修改很多次,通常直到第五稿时才会基本满意。下面分别介绍论文的各个部分。(1)标题、关键字、摘要论文的首页通常包括标题、作者、摘要、关键字等信息。标题 (title) 是论文的标签,正如商品的商标或名称。一般应选择简洁而有吸引力的标题,并能让读者知道该文主要做什么。在论文写作乃至成文之后,都有可能修改论文题目,使之更为贴切有趣。在题目之下一般为作者姓名,而将具体的作者单位、联系方式、感谢语 (包括基金资助) 以及 “文责自负” 等声明放在脚注里。如果有多位作者,一般需选择其中一位作者作为 “通讯作者” (corresponding author),负责投稿并与编辑部保持联系 。在题目与作者之下,一般为摘要 (abstract),通常在100字左右。摘要需突出论文的重要意义、研究方法与主要结论。一般读者会先看摘要,再决定是否看全文。因此,论文摘要应字斟句酌,凸显本文的主要贡献,并激起读者进一步阅读的兴趣。摘要通常在论文主体完成后才撰写,因为此时作者对于论文的主要内容会有更清晰的概念。在摘要的下面,通常还需提供几个关键字 (key words),以便读者能很快地根据关键字搜索到此文。关键字常常来自论文的题目。另外,在关键字之下,还可能提供 JEL 分类号,这是美国经济学会主办的 Journal of Economic Literature 杂志所用的经济学各领域的分类编号 。经济学实证论文的正文一般依次包括以下部分:引言、文献回顾 (可归入引言)、理论框架或背景介绍 (可省略)、数据说明、计量模型与估计方法、回归结果、稳健性检验 (可归入回归结果)、结论。下面分别进行说明。(2) 引言 (Introction) 引言虽是全文的第一部分,却经常最后写。原因之一,引言集中了全文的卖点 (selling points),最难撰写,须反复修改;原因之二,引言概括了全文的内容,只有在全文大体完工后,才能准确地总结与提炼。引言通常包括以下内容:本文研究了什么问题,此问题为什么重要 (研究意义);本文使用了什么数据 (最好在数据来源上有所创新或挖掘),实证研究的计量方法是什么,得到了哪些主要结论;此研究与已有文献的关系,本文的主要创新与边际贡献等。由此可见,引言将论文的精华部分以非技术性的方式呈现给读者,可视为扩展版的摘要,是 “销售” 此文的重要手段。事实上,许多读者在浏览论文时,常常先看引言与结论,然后再决定是否细读正文;可见引言的重要性。 引言的写作大致有两个套路。传统的套路是,在提出研究问题之后,首先回顾已有文献的相关研究以及不足之处,然后顺势引出本文的研究方法与主要贡献 (比如,填补了文献的空白)。传统套路的优点是,比较有逻辑性,能自然地呈现学术发展的脉络;其缺点在于读者需要有一定耐心,先回顾主要文献,然后才知道本文的主要工作。现代的套路是,提出问题之后,马上直奔主题,介绍本文的研究方法与主要结论,然后再回头介绍本研究与现有文献的关系。这两种套路各有优缺点,适合不同的论文,但直奔主题的现代套路似乎日益流行。另外,引言的最后一段通常提供全文的路标 (roadmap),告诉读者本文的其余部分在结构上如何安排,以便于读者阅读。(3) 文献回顾 (Literature Review)文献回顾如果较短,可以归入引言部分;反之,如果文献回顾较长,则可单独作为论文的一个部分。对于文献的回顾一般按文献出现的时间先后进行,着重介绍重要的文献,而其他文献可以简略介绍、放入脚注,甚至略去。文献回顾的写作切忌只是堆砌罗列一些文献,而未进行深入分析。事实上,文献回顾的根本目的是为了厘清本文的研究与已有文献的关系,以凸显本文的边际贡献及其在文献中的地位。为此,在肯定现有文献的原创贡献外,难免会指出其不足之处 (或被忽略的方面)。此时,应注意语气委婉,因为这些文献的作者有可能正是未来的审稿人或编辑。另一方面,你又希望突出本文的独特贡献 (当然必须实事求是)。因此,在指出现有文献的不足与突出本文的贡献之间,需要找到措辞与语调上的平衡。(4) 背景介绍 (Background Information) 或理论框架 (Theoretical Framework)实证论文并非仅仅是找一堆数据,然后汇报回归结果。只有告诉读者有关经济现象的背景,完整地述说一个经济故事,才能使得计量结果更有说服力。比如,Nunn and Qian (2011) 研究引入 “新世界” (New World) 作物土豆对 “旧世界” (Old World) 人口增长与城市化的影响,在其第二节背景部分,即以大量篇幅介绍土豆的优点 (virtues of the potato)、土豆如何从新世界传播到旧世界,以及其他新世界作物。因此,实证研究者的工作并不仅仅是下载数据进行回归,还需要熟悉所研究现象的历史、制度与文化背景,乃至数据的来源与产生过程。如果可能,在此部分可引入一个简单的理论模型 (theoretical model) 或思想框架(conceptual framework),为后续的实证研究提供理论基础。但对于实证论文而言,其理论部分不宜太过复杂,以致喧宾夺主。另外,如果经济现象过于复杂,没有现成的理论,也可根据常识 (common sense) 直接写下计量模型或回归方程。(5) 数据说明 (Data description)实证论文的结论是否可靠,首先取决于数据的质量。因此,在数据说明部分,应详细说明数据的具体来源,并评估其可靠性。介绍数据来源的详细程度,应使读者能按图索骥得到同样的数据,以保证科学结果的可重复性。如果对原始数据进行了一些处理或加工,也应一一说明。如果学术界对于数据的质量有质疑,则应说明这些潜在的数据质量问题,对于你的研究有何影响。比如,GDP的绝对水平可能被夸大了,而你仅使用 GDP 的增长率,故可能影响不大。如果数据来自问卷调查,则应说明随机抽样如何进行,问卷如何发放与执行等,并在附录中附上具体的问卷。介绍数据来源之后,通常以表格形式给出主要变量的统计特征 (summary of statistics),比如样本容量、均值、标准差、最小值、最大值等,使读者对数据的基本特征有所了解。有时,还会提供关键变量的相关系数矩阵 (matrix of correlation),作为对变量之间关系的初步证据。(6) 计量模型与估计方法 (Econometric model and estimation)在此部分,需要结合所研究的问题以及已有数据,给出具体的计量模型,即回归方程。通常会有一个基准 (baseline 或 benchmark) 的计量模型,然后在此基础上对模型设定 (model specification) 有所变化,比如增加或替换变量。此部分着重需说明论文的估计策略 (estimation strategy),即究竟应使用什么计量方法来识别主要变量之间的因果关系。初学者易犯的错误是,在论文中直接使用某计量方法,而未说明为什么这是最合适的计量方法。任何计量方法都有适用的前提条件,需要研究者仔细甄别与判断。如果有两个计量方法,各有优缺点,则可二者都用,然后作为稳健性检验,比较二者的结果。(7) 回归结果 (Regression results)介绍计量方法之后,即可汇报回归结果,通常以表格形式来呈现,主要包括以下信息:被解释变量与解释变量的名称、回归系数估计值、标准误 (或 t 统计量),以星号表示统计显著性,以及相关的统计量 (样本容量、拟合优度等)。在正文中,需要对回归结果进行解读,包括回归系数的统计显著性与经济显著性,符号是否与理论预期相符等。(8) 稳健性检验 (Robustness checks)在实证论文中仅仅汇报一个回归结果显然是不够的,因为变量的显著性可能在不同的模型设定下变化。只有在不同的模型设定下,都能得到类似的结果,才是稳健与可信的。对于稳健性检验的结果汇报,如果篇幅比较短,可归入上一部分的 “回归结果”;反之,如果做了较多的稳健性检验,则可单独作为论文的一个部分。(9) 结论 (Conclusion)结论是论文的最后部分,对全文所作工作进行总结,并给读者留下最后的印象。结论部分通常概要地回顾本文的研究问题、计量方法与主要结论,也可重申本文的独特贡献。由于任何论文都有局限性,故也可指出未来的改进空间与研究方向。许多读者会先看引言与结论,再决定是否看正文,故结论部分也十分重要。(10)参考文献 (References)几乎所有研究都建立在前人成果之上,故必然会在文中引用他人的论文或著作。这些论著的详细出处,则一般收集于文末的参考文献。需要特别注意的是,文中所有引用的论著,都应包括在参考文献中;反之,所有参考文献中的论著,都应在正文中被引用。参考文献的顺序一般按照作者姓氏的字母 (拼音) 进行排列,对于同一作者的作品则按发表年代排序。另外,不同期刊对于参考文献的具体格式也有不同要求;在投稿前需按所投期刊的要求进行修改。(11)附录 (Appendix)有些论文还有附录,主要收集不影响正文阅读,但篇幅较长的细节。比如,对于理论文章,可能把繁琐的证明放在附录。而对于实证论文,有时会把过长的数据说明放在附录。如果数据来自问卷调查,则通常把具体的问卷放在附录。(12)写作风格经济学论文属于科学类的论文,并不需要过于华丽的词藻,而应首先注意行文的简洁与逻辑性。另一方面,优美流畅的文笔对于提高论文可读性、吸引读者注意力十分重要。对于初次写论文者,首先要注意 “书面语” 与 “口语” 的区别,避免过分口语化;不能嘴上怎么说,笔下就怎么写,而应使用更为洗练到位的书面语言。在下笔之前,可先在脑海里构思文章的结构与写作风格。事实上,写作的过程也是使思路更加清晰的过程。对于论文中的方程式,可使用 Word 文档中的 “insert” → “object” → “Microsoft Equations” 进行编辑,使得方程更为美观 。论文中所有单独成行的方程式,都应按顺序编号,以(1)、(2)、(3)等表示,以便于检索。对于论文中的表格与图片,也应注意其格式。一般来说,表格的标题应在表的上方;而图片的标题则在图的下方。在表格或图片的下方,还可以有注释,说明数据来源、变量定义等相关信息。对于初学者,建议仔细观察经典论文的文章结构与风格,并注意模仿。比如,中文论文可以模仿《经济研究》或《经济学季刊》,而英文论文则可参照 American Economic Review, Journal of Political Economy, Quarterly Journal of Economics 等。正如古语所云,“熟读唐诗三百首,不会作诗也会吟”。12结语如何才能做出高水平的实证研究?如何才能写出高质量的经济学论文?更进一步,如何才能成为好的经济学家或经济工作者?显然,要达到这些目的,绝非单一学科 (比如,计量经济学) 就能胜任,而需要全方位的学识与素养。在此,引用凯恩斯的一段话作为结束语,并与大家共勉 (曼昆,2009,p.39):经济学研究似乎并不需要任何极高的特殊天赋。与更高深的哲学或纯科学相比,经济学不是……一门极其容易的学科吗?一门容易的学科,但这个学科中很少有人能出类拔萃!这个悖论的解释也许在于杰出的经济学家应该具有各种天赋的罕见的结合。在某种程度上,他应该是数学家、历史学家、政治家和哲学家。他必须了解符号并用文字表达出来。他必须根据一般性来深入思考特殊性,并在思绪奔放的同时触及抽象与具体。他必须根据过去、为着未来而研究现在。他必须考虑到人性或人的制度的每一部分。他必须同时保持果断而客观的情绪,像艺术家一样冷漠而不流俗,但有时又要像政治家一样脚踏实地。

是谓独有

实证研究选题经验分享

最新电影《模拟游戏》讲述了图灵这位数学天才传奇而结局悲凉的一生。每个时代, 天才总是孤独的,平凡人羡慕天才们超凡的智慧与想象力,却难以企及。除了极少数如图 灵般的天才开创了某一个领域,甚至某一个学科,大部分科研工作者的劳动都是在极其狭 小的领域中或前人的成果上进行的。他们劳动的价值,有时难以用短期眼光来衡量。有些 论文,也许在几十年中都没有人引用。有些研究,除了作者本人,甚至没有第二个人知晓。然而,他们依然坚定地工作着。正如图灵坚信他的机器可以破译德国的 Enigma 密码,坚信他的理论一定是正确的一样,大部分科研人员都执着地认为自己的工作虽然在很长时间内不会对外界产生影响,但终有一天,后人会去翻看他们留下的论文、 笔记、手稿、采访记录——一切可以留下的、解释他们对世界看法的点点滴滴。说了那么多,只为了解释一点:如果你想选择一个好的题目,就要抱着对自己和后人负责的态度。当然,除了抽象地理解一个好选题的特性,我们还应该懂得如何在庞杂的文献中找寻自己未来的研究方向。其实,这些经验也是在不断的文献积累中逐步获得的。每当你读新文章时都应该问自己:“它到底做了什么贡献?我可以继续做些什么?”下面我们先来回顾下前辈们是如何讲述他们的选题经验,再结合一些例子讲讲我个人的实践经验。01、前辈的总结哥伦比亚大学的经济学教授 Don Davis 在“Ph.D. Thesis Research: Where do I Start?” (《博士论文研究:我从哪里开始》)一文中针对博士论文选题给出了一条重要建议:选择你长期感兴趣的话题。这样做不仅有利于激励你完成博士阶段的研究,更是在职业生涯初期为你提供一个可以挖掘和拓展的主题性研究领域。一言以蔽之,博士阶段的选题要避免“竭泽而渔”,Davis (2001) 还谈到了“ 有趣”( interesting )选题的几个“参照指标”(indicators)。第一,“有趣”是一个很主观的词,难以统一标准,但总有些依据存在。笔者在这里补充一点,在学术界,“有趣”是一个既基本又苛刻的要求。说它基本是因为 几乎所有导师都会告诉学生要选一个有趣的题目,说它苛刻是因为每个人心中对“有趣” 都有不同的标准。第二,如果作者要让大家觉得选题有趣,那么选题在多大程度上对现实世界有影响就至关重要,简而言之就是选题要有“现实意义”。第三,证明一个问题的 “现实意义”可以通过学术领袖的工作来印证。如果有几位知名学者对你的选题做过相关 研究,那么我们有理由相信,这个选题是重要的。第四,当你证明了自己在做一个重要的选题之后,要说服读者你的选题是有新意且非常重要的。特别是对实证类选题而言,在前 人的模型中加入一些变量显然不能作为“新意”的代名词。即便使用了全新的数据和方法, 如果实证结果不能给读者带来耳目一新的感觉,如果实证的主题依然老旧,那么这类选题 还是不成功的。普林斯顿大学的经济学教授 Avinash Dixit (1994) 对选题的“现实意义”有自己的理解。他的首要建议就是不要太多顾及选题的社会意义,相反地,他鼓励学生尝试那些看似无用但非常吸引人的题目。显然,Dixit 的观点与 Davis 有很大不同。当然,经济学文献中互相矛盾的理论和实证发现比比皆是,在谈论如何选题时,出现这样的分歧也一点不意外。Dixit 主张兴趣第一,不断尝试,在实践中找到适合自己的方向。针对兴趣,Dixit 还提出了一个非常重要的建议:很多想法和理论上的技巧会突然出现在你脑海里。但是,不要被动等待它们出现,要鼓励自己主动找寻这类想法。所以,要对任何与你研究相关的想法和资料保持高度的兴趣和敏感。只有这样,新的想法和选题才会不断涌现。这一点,作为有一定科研经验的读者应该会感同身受。虽然经济学家在选题是否一定要有“现实意义”存在不同看法,但多数人在谈论选题时都会反复提到“有趣”这个词。原加州大学伯克利分校的经济学教授、现任 Google 首席经济学家的 Hal R. Varian (1997) 在讨论如何构建经济学模型中也提到,在写模型之前一定要确认研究的问题是否有趣。为此,他用了经济学中最常见的概念之一——机会成本。当你选择一个题目做研究时,其实还有其他备选的题目,所以做当前题目的预期收益一定要超过你的机会成本。他认为要检验一个题目是否有趣和重要,关键在于是否提供了新的洞见(insight)。一个很形象的检验方法是,读者看了文章要发出惊叹:“啊,这篇文章解释了如此重要的问题!”总结起来,Dixit 和 Varian 是高屋建瓴地看待选题,展现了大师境界。Davis 的建议很 接地气,适合研究生选题时候参考。虽然语言表达不同,某些观点也有区别,但三位经济 学家都强调选题要新颖要有趣。略微遗憾的是,他们的经验之谈中“战略”居多,“战术” 较少。下文将结合我在实践中的经验教训,提出更细致的操作性建议。02、我的实践经验由于经验和水平的差距,我对选题的理解与学界前辈们无法同日而语。作为一家之言与大家分享,仅供批判和参考。第一,选题要在大量阅读的基础上。尽管在如何读文献、读多少文献的问题上,经济学家看法各异,但我认为初学者还是应该养成勤读文献的好习惯。我们可以按照个人的研究,将经济学文献大致细分为几个领域,把论文分类归入文件夹。这些文献也包括没有正式发表的工作论文(Working papers) 。寻找文献的过程可以从各领域的文献手册(Handbook)、Journal of Economic Literature (JEL)、Journal of Economic Perspectives (JEP) 等入手,找出前人的文献综述,按图索骥查到文献的发展脉络。然后,通过文献索引查出目前最活跃的作者,根据作者的个人网站查询最新的文献综述及前沿研究。比如,在最近一段时期,哪些作者发表的重要论文最多、被引用最多,那么这些作者就应该被视作最活跃的作者。同时,可以关注 NBER (National Bureau of Economic Research) 每周的工作论文更新,看看这些作者是否也在 NBER 经常发表工作论文。最后,将这些作者定为重点关注对象,时刻关心他们的最新研究。这种关心要做到细致入微,包括知道他们最新论文的投稿状态和正在写作的论文。因为有些写作团队效率非常高,如果你不了解具体情况,遇到选题近似或者重复时,你的论文还没写到一半,他们的文章可能已经被发表。所以,大量阅读除了能提供坚实的文献基础,还能避免选题撞车。第二,选题要符合作者的能力。寻找到一个好的题目,除了了解本领域的发展,还要理解为什么有些问题没人做。那些没有人碰的题目到底是受制于数据还是方法,你本人有能力解决这些吗?事实上,别人做不了的,很可能也是你做不了的。当然,在确认了上述问题之后,如果你有信心解决前人束手无策的问题,那么完全可以尝试挑战自我。这类文章一旦成功,贡献将是普通论文无法比拟的。现实中,一些看起来很“高大上”的题目,往往不是初学者轻易能驾驭的。比如,制度与增长的关系是一个很好的话题,可我们能想象一个年轻的学生去写,结果会如何。这便是老师们通常说的,选题不要太大的原则。虽然这是一个老生常谈的话题,我还是想补充一点,凡事没有绝对。如果一个初学者确实有很深的文献功底,又有很好的数据和方法做支撑,同时非常清楚写出来的论文会是什么层次和质量,老师们应该放手让他去尝试。关于这点,我的看法与 Dixit (1994) 关于选题应该以个人兴趣为重类似:学生的论文总有从不成熟到成熟的过程,应该以兴趣为先,允许错误和失败。第三,选题要有明确的导向性。目前的实证研究,大体有三类选题导向:问题导向、数据导向、方法导向。第一种导向,层次最高,初学者往往难以做到。所以,能做到数据和方法导向,也应该被鼓励。在灯光数据普及前,对增长的研究常常受困于内生性问题。现在这方面的数据多了,双重差分和断点回归等方法也普及了,解决内生性的难度就相应降低了。所以,从技术角度说,如今研究制度对增长的影响,难度比 Acemoglu et al. (2001) 初步探索时期要低些。可是,无论文献如何发展,我们都不会抹煞 Acemoglu et al. (2001) 的功绩,因为在当时的条件下,这类选题是非常珍贵的,研究结果也有着深远的影响。大多数人都难以把问题、数据和方法三者兼顾。换言之,一篇论文诞生后,三个方面总有缺憾。这时,我认为问题是第一位的。读者和审稿人对一个重要的、稀缺的问题,多少会表现得宽容些。现实中,不少论文是数据驱动的。作者往往在获得了一些宝贵数据后才下决心要做一 篇雄文。在大数据成为热点的今天,如果研究者所占有的资源中包括了稀缺的大数据,而 不加以善待和利用,就是对资源的浪费。所以,数据驱动型的论文本身没有错。如果有错, 就是数据拥有者没有把故事讲好,没有把经济学理论(或者直觉)与数据结合好,没有把 问题实质研究透。出现这类情况,我认为可以归结于人的惰性。当数据优势太大时,研究 者往往会忽略问题的重要性。选题时也往往会片面强大数据的独一无二,而轻视了经济学 研究的基本要求。我们做数据分析,归根到底是为了理解经济体的运行规律和人做决策时 的规律。稀缺数据可以给予实证分析更精确的答案,更多因果性的结论,还有更多深层次 和异质性的启示。如果做不到这些,那么即使手握宝贵数据,也难以选得好题目。第四,选题要有自己的态度。所谓自己的态度就是在前人的研究基础上,明确自己的贡献,对过往研究有准确的评价。这个评价必须是客观公正的,在批判前人的时候要非常注意措辞。批判是需要的,但鉴于审稿人可能是你批判的对象,所以要把握尺度做到对事不对人。凡是涉及到批判的部分都要有理有据且措辞文雅。如果选择了一个老生常谈的题目,那么态度就显得尤为重要。如果你没有鲜明的态度, 审稿人会认为这篇文章没有什么贡献和进步,属于邯郸学步,审稿结果就很可能是负面的。同时,审稿人会从投稿人的态度中判断其对文献的熟悉程度和对经济学理论、方法、数据 的掌握程度,从而对文章质量进行评估。第五,选题最好有“源于生活,高于生活”的追求。如今的研究五花八门,数据新奇, 思路开阔。这些当然不是坏事,但我觉得源自生活的选题,可能会更有生命力。比如,时 下大学生就业难和专业不对口等现象比较普遍,它们就属于劳动经济学中的“过度教育”或 者“教育与岗位错配”。做这些研究贴近生活,同时具有科研意义。又比如,一些学者研究 放开二胎生育对妇女参与劳动力市场的影响,也很贴合热点,既有政策意义又有学术价值。近期,不少学者纷纷把目光投向了污染对经济和人们生活的影响,这也是他们有了切肤之 痛后,逐步尝试用经济学方法来研究和解释现实问题。总之,我们身边的很多事,都值得 研究。虽然我不主张扎堆搞热点研究,但多关注身边发生的变化,从中寻找有趣和有意义 的研究课题是值得提倡的。这条建议与 Dixit(1994)和 Varian(1997)的观点不谋而合。最后,选题也要有分享的精神。这是我个人的体会,可能与大部分导师要求学生严守选题的要求相矛盾。现实中,不少人觉得选题特别难,不愿意分享自己的想法。特别是自己发现了一个不错的方向,往往不自觉就“保密”起来。我的看法恰恰相反,选题和思路不需要过度保密。真正好的选题,别人听过也未必能轻易剽窃。在一个良性的环境中,讨论可以带来更多的视角和意见,丰富选题的意义,纠正可能出现的偏差。同时,更多人的讨论,也许更有利于促成合作。我们不能讳疾忌医和闭门造车。把选题和初步思路与合适的人分享,并不会损害个人的利益,相反可以提高自己的研究水平。退一步,如果你有很多好的想法,但受制于时间和精力无法把这些想法全部转化成科研成果,那么与别人分享,促成他们更多更好的研究也是对文献总量的贡献。有很多选题可以分享,说明你的思维没有枯竭。靠保守秘密,靠护着选题,其实已经棋输一招。总结起来,选题的指导思想是要找到一个有趣而又意义的题目。这种意义可以是基于个人兴趣的(Dixit,1994),也可以基于社会价值(Davis,2001)。实现这个目标的基础是:1、有一定的文献积累;2、带着“问题”和“兴趣”找选题;3、清楚个人能力的边界;4、对生活充满好奇心;5、学会交流与分享。

寄生虫

樊纲:中国经济学研究应更重理论内容本身,不可过分量化分析

在近日于北京大学经济学院举行的第三届“中国百所大学经济学院院长论坛”上,北京大学汇丰商学院教授、中国经济体制改革研究会副会长樊纲表示,我国经济学研究当前存在量化分析重于理论阐释、数学形式大于实践意义等问题,在期刊发表的评审中,应更重视理论内容本身,而不是过分注重量化分析。樊纲表示,改革开放以来中国经济学研究取得了巨大成就,在学科建设、研究方法和社会贡献等方面都取得了长足的进步。在与国际接轨的过程中,经济学研究的数理模型、计量分析、文献索引日趋规范,学术评价体系、期刊、职称评审评定制度逐步完善,国内国际的高水平成果不断涌现。但他表示,与此同时,我国经济学研究中出现的问题也“与国际同步”,比如量化分析重于理论阐释、数学形式大于实践意义、期刊内容过度专门化等方面的问题。樊纲引用了美国著名经济学家、2001年诺贝尔经济学奖得主乔治·阿克洛夫所批判的“搁置之罪”(sins of omission)的概念,即经济学作为一门学科鼓励硬研究,而轻视软研究,忽略了若干难以用“硬方法”加以分析的重要课题与疑问。樊纲解释道,经济学之所以被称为社会科学皇冠上的明珠,是因为相较之其他“软科学”,可以进行数理推导与计量分析,从而更类似于“硬科学”。但由于在期刊发表、职称评定、学术成果审查过程中,编辑和评审人普遍偏好于“硬科学”的方法,使得研究者出于论文发表可能性的考量,倾向于选择可以实证的题目进行分析,从而导致重要和复杂问题的研究被搁置。例如,没有经济学家能够预测出金融危机的发生,主流经济学成果也没能预测出中国如今取得的成就,以及中美之间的经贸摩擦。对此,樊纲呼吁,在经济学期刊论文评审过程中,要适当转换偏好和倾向,更加重视问题本身的重要性,重视理论内容的创新,尊重灵活多样化的论证方法,鼓励新理论假说的提出,关注复杂问题的系统分析。同时在经济学专业学生培养过程中,要区分博士论文和期刊发表,博士论文要坚持较为全面的评审规范,从文献回顾、理论模型到计量分析,打牢专业“基本功”。但对于期刊发表的评审,则不一定用博士论文的评判标准,而是更重视理论内容本身,而不是过分注重量化分析。樊纲在总结发言中提出,中国经济学未来的发展方向,不是要放弃高水平的学术标准,而是应增进研究对现实的指导意义,使得经济学研究与我国经济实践、发展紧密相连,为我国全面建设社会主义现代化培养出更多优秀的经济学人才。(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

任曰

坚守经济学研究的严肃性和本原性

理论上,任何经济学研究成果都要解决问题,都应该有研究发现或者研究结论,尤其是关于现实问题的经济学研究。一项经济学研究成果或者一篇经济学论文,其研究发现可能是人们以前未知的客观事实,也可能是事物的本质和规律。研究发现是论文的精华,是学者学术贡献的集中表现。因此,学者开展研究,必须秉持谨慎、认真的态度。各种科学虽然研究对象、研究手段、研究路径不同,但目标都是提升人类福祉,推动社会进步。任何事物或现象都具有本原性,即客观属性,所以科学活动要尊重客观事实,其研究发现要建立在实验结果、既有知识整理、统计数据搜集和客观现象分析的基础之上,必须是真实的、客观的。自然科学和人文社会科学都是如此。在科学发展史上,自然科学如天文学、地理学、物理学、化学、生物学等被称为硬科学;人文社会科学如政治学、经济学、管理学、社会学、法学、历史学等被称为软科学。硬科学的研究对象具体客观,依赖实验数据、实验手段,因而研究发现更为客观、精准;软科学研究对象相对抽象,获取数据困难,有些对象还无法用数据计量,因而研究结论或研究发现可能模糊和泛化。有的学者对待研究不够科学严谨,使得一些人文社会科学研究成果,如经济学论文中的研究发现在一定程度上出现了轻率、随意、甚至娱乐化的倾向。特别是有些研究发现完全背离了客观现实,背离了人伦常理,离奇偏执、稀奇古怪,经不起任何推敲。任何客观存在的事物和现象都有自身的内部结构,都有自身发展变化的规律,这种结构和规律就是事物或现象的本原,可能其暂时未为人们发现,却一直真实客观存在,科学研究的发现就要揭示这些结构与规律。哥白尼的“日心说”、笛卡尔的解析几何学、伽利略的自由落体定律、牛顿的力学三定律和万有引力定律、达尔文的生物进化论……近代自然科学发展史上的这些伟大发现或者揭示了真实的自然现象,改变了人们以往的认知;或者创造了全新的知识点,启发了人类的心智。与自然科学一样,经济学理论中,从亚当·斯密的自由市场经济与看不见的手,大卫·李嘉图的比较优势原理;到马歇尔的消费者理论、生产者理论、市场的竞争均衡分析,萨伊的“供给可以自动创造需求”萨伊定律,凯恩斯的有效需求不足、政府干预与宏观经济政策等,这些经济学研究发现,无一不是源自可信的实地调查数据、大量的数量分析、缜密的数学方法或者逻辑推理。这些成果,标刻着经济学家的时代烙印,反映出经济学家的世界观、价值观和方法论,对解释经济现象、解决社会问题发挥了积极作用。这些发现,源自现实世界,解释客观实际,充分体现了科学研究的本原性。如果一个学者的研究发现颠覆客观事实,那么这种所谓的研究发现就不是严肃的科学研究成果,而是学者的臆想和自娱自乐,某种程度上也是对科学和公众的不尊重。因此,经济学者将自己的研究发现公之于众时,必须仔细思忖,这一研究结论或研究发现是否确实为自己认真研究所得,是否经得起公众质疑,研究过程是否遵守了科学道德,坚守了科学精神。翻阅当下一些经济学论文,违背客观事实、违背逻辑常理的“研究发现”并非个案,这种现象值得关注与警惕。学者从事科学研究,必须恪守科学道德,尊崇科学精神,保证自己的研究成果或研究发现能有效地应用到人类的各种活动中,对现实社会或未来社会产生积极影响。从事经济学研究,应当站在国家民族利益的高度,秉持求真、实证、开放、怀疑、理性的科学家精神,用忠诚、智慧、心血和汗水服务社会、服务人类。作为一门软科学,经济学研究过程、研究发现必然会受到学者社会经历、时代背景等方面的影响,研究发现可能会带有一定的主观性。但无论怎样,研究发现永远不能脱离社会、脱离实际、脱离大众,必须始终坚持客观性,追求真理。经济学研究是客观实际的表达,也是学者意志的体现。真正的科学家、学者在从事学术研究时绝不能放弃职业操守、突破学术道德底线。学者在从事经济学研究时,可以选择多种研究方法和技术手段,但不能投机取巧、编造虚假数据;可以怀疑前人的研究成果,但不能违背事实、主观臆断;可以大胆探索、积极思考,颠覆前人结论,但不可急功近利、任性而为。经济学研究是严肃、神圣的事业,需要学者的优秀品质、真才实学,也需要学者对研究发现严肃性和本原性的坚守。(作者:李金华,系国家社科基金资助《数量经济技术经济研究》杂志常务副主编、中国社会科学院研究员)

逼猴儿

「北大经院两会笔谈」张延、王琪:发展经济学的新思路——评估“精准扶贫”政策效果的科学量化分析方法

当今时代,尽管世界经济发展取得了巨大进步,但全球仍有7亿多人生活在极度贫困中,每年有大约500万五岁以下儿童死于一些可以通过廉价治疗来预防或治愈的疾病,有一半的儿童仍然没有掌握基本的识字和计算能力就离开了学校(Committee for the Prize in Economic Sciences in Memory of AlfredNobel, 下文简称the Prize in Economic Sciences, 2019)。美国著名发展经济学家迈克尔·克雷默(Michael Kremer),哈佛大学经济学教授、2019年诺贝尔经济学奖得主,从微观角度切入全球贫困问题研究,通过引入随机对照实验的方法设计科学的实地实验,评估不同措施的影响效果,试图寻找有效的干预措施来帮助贫困人口改善生活。他的实验研究成果可被广泛用于发展中国家进行教育补贴、教师管理、疾病预防、医疗定价、技术推广等现实问题中。克雷默开创并推广的实验方法本身也对经济学多个分支具有重大意义,不仅重塑了发展经济学研究,也为整个实证经济学领域提供了更为丰富可信的经验证据和科学有效的研究方法。一、随机对照实验:开启经济学研究的新方法克雷默将全球贫困问题分解为与个体或群组相关的更为精确的问题,如提高入学率、提高疫苗接种比例等,试图在改善穷人生活状态的微观视角上给出解决办法,其采用一系列巧妙设计的随机对照实验,并寻求与发展中国家部分机构的合作以在真实环境中评估减贫项目的效果。这种新的实验设计方法不仅在全球减贫问题上具有重大的实践意义,也重塑了发展经济学的研究范式。评估干预影响的研究都试图回答这样一个问题:参与了某一项目的个体,在没有这一项目影响下将会如何?没有参与某一项目的个体,若在这一项目中将表现何种特征?而在任一给定时间,被观测的个体只存在参与或者未参与中的一种状态,因此难以获得项目对个体影响的估计(the Prize in Economic Sciences, 2019)。若要通过对照实验评估项目影响,克雷默和迪弗洛(Duflo& Kremer, 2003)认为,关键的一步是建立可信的对比。以实验组代表受项目影响的个体组,对照组代表不受项目影响的个体组,则可信的对比是指,若实验组未参与该项目,将与对照组具有相似的结果。在此基础上,对照组可以预测出实验组个体在没有该项目影响下将是何种特征,通过这样的设计可以给出上述问题在群组层面的答案,即项目的平均影响。但在现实中,克雷默和迪弗洛(Duflo& Kremer, 2003)研究发现,通常参与了某一项目的个体与未参与的个体本身就有所不同,有些项目也仅允许符合某类特质的人群参与(例如扶贫政策仅针对贫困人口实施)。另外,是否参与该项目的决策在很多情况下也是自愿的。这导致两组人群的差异不仅反映了项目的影响,还包含了预先存在的差异,即选择性偏误。因此,参与人群与未参与人群不能形成可信的对比,实验组和对照组不能简单等同于参与者和未参与者。消除选择性偏误的一个方法是在潜在参与人群中随机选择实验组和对照组。这种方法使得两组人群平均而言没有显著差别,两者的不同可被归因为参与项目状况所致。基于对照和随机这两个基础思想,克雷默及其合作者(Vermeersch& Kremer, 2005; Kremer, Moulin & Namunyu, 2003; Glewwe, Kremer &Moulin, 2009)设计了一系列的实地实验,并开展于多个发展中国家,通过与当地机构合作设计干预项目,在实施后评估干预效果。他们与当地具有在现实中实施项目的权力并对如何改善项目感兴趣的机构(如政府、非政府组织、私人企业等)合作,这保证了实验在真实环境中实施。研究者和机构均从这一合作中获益(Duflo,Glennerster & Kremer, 2006)。一方面,研究者基于经济理论帮助其合作者设计可解决实际问题的项目或政策,同时也可检验理论的现实适用性。另一方面,政府部门通过与研究者合作,可以推出多个改革实验措施用于随机选取的区域或群体,并选出较好的政策加以推广;非政府组织也希望检测新项目的效果或评估现有项目的作用;私人企业出于更好地理解其商业活动及服务客户、提高利润的目的,同样需要与研究者合作进行随机实验。克雷默及其合作者的创新不仅在于将随机对照实验引入发展经济学,而且还在实地实验的具体情境中提出了很多方便研究者在现实中实现随机化的方法。如克雷默等(Duflo,Glennerster & Kremer, 2006)所述,经典的临床实验中只需将实验样本随机分为实验组和对照组,其中前者接受某一新的项目干预。实地实验也可以沿用这一思想,但现实条件常使得随机分组不易实现。例如,存在资源、行政约束或需评估的项目是现存而非新引入的,因此研究者发展出过度订阅(Oversubscription)、随机引入(Randomized Order of Phase-In)等多种方法。过度订阅是指当资源或实施能力有限且对项目的需求超过供应时,在合格的候选人中随机选择获得该计划的人,这既是一种公平的分配资源的方法,也自然地引入了随机化。克雷默及其合作者(Angrist, Bettinger, Bloom, King & Kremer, 2002)在哥伦比亚进行的一项学校票券项目便采用此种方法决定票券的分配。另一种方式是将引入项目的顺序随机化,当存在金融或行政限制时,一些项目不得不以阶段性引入的方式进行,最公平的方式是随机决定引入顺序,这允许了参与项目和未参与项目的个体或群体同时存在且是随机选出的,而且这种分期引入的承诺可以促使被随机选为对照组的个体或群体保持与研究者的合作。因为对未来收益的期望为受试者提供了合作动机,克雷默等(Miguel& Kremer, 2004)进行驱虫实验时便分为三个阶段,随机选择学校并向其提供驱虫药治疗,以评估驱虫治疗对学生健康和学校出勤率的影响。总之,克雷默等人将随机对照实验引入经济学研究用来检验经济理论预测的结论,并通过评估不同项目的因果影响提出明确的政策建议。这一实验方法也发现了许多现有模型未能预测到的机制和事实,并促进实施部门设计出更有效的政策或项目。二、对发展经济学扶贫减困工作的贡献迪弗洛(Duflo, 2006)在总结实地实验在发展经济学中的地位时提到,最初的发展经济学常依赖于搜集原始数据来检验特定假设或研究某一特定问题,因而在很大程度上是由研究的问题决定所需数据,而非由数据决定可以做的研究。但20世纪后期出现了众多高质量、大规模的数据集,如普查数据和不同领域的调查数据,丰富的数据来源和自然实验为发展经济学开拓了广阔的研究可能性,也促使更为专业的计量方法被引入,发展经济学采用实证证据的标准被大大提高,而基于原始观测数据的研究不再像之前容易被接受。在此背景下,克雷默等(Vermeersch & Kremer, 2005;Kremer, Moulin & Namunyu, 2003)在肯尼亚发起了一系列与教育相关的实地实验,在现实环境中引入随机对照的思想,通过对比随机分配至实验组和对照组的个体来评估干预影响。这种科学严谨的实地实验既传承了发展经济学从调查中搜集原始数据的方法,又重塑了原始数据调查的权威性和科学性,使得实地调查的结果得以被学术界认可,延续了发展经济学先提出问题后寻找相应数据来回答的传统,再次奠定了实地调查在发展经济学中的地位。一旦建立了这一方法的可行性,其在不同项目、国家、时期等情境下的多样性和可实践性便突显出来,相对于回溯性计量研究的优势也得以被承认。在方法论上,随机对照的实地实验最大的优势是可以构造任何调查数据或自然实验均无法观测的反事实结果,这得益于其灵活的实验设计和干预选择(Duflo,Glennerster & Kremer, 2006)。观测研究只能评估现实世界中已经存在的事实结果,而实地实验可以通过实施干预创造出自然中无法观测到的事件,从而研究这一干预的影响。这使得研究者在政策尚未实施时即可检验其是否如先验知识或理论预测的那样有效,也可以在检验理论预测时通过设计不同的干预引入随机变化。在所研究的问题上,随机对照实验在发展经济学理论与政策适用性之间建立起直接桥梁,将贫困背后的主要机制与对于不同政策干预的行为反应融合起来探讨(Duflo,2006)。实验中干预的设计是由发展经济理论指导的,收集的观测数据是基于微观个体选择的,因此实验结果可以指明理论所发现的机制及政策方向在现实中的有效力,定量地测算某一因果关系,为理论预测提供更有说服力的实证检验。三、检验理论和评估政策效果的强有力工具为控制选择性偏误实现反事实推断,基于非实验数据发展出了倾向得分匹配、双重差分法、断点回归法等政策评估方法,但克雷默(Duflo& Kremer, 2003)指出这些非实验方法均有各自的局限性。倾向得分匹配法是根据可观测的个体特征预测其参与概率,以此为依据为受干预影响的实验组匹配参与倾向相似的对照组,但这一方法依赖于对受干预和未受干预两个群组自身差异的准确识别,这导致当基于某一难以观测的特征实施干预时,估计可能存在偏误。双重差分法通过比较受政策影响的某一区域和未实行该政策的区域的增长差异来探究该政策的影响,但结果的可靠性所依据的假设前提是:若没有该政策,两地发展趋势相同。而研究者无法检验这一假设,另外还要保证同一阶段两地没有实施其他可能影响结果的政策,以及未受到任何外来持续性冲击,这在现实中均难以实现(Glewwe,Kremer, Moulin & Zitzewitz, 2004)。断点回归所比较的是某一临界值附近参与项目和未参与项目的个体,认为两类群体其他特征相似,结果的差异仅来源于是否参与了项目,但这只适用于可产生此类断点(临界值)的项目,而在具体实施中断点常常是不存在的,尤其在政策实施不严格的发展中国家。而即便存在断点,这一方法也很有可能面临错误估计标准误差的风险(Bertrand, Duflo & Mullainathan, 2004)。随机对照实验则弥补了非实验的干预效应研究方法的缺陷,使得实证分析在更为广阔的领域和问题上具有可信的结果(Duflo,Glennerster & Kremer, 2006)。实验中干预的实施可供研究者设计并操作,随机化的处理可以控制选择性偏误,实验组和对照组的差异也可以被精准记录。整个干预影响及观测过程均可保证科学透明,研究者可以直接获得高质量的对比数据,而无需对样本自身或计量方法做出过高的要求。克雷默等(Glewwe, Kremer, Moulin & Zitzewitz, 2004; Glewwe, Kremer &Moulin, 2009)比较非实验方法和随机对照实验的评估结果发现,两者会有很大差异,其中非实验方法更容易面临选择性偏误、遗漏变量等识别问题。随机对照实验的引入发展出了一套更为可信的实验设计过程,极大降低了实证中常面临的选择性偏误的风险,使得实验成为经济学研究在检验理论和评估政策时的一种新的强有力的工具。。另外,克雷默等人创建了一套可迭代的实验研究过程(the Prize inEconomic Sciences, 2019),所谓可迭代即研究者可以在相同环境下使用相同的结果变量和相同的测量技术进行后续研究,可以在已有的实验基础上研究引申问题。实证研究中经常会遇到需要进行后续研究的问题,尤其是基于观测数据的研究通常难以作为其他研究的基础被进一步推进,因为初始政策改变时所产生的数据有限,研究引申问题时需要的数据可能并不在这一观测集中,也无法保证其他条件相同来观测在初始政策基础上施加新的干预将产生何种新的影响。而实验具有可以控制干预发生的特点,使得研究者可以进行多步骤的序贯实验(SequentialExperentments),其中每个新的步骤都可以利用较早步骤中的结果,克雷默等(Duflo, Kremer & Robinson, 2008, 2011)关于肯尼亚农民化肥使用情况的发现便基于一系列长期序贯的实地实验。总之,克雷默将随机对照实验引入经济学研究,形成了一种新的实地研究方法,以可信的方法实施大规模的实验,大大增强了经济学者研究现实问题的能力,增加了严格而系统地评估政策效果的科学方法。作者简介:张延,北京大学经济学院教授,博生生导师。主要从事微观经济理论与实践、宏观经济理论、政策与实践等方面的研究。在国内外核心学术刊物上,独立发表学术论文30多篇,并出版学术专、译著十余部。留校至今获教学科研奖多项,承担多项国家社科基金项目和省部级课题。王琪,北京大学经济学院2016级西方经济学博士研究生,主要研究方向为收入分配、公平认知和行为经济。