动态杠杆是初中物理中的重点内容,今天来看一道另类题型——图文信息转化。图像信息如图所示,有一轻质木板(质量可忽略不计)长为L,右端用一竖直向上的力F拉着,左端可绕O点转动,右端放一重为G的物体。当物体向左匀速滑动时,木板始终在水平位置保持静止,则下列表示拉力F与物体运动时间t的关系图像中,正确的是( )选项首先确定题型是动态杠杆类型,肯定是利用杠杆平衡条件“动力×动力臂=阻力×阻力臂 ”找出拉力F与实践t间的的函数关系式,从而得出图像。审题:找到有用信息①杠杆始终在水平位置保持静止,处于平衡状态。②拉力F方向始终竖直向上,则与杠杆使用垂直。也就是说动力臂恒为杠杆的长度L。③重物的重力不变,即阻力大小不变,始终等于物体重力。整个过程中,动力随着阻力臂的变化而变化。只要将阻力臂用时间t表示出来,就能找出拉力和时间的关系。解题步骤:1、阻力臂原长也近似看成杠杆长L(看选项可知这里只需要关系式,具体的数值不重要),随着时间在均匀变小,则 l2=L-vt 。2、利用杠杆平衡条件 F1·l1=F2·l2,得出F·L=G·l2, 将上面l2代入即可得出关系式:最终表达式观察上式发现:G、V、L都是定值,所以是一个F随t不断减小的一次函数。好了,今天就分享到这里,欢迎留言讨论!
来源:对冲研投文 | 蒋峤 陆韵婷 戴志锋 中泰金融 传统借贷vs新型金融 经授权发布前言:上周我们深度研究了美国大型金融机构与08年情况对比,总体认为稳健,市场也有逐渐有了共识。市场仍然担心美国投资机构的风险,本文进行了分析,尤其是风险较高的对冲基金。对冲基金的财务杠杆是下降的,监管也是趋严的,对金融体系风险传染度不高;对冲基金的产品杠杆的是在提升的,从而加大资本市场的波动,会通过 “居民财富效应”传递风险。投资者更应关注美国经济的中长期风险,美国金融体系的短期风险总体可控。投资要点美国金融投资机构的风险评估:对冲基金风险最高。1、美国资管产品结构:机构投资者主导的市场,资管产品是联通资金(居民、企业、政府部门)和资本市场(股票、债券、货币等)的载体;资管产品规模合计约64.6万亿美元,养老基金、共同基金、私募基金(对冲基金)、ETF、其他资产产品的规模分别为24、17.6、14.3、4.4、3.9万亿美元。2、ETF杠杆并不高:1641只美国股票ETF中,193只带杠杆。3、对冲基金潜在风险及传染性是最大的:对冲基金规模8.3万亿美元,以高杠杆、灵活多样的、复杂的交易策略,对市场 “追涨杀跌”。对冲基金是的“加杠杆”的机制及测算。1、对冲基金获得杠杆的方式有两种。第一类是融资,即从交易对手借入资金或证券来获得;第二类是通过衍生品合成,即通过使用衍生品(如期权,期货和掉期等)间接获得的杠杆。财务杠杆(总资产/净资产)衡量第一类杠杆,总杠杆(名义总风险敞口/净资产)衡量第一、第二类杠杆之和。2、各类对冲基金的杠杆情况。对冲基金包括股票、相对价值、宏观、事件驱动、信用、管理期货(CTA)等策略。财务杠杆较高的依次为相对价值、宏观、多策略,2019Q2杠杆依次为6.0、4.5、2.5倍;总杠杆(不含利率衍生品)较高的依次为宏观、相对价值、CTA,依次为29.1、24.0、19.9。3、财务杠杆主要来源:回购市场和主经纪商。回购质押率约9折(质押物以国债为主),主经纪商质押率约7折(质押物为股票和公司债券)。对冲基金的自身风险及风险传染。1、对冲基金的自身风险源于“高杠杆”:高杠杆放大损失,意味着对波动的低承受度;高杠杆意味着对“杠杆成本”的高敏感度,融资成本的提升以及初始保证金要求的突然变化。同时还有流动性风险与尾部风险。2、对冲基金风险对金融体系的风险。一是对其他金融机构的传导:对冲基金的主要交易对手方是主经纪商,从而风险传染其他类型金融机构。二是对资本市场的传导:a、负反馈循环。市场下跌—头寸亏损—抛售资产追加保证金—市场流动性收紧—市场继续下跌的负反馈循环;b、同模型和策略,会放大波动;c、对冲基金危机会影响资本市场整体流动性。本轮对冲基金的风险评估一:系统性金融风险传染性小。1、财务杠杆与07年比,明显下降。财务杠杆(2019Q2为1.7)低于07-08年金融危机(2017年中为2.6)。美联储及时为流动性背书,“踩踏式”去杠杆可能性降低。2、大型对冲基金系统性风险的监管加强、透明度提升。私募基金的规模、杠杆、敞口、与交易对手方的关联等更为透明。更高的初始保证金比例(金融危机后由17%提升至约30%),银行对对冲基金的敞口有限(如花旗银行对对冲基金的表内外授信,占对公授信和总资产的比例分别为4%、1.4%),OTC衍生品集中清算比例提升;投资者集中赎回风险降低。本轮对冲基金的风险评估二:加大资本市场波动。1、衍生品杠杆提升会加大价格波动,持有者损失也会加大。对冲基金总杠杆提升(2019Q2为3.8、2015年初为3.0),而同期财务杠杆是下降的,背后原因是对冲基金加大衍生品杠杆;2、交易策略趋同会放大市场波动:高位下跌初期,压力是最大。风险平价策略以及各类波动率目标策略的趋同交易,在市场急跌、波动率跳升时,大规模降杠杆,放大市场波动。3、大幅下降后,未来下跌的动能是会减弱的。若市场继续向下波动,较低的杠杆意味着对市场的压力较之前减弱,负反馈效应衰减。本轮的风险传导机制。1、本轮不是金融机构的风险传导。08年次贷危机是以金融系统为“圆心”向外传导;本轮市场下跌,金融体系自身风险相对较小:大型金融机构相对稳健,对冲基金风险传染性不高。(详见报告《美国金融机构这次会出现“雷曼”吗?——历史对比研究》)2、本轮风险传导是会通过“居民财富效应”。高杠杆的资管产品传导到居民,居民承担较大损失,通过影响“财富效应”传导至实体经济,最终影响金融机构的信用风险。3、投资者更应关注美国经济的中长期风险,美国金融体系的短期风险总体可控。风险提示:市场信心持续受挫;海外经济下滑超预期;尾部风险发生。1美国资本市场的风险点:对冲基金美国资管产品结构。美国资本市场是由机构投资者主导的市场,资管产品是联通资金(居民、企业、政府部门)和资本市场(股票、债券、货币等)的载体,机构化的特征,使得资管机构行为、产品策略会对市场形成直接影响,尤其在市场波动中,表现为放大波动、影响流动性。截至2019年底,美国资管产品规模合计约64.61万亿美元,养老基金、共同基金、私募基金(2019Q2数据)、ETF、其他资产产品的规模分别为24.36、17.66、14.28、4.40、3.91万亿美元。1. ETF风险分析私募基金及ETF有杠杆,对短期波动率敏感。根据资金期限、收益要求和风险偏好的区分,总体上可以分为三类,养老基金,换手率低、对短期市场波动不敏感;以对冲基金为主的私募基金,灵活度高、加杠杆、对短期波动率最敏感;共同基金、ETF介于两者之间。资金属性决定了各类资管产品不同的投资策略和杠杆水平,对市场影响的方式和程度也各有差异。ETF杠杆使用并不明显。根据彭博数据,美国1641只股票ETF中,带有杠杆的数量为193只,其中三倍、两倍、1.35倍、1倍杠杆的,分别有85、83、5、20只,总体看ETF的杠杆使用并不明显。ETF对市场的影响。1)具有一定杠杆,在减仓去杠杆中,给市场带来压力;2)基础资产流动性问题,大市值股票流动性好,小市值股票流动性差,在抛售中,加剧中小市值的股票压力;3)ETF被动跟踪,交易灵活、成本低,被许多趋势投资者使用,会被用作追涨杀跌的工具。2、对冲基金风险分析私募基金中对冲基金占比最高。截至2019Q2,美国私募基金规模为14.3万亿美元,其中对冲基金8.3万亿美元,占比最高,其他包括PE、房地产、资产证券化、VC等基金,占比依次降低。美国证监会SEC将净资产规模大于5亿美元的对冲基金归为合格对冲基金,截至2019Q2,8.3万亿美元对冲基金中,6.7万亿为合格对冲基金,并且SEC也以该群体为样本,披露更为详尽的数据,包括杠杆、融资、敞口、流动性等,因此下文的分析及数据使用,也主要针对美国合格对冲基金。对冲基金以高杠杆、灵活多样的策略、以及神秘感,始终是资本市场关注的焦点之一。从1998年曾经风云一时的LTCM的破产,到2008年美国金融危机中大量对冲基金倒闭,对冲基金也一直被贴上高风险标签。本轮美国市场波动,“桥水”等风险平价策略也给市场蒙上疑云。总体看,资管机构中,对冲基金潜在风险以及与金融机构的关联度是最大的,因此下文主要分析对冲基金的风险点与传导机制,并且评估当前以对冲基金为代表的的资管机构,如何影响美国金融系统。2对冲基金 “加杠杆”的机制及测算1、对冲基金的杠杆如何衡量对冲基金获得杠杆的方式有两种。第一种是融资,即从交易对手借入资金或证券来获得,两个主要来源分别是主经纪商(primebrokers)以及回购市场(repomarket)。第二种是通过衍生品合成,即通过使用衍生品(如期权,期货和掉期等)间接获得的杠杆。因此,有两种杠杆指标用来对冲基金的杠杆水平。1)财务杠杆。即仅考虑融资带来的杠杆放大,可以用总资产/净资产来计算,体现为账面上超过权益资本的融资杠杆。2)总杠杆。即将衍生品的合成效应考虑在内后带来的总杠杆放大,可以用名义总风险敞口/净资产来计算,体现的是包含自带杠杆的衍生品后,超过权益资本的实际杠杆效应。剔除利率衍生品的总杠杆,更能反映实际杠杆水平。SEC披露两种总杠杆,分别是包含利率衍生品的总杠杆,以及剔除利率衍生品的总杠杆。因为利率衍生品如掉期实际是以价差结算,以名义本金披露的杠杆数据要远大于实际杠杆效应,因此不含利率衍生品的总杠杆,更能反映实际杠杆水平,下文分析数据也以不含利率衍生品的总杠杆为主。总杠杆vs净杠杆。计算总杠杆为空头头寸的价值加上多头头寸的价值,总额再除以净资产值。计算净杠杆为多头头寸的价值减去空头头寸的价值。因为多空头寸有相互抵消效应,净杠杆往往能够更为合理地评估基金所面临的市场风险程度。总杠杆更多地反映了基金的整体情况,但可能会夸大市场风险,尤其对于相对价值类策略。由于SEC更多披露的是总杠杆数据,下文中使用总杠杆来看变化趋势。总体看,近年来财务杠杆水平下降,总杠杆提升。根据SEC披露,截至2019Q2财务杠杆的均值和中位数分别为1.7、1.2,(2013Q1为1.9、1.4),略有下降;2019Q2总杠杆(不含利率衍生品)的均值和中位数分别为3.8、1.8(2015年初为3.0、1.9),均值有所提升。总体上,财务杠杆水平有所下降,总杠杆有所提升,主要原因为对冲基金近年来更多使用衍生品加杠杆,而相对减少了融资杠杆。这一点也可以从对冲基金投向配置看出,如图14所示,投向中52%为衍生品,债券、股票、回购协议依次占比18%、12%、9%。2、不同策略对冲基金的杠杆情况按策略类型划分,可以为股票、相对价值、宏观、事件驱动、信用、管理期货(CTA)等策略。其中,规模大的是股票、相对价值、宏观策略,2019Q2规模占比依次为30%、19%、14%;例如,股票策略包括了多空、偏多、市场中性、偏空等策略。财务杠杆较高的依次为相对价值、宏观、多策略,2019Q2杠杆依次为6.0、4.5、2.5倍;总杠杆(不含利率衍生品)较高的依次为宏观、相对价值、CTA,依次为29.1、24.0、19.9。从趋势看,相对价值、宏观策略财务杠杆与总杠杆均有提升,而CTA主要提升了总杠杆。1)杠杆高低主要与策略模式有关。如相对价值捕捉合约间微小的价差,需要加较高的杠杆,以提升long/short套利的收益率;宏观策略中目前的主流即风险平价策略,需要对低风险资产加杠杆,来平衡风险配置。2)以总杠杆评估,会夸大相对价值类策略的实际杠杆。这两类策略的实际暴露是价差,总杠杆反映的多空敞口之和,放大了实际杠杆。3)总杠杆提升幅度要大于财务杠杆。这也与前文美国对冲基金总体情况相符。4)CTA使用很低的财务杠杆。主要通过衍生品来加杠杆,因为有成本低、灵活度高的特点,这也与CTA中大量的追逐趋势交易策略有关。观察CTA杠杆与标普500指数发现,走势有一定相关性。流动性是高杠杆策略的“命门”。采取较高杠杆率的大多数策略的一个共同点是,它们所操作的市场通常流动性很强。在正常的市场条件下,这些高杠杆策略能够迅速调整他们的风险敞口。而如此前美国回购市场的流动性风险,对需要通过回购市场及时调整国债杠杆的桥水等风险平价策略而言,确实是不小的“危机”。3、财务杠杆主要来源:主经纪商和回购市场对冲基金财务杠杆的两个主要来源,分别是主经纪商(primebrokers)和回购市场(repomarket)。两个渠道,均可以通过出借证券进行融资(做多),也可以通过出借现金进行融券(做空),以下表述均以融资为例。主要以抵押融资为主,信用融资占比很低。对冲基金根据可抵押的资产类别决定融资类型,持有的国债通过回购市场融资,而其他波动性相对大的资产,如股票和高收益公司债券,则通过经纪商的抵押贷款进行融资。从结构看,抵押融资中来自主经纪商的融资,高于从回购市场融资,但从趋势上看,通过回购市场融资占比在持续提升,主要是由于大量使用回购的相对价值策略和全球宏观策略的管理规模,近年来大幅提升。截至2019Q2,3.17万亿美元的总融资规模中,仅有150亿信用融资,质押融资3.15万亿美元,其中通过主经纪商1.44万亿美元,通过回购市场1.29亿美元,以及其他质押融资4290亿美元。质押率,回购质押率约9折,主经纪商质押率约7折。质押率的高低主要由抵押品的信用等级(信用风险)和波动率(市场风险)决定,因此以国债为主要抵押品的回购融资,质押率较高;而由股票和公司债券为主要抵押品的主经纪商融资,质押率相对较低。这一点,可以从不同分位数下的质押率看出。从中位数看,回购、主经纪商融资的质押率分别为9折和7折,且波动幅度较小。3对冲基金的风险,以及对金融系统的传导机制1、从LTCM破产案导致的风险传导LTCM盛名一时。美国长期资本管理公司(Long-TermCapitalManagement,简称LTCM)成立于1994年2月,是一家主要从事采用高杠杆交易策略的对冲基金,当时与量子基金、老虎基金、欧米伽基金并称为国际四大“对冲基金”。LTCM拥有豪华“明星”阵容,管理净值增长迅速。掌门人梅里韦瑟是所罗门兄弟前副董事长,被誉为能“点石成金”的华尔街债务套利之父,集结了包括诺贝尔经济学奖得主、前财政部副部长及联储副主席、前所罗门兄弟债券交易部主管等。LTCM保持骄人的业绩,在1994-1997年间,资产净值从12.5亿美元增长至48亿美元,每年的投资回报为28.5%、42.8%、40.8%和17%,1997年以1994年投资1美元派2.82美元红利的高回报率让LTCM身价倍增。LTCM的核心策略是“收敛套利交易”,即利用两种相似金融工具之间价差的变化趋势来盈利。收敛套利属于对冲基金的相对价值策略,背后原理简单理解,即两种相似金融工具之间价差的“均值回归”,当价差大于模型设定的阈值,开仓做空价差,当价差收窄时平仓获利。例如,LTCM最著名的策略,做空30年期与29.5年期美国公债的价差套利,让其收获了丰厚的投资收益。高杠杆。由于套利的收益率相对较低,LTCM使用了很高的财务杠杆,以及衍生品合约。由于市场有效性,价差往往很小,再考虑交易成本、冲击成本等,需要配合高杠杆来实现一定的资本回报率。1998年8月,LTCM的总资产和衍生品总敞口分别为1250、14000亿美元,即使以1998年初约50亿美元的净资产计算,财务杠杆和总杠杆(包含掉期)分别为25倍和280倍,总杠杆(剔除掉期)也达130倍之高!LTCM的陨落。1998年,由于亚洲金融危机冲击,发展中国家债券和美国政府债券利差扩大,LTCM预测发展中国家债券利率将逐渐恢复稳定,二者之间差距会缩小,于是做多意大利债券、做空德国债券。而由于国际石油价格下滑,俄罗斯国内经济不断恶化,俄政府宣布卢布贬值,停止国债交易,投资者纷纷从发展中市场退出,转而持有美国、德国等低风险债,价差不断扩大,LTCM净值持续下降的同时,衍生品端需要不断增加保证金,但危机中,由于市场流动性缺失,LTCM无法抛售资产,或者最多只能以低价甩卖资产,从1998年5月到9月,短短的150多天LTCM资产净值下降90%,出现43亿美元巨额亏损,仅余5亿美元,已走到破产边缘。9月23日,美联储出面组织安排,以MerrillLynch、J.P.Morgan为首的15家国际性金融机构注资37.25亿美元购买LTCM90%的股权,共同接管了LTCM。2、对冲基金的自身风险结合LTCM破产的案例,以及对冲基金运行的机制和特点,总结对冲基金的风险主要如下。1)高杠杆,是脆弱性的根源。a)高杠杆放大损失,意味着对波动的低承受度。以LTCM最高300倍的总杠杆(包含衍生品)为例,价差1BP的波动,会带来资本约300BP的浮亏。放大的损失有可能超过基金的资本,导致资不抵债。当市场向不利方向变动时,头寸损失将导致衍生品交易的追加保证金通知,这将冲击对冲基金的现金持有量。高杠杆交易要求有足够的现金支持保证金要求,而如果没有现金,需要抛售资产降杠杆,不断追加保证金。b)高杆杆意味着对“杠杆成本”的高敏感度,包括融资成本的提升、以及初始保证金要求的突然变化。如回购利率大幅提升,以及衍生品和质押融资的初始保证金增加等。初始保证金要求意外的提高,可能影响对冲基金内部流动性,耗尽现金缓冲。c)除了改变融资条款,经纪商可能不再展期或撤回融资。当市场恐慌,或融资人信用出现危机时,经纪商为规避交易对手违约风险,可能不再展期或撤回融资,如危机后期的LTCM,只能被迫将未到期融资仓位进行平仓。2)流动性风险。包括投资者赎回风险,以及因市场缺乏流动性而造成无法补足融资抵押品或保证金。投资者赎回的意外增加,在2008年金融危机期间,许多对冲基金面临投资者的赎回,因为对冲基金向投资者提供了非常优惠的流动性条款。其中一些对冲基金被迫平仓以满足赎回需求,而导致许多对冲基金倒闭。3)模型风险及操作风险。个性化,未知与不可测性。模型的执行都有一定的前提或假设,比如市场的有效性、连续性、流动性等,模型风险是在小概率事件冲击下,模型有失效的可能。操作风险和内控风险,以LTCM为例,交易员超权限操作,以及危机后期风控的失效,都是造成LTCM成为破产个例的因素。3、对冲基金对金融系统的传导机制与交易对手的风险传染,尤其是系统重要性机构。1)对冲基金的主要交易对手方是主经纪商,传导是相互连接的。由于主经纪商是对冲基金的重要融资来源,以及衍生品交易对手,对冲基金的危机将会传染给作为其对手的主经纪商,然后波及与该主经纪商关联的其他对冲基金。这也是LTCM案例中,美联储召集美林、JP摩根等对其进行紧急救助的原因,LTCM较大的融资与衍生品敞口将传染给作为其交易对手的经纪商。2)市场大幅波动时,信用风险与市场风险及流动性风险的相关性是增加的,市场信心和流动性是“症结”所在。信用风险管理应更大程度考虑到市场风险、流动性风险和信用风险之间的联系,尤其在极端波动时。主经纪商通过评估抵押品以及衍生品风险敞口,来调节保证金比例、融资价格,这在市场平稳的时候可以正常运行。市场大幅波动时,随着价格下跌,抵押品价值快速下降和衍生品风险敞口迅速扩大,可能造成对冲基金无法追加抵押品和补足保证金,将造成强制平仓,对冲基金亏损甚至清盘,进而造成主经纪商的实质损失,信用风险与市场风险及流动性风险的相关性是增加。在这里,市场信心和流动性是“症结”所在。对资本市场的传导。1)负反馈循环。负反馈来源的根本还是杠杆,杠杆交易最大特点是保证金机制,当出现头寸亏损时会接到margincall,需要追加保证金。这样就可能形成,市场下跌——头寸亏损——追加保证金——加剧下跌并影响市场流动性——市场继续下跌的负反馈循环。2)趋同模型和策略,会放大波动。例如,大量的锚定波动率的策略同向执行,会带来较大冲击,放大波动。3)对冲基金是市场重要的流动性提供者,对冲基金危机会影响整体流动性。考虑到杠杆以及高换手率,对冲基金对市场流动性的作用要大于其规模占比。4本轮对冲基金的风险评估一:风险传染性不大1、财务杠杆低于08金融危机,风险传染性大幅度降低如前文所述,高杠杆是脆弱性的根源。尽管没有全球统一的标准来准确衡量对冲基金杠杆,我们尽量用可比的指标,来纵向对比杠杆的变化。由于LTCM的超高杠杆并不具备普遍意义,2007-2008美国金融危机的数据更有可比性。财务杠杆低于08金融危机。2019Q2美国对冲基金的财务杠杆均值为1.7,低于2008年金融危机前的2.6(2017年中),高于2008年金融危机之后的1.4(2019年3月),可见08金融危机期间,对冲基金整体经历了显著的去杠杆过程。按照策略分类,根据IMF的统计数据,2008年金融危机期间倒闭的对冲基金集中于高杠杆的策略,相对价值、结构化产品、宏观、其他固定收益策略的财务杠杆(加权平均值)分别为16、17、14、10倍。而2019Q2,美国对冲基金财务杠杆较高的相对价值、宏观策略分别为6、4.5倍。总杠杆近年来有所升高,主要是利用衍生品加杠杆。总体上,结合前文所述,近几年美国对冲基金财务杠杆保持比较稳定,低于2008年金融危机期间的水平;而总杠杆近年来有所升高,主要是利用衍生品加杠杆。相对价值、宏观策略的杠杆天然会高于其他策略,这是策略特点决定的,当前这几类策略的财务杠杆要远低于2008年金融危机期间倒闭的案例水平。总体看,2008年金融危机之后,对冲基金行业监管加强,通过定期向SEC报送数据等措施,透明度大大提升,从这一角度,大型对冲基金因过分利用杠杆的可能性降低。2、监管加强、透明度提升:大型对冲基金系统性风险下降大型对冲基金重演LTCM的概率大大降低2008年金融危机之后,美国加强并完善了对私募基金的监管,从强化私募基金监管、交易对手方监管、投资者保护等方面着手展开。总体上,私募基金的规模、杠杆、敞口、与交易对手方的关联等更为透明,利于监管的实时监测与风险防范。LTCM中之所以美联储展开紧急救助,也在于LTCM的“大而不能倒”,当前在更多监管之下,再次发生类似LTCM破产事件的概率大大下降。交易对手风险下降1)更高的初始保证金比例。HFACS的数据显示,自2007年以来,经纪商要求对冲基金在其机构经纪账户上提交的初始保证金总额已从占总头寸的17%左右增至约30%。2)银行等经纪商对冲基金行业的潜在敞口总量有限。根据美国主要银行机构对金融类企业敞口,截至2019年,花旗银行、摩根大通、美国银行、富国银行、高盛集团、摩根斯坦利、纽约梅隆对资产管理者注的表内外授信占总资产比例,分别为1.4%、1.9%、4.5%、6.1%、0.7%、4.6%和2%。其中花旗银行披露口径为对冲基金,其他银行口径均要更宽,因此体现为数据差异。以花旗银行数据参考,对冲基金的表内外授信占对公授信,以及总资产的比例分别为4%、1.4%,敞口总量有限。3)引导OTC衍生品集中清算,降低交易对手信用风险。2008年金融危机过后,G20领导人同意对全球场外衍生品市场进行一系列改革,以降低系统性风险,提高透明度。首先,集中清算的OTC衍生品比例显著上升。全球集中清算的未偿付单一货币场外利率衍生品的比例已从2008年FSB估计的24%上升至2017年6月的62%。加强交易的中央清算,可以降低交易对手的信用风险,并简化风险敞口网络。其次,对于未集中清算的衍生品,引入强制性保证金要求,以降低未清算交易的交易对手信用风险。最后,参与者现在被迫向当局报告衍生品交易,增加了透明度。投资者集中赎回风险降低有关对冲基金的赎回,许多迹象表明,目前有了许多改善之处。1)更长的投资者锁定期。即投资者在投资后不允许赎回资金的时间。2)更长的通知期。即投资者在赎回之前必须给出一定数量的通知。例如,共同基金可能每天都有赎回,但对冲基金通常有30至90天的通知期。3)流动性缓冲。即投资组合流动性(在一定时间内可变现资产的百分比)超过投资者流动性(在一定时间内投资者可赎回的百分比),如下图所示。即总体上,每个时间点,均可以通过变现资产来应付投资者赎回,当然前提是市场不发生流动性风险,资产可以在正常市价出售,而不用打折甩卖。4)流动性管理的其他安排。包括限制赎回、暂停赎回、侧袋账户。侧袋账户,即剥离基础投资组合中流动性不足的部分,并只允许赎回该部分以外的资产。截至2019Q2,侧袋账户净值占比的中位数和均值分别为8.5、16.0。3、美联储及时为流动性背书,“挤兑踩踏”可能性降低如上文所述,市场流动性是对冲基金许多环节的“命门”所在。包括,1)充分的流动性是许多高杠杆策略的前提,因为这些策略需要通过控制杠杆来迅速调整他们的风险敞口。2)流动性的缺失,会加速抵押品价值下降,以及加剧衍生品头寸的亏损,没有了现金缓冲,以及无法补充抵押品和保证金,意味着融资以及衍生品仓位将被强平。美联储及时为流动性背书,主经纪商提供融资的能力和意愿提升。为缓解市场恐慌情绪和应对流动性问题,美联储先后采取了大幅降息、回购、QE等货币政策工具释放流动性。针对广泛的金融机构发挥“最后贷款人”的作用,对一级交易商提供一级交易商信贷便利(PDCF)、定期证券借贷工具(TSLF)。由于对冲基金主要融资渠道为主经纪商,美联储的流动性背书,使得一级交易商向证券市场参与者提供融资的能力与意愿,且提高了国债及其他担保债券市场的流动性。虽然本次联储操作并未包含直接购买股票,但若信用风险能够随之缓解,股票市场也将间接受益,即使股票市场再次大幅下跌,整体质押物的稳定性仍要好于此前,补充质押物及保证金的压力较此前减小。5本轮对冲基金的风险评估二:加大资本市场波动1、衍生品的杠杆提升:资本市场相关价格的波动加大总杠杆提升源于衍生品的杠杆提升。总体上,对冲基金财务杠杆水平有所下降,总杠杆有所提升,主要原因为近年来更多使用衍生品加杠杆,而相对减少了融资杠杆。根据SEC披露,截至2019Q2财务杠杆的均值和中位数分别为1.7、1.2,(2013Q1为1.9、1.4),略有下降;2019Q2总杠杆(不含利率衍生品)的均值和中位数分别为3.8、1.8(2015年初为3.0、1.9),均值有所提升。衍生品的杠杆提升会导致资本市场相关价格的波动加大。交易策略趋同会放大市场波动。风险平价策略以及各类波动率目标策略会是趋同交易,如前文所述,对资本市场的传导包括了负反馈循环、趋同策略的放大效应、以及影响市场整体流动性。2、各类交易策略:快速下跌之后,下跌动能是在减弱的高位下跌初期,压力是最大。风险平价策略以及各类波动率目标策略的趋同交易,在市场急跌、波动率跳升时,大规模降杠杆,放大市场波动。波动率目标策略,易形成负反馈。许多对冲基金策略锚定波动率,包括风险平价基金、风险溢价获益基金、以及波动率目标基金和可变年金,总体策略都是维持资产组合的整体风险目标,通过杠杆平衡资产类别的风险敞口,从而获取更高的风险调整后收益;而当波动率提升时,将出售资产,以降低杠杆控制整体风险敞口。当波动率跳升时,大量趋同的被动投资策略,将会给市场带来冲击,影响流动性,形成负反馈。大幅下降后,未来下跌的动能是会减弱的。若市场继续向下波动,较低的杠杆意味着对市场的压力较之前减弱,负反馈效应衰减。随着产品杠杆下降,下跌的动量会减弱,负反馈逐步衰减。反过来,当市场信心恢复,资产波动率下降,产品的趋同交易,也会助推市场的反弹,3、以风险平价策略为例,看对资本市场的传导机制这一轮,市场关注的“桥水”等风险平价策略的潜在风险,以下着重讨论包括风险平价策略以及各类波动率目标策略,分析对资本市场的传导机制。桥水“全天候”策略及风险平价基金。达里奥(Dalio)和他的桥水基金(Bridgewater)团队,于1996年推出了全天候策略(Allweather),采用的风险平价策略,因其优异的管理净值表现,于2008年金融危机之后,被机构投资者广泛认知,桥水基金逐步成为全球最大的对冲基金。截至2018年底,桥水基金资产管理规模达1247亿美元,主要服务的客户包括养老基金、捐赠基金、外国政府、央行等。不仅是桥水,世界知名对冲基金,很多旗下均有风险平价基金,如AQR(AQRCapitalManagement)旗下的AQR全球风险平价UCITS基金。初衷:全天候基金是风险平价策略的代表,达里奥的初衷是创建一个能适应各类经济环境的投资组合,确保后代不用完全依赖于受托人的资产管理能力。原理:通过给低波动性资产加杠杆,来平衡投资组合的风险贡献,使投资组合达到更高的风险调整后收益,即更高的夏普比率。例如传统的投资组合,比如债和股60/40比例的投资组合,由于股票的风险要高得多,因此组合风险绝大部分是由股票贡献的。而如果通过给债券加杠杆,使其风险与股票相同,由于股票和债券之间的低相关性,组合的收益会比具有同样风险的组合更高(如图2)。当然,风险平价策略的逻辑与特点,背后是基于后现代资产投资理论(PMPT):1)属于beta策略。不强调获取超额alpha回报,而是通过风险配置和调整,获取稳健的beta回报。2)逻辑前提。资产有状态偏向,市场具有一定的不可知性,长期来看资产间的夏普比率或多或少相近。3)编制风险预算,给予不同的状态/风险因子相等的权重。而非给每种资产相等的风险权重。风险平价基金的净值表现与回撤。根据Vineer(2018),风险平价基金2018年的杠杆约为2.8倍。在本次市场波动中,在“石油”、“疫情”双重冲击之下,全球各类资产的波动率大幅跳升,风险平价基金根据模型对波动率目标的设定,需要大幅削减杠杆,以达到风险配置的再平衡,而市场上风险平价基金由于背后类似的逻辑和参数设定,同时的减仓去杠杆,无疑加剧了市场的波动。另外,基金投资者在净值波动中可能的赎回,则更会收紧市场流动性,放大波动。但仍好于标普500指数表现。例如AQRUCITS基金,是对冲基金公司AQR(AQRCapitalManagement)旗下的风险平价策略基金,成立于2013年12月9日,截至2020年3月20日资产规模为12.4亿美元。在波动性飙升期间,这些策略预先根据波动率设定的程序化交易阈值,将导致重大的资产出售,以削减杠杆。尤其美国回购利率飙升,流动性危机又加剧了抛售资产去杠杆的过程,在此次美国市场下跌中出现了较大净值回撤,但仍好于标普500指数表现。做空波动率ETP。随着2008年金融危机之后,美国市场波动率逐渐维持在较低水平,市场上出现较多做空波动率的产品,包括做空波动率ETP等,通过加杠杆(如衍生品)做空波动率而获益,由于波动率长期向下,这类策略规模逐渐做大。而当波动率跳升时,管理人为避免净值大幅下降,需买入波动率来对冲敞口,比如买入波动率看涨期货,如此又会推高波动率。叠加做空波动率ETP,以及波动率锚定对冲基金策略,可能出现如下负反馈过程,放大市场波动,即:市场下跌——波动率上升——做空波动率的ETP买入波动率进行对冲——波动率继续上升——波动率锚定策略继续抛售资产——市场继续下跌。传导过程中,再加上ETF赎回、CTA等追逐趋势,市场波动会放大。负反馈动量的减弱与反转。随着产品杠杆下降,下跌的动量会减弱,负反馈逐步衰减。反过来,当市场信心恢复,资产波动率下降,产品的趋同交易,也会助推市场的反弹,例如当波动率下降到一定水平,锚定波动率的对冲基金,重新开始加杠杆,CTA等趋势投资者反手做多等,体现为脉冲式波动。仍需警惕尾部风险尽管总体看,对冲基金杠杆较稳定,流动性风险也随着美联储及时背书而下降,监管加强、透明度提升,再次出现LTCM的可能性降低。尾部风险发生时,需重新评估。模型的执行都有一定的前提或假设,比如市场的有效性、连续性、流动性等,在小概率事件冲击下,模型有失效的可能,即模型风险。操作风险和内控风险,以LTCM为例,交易员超权限操作,以及危机后期风控的失效,都是造成LTCM成为破产个例的因素。因此,模型风险、操作风险、内控风险,以及对冲基金高业绩提成比例的特点所形成潜在的“道德风险”,均具有个性化与不可测性。若发生较大型对冲基金破产危机,需重新评估对金融系统的传染风险。6结论:本轮风险传导机制与08年的差异08年危机是以金融系统为“圆心”向外传导。2008年金融危机的策源地是次级贷款,脆弱性来源是金融机构高杆杆,传导和扩散载体是过度包装与衍生的CDO、CDS等资产证券化产品,再加上评级机构的“道德风险”以及监管缺位,所形成的以两房、贝尔斯登、雷曼相继倒下为引爆点的“暴风骤雨”式的危机。本轮市场,金融体系自身风险更小。美国大型金融机构信用风险和流动性风险要明显小于08年,抵御风险能力分析同时大幅度增加,出现“雷曼”概率低;以对冲基金为代表的资管机构,当前杆较稳定,流动性风险也随着美联储及时背书而下降,随着监管加强、透明度提升,大型对冲基金再次出现LTCM的可能性降低,对金融系统的传染风险不高。本轮的传导演绎,通过市场下跌影响“财富效应”,传导至实体经济,最终影响金融机构风险。08金融危机之后,居民金融资产中股票和基金占比提升(2008年38.19%提升至2018年45.10%),市场下跌后投资者承担较大损失。本轮风险传导是,市场的下跌通过资管产品渗透到投资者,投资者承担较大损失,通过影响“财富效应”传导至实体经济,最终影响金融机构的风险。从这一角度,当前金融体系的可靠性要好于08年,本轮更大的风险是来自于金融体系背后的经济的风险。风险提示市场信心持续受挫。将导致市场下跌,缺乏流动性,信用传导不畅等不利情况。海外经济下滑超预期。“疫情”冲击海外企业现金流与流通,经济超预期下滑会最终影响市场。尾部风险发生。对冲基金仍可能面临模型风险、操作风险、内控风险等,特点是个性化强,未知性、难以预测性。
远川导读▼本篇报告发表于2012年2月份,是全球最大对冲基金BridgeWater的部分研究成果展示。众所周知,宏观经济周期是BridgeWater的研究强项,水平超越全世界几乎所有的专业金融机构,甚至包括所有国家的中央银行。一个经济体的“加杠杆”和“去杠杆”过程,是桥水宏观研究框架的重要组成部分。目前中国正处于后一个过程之中,更为重要的是,当前主导中国“去杠杆”过程的宏观决策者,对桥水的研究成果的重视程度,恐怕要比你想象地大得多得多。因此,本文值得所有专业交易者精读10遍以上。这篇报告的主要目的是展示过去多个国家的去杆杠过程,并且借此深入探讨去杆杠是如何进行的。去杆杠过程会降低负债/收入比,当债务水平过高时,去杆杠就会成为必然。去杆杠有非常成功的,也有惨淡收场的。有些国家去杠杆的结局非常惨(造成巨大的经济损失,社会剧变,甚至引发战争,而且杠杆率也没降下来),有些则结局美好(通过有序的调整,经济恢复到健康的生产-消费平衡状态)。在这份研究报告中,我们将通过回顾过去多次去杆杠化过程,来阐述去杆杠的详细机制。您将会看到的是:好的去杠杆过程是均衡的,差的去杠杆过程是失衡的。去杠杆的结局之所以有好坏之分,主要取决于以下四个政策措施执行的力度大小和进度快慢。债务减记紧缩政策财富转移债务货币化好的去杠杆能成功地平衡上述过程,而坏的去杠杆则无法平衡,而下文将具体展示这些(成功/失败的去杠杆)案例是如何形成的。在阐述两者差别之前,我们先来回顾一下典型的去杠杆过程。典型的去杠杆过程通常来说,去杠杆过程之所以经常被决策者搞砸,是因为“去杠杆”对于绝大多数人来说一辈子只会发生一次,所以政策制定者没有研究过它们。导致的结果就是,他们像盲人烧饭一样来制定政策,过程中夹杂着大量痛苦的尝试和纠错。这些痛苦和教训让政策制定者慢慢摆脱差劲的举措,驶向正确的方向。虽然最终都会完成去杠杆整个过程,但问题在于:整个过程中你能承受多大的痛苦?因为历史是有很多去杠杆案例可供参考,而且经济机器是一个相对简单的事物,所以如果政策制定者明白去杠杆是如何运作的,很多痛苦其实可以避免。这就是这篇报告研究的目的。如前所述,去杠杆化之所以有好坏之分,主要取决于前面讲的四个措施执行的力度和进度。这四条措施每个都能降低负债/收入比,但它们对通货膨胀和经济增长的影响各有不同。例如:债务减记(即违约和重组)和紧缩政策具备通缩和抑制属性,而债务货币化则具备通胀和刺激属性。好的去杠杆能够巧妙地平衡他们,坏的去杠杆则正好相反。换句话说,关键在于上述措施混合在一起的比例。通常来说,债务危机的演进过程会经历如下步骤:第一阶段首先,债务问题和债务增长率持续下降会导致经济收缩,在这个收缩过程中,负债/收入比上升,经济活力下降,金融资产价格下跌。我们称这个阶段是“糟糕的通缩去杠杆化”。这个阶段的特征是,只存在债务减记(违约和重组)和支出紧缩,没有实施债务货币化。在这期间,私人部门信用增速下滑和流动性紧缩会导致对商品、服务和金融资产的需求下降。当没有足够的钱来还债时,金融泡沫破灭。债务违约和重组将重创市场,尤其是使用杠杆的放贷方(通常是银行)会像雪崩一样引发恐慌。 这些恐慌将恶性自我加强,导致流动性危机。结果,还没等到违约问题失控,政策制定者自己就已经手足无措捉襟见肘了。这种债务减记(债务违约和重组)的方法必须受到严格控制,否则将会导致自我加强的下降螺旋,如果任由这种螺旋发展,市场信心遭受重创并在很多年内都无法恢复。违约和重组的规模不能太大,而且进展也不能太快的原因是:一个人的负债是另一个人的资产,资产价值剧烈下跌引发的财富效应,将会对商品、服务和资产的需求产生灾难性的影响。为了将债务减少到(债务人)可承受的范围内,必须对债务的账面价值进行减值,使得债务人有能力偿还(比如减值30%),账面价值减值将会导致债权人的资产价值总量减少(30%)。30%听起来很大,但由于很多经济实体都加了杠杆,所以它们的净资产受影响程度其实更大。例如,如果债权人杠杆率是2:1,30%的债务减记将会导致债权人净资产将承受60%的下跌。然而银行杠杆率一般介于12倍到15倍之间,其遭受的损失很显然将是灾难性的,这种情况在去杠杆化的初期特别明显。去杠杆初期,违约造成的灾难性事情从一开始就很明显,所以政策制定者会在第一时间控制违约率,但他们通常找不到什么好办法。为了应对债务危机带来的冲击,政策制定者通常会采取紧缩政策,在他们眼里,这几乎是再明显不过的手段。因为债务人很难借到更多的钱,而且身上的债务已经很多了,所以债务人不得不削减支出,将其拉到收入的同一水平线。但问题在于,一个人的支出是另一个人的收入,支出减少等于收入减少,所以通过削减支出来大幅降低负债/收入比,将极其痛苦。(评:看看希腊)通常,政策制定者会在上述路径上徘徊几年,被折磨的痛苦不堪,最终意识到债务减记和紧缩政策引发的通缩和抑制效应实在是太痛苦了,得搞点儿其他的措施才行。这将带他们进入下一个阶段,在这个阶段,“印钞”将成为主角。我们并没有说债务减记和紧缩政策在去杠杆过程中一点儿作用都没有,因为它们其实有点儿用处,但作用不大,却带来痛苦的结果。如果债务减记和紧缩政策要起到应有的作用,必须跟“印钞/债务货币化”来混合使用。第二阶段在去杠杆的第二个阶段中,负债/收入比将会下降,与此同时,经济活力有所恢复,金融资产价格得到改善。这些得益于充足的“印钞/债务货币化”,把名义增长率提升到名义利率之上,同时用货币贬值抵消了通货紧缩。这便开启了“好的去杠杆化”。抵消通缩萧条最好的方法是中央银行提供充足的流动性和信用支持,并且让中央政府根据不同的关键经济实体的资本需要,提供相应的资金支持。上述措施通常以如下的行为来体现:中央银行放宽贷款所需抵押品的范围(更低的资产质量和更长的抵押期限),同时买入(货币化)更低质量和更长久期的债务。若实施力度达到如下标准,便能在经济积极增长的同时去杠杆:阻止通货紧缩阶段的信用市场崩溃把名义增长率提高到略高于名义利率的水平在再通胀阶段,货币通常比较疲软,尤其相对黄金而言。但由于此时再通胀可以冲销通货紧缩,所以并不会产生难以接受的高通胀率。历史证明,比起行动迟缓的案例(如1930-33年的美国),又快又好地执行上述措施(如2008-09年的美国)就能取得更好的结果。不过,因为刺激措施实在是太好用了,以至于跟政府的其他选项相比,他们很可能被滥用,进而导致“糟糕的通胀去杠杆”。第三阶段当 “印钞/债务货币化”被过度采用,而其他三个措施被用的较少时,货币贬值(再通胀)过于严重,“糟糕的通胀去杠杆”便会出现。存在两种可能性:如果这个国家没有储备货币,同时有大量以外币计价的债务,而且通胀率是以快速贬值的本国货币来衡量,那么“糟糕的通胀去杠杆”很快就会浮现;如果这个国家拥有储备货币,经过长时间一系列的刺激政策后,“糟糕的通胀去杠杆”才会缓慢较晚出现。顺便说一下,在去杠杆过程中,会发生由富人向穷人的财富转移,方式多种多样(如对有钱人征税,金融援助如“富有的”欧洲国家向负债过重的国家提供支持,等等),这样的财富转移过程通常意义不大(除非发生革命)。下面我们来展示过去发生过的去杠杆案例,来更清晰的观察上述阶段如何发生。过去的去杠杆案例历史上有众多去杠杆案例,我们选择了其中的6个:1930年代的美国1950-60年代的英国过去二十年的日本2008年-至今的美国当今的西班牙1920年代的魏玛共和国之所以挑出以上6个案例,是因为它们都非常重要,并且在一些很有趣的角度上存在差异。你将会看到,这6个案例实施四个措施的力度和节奏各有不同,所以它们结局相差迥异,但背后推动它们的“经济机器”却基本相同。我们先来研究前五个案例,然后再来集中分析魏玛共和国案例中的通胀去杠杆。我们将不同情况的去杠杆化过程分成以下三个类别:“糟糕的通缩去杠杆”:此类去杠杆,通常发生在足够的“印钞”之前,此时货币供应不足,通货紧缩,且名义利率高于名义增长率;“好的去杠杆”:在此类去杠杆中,有足够的“印钞”来平衡因债务减少及紧缩形成的通缩压力。这时经济通常正向增长,负债/收入比下降,名义GDP增长率超过名义利率;“糟糕的通胀去杠杆”:在此类去杠杆中,相对通缩的程度而言,货币发行过多,引起恶性通胀,导致名义增长率和名义利率处于自我加强的上升螺旋。下面是三类去杠杆的具体案例:“糟糕的通缩去杠杆”(即经济衰退且负债/收入比升高)下表的所有案例中,都有如下特征:印钞受限;名义增长率小于名义利率;货币整体强势;由于利息支付成本和名义收入下降/停滞,负债/收入比上升。下面的一张图表,拆解了负债/GDP比率的变化归因。更具体地说,黑点具体代表负债/GDP年化变动率。每个条柱被分解成这种变化的两类因素:GDP(即收入)变化和债务票面价值变化。其中,收入变化的原因如下:实际收入变化;通货膨胀。实际GDP下降对负债/GDP比产生正效应,通胀率上升则产生负效应。债务票面价值变化原因如下:债务违约;因支付利息而新增的债务,其他借款的增减。所以,债务违约对负债/GDP比产生负效应,支付利息(而新增的债务)产生正效应,而其他新债务可能产生正或负效应(取决于是新增还是偿还了债务)。“好的去杠杆”(即经济均衡增长的同时负债/收入比在下降)下表中的所有案例,都进行了大规模的印钞,货币严重贬值,这都使得名义增长率超过名义利率,并且降低了负债/收入比率。在再膨胀期间,名义收入的恢复降低了债务/收入比。可以理解的是,萧条越久,反弹越大(如1930-32年的美国)。下面的一张图表,拆解了负债/GDP比率的变化归因。黑点具体代表负债/GDP年化变动率,每个条柱被分解成造成这种变化的各项因素。注释:美国的GDP名义增长率已经超过名义政府债券收益率,但仍略低于经济中的实际支付总利率(假定私人部门债务的信用利差和当前债券收益率下跌对经济中的实际支付利率有滞后影响)。所以,因利息支付而引起负债/GDP比上升的幅度(浅蓝色区域)略大于名义收入(实际收入+通货膨胀)造成的负债/GDP比下降的幅度,但从趋势上看,社会融资利率(economy-wide interest)会降到名义增长率之下。“糟糕的通胀去杠杆”(即经济衰退的同时债务被恶性通胀抹去)对于此类去杠杆,可以先通过下表来了解个大概。这张表格中摘绿了魏玛共和国(注释:1918年至1933年期间采用共和宪政政体的德国)的通胀关键数据 ,稍后会对该表进行详细阐述。这个过程跟其他恶性通胀去杠杆的过程类似(如1980年代的拉丁美洲)。注释:战败德国的赔款从1921年初的2690亿金马克,降到了同年春天的1320亿金马克。1922年夏,德国停止支付赔款,债务进行过多次重组,1929年减少为1120亿元,到1932年已基本被消除。恶性通胀和债务违约对债务减记所起的作用,如下表所示:每个案例的详细研究案例1:1930-1937年美国的萧条与复苏前面讲了,1930年代美国的“宏大的去杠杆”分成两个阶段:1930-1932年通缩下的萧条,和1933-1937年再通胀去杠杆。下面有两张图,分别是为:上图:债务/GDP率和名义GDP增速的关系;下图:债务/GDP率和股票总收益的关系。债务/GDP率用右侧坐标轴表示。黑色的竖线表示此时有大规模的印钞防水。第一个阶段标记为(1),第二个阶段标记为(2)。在第一个阶段(糟糕的通缩去杠杆),收入和信用崩溃,GDP名义增长率明显低于名义利率,经济萎缩,同时负债/收入比上升。如图所示,这一阶段发生在1929年夏股票市场泡沫破裂后。由于私人部门去杠杆,收入崩溃,到1932年底,收入下跌了接近30%。由于收入大跌,负债/GDP率从150%左右上升至GDP的250%(如上图所示),这期间股票下跌超过80%(如下图所示)。1933年3月政府开始印钞放水,标志着第一阶段的结束转,去杠杆进入第二阶段。罗斯福政府取消美元挂钩黄金的政策后,美元一年就贬值了40%,从21美元/盎司黄金上升至35美元/盎司黄金。同时再通胀也刺激了经济活动,使得名义增长率超过名义利率。到1937年,美联储开始采取紧缩政策,再通胀结束,经济进入“再衰退”阶段(这个用词便是那会儿发明的)。1933年3月开始,美联储通过把美元对黄金贬值,并维持多年低利率,来施行宽松政策。大多数资产负债表扩张主要是为了购买黄金以维持美元价值弱势地位。美联储通过降低利率和印钞,创造了天量的货币,但并没有直接购买大量的风险资产,这点不同于现在(指的是2008后的去杠杆策略),关于这点我们将会在下文中做更多讨论。下面这张表,可以把整个故事讲的更加透彻。在“糟糕的通缩去杠杆”时期,在收入崩溃的同时,名义GDP每年的下降幅度高达17%,其中原因一半来自通货紧缩,一半来自实际需求的崩溃。结果名义增长率比名义利率低20.4%,负债/GDP比年增长率为32%。下表拆解了影响负债/收入比率变化的各种因素。相较GDP而言,1937年的总负债水平和1930年相同。在此期间,通缩和负实际增长引起收入收缩,于是债务水平急速上升。当收入上升到1930年的名义水平时,债务负担才开始下降。由于债务得到偿付,为支付利息而产生的新借款已基本被抵消补偿。连同债务偿还一起,收入由下降转而上升也是私人部门债务负担下降的主要驱动力,债务违约是作用较小的驱动力。在大萧条初期,政府债务水平较小。最开始时,由于收入的暴跌,债务负担上升。1933年后,因为财政赤字变大,政府名义债务水平上升,而收入的恢复对债务负担增加起了相当大的缓冲作用。如下图所示,经济复苏的重要催化剂有两个:印钞和美元相对黄金贬值。在那个时点上,价格水平从每年下降8%,变为每年上升2%左右。这个例子极好地证明了:印钞能减缓通缩,而不是引发高通胀。如下图所示,政府宣布进行货币贬值后,经济开始恢复活力。在1933年时点,央行适度增加印钞量,信用不再恶化,之后信用创造便稳定在一个很低的水平。在1933至1937年期间,由于采取了不同的政策,名义GDP增长率明显高于政府债券利率,极大地减轻了债务负担。名义GDP的高增长,包含了强劲的实际增长,和适当的通胀。(本案例完)案例2:1947-1969年英国的去杠杆跟案例1一样,上图:债务/GDP率和名义GDP增速的关系;下图:债务/GDP率和股票总收益的关系。债务/GDP率用右侧坐标轴表示。黑色的竖线表示此时有大规模的印钞防水。第一个阶段标记为(1),第二个阶段标记为(2)。英国在二战前及二战期间产生大量的债务。二战结束后,英国经济陷入衰退,债务负担进一步加重。如图所示,从1943年底至1947年底,债务占GDP比从250%上升至400%。当1948年收入恢复时,债务负担略有减轻。1949年9月英国加大印钞量并且将英镑贬值约30%,同时将短期利率基本维持在零的水平。因此在1948年到1969年间,名义增长率超过名义利率,债务水平下降约250%,股市复苏。在这个阶段,英国将利率保持在低位,低成本资金充沛,英国央行在1949年进行了大幅的货币贬值。英格兰银行在1950年增加了约占1%GDP的资产购买量,两者帮助名义增长率维持在名义利率之上,而这正是降低负债/收入比的最主要原因。下表显示英国杠杆中最重要的两个部分。因为有所差异,我们将整个过程分为两个阶段: 1947年-1959年和1960年-1969年。由于多项措施并举,名义GDP增长率极大地超过借款的增长率, 战后总债务得到了削减。由于GDP稳步增长,通货膨胀率在1947-1970间为4%左右,使得负债/GDP比下降近2/3。为支付利息所产生的新借款因债务被偿付所对冲,所以新借款的净增加量很小。如下图所示。在政府部门和私人部门也是如此。这段期间政府新借款净增加量相对较小,尤其是在1947-1960年间。下图显示导致负债比变化的影响因素。(本案例完)案例3:1990年至今的日本去杠杆截止到目前为止,日本已陷入到“糟糕的通缩去杠杆”超过20年。1989年私人部门债务泡沫破灭,政府部门债务/财政开始扩张,但政府从来没有采取足够的“印钞/货币化”政策来使名义增长率超过名义利率,也没有将货币贬值。当日本货币政策略有宽松时,名义收入增长率停滞,长期的通货紧缩使得原本稳健的实际增长率不断下跌。与此同时,名义债务增长迅速,推动债务水平上升,从1989年底占GDP比为400%左右,上升至目前的500%,股市下跌70%左右。在整个去杠杆化的过程中,日本央行仅以久期调整的名义,进行了少量“印钞/货币化”,而且其中大部分都流向了在能快速变现的短期资产。其结果导致,再通胀无法实现,政府却增加了数额恐怖的债务。如下表所示,从1990年至今,印钞占年GDP比重被控制在0.7%,日元兑美元汇率年均升值2.9%。结果,从1990年起,经济遭遇持续通缩(年均-0.5%),GDP实际增速为1.1%。这导致名义增长率维持在低于名义利率2个百分点的水平,遂使负债/收入比大幅上升。虽然私人部门债务保持在适度水平,日本总体债务水平却因政府借款和通紧,从403%上升至498%。为了能够更清晰的阐述日本案例发展过程,下图拆解了影响负债/收入比率变化的各种累积因素。从经济总体上看,新增借款仅能覆盖持续债务的还本付息,仅此而已。虽然债务违约和经济真实增长会减少债务负担,但持续的通货紧缩却加重了它们。私人部门的债务水平呈现温和的下降趋势,这得归功于债务违约、经济真实增长和债务偿还。利息支付量巨大,通货紧缩加重债务负担。政府债务增长明显,大多数用来弥补居民部门的疲软债务需求。平缓的实际GDP增长率和通货紧缩导致名义GDP增长乏力。在1990年至今的大部分时间里,名义GDP增速始终低于日本政府利率,对债务负担产生了持续的上升压力。(本案例完)案例4:2008年至今的美国去杠杆和美国1930年代的去杠杆一样,本次去杠杆的前奏是债务驱动的经济繁荣。此次去杠杆化主要包括两个阶段:先是收入收缩,紧接着是再通胀和经济增长。跟上次不同的是,由于美联储及时采取相应对策,包括迅速对债务进行担保以及大量印钞,经济萎缩期仅仅持续了六个月就结束(而1930年超过了3年)。随后,提升名义增速、债务违约和还债等一揽子措施混合实施,美国经济进入再通胀和债务削减阶段。如下图所示,跟美国1930年代案例和日本1990年案例截然不同的是,美国经济迅速进入复苏状态,“糟糕的通缩去杠杆”被终结(始于雷曼倒闭的2008年9月,止于美联储用量化宽松来货币化债务的2009年3月)。在这一“糟糕的通缩去杠杆”的阶段中,收入水平下降,债务水平占GDP比重从340%升高到370%,股市缩水了近一半。由于全世界众多债务都以美元计价,全球信贷紧缩和美元流动性变差造成美元挤兑,相对于一篮子货币加权,美元升值了14.8%,出口需求比国内需求更快崩溃。2009年3月再通胀之后,收入水平恢复,债务水平下降到初始水平之下,占GDP比重为335%左右,股市几乎全部收复失地。与此同时,信贷市场很大程度上得到恢复,私人部门信贷增长率也有所提升。到目前为止,这次去杠杆是历史上最成功的一次。未来的关键是政策制定者要维持平衡,以确保债务/收入比有序下降。美联储实施的宽松政策力度确实很大。美联储不仅在流动性危机中降低了利率,支持基本的信贷,而且还采用了一项最激进的量化宽松政策,即将资金注入风险资产。2009年3月,美联储宣布开始第一轮量化宽松政策,通过购买国债和政府担保债券将资金注入风险资产。2010年8月,第二轮量化宽松开始,美联储增持长期政府债券(主要是国债),并于2011年秋天开始实施扭曲操作(注:卖出较短期限国债,买入较长期限的国债,从而压低长期利率)。在这三个阶段,如果将持有的资产久期全部调整到10年期,可以计算出资产持有量占GDP比顶峰时为8%,随后降到5%,最后在2%左右。如下表所示,在经济紧缩期间,实体经济在2008年9月至2009年2月之间的衰退,导致名义GDP以年化5.4%的速度下滑。收入水平的下降意味着更高的债务/GDP比,尤其在信贷系统崩溃后更为严重。在2009年3月,美联储采取积极的量化宽松政策,通过购买国债,将大量货币注入经济系统(超过1.5万亿)。大量的资本注入以及随后的再通胀刺激了经济复苏,随后经济以3.5%的年增长率反弹。名义GDP增长率也略高于名义政府利率。尽管政府部门借贷有所上升,但由于私人部门进行了去杠杆化,债务/GDP比年化下降率达13%。名义GDP增长使得债务/收入比年下降12%,债务违约使其下降6%,债务偿还使其下降15%,而利息支付导致债务/收入比上升20%。如图所示,债务水平在经济紧缩时期有所上升,在经再通胀时期有所下降,现在比危机刚爆发时略低。由于债务水平如此之高,利息支付成为巨大的负担,但是两者随着债务偿还、缓慢通胀以及债务违约而有所缓和,其中债务偿还作用最大。私人部门债务/GDP比减少了约37%。虽然债务违约和通货膨胀也有一定作用,但债务偿付才是最大的影响因素,其发挥的作用远不止减轻利息负担。除了利息支付以外,私人部门产不多一半的债务偿还被政府部门的新增债务所抵销。(本案例完)案例5:2008年至今的西班牙去杠杆如下图所示,西班牙正在经历去杠杆化的第一个阶段,而且是“糟糕的通缩去杠杆”阶段,因为它无法“印钞或债务货币化”,目前仍未取得任何进展,其未来的前途取决于欧洲央行。如图所示,西班牙的收入水平从2008年9月也开始下降,从那个时间点算起,西班牙债务/GDP水平从365%左右增长到近400%,随后债务水平开始稳定,但是仍然比去杠杆化刚开始时要高。股市最开始时下跌了45%,现在仍然比2008年9月还低25%。虽然西班牙不能直接印钞,但欧洲中央银行拿出了相当数量的货币购买西班牙的债券,而且向西班牙的银行提供流动性以防止更严重的通货紧缩。欧洲央行在2010年夏天和2011年秋天两个时间段都采取过这项支持政策。在这两个期间,欧洲中央银行投入到西班牙风险资产的货币最多时超过西班牙GDP的10%(调整至10年久期)。这些注资主要用于主权债务和担保债券的采购,再加上短期贷款,例如近期的LTRO(长期再融资计划)。这次印钞,欧洲中央银行并能够使西班牙主权息差和利率下降的足够多,来实现名义增长率高于名义利率的目的。可以理解的是,由于能实施的政策有限,西班牙政府的政策反应速度要比美国要慢得多,最关键的是:西班牙无法印钞。很显然,西班牙已经看到其信贷息差上升,而且上升的债务偿付成本已将债务/收入比抬高。不同于其他案例,由于西班牙无法印钞,西班牙的政府债券存在严重的信用风险。在西班牙去杠杆过程中,名义增长已经为负值,因为通货膨胀率已经达到0.6%且实际增长为-1.1%。导致的结果就是,名义增长率比政府债券利息率低5.5%。欧元兑黄金的汇率已经贬值20%,但由于所有主要货币兑黄金都贬值,欧元兑美元汇率的贬值程度要小的多。如下图所示,西班牙的债务水平有所上升,原因是高企且增长的利息负担、偿债产生的新债务、以及实际负增长的经济。增多的利息支付是最大的部分,因为西班牙信贷息差的增加使得债券偿付成本增加。通货膨胀和债务违约在一定程度上减轻了债务的负担。虽然私人部门一直在偿还债务,私人部门的债务仍高于2008年06月份水平(尽管最近有所下降),这是由于利率支付产生了新的借贷以及实际负增长的经济。在此期间,政府提升了杠杆率。政府债务在经济危机刚开始时相对较低,到目前为止仍然只占总债务的一小部分。在目前时间点上,尽管欧洲中央银行提供了帮助,西班牙的前景仍然黯淡。以目前他们的货币政策,名义GDP增速依然疲软,而且太多的调整过程需要依赖紧缩政策和债务削减。(本案例完)案例6:1918-1923年的魏玛共和国在魏玛德国的案例中,恶性通胀和债务违约大大减轻了高企的债务负担。1918年,战争给德国政府留下了160%的债务/GDP比率,主要是因筹集战争经费而产生的大量借款。在盟国给德国强加赔款并要求用黄金支付后,政府的总债务甚至飙升到GDP的913%。1918年-1919年是经济紧缩期,实际收入在这两年中分别下降了5%和10%。在1919年12月到1920年2月间,即经济紧缩末期,德国将马克纸币兑美元和兑黄金都贬值50%,收入和资产价格都有所恢复。随着货币贬值,通胀开始起飞。在1920年到1922年间,通货膨胀削减了以当地货币计价的政府债务,但由于赔偿债务以黄金计价,所以然并卵。但在1922年夏,德国停止支付赔偿,实际上就是债务违约。经过一系列的协商直到1932年,赔偿债务被重组,最后被有效地抹掉了。货币的贬值让很多债权人倾向于短期贷款和将钱转移出德国货币,这使得德国央行购买更多债务以便填补空缺。这导致了恶性通货膨胀螺旋,并在1923年达到顶峰,地方政府债务占GDP比例变成了0.09%的水平。在1919-1920年货币贬值后,德国央行增加了印钞量,而且在1922年和1923年加速印。到1923年恶性通货膨胀末期,德国国家银行在1919年到1923年间的货币供给增加了1.2 trillion percent。魏玛共和国的案例是最极端的通胀去杠杆过程。在战争末期,德国政府只有两个选择:要么面临现金短缺的经济紧缩,要么就是增加印钞刺激收入增长。政府选择印钞和贬值来刺激经济,在1919年末将货币贬值50%,使经济走出衰退。但最终,对货币信心的丧失和大量的印钞导致了恶性通货膨胀的产生,货币变成了废纸。如下图所示,货币兑黄金几乎跌了100%,而且印钞还是指数增长的。债务/GDP比从913%降至0。剔除赔款的政府债务占GDP在1919年为133%,这一数字被通胀清零。以黄金计价的战争赔款占GDP比例为780%,并在1922年夏停止支付,实际上就是债务违约。我们在下表中进行了总结梳理,详见下表。下面的图表显示了政府总债务和它的两个组成部分:以黄金计价的战争赔款和其他政府债务:如上所述,战争赔款之外的政府债务在通货膨胀中会迅速被削减。由于赔款部分直到1921年才强加给德国政府,这个赔款在战后仅有效存在了很短的时间,而且关于赔款的数额很久都没达成一致(在1921年初才确定了赔款数额,然后在当年春天就下降了将近50%,但仍然是个庞大的总数)。因为赔偿部分是以黄金计算的,它一直没变直到1922年德国停止支付。在接下来的十年间内,战争赔款被重组了几次,最后被彻底抹去。(本案例完)今日互动话题:你接触过自闭症患者吗?编辑丨Liz翻译丨戴老板资料丨远川研究校对丨其奇、LUSEN来源丨投资研选(ID:touziyanxuan)主题推荐阅读11岁女孩向瑞·达利欧提问:如何才能学会原则性的思考?(点击图片看完整内容)徐新对话瑞·达利欧:如何留住那些能力强悍的独行侠?(点击图片看完整内容)一键了解「火星会员」
新课程改革要求,在突出科学探究内容的同时,要重视研究方法的指导。通过举例、专业的物理表述能达到事半功倍的效果。人类在探索自然规律的过程中,总结出了许多科学研究方法,如:“控制变量法”“等效替代法”“类比法”“理想模型法”等。一、控制变量法所谓控制变量法就是指一个物理量受到多个物理因素的影响和制约。那么在讨论这个物理量与其中某个因素的关系时,只让这个因素发生变化,需要先控制其他几个因素不变,确定相关物理量之间的关系,这种方法叫控制变量法。比如在“探究影响电磁铁的磁性强弱与哪些因素有关”的实验活动中。学生猜想:①可能跟电流大小有关;②可能跟线圈匝数多少有关。要验证猜想①跟电流大小有关,只改变通过电磁铁线圈中电流的大小,要控制线圈的匝数不变;要验证猜想②可能跟线圈匝数多少有关,就应该只改变电磁铁线圈的匝数,而要控制通过电磁铁线圈电流大小不变。最后我们利用电磁铁吸引大头针的数量来分析判断出它们之间的关系。初中物理设计的实验主要有:1.探究影响液体蒸发快慢的因素有哪些;2.探究滑动摩擦力的大小与哪些因素有关;3.探究压力的作用效果与哪些因素有关;4.探究液体内部的压强与哪些因素有关;5.探究液体浮力的大小与哪些因素有关;6.探究滑轮组的机械效率与哪些因素有关;7.探究动能、重力势能大小与哪些因素有关;8.探究物体温度升高(或降低)时,吸收(或放出)的热量与哪些因素有关;9.探究研究通过导体的电流与导体两端的电压以及导体电阻的关系;10.探究探究影响导体电阻大小的因素;11.探究研究电流做功的多少跟哪些因素有关;12.探究电流的热效应与哪些因素有关。二、转换法在物理学中对一些不易观察的物理现象或不易直接测量的物理量,通常用一些较直观、易观察的现象去认识,或用易测量的物理量间接测量,这种研究问题的方法叫转换法。在初中物理概念、规律学习和实验中经常应用这种方法。比如说电流看不见、摸不着,不易研究它的大小,但是我们可以通过电流通过导体产生的三大效应(热效应、磁效应、化学效应)来研究它的存在及大小;磁场看不见、摸不着,我们可以通过观察放入其中的小磁针的偏转情况来判断磁场的存在;空气看不见、摸不着,我们可以根据空气流动所产生的作用效果来认识它。三、类比法从两类不同事物之间找出某些相同或相似的量的思维方法,为了把要表述的物理事物说得清楚明白,往往用具体的、易理解的、人们所熟知的事物来类比那些抽象的、不易理解的、陌生的事物。比如在物理教材中用水流来类比电流;用水压来类比电压;用抽水机类比电源;用速度概念类比机械功率及电功率概念等。四、等效替代法等效替代法简称“等效法”,所谓“等效法”就是在特定的某种意义上,在保证效果相同的前提下,将陌生的、复杂的、难处理的问题转换成熟悉的、容易的、易处理的一种方法。初中物理教材中,在二力的合成中用合力等效代替分力;研究串、并联电路中电阻关系时引入等效电阻的概念;在电路分析中可以把不易分析的复杂电路简化成较为简单的等效电路。五、建立理想模型法为了研究的需要,把物理实体或物理过程经过科学抽象转化为一定的模型,这种转化忽略了一些次要因素,突出主要因素,它使物理教学简单化、形象直观化,易于学生理解。如:磁场是客观存在的一种特殊物质,而“磁感线”并不存在,为了描述磁场而引入的“磁感线”是假想的物理模型;光是客观存在的,为了研究光的传播路径和方向而引入“光线”,也是“假想模型法”;用图示的方法表示力;电路图是实物电路的模型;“管涌”是连通器模型;杠杆模型;轮轴模型;斜面模型等等。六、科学推理法有些物理实验结论或规律单凭物理实验是无法完成的,它需要大量可靠事实为基础,以真实的实验为原型,通过大胆、科学、合理的推理得出结论,深刻地解释物理规律的本质,是物理学研究的一种重要的思想方法。例如在进行牛顿第一定律的实验时,根据把物体放在越光滑的平面上就运动的越远的知识,我们可以推理出:如果平面绝对光滑且不受其他摩擦阻力,物体将永远做匀速直线运动;在做真空是否能传声的实验时,当我们发现装置中空气越少,传出的声音就越小时,我们可以推理出:真空是不能传声的。其实物理研究方法不仅仅是以上所谈,还有观察法、实验法、归纳法、累积法、微小放大法、比较法、比值法、图像法等等。在进行科学探究、学习物理知识的过程中,逐渐拓宽视野,初步感受科学研究方法带来的思维灵感火花,能够从中领略物理学科的奥妙,从而感受“另类思维”给他们带来“柳暗花明又一村”的效果。
专题 初中物理科学方法在初中学习阶段,学过的常用物理方法有控制变量法、理想模型法、转换法、等效替代法、类比法、比较法、实验推理法、比值定义法、归纳法、估测法、图像法、放大法、分类法、观察法、多因式乘积法、逆向思维法、思维导图法等。1.控制变量法:当某一物理量受到几个不同物理量的影响,为了确定各个不同物理量的影响,要控制某些量,使其固定不变,改变某一个量,看所研究的物理量与该物理量之间的关系。如:研究液体的压强与液体密度和深度的关系。2.理想模型法:在用物理规律研究问题时,常需要对它们进行必要的简化,忽略次要因素,以突出主要矛盾。用这种理想化的方法将实际中的事物进行简化,便可得到一系列的物理模型。如:电路图是实物电路的模型;力的示意图或力的图示是实际物体和作用力的模型。3.转换法:物理学中对于一些看不见、摸不着的现象或不易直接测量的物理量,通常用一些非常直观的现象去认识,或用易测量的物理量间接测量,这种研究问题的方法叫转换法。如:奥斯特实验可证明电流周围有磁场;扩散现象可证明分子做无规则运动。4.等效替代法:等效的方法是指面对一个较为复杂的问题,提出一个简单的方案或设想,而使它们的效果完全相同,将问题化难为易,求得解决。例如:在曹冲称象中用石块等效替换大象,效果相同。5.类比法:根据两个(或两类)对象之间在某些方面的相同或相似而推出它们在其他方面也可能相同或相似的一种逻辑思维。如:用抽水机类比电源。6.比较法:通过观察,分析,找出研究对象的相同点和不同点,它是认识事物的一种基本方法。如:比较发电机和电动机工作原理的异同。7.实验推理法:是在观察实验的基础上,忽略次要因素,进行合理的推想,得出结论,达到认识事物本质的目的。如:研究物体运动状态与力的关系实验;研究声音的传播实验等。8.比值定义法:就是用两个基本的物理量的“比”来定义一个新的物理量的方法。其特点是被定义的物理量往往是反映物质的最本质的属性,它不随定义所用的物理量的大小取舍而改变。如:速度、密度、压强、功率、比热容、热值等概念公式采取的都是这样的方法。9.归纳法:从一般性较小的前提出发,推出一般性较大的结论的推理方法叫归纳法。如;验证杠杆的平衡条件,反复做了三次实验来验证F1 L1= F2 L210.估测法:根据题目给定的条件或数量关系,可以不精确计算,而经分析、推理或进行简单的心算就能找出答案的一种解题方法。它的最大优点是不需要精确计算,只要对数据进行粗略估计或模糊计算,就能使问题迎刃而解。(1)解答时应了解一些常用的物理数据:家庭照明电压值220V、每层楼高3m左右、一个鸡蛋的质量约50g、成人身高约1.60~1.80m、人体的密度约为1.0×103kg/m3、人的心跳约1秒70~80次、人体电阻约为几千~几百千欧、人正常步行的速度1.4m/s、自行车一般行驶速度约5m/s、一本物理课本的质量约230g、一张报纸平铺在桌面产生的压强约0.5Pa等。(2)记住一些重要的物理常数:光在真空中的传播速度、声音在空气中的传播速度、水的密度、水的比热容等。11.图像法:在物理学中,常采用数学中的函数图像,将物理量之间的关系表示出来。因此图像实际上反映了物理过程(如熔化图线等)和物理量的关系(如电阻的伏安特性曲线等)。运用图像知识来解物理试题的方法,叫“图像法”。运用此方法时应做到:(1)识别或认定图像横坐标和纵坐标所表示的物理量,弄清情景所描述的物理过程及其有关的因素和控制条件;(2) 分析图像的变化趋势或规律,弄清图像所表达的物理意义;(3)根据图像的变化情况确定两个物理量之间的关系,并给以正确描述或做出正确判断。12.放大法:把测量量按一定的规律放大后再进行测量的方法,称为放大法。在有些实验中,实验的现象我们是能看到的,但是不容易观察。我们就将产生的效果进行放大再进行研究。比如音叉的振动很不容易观察,所以我们利用小泡沫球将其现象放大。观察压力对玻璃瓶的作用效果时我们将玻璃瓶密闭,装水,插上一个小玻璃管,将玻璃瓶的形变引起的液面变化放大成小玻璃管液面的变化。在测量微小量的时候,我们常常将微小的量积累成一个比较大的量、比如在测量一张纸的厚度的时候,我们先测量100张纸的厚度在将结果除以100,这样使测量的结果更接近真实的值就是采取的累积放大法。要测量出一张邮票的质量、测量出心跳一下的时间,测量出导线的直径,均可用积累法来完成。13.分类法:分类法是指把大量的事物按照一定的“标准”,将其划分为不同的种类的方法。其一般步骤为:(l)确定分类依据;(2)选择分类方法;(3)正确进行分类. 如把固体分为晶体和非晶体两类、导体和绝缘体。机械运动分为直线运动和曲线运动等。14.观察法:物理是一门以观察、实验为基础的学科。人们的许多物理知识是通过观察和实验认真地总结和思索得来的。著名的马德堡半球实验,证明了大气压强的存在。在教学中,可以根据教材中的实验,如长度、时间、温度、质量、密度、力、电流、电压等物理量的测量实验中,要求学生认真细致的观察,进行规范的实验操作,得到准确的实验结果,养成良好的实验习惯,培养实验技能。大部分均利用的是观察法。15.多因式乘积法:用两个或者两个以上物理量的乘积定义一个新的物理量,这种方法叫做乘积法。例:电功、电热、热量等概念公式采取的都是这样的方法。16.逆向思维法:逆向思维是指与一般思维方向相反的思维方式,也称反向思维逆向思维也叫求异思维,它是对司空见惯的似乎已成定论的事物或观点反过来思考的一种思维方式。敢于“反其道而思之”,让思维向对立面的方向发展,从问题的相反面深入地进行探索,树立新思想,创立新形象。当大家都朝着一个固定的思维方向思考问题时,而你却独自朝相反的方向思索,这样的思维方式就叫逆向思维。例:由电生磁想到磁生电。通过熔化过程想象凝固过程;由汽化吸热想到液化放热,加快蒸发想到减慢蒸发;由升华吸热想到凝华放热。17.思维导图法:是英国著名教育专家东尼·博赞创造的一种学习方法。在学习科学过程中,以思维导图的形式将科学知识自主建构串联成网,可直观显现知识脉络,深刻领会知识间的内在联系。初中物理科学方法题考法及其解析【转换法例题1】在探究阻力对物体运动的影响时:(1)如图甲所示让小车从同一个斜面的同一高度静止释放,目的是 。由图可知,小车受到的阻力越小,小车运动的路程 。如果小车在绝对光滑的水平面上运动,小车将 。(2)在辨析图乙小明、小华的观点,研究力与运动的关系时,为什么设计探究阻力对物体运动的影响,而不设计探究推力对物体运动的影响,理由是 。(1)让小车从斜面的同一高度由静止下滑的目的是,当小车到达水平面时,使小车的速度相同;毛巾、棉布、木板粗糙程度变小,阻力变小,根据实验现象,可以得出结论,水平面越光滑,小车受到的阻力越小,在水平面上运动的距离越远;如果水平面绝对光滑,对小车没有阻力,则小车将做匀速直线运动;(2)研究阻力对小车运动的影响,需要改变接触面的粗糙程度,且对于同一接触面摩擦力一定,不同接触面,摩擦力不同,容易探究摩擦力对物体的影响,而推力,不易控制其大小且不便于测量推力的大小。【模型法例题2】下面几个研究实例中,采用了相同研究方法的是( )①利用光线表示光传播的径迹和方向②“探究压力的作用效果与受力面积的关系”时,保持压力不变,改变受力面积③“比较不同物质吸热的情况”时,用加热时间的长短表示吸收热量的多少④“探究物体的动能与速度的关系”时,让同一钢球从斜面的不同高度由静止滚下A.①和② B.②和③ C.②和④ D.③和④答案:C【理想化实验法例题3】测量电流时,需要将电流表串联在电路中,通常,电流表的电阻比待测电路的电阻小得多,因此对测量值的影响可以忽略不计。下列研究方法与此相同的是( )A.在探究平面镜成像特点实验中,用两根相同的蜡烛探究像与物的大小关系B.在探究二力平衡条件的实验中,选用轻质卡片C.根据被压物体形变大小反映压力作用效果D.在研究光的传播现象时,引入光线答案:B解析:测量电流时,需要将电流表串联在电路中,通常,电流表的电阻比待测电路的电阻小得多,因此对测量值的影响可以忽略不计,这种方法叫理想化实验法。A.在探究平面镜成像特点实验中,用两根相同的蜡烛探究像与物的大小关系时,采用的是等效替代法,故A不符合题意;B.在探究二力平衡条件的实验中,选用轻质卡片,忽略了纸片质量的影响,用到了理想实验法,故B符合题意;C.在探究影响压力作用效果因素的实验中,根据被压物体形变大小反映压力作用效果,用到了转换法,故C不符合题意;D.在研究光的传播现象时,用一条带箭头的直线来表示光线,采用的是模型法,故D不符合题意。【微小量放大法例题4】将玻璃瓶、两端开口的细玻璃管和橡皮塞组成如图所示的装置。装置内加入适量的液体,可完成如下四个实验:在这些实验的设计中,把微小变化放大以利于观察的是( )①验证力使物体发生形变;②观察大气压随高度的变化③观察液体的热胀冷缩:④模拟潜水艇的浮沉。A.①②③ B.②③④ C.①③④ D.①②④答案:A【控制变量法例题5】在探究“浮力的大小跟哪些因素有关”的实验中,辰辰同学和他的伙伴们做了如图所示的一系列实验.(1)①②③三次实验是为了探究浮力的大小与 的关系,得出的结论是 .(2)分析 三次的实验数据,可知浮力大小与物体浸没在液体中的深度无关.(3)此实验还探究了浮力的大小与 的关系,得出的结论是 .(4)通过实验数据可知金属块的密度为 kg/m3.【答案】(1)排开液体体积;在液体密度一定时,物体排开液体的体积越大,物体受到的浮力越大;(2)①③④;(3)液体密度;在排开液体体积一定的情况下,液体密度越大,物体受到的浮力越大;(4)9000.【评析】此题考查了学生比较熟悉的控制变量法,控制变量法的优点就是将复杂的问题简单化,再结合实验过程图,很容易完成看起来复杂或者是高不可攀的科学问题。
阿基米德对重心的研究,是从研究杠杆的平衡发展起来的。为此他写了一本著作叫《论平面图形的平衡》的科学著作。在这本著作中,他将杠杆原理总结成如下的几条定理:①重量相等的重物,加在离支点距离相等的无重杆上是平衡的。②重量不相等的重物,加在离支点距离相等的无重杆上,杆子就倾向重的一面。③重量相等的重物,加在离支点距离不相等的无重杆上,杆子就倾向离支点远的一端。④一组重物可用等重的一个重物来代替,只要这个重物的重心是在这一组重物重心的位置上。相反,一个重物,可用一组等重量的重物来替代,只要这一组重物的重心在这个重物重心的位置上。⑤面积不相等但有相似形状的几何图形的重心,在它相似图形相应的位置上。从这些定理中我们可以十分清楚地看到,前三个定理是本章中讲到的“给我一个支点,我将推动地球”故事中讲的阿基米德作的关于杠杆平衡的实验。第四条定理是本章中柯伦看到的阿基米德做的实验,他在不停地用一组重物去代替一个重物,或者用一个重物去代替一组重物,只要它们的重心位置相同。而第五条定理,便是我们看到的阿基米德和柯伦对几何图形的重心探讨,不管圆的面积是大是小,它的重心总归在它应在的位置上;其他的图形如三角形、平行四边形,包括正方形和矩形、球形,以及梯形、方形、棱柱体和圆柱体、正棱锥体和圆锥体、球体和半球体,不管它们的面积和体积的大小,重心总在它们应该在的那个位置上。阿基米德曾经强调他运用力学原理为基础去解决几何问题的方法,他对重心概念的研究和确立,想必是典型的代表。阿基米德关于重心的发现以及确定重心位置的方法确实对科技,特别是技术的迅速发展起到了不可尽述的作用。举个十分简单的也十分常见的与生活密切相关的例子,小时候我们玩的不倒翁,为什么它摇来摆去不会倒呢?你也许曾经自己亲手做过不倒翁,你知道做不倒翁的鸡蛋壳,它的下半部装了重重的沙土或泥,重心相当低,它就变得十分稳当,即使你把它按倒在地上,它也会倔强地直立起来。不倒翁的原理还普遍应用在许多技术设计上。比如,在江海中航行的轮船,必须先将重物装在舱底,使船的重心降低,它在大风大浪中航行,才不至于被掀翻。比如塔式起重机,它要将重物吊到很高的高处,怎样保持重心的平衡就十分重要。人们一方面在塔底放了装着沉重钢绽的压重架,同时让它有四“条”向外伸开的“腿”紧贴在地面上,这两个方法都能达到使起重机的重心降低的目的,使它稳度加强。再说那两边挂着水桶的独轮车,它那降低重心的作用,现在就应用在单轨磁悬浮列车上,列车骑在单轨上,使人产生可能不稳当的感觉,其实它的重心已经降低在单轨上。甚至在儿童游乐场里,我们也能看到一种高空单轨列车,在单轨的两旁各挂着一个车辆,既保持了平衡,也降低了重心。小朋友们尽可以放心地坐上那高空单轨列车去“旅行”一圈,从高空中去俯看一下它下面的城市或郊区的风采!朋友们,当我们翻开数学课本时,你一定会看到这个符号,这是圆周率。你可知道这是谁首先发现并计算出来的?也许你会说是我国的祖冲之。是的,确也如此,然而你可知道,在祖冲之之前几百年,在欧洲西西里岛叙拉古王国已有一个人发现了圆周率,他就是我们要讲的数学家我们知道,古希腊人在研究数学方面,达到了一种如醉如痴而又十分清高的境界,他们将这种探索看成是一项纯理性的神圣而又崇高的事情,不受世俗的实用法则干扰。阿基米德是著名的古希腊数学家欧几里得的学生的学生。关于欧几里得的清高,有两个很著名也很有代表性的传说。欧几里得在给他的学生传授几何学时,坚决要求学生要对几何学的原理进行透彻的研究。在那个时候,亚历山大的国王多禄米也来向欧几里得学习几何,欧几里得反复解释的抽象的逻辑推理,也把多禄米国王搞得糊里糊涂,于是有一次他向欧几里得提出说:“是否有比你所讲的方法要简捷一些的途径,去达到学习几何的目的呢?”听了国王所说的话,欧几里得毫不迟疑地回答说:“尊敬的国王,在我们乡下有两条道路。一条是专供老百姓们走的曲折小道,一条是专门供皇家走的平坦大道。然而,在几何学里,大家只能走同一条道。要达到学习几何的目的,是没有什么专供皇家走的平坦大道的。”据说,虽说欧几里得对他的学生是十分亲切、关心的,但他十分反感学生提出几何有什么实用价值的问题。一次,有一个学生在听罢欧几里得讲授的几何学定理以后,就像欧几里得提出一个问题:“老师,我们学习几何究竟有什么实际的好处呢?”欧几里得听了这位学生的问话,就马上转身对一个仆人说:“给这个人三个阿宝尔,古希腊通用的一种小银币,他想靠几何学发财呢!”这虽说只是一个传说,但却完全暴露了欧几里得对学以致用的问题的毫不在意。然而,和欧几里得同一时代的阿基米德是否也曾有这种自负清高,只追求推理而很少学以致用的思想呢?一些历史学家也用如此观点去看待阿基米德的学术态度,认为他也是一个沉湎于为研究而研究、缺乏实际运用的学者。但是,我们从阿基米德一生所从事的研究和他所涉及的领域来看,他似乎是另一种类型的学者:他注重学以致用,十分关心生产、生活中的实际问题的解决。与一般善于解决工艺问题的高手不同之处是,在实际问题解决之后,他会以超常的毅力和兴趣去进行一系列理论上的探讨和钻研。有一天,有一位老农来找阿基米德帮助他解决一个难题,恰好他的好朋友柯伦也在那儿。老农说道:“聪明的阿基米德,我想做一个木桶,底板已经准备好了,但是我不知道在它周围的木板需要准备多宽才可以,你能告诉我吗?”“你计划做多大的木桶底,你是否心中有数呢?”柯伦向老农问道。老农回答道:“这我已经计划好了,我准备做直径是2/3米的木桶底。”柯伦不假思索地顺口说:“这十分简单,那你就准备出一共有2米宽的木板就可以了,人们不是常说,径一周三吗!”柯伦所说的计算方法也有道理,因为长期以来,人们在制作圆桶形、圆柱形、圆盆形的过程中已经得出一个比较容易计算的概念,那就是柯伦所说的:“如果圆的直径是一的话,那么它的圆周的周长是直径的三倍。”在我国古代,人们同样也在日常生活实践中得出了如此结论。然而老农仿佛对柯伦的回答并不感到满意。他继续说:“我知道这种计算方法。不过当我每次用这样的方法去准备木料时,总会少一点儿,我想是否会有一个更准确些的计算方法。”阿基米德一直在听着老农和柯伦的对话没有接话,这时他开口说道:“老伯伯,我告诉你一个解决这个问题的方法。”说着,阿基米德就蹲下来在地上画了一个图形,这个图有一个圆,还有一个很长的三角形,他指着图对老农说道:“您看,好比这是您想要做的木桶的半径,您让底边的这个半径和那根竖直的半径成直角,然后将底边的这根半径向外延长,一直长到可以和那根竖直的半径的切点成为一个三角形,这直角的三角形的底边即是圆周的长。您放心好了,这不会有什么误差的。”虽说老农无法听懂阿基米德所讲的那些个概念,但他能看得懂阿基米德在地上画的那个图,又指指三角形的底边,再确认一下说:“你的意思是,这根线就是这个圆绕一周的长,是这样吗?”“是这样的。”阿基米德轻松地回答。“那我就太谢谢你了,你帮助我解决了一个大难题,从此我再也不用为此而烦恼了。”老农高兴异常地辞别而去。老农走后,柯伦好奇地问道:“聪明的阿基米德,你是如何知道这样一个直角三角形的底边的长就是这个圆的圆周长呢?”阿基米德不经心地回答说:“可能是欧几里得说过的吧,或许在欧几里得之前,就有人思考过这一问题。”柯伦毫不放松地道:“那你又如何去证明为什么这个底边的长就是这个圆周的周长呢?”阿基米德爽朗地笑着:“为什么?别考我,我正在考虑,用什么方法可以证明它一一或者,是否有更明确一些的方法去求出圆的周长。”随之,阿基米德便进人了“圆的量度”的艰苦探索与研究。他的思路进入了属于他自己思维方式的求索,他在地上画了一个正四边形,又画了一个外接圆。但如果用这个外接正四边形的周长和面积与这个圆的周长和面积相比较,显然要大得多。
本文为年初面向高榕资本研究院(以及部分投资团队)作交流的文字纪要,主题为《我的行业研究方法论》。该交流持续约八小时,文字纪要约八万字,涉及宏观、产业、产品,一级市场与二级市场。我们作一定删减,并根据时间顺序逐步整理出。目录一、关于研究阿丽塔仙子精灵反乌托邦洛丽塔二、什么是研究话语体系行业划分知行合一虚假世界你做不出成果只恨黑夜太漫长观察生活解放天性/当众孤独/时刻准备着游戏规则与市场机制三、核心方法论(基础)驱动力与信号验证核心驱动要素草根调研代理变量假说成长红利/ABH效应四、核心方法论(进阶)影子魔法与水晶球人民币汇率问题毛利杠杆与库存周期晴雨表宏观经济问题社会文化问题金融反身性与产业反身性精确的错误与模糊的正确话语体系的损耗数据挖掘五、核心方法论(艺术)非线性外推PE是什么成长与周期股票价格估值上帝视角数字货币的例子价格决定预期差投资五要素六、小结待续……注:本文为目录中的第一章与第二章,约1.2万字。第一章:关于研究阿丽塔放个视频给大家看,我用抖音自拍的阿丽塔,抖音的美颜算法很强,看完电影后,我就想到“抖音或成最大赢家”,因为看到阿丽塔首先想到的就是抖音的大眼瘦脸。我还有一些,大家也可以拍一些,女生肯定可以拍的,不管是不是因为美颜总之抖音能看到很多美女,抖音会帮你发现自己的美,为什么火是因为这是一个好产品。我穿的这件蓝色毛衣也是一件典型的“软妹服”,我们后面也要讲到。现在我们就开始讲行业研究方法论吧。过去我在很多场合讲过我的研究成果,但这是第一次讲研究方法论。我会结合做产品的一些经验,以及过去在券商的一些经历和案例。首先大家想一个问题:什么是研究?以及什么是好的研究?前几天在抖音上看到一个视频,爱因斯坦说,如果有一天遇到一个关乎生死的重大问题,只有一天的时间解决,他会用95%的时间去研究问题是什么,再用5%的时间去解决问题,我很认同这一点。就是95%的审题和5%的解题。很多时候我们并没有搞清问题是什么,当问题被界定清楚时,答案便显而易见了,你离问题越近,就离答案越近。我们现在讲研究方法论,我们可以把“研究”作为一个研究对象来研究一下,研究以及好的研究其本身到底是什么?这一点非常重要,问题界定清楚时答案便显而易见。还有一句话是“万解皆可包,唯有题无价”,即所有解决方案都是可以外包的,提出关键性问题才最有价值。很多时候,我们面临一些困扰,你想该怎么解决,你潜意识里有一个问题,但可能并没有仔细界定这个问题,包括现在我们讲的到底什么是研究?我们还可以举个例子,比如什么是爱情?以及什么是二次元?什么是萝莉?什么是社交?什么是人工智能?什么又是新零售?仙子精灵什么是爱情?大多数人都经历过爱情,即便没有经历过也至少向往过,知道爱情“大致”是什么样子。这个问题没有标准答案,每个人有不同的理解。当问到什么是爱情时,你脑子里会蹦出很多概念,很多感动,那到底什么是爱情?我和朋友做过这个事情,一天他问我什么是爱情,我们几个朋友回答是美好是痛苦,是希望是绝望等等,每个人都在说,最后差点声泪俱下。你发现爱情场景中的点点滴滴太多,是我人生的希望,是我人生的绝望,是我的全世界也毁了我的全世界,是精神交流,是肉体融合,是小鹿乱撞,也是胃痛,失恋的时候胃是会痛的。说到爱情脑海里会出现大量场景,对应的词便会蹦出来,到最后越来越深刻,你就接近崩溃了。所以我这里提到了很多词,是阳光明媚,是乌云密布,是喜笑颜开,是声泪俱下,是轰轰烈烈,是万劫不复,其实还有很多其他的。比如,爱情到底是漫不经心还是掏心掏肺呢?阿丽塔就是掏心掏肺,看到一个帅哥就爱上了,缺乏爱情经验的人几乎都是这样,男人也是如此,看到漂亮妹子就会喜欢,然后不切实际地追求,搞得双方都很尴尬,但这也恰恰是最宝贵最美好的经历,所以爱情是包含很多方面的。然而,在今天掏心掏肺的纯情却被称作舔狗。这是因为,爱情游戏的本质在于你需要“漫不经心”。爱上一个人时,你会变得卑微,因为你把所能想到的所有最美好品质,全都赋予了你最深爱的人。这是矛盾,也是人性无法逃脱的宿命。所以我说爱情是不稳定的存在物。热恋很幸福失恋很痛苦,这和投资很像,投资赚钱和亏钱的感觉与热恋失恋高度一致,一样充满了不确定性,进而有天堂和地狱同时存在的反差。真爱像稀有金属一样难以以单质形式保存,条件苛刻,你需要很好的经营,但大部分人都很着急。所以对于爱情,我说她是森林里的仙子精灵,如果有生之年你曾经遇到过她,曾经看见过她,这是“曾经”这个词在你一生中,最美好的一次使用场景。因为你可以骄傲地说出,我曾经相信过、看见过爱情。现在你会发现,很多东西定义本身就是主观的,并不严格存在一个客观世界,正因爱情的这种主观性,最近流行在任何一句话后面都加上“像极了爱情”就立即深刻起来,也是这个道理。投资,像极了爱情。那什么是美女呢?其实类似,金融市场选股就是选美,其实就是你要去关注“主观”是什么而不是“客观”是什么。其实不仅资本市场,互联网以及2C的产品,都是在判断大众主观在如何变化,那什么是美女?我不展开了,我讲一下结论。首先我们讲的是异性眼中的美女,男人眼中的美女首先是长得好看,这没问题,但美女最不可或缺的要素是什么呢?是“社会属性的难以接近性”。比如你的亲妹妹长得再好看你也不会对她有什么想法,因为社会关系太接近,这是结论,原因在于“美”是“感而不应”。具体我不展开了,因此美女界定核心恰恰是社会属性而非自然属性。反乌托邦那什么是社交呢?我在《社交产品方法论》中已经阐述,相信大家也都看过了。当我们提及社交时,不同人心中会有不同概念,语言是思维的物质外壳,无论是为了避免交流时各说各话,还是更重要的为了解决问题,我们首先都要界定问题。社交产品有多种界定方式,我从技术逻辑界定成通讯、媒体与交友三大类。通讯是既定社会关系沟通工具,媒体是社会化传播工具,交友是社会关系扩展工具,三者有区别,但正因他们都与人类社会活动有关,并通过互联网完成,所以我们都叫它们社交产品,但三件事背后的产品逻辑和技术逻辑都是不一样的。通讯产品出现需要计算平台级技术进步,这是怎么超越中国移动的问题。社交媒体依赖平台内技术进步,从3G到4G再到5G,抖音全称叫抖音短视频,和当年快手GIF一个道理,GIF是3G环境的产物,短视频则是4G环境。接下来抖音一定会把“短视频”三个字去掉,就像快手去掉“GIF”一样。交友产品则是另一逻辑,其实我们可以出一道题,请在下列选项中选出完全与其他几项不一样的选项:微信、微博、抖音、陌陌。你会怎么选?不同视角不同答案,但有一个“更深刻”的答案。你可以选微信,因为是熟人社交,是即时通讯。你可以选微博,因为是最大的舆情平台,社交媒体。你可以选抖音,因为是短视频。如果我选,我会选陌陌。因为他有着更深刻的差别。陌陌和其他三个产品之间的差别已经上升到了“阶级关系”。我们说这么多年,即时通讯一直被很好的满足,社交媒体也取得了长足进步,到今天唯一没有被解决的,就是交友问题,包括婚恋。App Store社交排行榜基本上是最浪得虚名的排行榜,因为除了前面的一些产品外都是“垃圾”。这个品类太缺产品,永远是“今夜寂寞”、“同城约”等字眼,因为交友需求从来就没有被正真满足过。这也是为什么交友类产品,永远是一波一波,爆发之后又掉下来,水分蒸发剩下淤泥变成酱缸,陌生人社交产品的生命周期相对都会短一些。资本主义经济危机的必然性在于社会化大生产与生产资料私有制之间的矛盾。交友类产品的创新与酱缸周期,也源于陌生人社交的根本矛盾:社会化大交友与优质的脸和钱的私有制之间的矛盾。大家都要找最好的脸和钱,但资源掌握在少数人手里,这就是“阶级关系”。这是交友类产品和社交媒体以及即时通讯的最大区别,因其涉及社会关系拓展,阶级性是社会规律,永远存在。这也是为什么我很喜欢反乌托邦模型,这是一个最简单的社会模型。阿丽塔也一样,人们想去一个地方,但不让去,但可以通过参加比赛去,目标明确,反而简单了,只是现实社会比这个复杂,真是像极了爱情。洛丽塔什么是萝莉呢?萝莉(可爱的低龄少女)一词源于洛丽塔(小说)但不等于洛丽塔,更不等于穿着Lolita裙子的人(lo娘)。刚才大家提到最近在调研Lolita用户,在做用户访谈,其实了解圈子的最快方法就是进入这个圈子,调研会因为技术问题失真,事实上大多数调研都难以接近真相。真正的用户调研来自一种“主观感知”能力而非客观统计学调查。因为永远无法通过抽样接近客观真相,只能形成主观感知能力来判断真相,类似金融反身性原理,这是一种社会反身性。我过去买了很多Lolita裙子和Cosplay裙子作收藏,最近我开始尝试。我对漫展很了解,也知道大家为什么要去漫展,但这更多是一种理性认识,或尚不深刻的感性认识,直到穿上裙子那一刻,我才真正获得了感性认识。纸上得来终觉浅,绝知此事要躬行。穿上裙子那一刻,你开始发自内心期待漫展,因为你开始渴望展示自己,开始思考如何变得更美。哪怕只是通过拍照及后期做出完美的平面效果,而不是在现实中,但这件事情,也已经足够引人入胜。我妹妹玩了十年Cosplay,我一直有个疑问,为什么她的大多数作品在我看来并不是特别的“完美”,后来发现男女审美并不一致,进而在视觉展示上(包括角色选择)追求的重点就不一样,女性更多追求 “华丽大气”,而非“吸引力”。这也是我开始“穿女装”的重要原因之一,我在试验自己心中的审美风格。我心中一直有一个完美女子形象,我还不曾遇到你,便只能先把自己变成你。很短的Lolita裙子,运动鞋,上身吊带(JSK无袖),里面T恤,手持宝剑向你跑来,然后启动法拉利带你认识更多萝莉。你的意中人是一个盖世英雄,会踏着七彩祥云来娶你。我的意中人则是一个盖世萝莉,我相信有一天她会开着法拉利,身穿短裙丝袜,脚踏AJ,带我认识更多萝莉。所以大家应该去买点裙子,Lolita/JK制服/汉服还是Cosplay用户很多是学生,买裙子还会有经济压力,在座的各位都不会有压力。这恰恰是了解圈子、研究用户的真正捷径。大家也可以多参加漫展,漫展信息可以看喵特APP。五年前我说过中国三四线城市的漫展正像当年中国三四线城市电影屏幕一样快速增长,2012年便诞生了10亿票房的电影《泰囧》。去年中国漫展已经办到了3822场,除去一、二线城市外仍有2322场。下一个趋势是电竞中心。第二章:什么是研究话语体系现在我们回到开始的话题:什么是研究?我把研究分成三类:一是大家日常口中所说的“这个问题研究一下”,即工作和生活中都会出现的我们叫它“①求真态度”。后面两种则是专门的研究职能:一是“②学术研究”,另一种是“③商业研究”,券商研究、以及买方(包括一级市场)自己的投资研究都是商业研究。学术研究好理解,今天我们主要讲商业研究。以及更关键的,商业研究和学术研究的差别。这里我会结合一些二级市场的例子。记得刚进申万研究所时,领导就给我们强调要完成学术研究到商业研究的转变。券商招人强调实习经验,一是行业节奏快没人有时间教你,二是学术研究到商业研究之间有一个鸿沟,最好在工作前你就已经跨越了这个鸿沟。但正如申万研究所的优良传统之一,申万(至少在早年)招人最不强调实习经验,甚至你最好不要有任何实习经验,学生就好好完成学术研究,申万的培训体系能在三个月内帮你完成学术到商业的转型。这一点是非常对的,研究能力相通,如果没有接受过规范的学术训练,你很难完成好的商业研究。如果你在学校混日子是很难做好研究的,做商业研究时你会一脸懵逼,你要重新进入一个探索过程,因为研究是有经验的,有习惯的,需要一个持续训练的过程。商业研究和学术研究的区别是什么呢?我的总结是:商业研究需要有①可操作的②经济利益。你不能研究了半天,一点操作性都没有,同时背后要有经济利益,这是和学术研究的最大差别。学术研究就像一个大圆,你在圆的边缘上往外做了一点点贡献。这些东西可能当下没有经济利益,也没有操作性,但把人类知识往前推了一点,这就有学术价值。商业研究则要有可操作利益。金融市场比较直接,可以买卖,产业也是类似,上马什么项目进入什么领域,都要有可操作的经济利益。因此切勿陷入探究本身的快感中。探索求知是很快乐的,但商业研究不能只是快乐。举个例子,二级市场事实上你在哪个行业很大程度上决定了你的职业生涯高度,比如航运这个行业,周期是三十年,你如果进入这个行业时恰逢下行周期,下行周期十年,直接超过了你的职业生涯,那你就有点麻烦了,虽然你依然可以研究的很快乐。行业划分二级市场大多券商都会对行业进行全覆盖,因此会有好坏行业之分,秘密就是你要进入好的行业,我入行看的是钢铁行业,在明确知道这个行业“没有前途”的情况下依然选择呆在这个行业,因为我想学一下产业链。这也涉及申万的人才分类策略,行业划分整体涉及上游领域(资源品)、中游领域(制造业)和下游领域(消费品)。一般学经济的人去看上游,其更受宏观经济影响,如钢铁、有色、煤炭、建材、石油等。钢铁行业事实上属于中游制造业,但在实务中仍放在上游资源品领域。我的专业是世界经济,因此在实习时就去了钢铁行业。学管理的人看下游,如食品饮料、纺织服装、旅游酒店等,因其更受消费者市场影响。有工科背景的人则去看制造业,这一点好理解,“复合背景”在投资领域一直很吃香。TMT则跨越上述三个品类。但正如申万研究所的另一个优良传统,事实上申万可能是所有券商里招募“工科背景”最少的券商。这涉及券商行业研究的本质。券商行业研究的本质是金融研究。你需要懂行业,但你更需要懂金融,你做的研究实际上也只是金融研究,即你所在行业及上市公司基本面的变化如何影响了预期进而影响了股价?这又涉及另一句申万名言:证券研究的直接目标是寻找预期差。行业知识都可以学,金融素养则更加重要(当然也可以学)。申万领导曾说只有三个行业需要有相关背景,一是医药,二是化工,三是电子勉强需要。不是因为这三个行业无法临时学,而是临时学起来太耗时间,事实上只有医药研究员需要相关背景。我正式入职前领导一度问我要不要转去化工行业,我诧异这不是需要相关背景吗?领导答只要你高中是理科生就可以了。我还是选择留在钢铁行业,因为我在钢铁行业实习了很长时间也在宏观部门实习过,有一个自己的宏观与产业链研究体系的搭建过程,钢铁行业受宏观驱动,上游涉及铁矿石和焦炭,下游涉及房地产、基础建设、造船、汽车家电、轻工业等,几乎涵盖所有上中下游产业链。我后续转行互联网行业研究,也受益于钢铁行业的训练。我研究互联网行业的时间很短,但做出了一些成果,很多人问我怎么做的,事实上就是源于钢铁行业的研究基础。行业研究是你要去洞察一些东西,即便你在航运行业,你也可以去搞清楚波罗的海指数以及世界经济周期,这背后都很有价值。知行合一讲到这里,我们要讲一个东西叫知行合一。前面讲商业研究和学术研究的差别在于是否有可操作的经济利益,即正确把握认识世界和改造世界的关系。事物=客观+主观+主客观之间的裂痕。如果说谋士在知,主公在行,那么研究是认识世界,产业化是改造世界。知和行本身有一个交集,好的学术研究和商业研究都在这个交集里,学术研究的范围比商业研究大,且不是所有的研究都在这个交集里。前面说的研究三种类别中的“求真态度”即是一种知行合一的态度。就像投资经理肯定要做研究,但他需要的是 “求真态度”而不是专职的研究工作,把他分工出来就是商业化研究,但好的“研究”一定是和执行高度相关的,你研究到极致时你已经在做这件事本身,而不再仅仅是“研究”了。某件事做的非常好的人,他一定明白其中的秘密与Knowhow。你做研究也是在逼近这个状态,即不仅“知”,还要“行”。最好的研究就是最好的执行,反之亦然。从这个角度看待,你就会发现研究并不是一个“后台”,而是问题的核心,如果你能做到“知行合一”你就很厉害。人都有舒适区,当你研究的很快乐时你要小心了,你要时刻关注自己的研究在操作性上的价值,事实上你要明白主观和客观之间存在的裂痕,我们永远只是在逼近真相,但你自己要明白到了什么程度。二级市场的研究都是进行获利交易,股票你买卖就行了,但炒股票实际又很难,因为你只把握了50%的概率。基本面你把握了80%,但股票价格=价值+套利+情绪——申万研究所,它由三部分组成,并且还天天变,这就变得高度复杂了。所以股票研究本质在于研究预期的变化而非基本面的变化,只是后者影响了前者。你可以把一个问题研究清楚,但你必须明白你研究清楚的东西在整个决策系统里占了多少比例,它可能只占了20%。如果你以为你搞清楚了80%,那就是在自娱自乐,在搞行为艺术。但如果你真正搞清楚一个极小的部分,至少你在这一点上你是知行合一的。由于我们当前在探讨“研究”,我便把“研究”和“执行”在逻辑上做了区分,事实上两者没有区别也不该有区别,研究者和执行者都是从两个方向无限逼近价值实现。只是当他太难实现的时候,我们便区分了职能。知行合一并不代表时时刻刻需要“有用”,大部分基础研究在当下是无用的但在某时某刻是无价的。但这涉及另一个话题,即创新是边缘溢出。当“暂时”无用的研究一旦完成“边缘溢出”便实现了价值,基础研究在等待“边缘溢出”,“知行合一”在创造“边缘溢出”。这就是为什么之前我们还要问一下什么是爱情?因为如果你连什么是爱情都搞清楚了,还有什么东西搞不清楚? 虚假世界这个世界是虚假的。前面我们讲到互联网行业和钢铁行业(以及周期品行业)的差别,一个是研究主观世界,一个是研究客观世界。周期品行业要不断逼近经济运行的平均水平,互联网则要不断逼近大众心理的平均水平,前者是客观世界,后者是主观世界。互联网是主观世界好理解,事实上经济周期也是主观的,都存在反身性原理。文化流行存在反身性,宏观经济也一样,经济规律、政府调控、主体行为共同构成反身性,包括凯恩斯主义与奥地利学派的差别。巴菲特说,大部分投资人是不看年报的,就是说这个世界上大部分人都是不认真和不用心的,投资领域无论二级市场还是一级市场都是如此,很多时候人们只是在干一份工作,只有极少数人用心,或者说,大部分人待在虚假里。奥地利学派讲,大家看到经济下行后政府会增加支出或扩大信贷,但经济规律是经济进入衰退后必须通过萧条来完成市场出清,让非理性行为得到清偿,经济自然会快速复苏。经济高涨时大家都觉得自己牛逼,进行了不必要的扩张和资本开支,借了不必要的钱,因为周围的人都在这么干,你觉得你不干就落后了,就完蛋了,所以你也去干了。之后一定会带来问题,金融经济互为表里,之后就没钱了,这个过程就是市场出清,让犯错的人付出代价,从而减少总供给。市场萧条后自然就会再起来,但如果去救的话,问题就会更大。想想个人借贷就好理解了。用于消费而非价值创造的贷款,如果继续提供信贷,无异于延缓更大问题。奥地利学派就是说什么都不要管,市场出清后自然会快速复苏。现实中更多是皇帝的新装,这一点非常关键,但这一切又是“合理”的。你做不出成果现在我们来看看,什么是好的研究?我们来看看一九法则,以及199法则,世界永远是两极分化的。市场上1%的人赚去了99%的钱,0.1%的LP赚去了99.9%的钱,全球化和AI又加速了两极分化。研究也是如此,大部分研究都是没有用的,因为大部分人都是不用心的,资本市场的“虚假”程度只会远超你的想象。如果给好的研究一个定义,我叫他“建体系,出思想”,这句话也是申万研究所提出来的。申万要求研究必须建体系、出思想。当然即便在申万能真正做到这一点的也是少数。大家一定要明白一件事情,就像我们前面提到的知行合一,研究本身是一种艺术,只有少数人才能成为艺术家(投资也是如此),绝大部分人包括在座的部分人做不好研究是一种非常正常的常态。这个世界上90%的研究只是在“提供信息”,也即一份工作。9%的研究给人启发,实现了某种程度的“建体系”。只有1%的研究令人惊愕,我们叫他“出思想”。这便是研究三层次。任何行业都是如此,所以大家在做研究的时候,并不要默认你能做出什么成果,因为大部分人都做出不成果,包括投资也是如此。你必须明白这一点,你到底是那90%,9%还是那1%,你需要努力,以及判断自己的天赋领域,亦或是满足于只做那90%。高中艺考生越来越多,但大部分成不了艺术家,甚至只是为了逃避文化分数。即便上海戏剧学院这种层次的表演系和导演系学生毕业后不少也只能干着不相关的工作(技术进步会逐渐改变这一点),播音主持专业大部分毕业后也并不在从事主持人工作,央视、卫视的主持人要求很高,大部分人也不愿去基层电视台或相关领域,最后也就从事了其他职业。研究也是如此,研究和做学术一样需要天赋,研究和投资事实上都是高阶工作,是一件门槛很高的事情,只是中国经济过去的加杠杆使得很多高阶职业变成了一份日常工作进而误导了很多人。大家都知道一级市场大部分人都投不出好项目,但很多人并不明白事实上大部分人也做不出研究成果,因为投资与研究本无区别。VC投资是认知、圈子、阅历的综合结果,而不是一份工作,研究的迷惑性也在于让人误以为只是一种脑力劳动,只要高学历就可以完成。研究恰恰涉及前文说的主观世界与反身性甚至“边缘溢出”,如果把研究一词换成“深刻洞察”就好理解了。研究的基础是获得信息和整理信息,当你对信息和逻辑理解非常深刻的时候你自然就会有自己的体系,比如什么是社交、什么是爱情,他一定是一个逻辑体系,你首先需要把它界定清楚,比如我们说社交包含通讯、媒体与交友,通讯依赖计算平台技术进步,媒体依赖平台内技术进步,而交友最后还是一个阶级矛盾的问题,这样就是一个体系。但很多研究也都能形成让人启发的体系,这还不够,最高阶段则是出思想,即你的研究成果成为了一种思想。做研究你必须要求自己建体系出思想,否则你和咸鱼有什么区别。我们刚才讲的商业研究,不仅指卖方研究,而是指商业价值导向的研究,买方研究(包括VC)本身也是商业研究,必须产出商业价值。只是卖方研究你还必须把它搞得很牛逼的样子,比如一篇报告50页甚至100页,要显得牛逼,但如果只是内部汇报你的逻辑与洞察,一般3-5页足以。卖方研究出于要显得很牛逼,要把一些方方面面展开,把一些基础信息和补充信息附上,这也是有价值的,但核心还是体系与思想。大家可以尝试找一个领域或一个点进行深入洞察,你搞懂它后,他一定是一个高度简单和高度容易理解的结果,这些洞察就是有价值的,作为内部汇报的话你可以在附录里附上补充资料,逻辑和洞察本身则是简单却富有启发的结论。你可以提供信息,但这只是基础工作,你要知道如果没有体系,没有思想,你的研究就真的没什么用。研究是跨越主观和客观的鸿沟,大家想想如何建体系与出思想,强大的洞察力其实是一种性格特点,所以研究要靠天赋,我叫它“只恨黑夜太漫长”,即一种神游的感觉和创造心流的过程。我们前面讲研究要避免陷入快感,是不要让快感成为研究本身,但研究一定是有快感的,对“真理”的追求,朝闻道夕可死矣,你会一晚上不想睡觉,就像小学生想到明天要春游的那种感觉。只恨黑夜太漫长去年5月份朋友圈有一篇很火的文章大致叫悲催的成年人,什么做PPT到凌晨然后电脑坏了,很多辛苦感人的画面让大家共鸣,我当时也转了,但我觉得这篇文章很正能量,一点都不辛苦。这种只恨黑夜太漫长的感觉真是太好了,也是你人生中最奢侈的一段经历,只有在你最年轻的工作时期你才能体会到,加班到两三点万籁俱静身心合一的专注感觉。这也非常有利于你的职业生涯,因为任何一个人的职业习惯都是在工作最初的2-3年内形成的,你如果没有找到只恨黑夜太漫长的感觉,那很遗憾。什么是青春?不计回报的努力还能让你感到快乐便是青春。研究是一种天赋,事实上就是一种快速进入“神游”状态的天赋,本质是一种感知能力。我们前面说无论是互联网泛娱乐产业,还是周期品制造业,到最后都是一种对大众心理和社会反身性的感知能力,研究的天赋即强大的感性感知能力。这也是为什么我们要反复强调什么是爱情,当你开始思考什么是爱情,你开始声泪俱下,爱情便深刻地理解清楚了。有中学生问我语文不好怎么办,我说你去失恋一次语文成绩就会上来,失恋后内心会有源源不断想要表达的东西,你文采会变得很好,语文成绩就上来了,本质是感性化能力上来了。人类强大的情感能力在经历痛苦后都会表现出来,所以失恋是很多人的人生转折点。所以研究对我来说是一件高度感性化事件,我研究问题时经常听一些很中二的歌曲,非主流三巨头,徐良、许嵩、汪苏泷,即能让你快速进入青春期思维模式的歌曲。青春期是大脑算力即流体脑力的巅峰,我们虽然过了青春期,但可以通过歌曲进行超频。十几年前我用500倍杠杆炒外汇,全是手动高频交易,几秒钟下单,十几秒后平仓,我必须听着马克西姆钢琴曲,大声快节奏的音乐能让人进入一种失去自我的状态,然后下意识建仓平仓,我叫它“用感性祛除感性”。如果说研究靠天赋,那么日常生活中我们是否还有一些可操作性的方法,怎么去做点事情呢?我叫他观察生活。观察生活“观察生活”一词来自表演学,演员需要塑造各种没有经历过的角色,他必须通过生活中的点滴观察进行积累,比如街头遇到乞丐,和他交流,看看他在干什么,看到建筑工地进去搬搬砖,你要深入生活的点点滴滴。前面聊到调研Lolita用户,调研本身是一种观察生活,但要做好一个调研本身,真正的观察生活就是亲自去尝试一下Lolita。你自己穿一次Lolita可能才会真正明白,为什么要穿裙子?为什么要省钱买裙子?是因为虚荣吗?部分是,但更多是因为让你发现了自己的美,发现了自己的闪光点,你开始变得自信,开始很热爱这件事情,进而开始热爱生活。你开始找到了生活中的闪光点,你找到了甚至找回了少年心气,找到了疲惫生活中最后的英雄梦想。TFBoy很多粉丝是中年女性,杨超越有很多国企男性粉丝,SNH48有很多富二代粉丝,为什么,因为杨超越给了我们平淡无奇一眼到头的生活中带来了那么一点点英雄梦想,让我们看到了生活中那些还会闪光还有盼头的瞬间。明星只是一个法相,那么杨超越就是一个很好的法相,你追的不是一个明星本身,而是提醒你追求心中最后的梦想。明星就像一尊“佛像”,佛像本不是佛,佛像只是提醒你要敬畏心中的佛法,因为每个人都是佛,见性成佛。“偶像”就是“像偶”,一个你想成为的更好的自己,如果你正处青春期,家穷人丑,成绩还不好,如果你还不追星,你的青春期那不是一事无成?当然为什么会这样是家庭教育进而阶级关系问题。但不管怎样,追星已经是一件非常可爱的事情了,因为每天叫醒你的不再是闹钟,而是梦想。蔡徐坤也是如此,其实不用质疑现在的男性偶像为什么越来越女性化,这本身是女性消费主义的崛起,把男人打扮成洋娃娃,是因为要给女性消费。所以买裙子也是观察生活,当你观察生活到极致时,你就是一个演员了,你也是一个对产业、产品和用户非常有洞察的一个人。除了观察生活,表演学里还有“解放天性”和“当众孤独”两个要素,以及我加上的“时刻准备着”。解放天性/当众孤独/时刻准备着“解放天性”作为表演第一课,简单说就是让你彻底放开,以便塑造任何与你人格性格不一致的角色,往往通过极端的表演行为来训练。比如先想象出物理上与精神上难以忍受的场景、角色行为和角色特点,然后再演出来,把视觉上和精神上最难以忍受、甚至摧毁价值观的场景自然地表演出来,那么解放天性训练就完成了。“当众孤独”作为表演第二课,简单说就是做到不受大众和旁观者影响严格遵循内心。在舞台上严格按照剧本完成角色,不受台下万千观众的唏嘘、质疑、称赞、吹捧等行为的干扰。最后我再加上了一个“时刻准备着”,这其实是播音主持专业的提法,即时刻保持状态。商业上也是如此,成功者往往都在争议中成长,因为他们解放了天性,也完成了争议中的成长,因为他们做到了当众孤独。好的研究者/执行者也是如此,因为一个极致的研究者本身就是一个执行者。这三点本身又是和“观察生活”相关的,你要做好研究,或者说知行合一的话,首先你要做到观察生活,深入生活。更高阶段你则完成了解放天性与当众孤独,你成为了一名演员,你与这个世界已经融为一体。我一直说研究是高度感性化事件,无论是宏观经济还是互联网与新兴产业,其本质都是用你的内心去同步这个世界的频率,感受这个世界(包括大众主观世界)的震动,进入群体共鸣,完成连接,完成你的心灵与这个世界的连接。这个世界天地万物都在相互作用,你要做的只是融入这张大网。所以让你买裙子只是很基础的一件事而已。好的研究者/执行者首先是一个观察者,最优秀的则是一名演员。游戏规则与市场机制讲到感知能力,申万在选择研究员时会有心理测试,横向思维看策略,纵向思维看行业,以及横向思维看包含产业链多的行业等。策略分析师必须相貌英俊,行业分析师则必须练好唱歌,这些都是研究中的Knowhow,某种程度也是一种游戏规则,当然更大的游戏规则在商业本身,尤其是资本市场。证券分析师本质是在做销售工作而不是研究工作,原因一方面在于前文说的大部分人是做不出研究成果的,另一方面在于,这个世界大多时候比我们想想的虚幻,当大家都活在虚幻中的时候,真相便不再那么重要,大家只是在玩一个游戏而已,各方也只是在相互配合完成这个游戏。也正因为此,超额收益永远只属于少数人。这让我想起《寒战》里梁家辉的一句台词:“我服务香港警队30年,认识不少人,也得罪不少人。不过在这30年里,我学会了一件事,就是每一个机构,每一个部门,每一个岗位都有自己的游戏规则。明也好,暗也好,第一步学会它,不过好多人还没有走到这一步就已经死了,知道为何?自以为是。第二步,就是在这个游戏里面把线头找出来,学会如何不去犯规,懂得如何在线球里面玩,这样才能勉强保住性命。”但我今天不是在讲职业生涯规划,我是在讲研究,道理一样,任何事情,你都要搞清楚其背后的秘密,包括研究的规则,研究的方法,你都要理出来。但这又涉及到一个驱动力问题,我叫他市场机制。卖方研究有外部客户作为驱动力,这一点很重要,就像任何创业的成败,本质都源于是否存在巨大的外部需求推动,外部需求会推着你走,推着你成长并给你足够容错率,这就是市场机制。一级市场VC研究团队的驱动力来自哪里?来自内部投资经理和合伙人吗?我认为这个驱动力不够,优秀的人才是有强大的自我驱动力,但这种驱动需要建立在外部环境的催化下实现,也即大量需求和倒逼机制,这是一个关键话题,即对内服务的研究团队的驱动力来自哪里,相比外部市场的强大驱动,内部需求、领导评价等驱动会显得不足。注意,这并不涉及“自我内心满足”和“外部评价满足”的个体心理学差异,内部需求的评价对个体来说也是一种“外部评价”,该问题本质上涉及的是,对内服务的研究团队其所在机构能否源源不断产生强大需求推动研究团队成长,因此对内研究团队要是未做出什么成绩,原因可能是来自机构本身而非研究团队本身。但最后,心有多大,舞台就有多大。我们讲了这么多,事实上还没有真正开始涉及研究方法论,而更多是关于方法论的方法论。下面,我们开始正式探讨“研究方法论”。待续……
寻找‘位置感’“宏观研究的目标,不是愤世嫉俗,揭露经济的深层腐朽;也不是摇旗呐喊,安慰投资的短期情绪。像做实验一样对待宏观研究,规律是冰冷的存在,少一些IDEA,多一些数据。才能找到更为准确的位置感。”2018年的经济现象异常复杂,那么2019年宏观环境又会有什么样的峰回路转呢?本期《郭磊大师课:宏观研究方法详解》中,特邀嘉宾郭磊会给大家展示一直以来他自己总结出的宏观分析的框架和心法,也希望可以通过本期节目可以把这些年他在宏观江湖里默默坚守的专注和极致的研究风格与大家分享。祝大家可以在这个冬日,跳出宏观研究中的陷阱,耐心拆解一遍经济和市场逻辑,并最终落实到资产定价,以求让眼前的世界变得更冷峻和清晰。“段王爷”郭磊郭磊,证券分析师,广发证券首席宏观分析师,北京大学经济学博士。曾于《经济学动态》等专业期刊发表十余篇学术论文。12+年的证券分析师从业经验,让他获奖无数。2013金融界“慧眼识券商”策略多空榜第二名。2017年新财富宏观分析师第一名,水晶球奖宏观分析师第一名,中国证券分析师金牛奖第一名。他曾经调侃说卖方就像是掏枪打鸟的人,虽然各种动作都很标准, 但是因为隔得太远,所以都打不中。真正预测能做的事情都是对错相半的,那么作为宏观研究就要尽可能找到探寻真相的方法。大师课·《寻找“位置感”:宏观研究方法详解》限时优惠中!“我们做任何一个判断,比如股市要涨,房价要跌,他还爱你,俗称的“人生三大错觉”,都面临着既定的约束条件。宏观研究也是如此,在有条件成立的框架下进行。”—— 郭 磊 课程亮点为何说经验规律性重于逻辑?郭磊老师给出六个案例帮你解答!朱格拉周期的本质是什么?应当如何根据其变化调整路径;如何在当前形势下对资产定价?郭磊老师用“三步走”的逻辑推演告诉你!适宜人群如果您有投资的困惑与需求,却对资产配置的方向举棋不定;如果您是一个家族企业的掌门人,却发现自己企业的命运与国运息息相关; 如果您想系统了解去杠杆和全球化的经济格局,却无法穿透浩如烟海的信息迷雾…… 那么,《郭磊大师课:宏观研究方法详解》大师课就是为您量身定制的投资体系学习课程!
文|思博(富书专栏作者)人这辈子,心态会直接决定自己的命运,也会决定一个人的幸福和成败。物理学中,有个著名的杠杆原理:一块木板,在两端力的作用下,围绕一个支点转动。这块木板就是杠杆,它能否平衡,取决于支点是否固定。其实我们人这一生,也像杠杆一样。左边是昨天,右边是明天。那中间的支点是什么?心态。当心态稳了,人生杠杆就会平衡。当心态不稳,人生杠杆就会失衡。所以说,拥有积极心态的人,往往活得会更好。心态崩了,人生的杆杠就崩了国外有一项心理研究:一个人能否获得成功,85%是受他的心态影响。心态,是真会影响一个人的人生。心态好的人,哪怕遇到再大的困难,也会将勇往直前。反之,心态不好的人,一遇到小挫折,就容易自暴自弃,一蹶不振。我有位学生,两年前,考研失败后,就开始自怨自弃。后来去找了工作,一时没接到面试通知,又开始整天抱怨:“我怎么那么倒霉?做什么都不成?”“找工作真难啊!”“我真的太没用了!”····不管身边的人,怎么安慰和鼓励他,他始终在极力否定自己,觉得自己一无是处。时间久了,他甚至开始怀疑自己,觉得自己能力不行哪怕接到面试电话,他也会往坏处想:“我是二本学生,肯定不能录用。”“这是外企,我的英语一般,估计没戏了,哎!”“我没有工作经验,这份工作我可能做不好。”······他带着这种消极的心态,慌慌张张去面试。结果当天,就收到拒用通知:“很遗憾,我们招的这个岗位需要跟客户打交道,从面试上看,你缺乏自信心。”此后的一个月,他连吃饭都没心情了,天天把把自己关在房间里不出来。很显然,心态不好,是这位学生最大的绊脚石。不仅找工作时这样,工作后也是这样。他因缺乏积极心态,错过了单位的提拔,一次次成功的机会都跟他擦肩而过。他的经历,很像心理学上所说的悲观主义:凡事总是往坏的方面去想,在困难面前往往缺乏自信,同时会相信负向价值会对自己的人生带来非常严重的影响。心态消极,真会影响一个人的情绪,进而影响他各种表现的。所以,心态差的人,往往杠杆会晃动得更厉害,最终影响整个人生。心态稳了,人生的杆杠才会稳曾看过一句话:“有时,人与人之间很微小的差异,最终能造成了巨大差距。这种差异,就是所具备的心态,是积极的还是消极的,巨大的差异就是人生的成功和失败。”深有同感。同样的起点,同样的水平,有人成为最闪耀的一颗星,有人则永远躲在角落中偷偷流泪。有一项研究显示:针对40名高考状元进行调查,在紧张的高中备考阶段,只有10%的人经常会有负面情绪,而大部分状元只有偶尔出现或者几乎没有。在困难面前,有好心态的人,往往更能解决它。《破产姐妹》中的女主人公麦克斯和凯瑟琳,就是如此。凯瑟琳本来是富家女孩,却因为父亲的破产成为了一无所的人,只能寄住在素未谋面的麦克斯简陋的房子里。自此,两人也成为了美国社会的底层人员,她们为房租而努力,为三餐而拼搏。一开始,她们身上只剩下几美元,但是由于心态积极,遇到再大的困难,也依然是嘻嘻哈哈。努力打工,最后凑够了开蛋糕店的资金,圆了当老板的梦想。用心攒钱,终于凑够了凯瑟琳帮父亲打官司的高额律师费,可以帮父亲扬眉吐气。这一对好姐妹的经历告诉我们:生活以痛吻我,我却报之以歌。只要拥有乐观的心态,哪怕生活破产了,自己的梦想也不会破产。因为就算物质上再穷,但只要内心从容,精神上会十分富有,从而人生杠杆越来越稳。真正的高手,会用好心态撑起人生如果你正处于人生低谷,可以尝试用这4种方法,调整自己的心态。1、降低欲望值前段时间,一则“女孩查到考研成绩后,激动得狂笑不止。一边手舞足蹈,一边大喊:我数学考了80分”的新闻冲上微博热搜。网友们纷纷评论:“自己满意就行了。”“跟自己比较最重要。”“心态真好!”······而在这之前,今年的考研高分成绩一直刷屏全网:有人数学考了满分;有人英语90多分;还有人总分“471分”……跟这些“考研大神”相比,这个女孩的成绩不能算好,甚至是很一般。但是她不跟别人比较,只跟自己比较。2、积极暗示法前几天,看到一位学生发了一条朋友圈,他以出色的表现,在考研复试逆袭,最终被某985高校录取为研究生。让我们匪夷所思的是,就在上个月,这位学生正在准备硕士研究生的复试,由于备考的压力,宿舍的几位舍友都出现了不同程度的感冒,其中一位舍友还发起了高烧。但当时,他不断暗示自己:“不会感冒的。”“我身体好着呢。”“就算感冒了,我也不怕。”果然, 复试当天,他状态非常好,表现出色。一个能够时刻积极暗示自我的人,他内心的焦虑和恐慌会慢慢消失。这就是心理学上的积极暗示法:用积极的话去激励自己,让自己心中有阳光,充满正能量。3、懂得减压《解压全书:压力管理》提到:“慢性压力,长期持续的对身体、情绪和精神的压力。”这种压力可能来自各个地方,也许来自职场,也许来自家庭,也许来自友情。它会持续比较久的时间,对我们的身心是潜移默化的影响,长时间还会让我们的心态崩溃。这种情况下,最好的减压方法——转移自己的注意力。可以去看一场电影、去爬山或者去购物,不再将注意力放在压力上。当自己的慢性压力没有了,心态也会好了,离成功也就更近了。有哲学家说过:“你的心态,就是你的主人。”诚然如此。在生活这面镜子面前,如果我们多微笑,那生活也会对我们多微笑。人这辈子,心态会直接决定自己的命运,也会决定一个人的幸福和成败。愿我们在人生下半场:调整好心态,把好心情带回来!作者简介:思博,富书专栏作者,你身边最好的闺蜜,富书2018重磅推出新书《好好生活》。
机器之心发布作者:李渔样本少、分布不均衡,如何让训练的模型性能更优越?文本增强技术算得上一个不错的办法。本文介绍了熵简科技联合创始人李渔的一篇关于自然语言处理领域中文本增强技术的论文,重点探讨了近两年来常用的五类文本增强技术路径以及对应的代表性技术。目 录1 为什么要了解文本增强技术2. 典型技术方案2.1. 回译(Back translation)2.2. 随机词替换2.3. 非核心词替换2.4. 基于上下文信息的文本增强2.5. 基于语言生成模型的文本增强3. 新方向展望4. 在金融领域任务的实践164.1. 金融领域的 NLP 任务为什么需要文本增强技术4.2. 案例背景及实验条件4.2.1. 案例背景和数据集特点4.2.2. 算法模型4.3. 实验结果及分析4.3.1. 回译4.3.2. EDA4.3.3. 基于 TF-IDF 的文本增强4.3.4. 三类方法的对比4.3.4. 小结5. 总结参考文献摘 要文章系统性地回顾了自然语言处理领域中的文本增强技术在近几年的发展情况,重点列举和讨论了 18 年、19 年中人们常用的五类文本增强技术路径以及对应的代表性技术。接下来,文章以金融领域的自然语言处理任务入手,多维度地分析几类通用文本数据增强技术在实际业务问题上的重要价值。文章的结论是,文本增强技术是一类低成本的数据杠杆,可以在不引入新数据下,有效撬动模型性能。1 为什么要了解文本增强技术本文摘自熵简科技 NLP 团队的内部技术沙龙,文章系统性地回顾了自然语言处理领域中的文本增强技术在近几年的发展情况,重点列举和讨论了 18 年、19 年中人们常用的五类文本增强技术路径以及对应的代表性技术,希望对于大家的日常研究工作有所启发。在第 4 节中,我们以金融资管领域的实际应用场景入手,多维度地分析了几类通用的文本数据增强技术在实际产品研发中的作用。在开始介绍具体方法之前,先简单列举一下目前自然语言处理任务中运用文本增强技术的常见场景:(1) 少样本场景在少样本场景下,能够搜集到的样本数目不满足模型训练的需求,导致模型处于欠拟合的状态。自然而然,在现有数据基础上,运用文本增强技术来扩充样本集,是一件又快又省,性价比很高的事。很多研究也已经表明,这种方法可以明显提高模型的性能 [1-3];(2) 分类任务中样本分布不均衡的场景除了一些基准 benchmark,真实场景中大部分文本分类任务中的各类别样本数目都是不均衡的,很多时候样本数最多类别的数目可能比最少的类别高两个数量级。这会带来很多问题,比如模型对于小样本类别往往处于欠拟合状态,在实际预测时,几乎不会对这一类别给予太高的概率。自然,面对这样的问题,一种常见的处理方式是针对小样本类别,运用数据增强技术进行样本扩充,从而降低样本间的不均衡性,提高模型的泛化能力。这种方法也在实际中被多次证明了其有效性 [2,4];当然,对于样本不均衡问题,已经有很多解决方法,大家可以参考这篇 google 引用数快 1 万的论文 [5] 及其引文。(3) 半监督训练场景至少从 19 年 NLP 方向 google 出品的半监督学习算法 UDA 可以看出 [6],文本数据增强技术可以用在无标签样本上,以构造出半监督训练所需的样本对,以此让模型从无标签的数据中获取到优化所需的梯度。关于半监督学习的具体进展,后面如果有时间,可以单开一篇文章介绍。(4) 提高模型的鲁棒性数据增强技术在不严谨的情况下可以分为两类,一类是在保持语义不变的情况下,变换文本的表达形式,例如接下来提到的回译、文本复述等;另一类是,按照某种策略对原文进行局部调整,例如后面提到同义词替换,随机删除等等。不论是哪种方法,都可以认为是提高了模型的鲁棒性,使得模型更关注文本的语义信息,并对文本的局部噪声不再敏感。举个例子,「文本数据强增技术帮助可以模型对于噪声局部不再感敏」,如果你依然能够看明白这句话的意思,说明你对于文本局部噪声也是不敏感的。基于这种考虑,无论是少样本场景还是大语料场景,文本增强技术都有助于提高模型的鲁棒性,提高其泛化能力。关于这一点,深度学习领域著名的花书 [7] 的 7.4 节表达了类似的观点。从上面的介绍可以看出来,文本数据增强技术在自然语言处理中属于基础性技术,具有广阔的应用场景,因此有必要对其进行系统性的讨论。2. 典型技术方案2.1. 回译(Back translation)得益于近几年文本翻译领域的显著进展、各种先进翻译模型的开源(包括百度、google 等翻译工具的接口开放),基于回译(back translation)方法的文本数据增强成为了质量高又几乎无技术门槛的通用文本增强技术。回译方法的基本流程很简单,利用翻译模型将语种 1 的原始文本翻译为语种 2 的文本表达,基于语种 2 的表达再翻译为语种 3 的文本表达,最后再直接从语种 3 的形式翻译回语种 1 的文本表达,此文本即是原始文本增强后的文本。当然,很多时候只采用一种中间语种也可以实现很好的增强效果。我们利用 google 翻译举个例子:原始文本为:文本数据增强技术在自然语言处理中属于基础性技术;翻译为日语:テキストデータ拡張技術は、自然言語処理の基本的な技術です;日语再翻译为英语:Text data extension technology is a basic technology of natural language processing;英语再翻译回中文:文本数据扩展技术是自然语言处理的基本技术;可以看出来,由于 google 翻译足够优秀,增强前后的文本在语义上基本保持一致。因此,对于回译这一增强技术,翻译模型的好坏决定了数据增强的最终效果。其中还有一些细节值得说一下:第一,如果采用翻译模型,可以采用 random sample 或 beam search 等策略实现成倍数的数据扩充。如果采用 google 等翻译工具,通过更换中间语种,也可以实现 N 倍的数据扩充。第二,目前翻译模型对长文本输入的支持较弱,因此在实际中,一般会将文本按照「。」等标点符号拆分为一条条句子,然后分别进行回译操作,最后再组装为新的文本。说了这么多,我们看一下回译技术在近几年研究报道中的实际应用情况。据我们所知,早期人们主要将回译技术用于神经网络翻译模型(NMT)的性能提升 [8,9],通过回译可以将单语语料(monolingual data)构造成双语语料,从而帮助模型提升性能。实验证明,回译可以帮助 NMT 模型带来平均 1.7 BLEU 的性能提升,帮助 facebook 的团队在 WMT'14 English-German 测试集上实现了当时的 SOTA 性能,更多的细节大家可以移步文献 [9],里面有详细讨论。到了 2018 年,CMU 和 google brain 的团队将回译技术独立出来作为一个专门的数据增强技术用来优化问答模型的性能 [10]。他们同时训练了两个 NMT 模型,分别是 English to French 和 French to English,用来实现回译,如下图所示:最终的实验证明,回译技术帮助他们的模型带了至少一个百分点的性能提升,如下图红框所示。我们知道,对于问答系统而言,能够有一个百分点的提升,也是很不错的工作。同时,他们详细研究了不同增强倍数以及不同采样比例下,回译对于模型提升的大小,如下图所示:对比图中的两个红框部分,研究人员发现,在最佳情况下,回译带来的性能提升与在模型中加入 self-attention 组件带来的提升几乎相当。这似乎表明,挖掘数据多维度的信息和优化模型架构具有同等的重要性。时间到了 2019 年下半年,google 团队提出了一种可用于 NLP 任务的半监督学习算法(UDA)[6],前面已经提到过了。这篇文章本身并不复杂,主要是实验证明了 回译 等文本增强技术可以用于半监督学习,而且结果看起来很惊人,他们仅用了 20 条样本作为标签数据,就在 IMDb 数据集上实现了接近 SOTA 的性能。当然,我们觉得这里面至少有一半的原因是算法采用的 BERT 模型原本就已经在大规模预料上学习过。关于 UDA 更具体的分析,感兴趣的同学可以移步文献 [6],这里就不再详细展开。最后,再从机器学习本身来讨论一下回译技术:第一,回译技术的有效性本质上来源于迁移学习。通过文本增强的过程,回译技术将翻译模型学到的关于词义、语法、句法等知识转移到了新生成的样本上,从而为当前的自然语言处理任务引入了新的信息和知识来源;第二,回译技术产生的新样本如果有益,隐含着这样一个先验,即模型对于具有不同语言表达形式但同样语义的输入文本,应该具有不变性,或者应该具有相近的输出。那么,是否所有的 NLP 任务都具备这样的先验假设呢?2.2. 随机词替换此处所谓的基于随机词替换的数据增强方法是对一类文本数据增强方法的统称,其基本方法类似于图像增强技术中的随机裁剪、图像缩放,通常是随机地选择文本中一定比例的词,并对这些词进行同义词替换、删除等简单操作,不像回译等模型,需要外部预训练好的模型的辅助。19 年有研究团队提出了一种称为 EDA (Easy data augmentation) 的文本增强方法 [11],该方法可以认为是这一类方法的集大成者。EDA 主要包含四种操作:同义词替换、随机插入、随机交换和随机删除。详细说明如下:(1) 同义词替换 (SR):从句子中随机选择非停止词。用随机选择的同义词替换这些单词;(2) 随机插入 (RI):随机的找出句中某个不属于停用词集的词,并求出其随机的同义词,将该同义词插入句子的一个随机位置。重复 n 次;(3) 随机交换 (Random Swap, RS):随机的选择句中两个单词并交换它们的位置。重复 n 次;(4) 随机删除 (RD):以概率 p 随机删除句子中每个单词。下面列举了以上四类操作的例子:原始文本:今天天气很好。同义词替换 (SR):今天天气不错。(好 替换为 不错)随机插入 (RI):今天不错天气很好。(插入 不错)随机交换 (RS):今天很好天气。(很好 和 天气交换位置)随机删除 (RD):今天天气好。(删除 很)对于这种方法,最大的一个疑问是,经过 EDA 操作之后,文本的类别标签(label)是否还能保持不变,毕竟这是对文本进行随机操作。研究人员对于这个问题专门进行了实验分析。首先,他们仅用原始训练集 (未经过数据增强) 训练了一个分类模型,这里姑且称之为「模型 A」。接下来,利用 EDA 方法对测试集进行了数据拓展。最后,将原有的测试集和拓展出的语料输入到模型 A 中,并对模型在最后线性层的输出进行了比较。他们发现原有测试集和拓展出的语料,在高维空间中,距离很小。二者经过 t-SNE 算法降维之后的结果对比,如下图所示:从上面的分析可以看出来,经过 EDA 变换之后,原始数据集一方面在原有基础上扩展吸收了很多噪声,扩大了数据量,同时还保持了原有的标签,因而有效的扩大了原始样本集的信息容量。接下来,我们看一下 EDA 技术应用到实际问题中的效果怎么样。研究人员在五项公开的文本分类数据集中进行实验测试,为了更充分地对比,实验中分别采用了卷积神经网络(CNN)和循环神经网络(RNN)作为分类模型,最终在五项任务中的平均表现如下表所示 [2.2.1]:从上表的结果中,我们至少可以得出两个结论:第一:EDA 技术可以有效提到模型的泛化能力,降低泛化误差,即使在完整数据集下,EDA 技术也可以带来平均 0.8 个百分点的提升;第二:数据集越小,EDA 技术对模型带来的提升越明显。当样本数量只有 500 时,EDA 技术可以带来平均 三个 百分点的提升。因此,很适合用在少样本的场景。值得注意的是,在 EDA 技术的帮助,数据量规模仅有原数据集的 50% 时,模型性能已经超过了不使用 EDA 时在 100% 数据上的表现。此外,在 19 年 11 月由 IBM 研究团队发表的一项新的文本增强技术的研究中 [2],也对 EDA 技术进行了对照实验:其中,LAMBADA 技术为 IBM 研究团队所提出的文本增强方法,将本文的后面部分做详细介绍。从表中可以看出,EDA 方法在多数训练集中的表现仅次于 IBM 最新研究成果 LAMBADA,这再次验证了 EDA 方法的简单有效。关于 EDA 技术,另一个需要重点关注的问题是,在运用 EDA 技术,如何设置替换比例 和 增强的文本倍数,比如 2000 条语句应对多少数据进行随机删除,增加等。原文给出的建议比例如下 [11]:其中,α是替换删除等的比例,比如同义词替换中,替换的单词数 n=αL,L 是句子长度,随机插入、随机替换类似;Naug 是使用 EDA 方法从每一个句子拓展出的句子数量。综上,我们可以知道,采用 EDA 文本增强技术进行模型性能的提升,简单而有效,尤其是在小样本场景下。2.3. 非核心词替换在上文的 EDA 技术中,对于要替换的词是随机选择的,因此一种直观感受是,如果一些重要词被替换了,那么增强后文本的质量会大打折扣。这一部分介绍的方法,则是为了尽量避免这一问题,所实现的词替换技术,姑且称之为「基于非核心词替换的数据增强技术」。我们最早是 google 提出 UDA 算法的那篇论文中发现的这一技术 [6],是否在更早的文献中出现过,我们没有再深究了,有了解的同学请留言告知。整个技术的核心点也比较简单,用词典中不重要的词去替换文本中一定比例的不重要词,从而产生新的文本。我们知道在信息检索中,一般会用 TF-IDF 值来衡量一个词对于一段文本的重要性,下面简单介绍一下 TF-IDF 的定义:TF(词频)即一个词在文中出现的次数,统计出来就是词频 TF,显而易见,一个词在文章中出现很多次,那么这个词可能有着很大的作用,但如果这个词又经常出现在其他文档中,如「的」、「我」,那么其重要性就要大打折扣,后者就是用 IDF 来表征。IDF(逆文档频率),一个重要性调整系数,衡量一个词是不是常见词。如果某个词比较少见,但是它在这篇文章中多次出现,那么它很可能就反映了这篇文章的特性,正是我们所需要的关键词。TF-IDF = TF×IDF,通过此公式可以有效衡量一个词对于一段文本的重要性。当我们知道一个词对于一个文本的重要性之后,再采用与 TF-IDF 负相关的概率去采样文中的词,用来决定是否要替换,这样可以有效避免将文本中的一些关键词进行错误替换或删除。UDA 论文中所提出的具体实现方式如下:提出这一方法的原始论文并没有单独对这一方法进行对照实验,而是与 回译 技术一起来共同实现文本的增强,我们可以看一下综合的效果。论文在六个不同的数据集进行了实验:实验中,采用了四种不同的模型进行对照实验,分别是权重随机化的 Transformer 结构,BERT-base,BERT-large 以及在领域内微调过的 BERT-large,表中的数值是在测试集上的误差。从表中可知,在经过 非核心词替换 以及 回译 的文本增强之后,模型在实验各个数据集中基本都取得较大提高。上图展示了不同含标签数据量下,模型利用 UDA 算法框架和两种数据增强方法可以实现的最佳性能。关于文本增强技术,从图中可以间接验证一个重要判断:无论在少样本下还是大样本场景,文本增强技术的运用可以帮助模型在原始样本集的基础上进一步提高性能。遗憾地是,论文没有对基于 TF-IDF 替换的文本增强技术的效果进行单独研究,或许团队内部实验过,但没有放在论文中。本文的姊妹篇 文本增强技术在金融领域的应用实践,单独对这一技术的效果进行了对照实验,感兴趣的同学可以参考。最后再针对 UDA 这篇论文所涉及的文本增强技术讨论两点:第一,在 UDA 的这篇研究中,研究人员仅仅用到了词替换的操作,并没有将 EDA 中其他三项操作加入进来,如删除、交换位置等等,这可以作为后续的研究方向之一。第二,相对于 UDA 技术,这一技术额外的操作是引入了 TF-IDF 来衡量一个词对于一个句子的重要性,本质上可以认为是在 EDA 的基础上引入了强的先验知识,再根据确定好的关键词替换同义词,避免无用数据和错误数据的产生。2.4. 基于上下文信息的文本增强基于上下文信息的文本增强技术在原理上也很直观:首先需要一个训练好的语言模型(LM),对于需要增强的原始文本,随机去掉文中的一个词或字(这取决于语言模型支持字还是词)。接下来,将文本的剩余部分输入语言模型,选择语言模型所预测的 top k 个词去替换原文中被去掉的词,以形成 k 条新的文本。这里列举两个近两年的代表工作。一个是日本 Preferred Networks 公司在 2018 年提出的基于双向 LM 的上下文文本增强技术 [12]。整个框架如下:相对于一般的双向 LM,在这个方案中,为了保证文本变换之后的标签不变(例如对于表示情感极性的文本,变换之后不会从积极变为消极),研究人员在 LM 隐层中加入了文本的标签信息,从而保证产生的文本与原始本文具有相同的标签属性。研究人员在五个分类任务中测试了这个方法的效果,结果如下:从上图可以看出,本文提出的方法相对于同义词替换的方法,能够带来 0.5 左右的提升。但是,针对是否应该加入标签信息这个问题。从实验中可以看出,加入标签信息之后带来了约 0.2 个百分点的泛化误差的降低,这个差值基本在泛化误差的波动范围之内,因此是否有明显效果是存疑的。另一篇研究报道来自于国内的中科院 [13],是 19 年发表的成果。整体的思路与上面的方案类似,主要的区别是将双向 LM 替换为了 BERT,并同样对 BERT 进行了微调,引入了原始文本的标签信息,以保证新产生的样本具有与原始样本相同的标签属性。实验结果如下:从实验中至少看出两点:第一点,基于 BERT 的上下文增强技术可以带来明显的模型性能提升,平均能够提高接近两个百分点,这还是很吸引人的。第二点,将原始原始文本的标签信息带入 BERT(w/C-BERT)相对于不带入的情况(w/BERT)确实能够带来较为显著的模型增益。由于 BERT 模型已经开源,大家在平常工作和研究中也用的很多,因此从实用价值来说,这篇文章相对于前一篇文章 [12] 的参考意义更大一些。从上面的实验可以看出,即使不对 BERT 做任何改造,直接套用过来,也可以带来至少 1 个百分点的模型性能提升。2.5. 基于语言生成模型的文本增强利用语言生成模型进行文本增强是一大类方法,已经报道了多种实现方式 [14-16],19 年之前的研究工作一般是针对特定任务在 RNN 架构基础上衍生出的文本增强技术。直到 19 年前后,GPT 和 GPT-2 模型横空出世,在文本生成任务上的效果极其惊人,以至于 OpenAI 当时不敢放出 GPT-2 完整版的模型参数。关于 GPT 模型的详细介绍,大家可以参考 OpenAI 的相关文献 [17,18]。至于中文相关的资料,大家可以参考张俊林老师在知乎上的文章:https://zhuanlan.hu.com/p/56865533。本文就不再做详细介绍。GPT 作为一个在海量语料上预训练过的通用语言生成模型,人们自然会想到拿它来实现文本增强相关的工作。前面已经提到,IBM 的研究团队在 19 年 11 月提出了一种基于 GPT 架构的文本增强技术,他们称之为 LAMBDA (language-model-based data augmentation)[2]。具体方法如下:LAMBADA 首先在大量文本上进行了预训练,使模型能够捕获语言的结构,从而能产生连贯的句子。然后在不同任务的少量数据集上对模型进行微调,并使用微调后的模型生成新的句子。最后在相同的小型数据集上训练分类器,并进行过滤,保证现有的小型数据集和新生成数据集有相近的分布。为了充分验证 LAMBADA 技术的性能,研究人员进行了两大类实验。实验一:将 LAMBADA 技术运用在了三种不同数据集上,并采用三种不同的模型架构(BERT、LSTM、SVM)进行对照实验,结果如下:其中,Baseline 指的是仅采用原始数据集进行训练时的模型。从表中可以看出,LAMBADA 技术相对于 baseline 在三种数据集下都可以带来性能提升。尤其是对于 ATIS 数据集,相对 baseline 的性能提升超过了 50%,原论文中给出的说法是,ATIS 数据具有明显的分布不均衡性,而 LAMBADA 技术可以有效弥补原数据集的不均衡性。实验二:将 LAMBADA 技术与当前其他主流的数据增强技术进行了比较(竟然没有比较 回译):其中,EDA 和 CBERT 在前文中都已经做了详细介绍。从图中可以看出,LAMBADA 技术的优势还是很明显的。如果采用 BERT 作为模型架构,那么相对于其他文本增强算法,至少可以提升 1.2 个百分点;在 ATIS 数据集上,更是比第二名提高了 13 个百分点。同样地,在 SVM 和 LSTM 上,除了个别数据及上的表现略差于 EDA,LAMBADA 技术仍然是一枝独秀。其实很好奇,如果将 回译 技术也纳入比较会是什么样的情况。总而言之,至少从论文中的实验来看,LAMBADA 技术可以视为当前最优秀的文本增强技术之一。LAMBADA 技术后续还有很多可以挖掘的地方,比如与前面提到的 UDA 框架结合,用实现少样本下的半监督学习。或者像论文原作者提到的那样,未来他们将尝试将此技术用于 zero-shot learning。3. 新方向展望(1)文本风格迁移在 CV 领域,图像风格迁移在前两年研究较多,相信大家也体验过在手机 app 上,一键将普通照片转换为梵高风格的画。对于人眼来说,变换前后的照片虽然风格变化很大,但是上面的人物或动物实体仍然是可以识别出来的。换言之,风格迁移也可以看作是一次图像数据增强(augmentation)。沿着这个思路,如果在 NLP 领域也有成熟且通用的语言风格迁移算法,那么自然也可以用来做文本数据增强。其实,回译 就有一点文本风格迁移的意思,但是属于风格不可控的文本转换。在这方面,近两年已经有一些代表工作,但目前还有看到把相关算法用于文本数据增强的研究报道,感兴趣的同学可以详细参考文献 [19,20]。4. 在金融领域任务的实践文章到这里,其实还有留下两个问题:第一,我们团队为什么会如此关注文本增强技术,它在具体业务场景中真的能发挥作用吗?第二,文中提到的几类技术虽然在公开测评集上表现很好,那么在实际业务中的表现如何?特别地,目前没有看到有公开的研究报道对于文中部分技术进行单独实验。自然,我们会好奇这些技术在单独运用时,到底效果怎么样。本小节接下来部分,尝试对这两个问题进行回答。4.1. 金融领域的 NLP 任务为什么需要文本增强技术先回答第一个问题。我们团队之所以如此关注文本增强技术,这与我们日常面临的业务需求紧密相关。我们团队一直致力于将 NLP 和深度学习领域内最新的思想、最成熟的技术真正落地于金融资管领域,让科技赋能产业,因此主要面对的任务特征与金融资管领域的数据特点息息相关。在面对金融资管领域的数据分析任务时,面临的问题常常具备两类特点:第一,大量及时有效的信息分布在非结构化的文本数据中,如研报、新闻资讯、twitter 等社交媒体中,需要 NLP 等技术从中高效准确地挖掘出结构化信息。上图的数据来自 IDC,说明了近几年全球新增的数据中,有 80% 的数据都是非结构化数据(除文本外,还包含图片和语音等数据)。因此,金融业机构需要高精度、高鲁棒性和高效率的 NLP 技术。其中,算法的高精度、高鲁棒性是两项最重要的指标。第二,很多与金融领域内特定任务相关的应用场景常常面临着少样本的困境。这体现在两方面:一方面,可搜集的数据量少,数据搜集的时间成本很高,尤其在从 0 到 1 的立项初期。曾经在某个项目上,我们用了三周时间才搜集到 1000 多条有效样本。另一方面,数据的人工标注成本很高。大家都知道,NLP 属于认知层面的技术,数据标注的难度和不确定性本来就比图像识别要高。而对于金融领域的问题,还需要业务人员甚至金融分析师的参与才能实现相对准确的数据标注,满足业务需求。这又进一步增大了数据标注成本。因此,不论是为了提高模型的准确性和鲁棒性,还是为了在少样本场景下尽可能有效地利用数据,我们都希望能够充分运用文本增强技术这个低成本的数据杠杆,在有限条件下尽可能撬动模型的性能。关于第二个问题,这也是我们之前深入探索这一技术时的疑问。在本文的接下来部分,我们以金融资管领域的一类典型的文本处理任务为案例,以对照实验的方式详细地讨论和展示,文本增强技术在具体产品开发时的重要作用。4.2. 案例背景及实验条件4.2.1. 案例背景和数据集特点此案例由前面提到的少样本场景下的某个金融舆情项目抽象出来。其任务目标是,针对金融舆情类的短文本进行所属行业分类,项目中以中信一级行业分类作为分类基准,包括餐饮旅游、商贸零售、煤炭、纺织服装、农林牧渔、建筑、石油石化、家电、通信、计算机等 29 个行业类别。这里展示了几条原始样本,我们可以直观感受一下数据(数据中的数值类指标为虚构数):原始数据:【xxx 月报】特点:(1)紧跟物业市场动向,观测各地政策变化;(2)补充公告内容,跟踪项目中标和收并购。行业:「物业服务」入产业结构鼓励类目,中消协发布调查报告。行业类别:房地产原始数据:公司有望成为「慢病管理+血糖监测+药物治疗」三位一体的糖尿病管理大平台企业。维持预测 2001-2002 年 EPS 为 0.2/0.34/0.21 元,同比增长 11/11/11%,现价对应 01~21 年 PE 为 10/10/10 倍,维持「增持」评级。行业类别:医药原始数据:公司实现飞机起降架次 6 万次,同比增长 4.8%,旅客吞吐量 800 万人次,同比增长 4.5%,货邮吞吐量 32.2 万吨,同比增长 0.8%。行业类别:交通运输在项目初期,我们共搜集和标注的有效数据约为 1900 条。为了充分测试和准确验证算法的性能,在维持各类别数据相对均衡的情况下,我们将数据集随机分为了训练集和测试集。其中,训练集共包含 900 条样本,用于模型的训练。测试集包含约 1000 条数据,仅用来测试模型的泛化误差,不参与模型的训练。4.2.2. 算法模型在实际产品中,一般会采用多模型集成以及人工规则等多种方法的结合,以尽可能提高模型的泛化能力。在本文中,为了突出实验重点,我们采用 TextCNN 网络作为行业分类器 [21],其网络架构如下图所示:这里对于 TextCNN 网络简单做一下介绍,对于此模型熟悉的同学可以直接跳过此部分。如上图所述,TextCNN 网络由基于 word2vec 技术的词向量层 (Word embedding block)、基于 TextCNN 架构的卷积神经网络层(Multi-CNN block)共同构成。TextCNN 架构由美国纽约大学的 Kim 教授提出 [21],该架构的两类基本操作分别是卷积运算和池化运算:卷积运算本质上是局部区域的加权运算,应用在本模型中可以有效提取文本的局部特征及局部语序信息。通过不同长度卷积核的组合,还可以同时提到取文本中不同距离上的特征信息。池化运算一方面可以实现降维功能,并保证输出向量的长度不受文本长度变化的影响,另一方面池化操作还可以保证平移不变性,从而使得文本的关键特征不受到位置的影响。得益于这两大优势,同时 CNN 网络天然支持并行运算,具备无可比拟的计算效率优势,因此本模型采用 CNN 网络作为文本信息特征提取层。值得一提的是,基于工程实践经验以及公开研究结果来看 [22, 23],卷积神经网络在自然语言处理任务中具备独特的优势,受到很多大厂的青睐。本模型的训练样本包含两个部分:词向量层的语料训练样本:由各门户网站的新闻语料、各机构发布的研报、百度百科等文本构成的数亿规模的语料;整体模型的训练样本:包含上述的训练集中的 900 条语料、利用数据增强技术对 900 条原始语料扩充之后获得的语料;4.3. 实验结果及分析本文接下来部分,分别将 回译、EDA 和 基于 TF-IDF 的词替换 这三种数据增强技术运用在上述案例上,验证三类方法是否有效。4.3.1. 回译在回译的具体实现方案上,我们先后尝试了两种方案:方案一:利用开源的 中-英、英-中 两个翻译模型实现回译变换,在输出选择时,我们同时尝试了随机采样和 beam search 两种方式,以实现多倍数的文本增强;方案二:利用 google 翻译,选用多个中间语种做过渡,以同样实现多倍数的文本增强。如,中-日-英-中,中-法-德-中 等。实验中我们发现,虽然方案一所增强文本的语言丰富度更高,但是方案二所增强的文本在语义准确度和连贯性上更好,因此最终采用方案二。原始文本与增强后的文本举例如下:原始文本:公司有望成为「慢病管理+血糖监测+药物治疗」三位一体的糖尿病管理大平台企业。维持预测 2001-2002 年 EPS 为 0.2/0.34/0.21 元,同比增长 11/11/11%,现价对应 01~21 年 PE 为 10/10/10 倍,维持「增持」评级。增强后文本:该公司有望成为具有「慢病管理+血糖监测+药物治疗」的三位一体糖尿病管理平台公司。维持预测,2001 年至 2002 年每股收益为 0.2 / 0.34 / 0.21 元,比上年增长 11/11/11%。当前价格是对应于 01-21 PE 的 10/10/10 倍,维持「增持」评级。在实验参数的选择上,我们重点对于数据集规模、数据增强倍数这两个参数进行了详细的对照实验。整体的实验步骤可概括如下:步骤一:对训练集中的 900 条样本,运用 回译 技术进行文本增强操作,共增强 4 倍(因此利用了 4 种不同的中间语种);步骤二:从原始训练集的 900 条样本中随机取 20%、40%、60%、80% 和 100 % 比例的数据,然后混合进对应的增强后数据(包括 0 倍,即不做增强),在不同混合倍数下进行模型训练,并记录最优实验结果;步骤三:重复步骤二的实验三次,以三次实验的平均值作为最终结果。最终的实验结果如下:从上表的结果来看,我们至少可以得出以下几个结论:第一,从整体来看,无论是在小规模数据下(20% 比例的数据对应约 180 条训练样本)还是在完整训练集下(约 900 条训练样本),回译技术都可以给模型带来 8~25 个百分点的提升。这个提升有时可以带来质的变化。例如,在比例为 60% 的实验中,无扩充下的模型 F1 值为 0.823,这很难应用在金融领域的产品上。而运用文本增强技术之后,模型可以达到 0.921,这个表现已经接近灰度发布的标准了。第二,对比不同倍数下的模型表现可以发现,相对于无扩充时 baseline 的表现,1 倍扩充时给模型带来的新增提升是最显著的,之后新增的倍数带来的模型增益逐渐递减,但即使采用 4 倍增强时,模型的性能依然略有提升。考虑到回译的实现方式(参看方案二),这可能得益于不同语种之间对于同一语义表达的多样性。第三,对比不同数据规模下回译带来的模型提升,我们可以发现,随着数据规模增强,回译给 baseline 带来的提升绝对值在逐渐降低,这也验证了前一篇文章中的结论。即,小样本场景下,文本增强技术给模型带来的提升会更加显著。第四,从结果来看,在采用完全数据集下,在不引入额外数据的情况下,回译技术帮助模型表现从 0.91 提升到了 0.95,这也充分说明了回译是一种低成本的数据杠杆。值得一提的是,回译技术确实帮助模型在原有数据集上有效地提升了能力,但 embedding 层发挥的作用也不可能忽略。此模型用到的 embedding 层在海量通用语料和领域内语料上预训练过,其词典收录了 20 万个词。对于金融领域内的重点词,已经有很好的先验表示。4.3.2. EDA在 EDA 增强方案中,我们尝试了五种操作,分别是同义词替换,随机插入,随机交换,随机删除和句子位置随机替换。其中,句子位置随机替换在原始的 EDA 技术中并不包含,而是我们在本实验中新加入的一种增强方式。本质上,我们是在表达这样一种先验信念,即对于所处理的金融舆情短文本,其句子出现的先后顺序并不影响其所属的行业。关于实现中的几个重要细节:第一,所操作的词语数,比如每句话同义词替换个数,随机交换个数等按照公式 n=αL,L 是句子长度,α是替换删除等的比例,经过试验发现 0.1 到 0.2 之间效果最佳。第二,同义词替换所用的同义词:采用 word2vec 方法在公开的新闻语料训练的词向量,找出与被替换文本最相似的词语。第三,五种方法独立使用,也即,对于每一条扩充的样本,只使用了一种增强操作。更花式的组合,大家可以自己尝试。原始文本与增强后的文本举例如下:原始数据:【周报(12.02-12.08)】:拼多多上线火车票业务,海南离岛购物免税新政三周年销售近 200 亿。(行业类别:餐饮旅游)同义词替换:【周报(12.02 亿 12.08,】:拼多多上线火车票业务)海南离岛购物免税新政三周年销售近 200 亿。随机插入:【周报(12.02</s>-12.08)】:拼革新多多上线火车票业务,海南离岛购物免税新政三周年销售近 200 亿。随机交换:【服务 200(12.02 近 12.08)】:拼多多上线火车票业务,海南离岛购物免税新政三周年销售-周报亿。随机删除:【周报(12.02-12.08)】:拼多多上线火车票,海南离岛购物免税新政三周年销售近 200。随即交换句子位置:海南离岛购物免税新政三周年销售近 200 亿,【周报(12.02-12.08)】:拼多多上线火车票业务。再次说明,上述文本中的数值为虚构数值,无任何参考意义。直观来看,经过五项操作之后,新扩充出文本与原始样本的行业类别仍然保持一致。在实验参数的选择上,与回译类似,我们同样对于数据集规模、数据增强倍数这两个参数进行了详细的实验,步骤可概括如下:步骤一:对训练集中的 900 条样本,运用 五种 EDA 技术进行文本增强操作,每中操作进行 2 倍,3 倍,4 倍扩充,即每条样本对应扩充 10 倍,15 倍,20 倍;步骤二、三:与回译实验相同;实验结果如下:从表中的结果,EDA 技术给模型带来的提升整体与回译技术类似:第一,无论是在仅有 180 条样本的场景下,还是在完整数据集下,EDA 的运用可以给模型带来 2~30 个百分点不等的提升,数量越小,相对于 baseline 的提升越明显;第二,运用 EDA 技术时,较好的增强倍数在 3 倍左右,数据量小时,可适当选择更大的增强倍数;第三,从表中可以看出,数据集仅为 60% 时,采用 EDA 进行 2 倍扩充时,模型的表现就已经超过了在完全数据集下不用 EDA 技术的模型,这也充分说明了 EDA 的杠杆作用。同时,这一现象,也在 EDA 的原始论文中提到过 [4];4.3.3. 基于 TF-IDF 的文本增强在基于 TF-IDF 增强方案中,主要思想是基于 TF-IDF 值评估原始样本中各个词对于文本的重要性,在此基础上,用词典中的非核心词替换掉文中不重要词,以重新生成一段文本。在构建候选词的字典时,由于原始预料数量较少,我们搜集整理了 4 万多篇研究报告,尽量保证每个行业的报告数目不少于 1000 篇。同时,考虑到研报第一页的内容在分布上与原始预料的分布最为相似,因此我们以这 4 万多篇研报的第一页来构建字典,并统计相应的词频和 IDF 值,用来统计字典中各词的被替换概率。下面给出一些原始文本与增强之后文本的对比:原始样本 1:锦江酒店调研纪要,经济型酒店相比中高端酒店各指标下滑多一点,入住率、单价均有下滑,幅度较之前差不多。近期中端酒店同店 revpar 数据是持平,整体受新开店影响略有下降。增强后样本 (扩充系数 p=0.1):齐格勒酒店调研纪要,经济型酒店相比中探访酒店各细目下滑多一点专攻入住率、单价均有下滑,幅度较之前差不多。近期中端酒店同店 revpar 数据是持平,整体受新开店略有下降。增强后样本 (扩充系数 p=0.3):201912 锦江酒店每位纪要,经济型酒店相比中高端酒店各指标下滑多一点,入住率陶冶华有下滑,幅度较之前差不多。近期中端酒店同店 revpar 诺思是于长,整体受新町村蓝黛略有下降。原始样本 2:大秦铁路点评:电煤需求回升或受港口卸车影响,8 月运量同比 2%。新闻/公告。大秦铁路公布 9 月份运营数据,公司核心资产大秦线 9 月份完成货物运输量。增强后样本 (扩充系数 p=0.1):大秦铁路点评:电煤需求回升或受港口卸车影响,8 月运量同比 2%。新闻/公告:大秦铁路公布 9 月份运营马勒,公司核心资产大秦线 9 月份完成货物运输。增强后样本 (扩充系数 p=0.3):大秦铁路助益:项下不断回升或西递专属卸车影响,8 月运量同比 2%。偿债/公告。大秦铁路形制 10 月份运营数据,滑石封航 cerner 大秦线 9 月份完成招聘。在实验参数的选择上,我们重点对于数据集规模、数据增强倍数以及扩充比例这三个参数进行了实验。步骤可概括如下:步骤一:将数据集按照之前的比例划分为 训练集 和 测试集,并对训练集进行文本增强操作,替换比例分别为 5%,10%,15%,20%,25%,30%;步骤二、三:与回译实验相同;实验结果如下,遵循简明扼要、突出矛盾的特点,这里只展示了替换比例为 10% 和 30% 的情况:从表中的结果可以得出以下结论:第一,本方法与 EDA 技术给模型带来的提升类似,即无论是在少样本还是在完整数据集下,本方法都可以给模型带来 3~30 个百分点的提升,样本越少,效果越明显。第二,对比不同替换比例下的实验结果,p=0.1 的替换比例一般会优于 p=0.3 的情况,尤其在小样本下,这种差别会更加明显。这是由于在 30% 的比例下,文本引入了更多的噪声。但是,二者的差距很多时候都在 1 个百分点以内,这说明在这类任务下,模型对于噪声的容忍度是很高的。这反过来可以启发我们更好地设计和优化模型。4.3.4. 三类方法的对比为了更全面地了解三类方法的特点,我们选取了其中最有代表性的部分实验数据进行了对比:对比表中的三类方法,初步可以得出以下结论:第一,三种方法都可以有效帮助模型提升性能。在全数据集下,只要保证充足的增强倍数,三类方法对于模型的提升基本相当。第二,整体而言,基于 TF-IDF 的增强方法在效果上稍逊于另外两种方法,随着样本量减少,这一差别越发明显。从正则化或者先验假设来看待这个问题:回译技术在基本保证语义不变的情况下,可以提供丰富多样的文本表达形式;EDA 技术则通过五种不同的操作,给模型施加了五类先验信念,例如,文本中的句子应是可以交换的,部分词是可以被替换、删除或者交换位置的。而基于 TF-IDF 的增强方法仅仅告诉了模型不重要词对于文本的行业类型没有贡献。相对而言,前两类方法给予了模型更多的信息,因而能够给模型更大的提升。4.3.4. 小结本文首先介绍了金融资管领域文本分析任务的特点,以金融资管领域一类典型的行业分类任务为案例,在少样本场景下,对三种不同的文本增加技术进行了详细的实验分析,证明了 回译、EDA 和 基于 TF-IDF 词替换方法确实可以作为数据杠杆,在实际业务中撬动模型的性能。另外,据我们所知,这也是第一次有公开文章单独对基于 TF-IDF 的文本增强技术的实验分析。如果有同学在其他地方发现了更早的实验报道,望告知。关于本文内容的其他补充如下:第一,EDA 或 基于 TF-IDF 的词替换方法会在原始样本中引入噪声,并导致一部分语义的丢失,因此这类方法是否有效与具体任务息息相关。在本文的案例中,行业分类属于依靠少数一些关键词的出现与否即可实现类别划分的任务,对于局部噪声并不敏感。因而,EDA 等技术才能够有效发挥作用;第二,我们内部正在实验基于 GPT 的 LAMBADA 方法 [5],并在尝试提出一些新的思想和方法,后面有机会再和大家分享。5. 总结本文回顾了文本数据增强技术(Data Augmentation)近几年的发展情况,重点列举和讨论了 18 年、19 年中人们最常用到的五类文本增强技术路径以及对应的代表性技术,分别是 回译 (Back Translation)、随机词替换 (EDA 技术)、非核心词替换 (基于 TF-IDF 的词替换)、基于上下文信息的文本增强(C-BERT)以及 基于生成语言模型的文本增强 (LAMBADA),给出了各方法的详细实现方案以及实验效果。简单总结如下:第一,从各技术的实验中来看,无论对于少样本场景还是大样本场景,文本数据增强技术都能带来额外的增益,尤其在少样本场景下,文本增强技术往往有奇效,多个实验证明了可以带来 5~20 个百分点的提升;第二,文中提到的五种技术都可以独立运用,而且实现起来相对简单,属于性价比很高的提高模型性能的通用方法。在实际中,大家可以尝试联合运用这几种方法。第三,回译、基于上下文信息的文本增强以及基于 GPT 的文本增强,都利用了外部预训练好的模型作为杠杆来撬动下游任务,因此可以认为这是 NLP 普通玩家能够享受当前 NLP 技术快速发展的红利之一;最后,从机器学习的角度再简单谈谈对于文本增强技术的认识,总结上述几类方法,至少可以从四个角度来看待文本增强技术的有效性:(1) 正则化:文本增强技术无疑是一种有效的正则化方法,无论是回译、EDA、非核心词替换还是基于上下文的文本增强,本质上都是设计者表达了一种模型偏好,或者对于模型的分布施加了较强的先验分布假设。其中,回译表达的模型偏好是,模型应该对于不同表达形式但同一语义的文本具有不变性。EDA、关键词替换等表达的模型偏好则是,模型应该对于文本的局部噪声不敏感。因此,即使面临少样本场景,在这种正则化下,模型也能够在假设空间中有效的收敛,实现较好的泛化误差。(2) 迁移学习:任何学习都需要有效的外部信息指导,上面所提的部分文本增强技术的有效性无疑也可以从迁移学习的角度来理解。无论是回译、基于 GPT-2 的文本增强还是未来有希望的文本风格迁移,都可以理解为将外部预训练好的模型从其他地方所学习到的信息或者知识迁移到了当前的任务中,提高了整体数据的信息容量,进而更好地指导当前模型的学习。(3) 提高模型鲁棒性:EDA、关键词等技术除了可以从语义层面的噪声来看待,同时还可以看作是对于输入数据施加一般化噪声(与具体任务无关的),实现类似于 dropout 层的功能,而这一思路已经被各个研究证明,可以一定程度提高模型的鲁棒性。(4) 流形:同一类标签的文本可以视为文本空间中某一类流形,因此有效的文本增强技术应该保证新生成的文本仍然是该流形上的一点。参考文献Wei, Jason W., and Kai Zou. "Eda: Easy data augmentation techniques for boosting performance on text classification tasks." arXiv preprint arXiv:1901.11196 (2019).Anaby-Tavor, Ateret, et al. "Not Enough Data? Deep Learning to the Rescue!." arXiv preprint arXiv:1911.03118 (2019).Hu, Zhiting, et al. "Learning Data Manipulation for Augmentation and Weighting." Advances in Neural Information Processing Systems. 2019.Wang, William Yang, and Diyi Yang. "That』s so annoying!!!: A lexical and frame-semantic embedding based data augmentation approach to automatic categorization of annoying behaviors using# petpeeve tweets." Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. 2015.Chawla, Nitesh V., et al. "SMOTE: synthetic minority over-sampling technique." Journal of artificial intelligence research16 (2002): 321-357.Xie, Qizhe, et al. "Unsupervised data augmentation." arXiv preprint arXiv:1904.12848 (2019).Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep learning. MIT press, 2016.Sennrich, Rico, Barry Haddow, and Alexandra Birch. "Improving neural machine translation models with monolingual data." arXiv preprint arXiv:1511.06709 (2015).Enov, Sergey, et al. "Understanding back-translation at scale." arXiv preprint arXiv:1808.09381 (2018).Yu, Adams Wei, et al. "Qanet: Combining local convolution with global self-attention for reading comprehension." arXiv preprint arXiv:1804.09541 (2018).Wei, Jason W., and Kai Zou. "Eda: Easy data augmentation techniques for boosting performance on text classification tasks." arXiv preprint arXiv:1901.11196 (2019).Kobayashi, Sosuke. "Contextual augmentation: Data augmentation by words with paradigmatic relations." arXiv preprint arXiv:1805.06201 (2018).Wu, Xing, et al. "Conditional BERT contextual augmentation." International Conference on Computational Science. Springer, Cham, 2019.Liu, Ting, et al. "Generating and exploiting large-scale pseudo training data for zero pronoun resolution." arXiv preprint arXiv:1606.01603 (2016).Hou, Yutai, et al. "Sequence-to-sequence data augmentation for dialogue language understanding." arXiv preprint arXiv:1807.01554 (2018).Dong, Li, et al. "Learning to paraphrase for question answering." arXiv preprint arXiv:1708.06022 (2017).Radford, Alec, et al. "Improving language understanding by generative pre-training." URL https://s3-us-west-2. amazonaws. com/openai-assets/researchcovers/languageunsupervised/language understanding paper. pdf (2018).Radford, Alec, et al. "Language models are unsupervised multitask learners." OpenAI Blog 1.8 (2019): 9.Hu, Zhiting, et al. "Toward controlled generation of text." Proceedings of the 34th International Conference on Machine Learning-Volume 70. JMLR. org, 2017.Guu, Kelvin, et al. "Generating sentences by editing prototypes." Transactions of the Association for Computational Linguistics 6 (2018): 437-450.Kim, Yoon. "Convolutional neural networks for sentence classification." arXiv preprint arXiv:1408.5882 (2014).Strubell, Emma, et al. "Fast and accurate entity recognition with iterated dilated convolutions." arXiv preprint arXiv:1702.02098 (2017).Tang, Gongbo, et al. "Why self-attention? a targeted evaluation of neural machine translation architectures." arXiv preprint arXiv:1808.08946 (2018).作者信息李渔,熵简科技联合创始人,博士毕业于清华大学电子工程系,以第一作者身份发表学术论文 10 余篇,申请专利 6 项,致力于将先进的自然语言处理及深度学习技术真正落地于金融资管领域,让科技赋能产业。目前负责熵简科技 NLP 技术中台的建设,包括层次化的分层架构、大数据泛采体系、持续部署的后台支持以及前沿算法的领域内落地等,为熵简科技的各大业务线提供底层技术支持和可落地的解决方案。