作者介绍@大师兄混迹数据江湖十余载。主要负责大数据商业变现和产品运营工作。学好统计学,让你成为高富帅,迎娶白富美,走上人生巅峰,不是不可能,但可能性只有0.00001%。从统计学的角度,这是小概率事件。但是学好统计学的现实好处多多,我就随便举几个例子给大家听听。学会看问题,懂得数字的意义。新闻报道上,各种各样的数字随处可见,如果你不想被各种数字蒙骗,最好学点统计学。学过统计的人,当看到这样的数字的时候,就会多问几个为什么,就能明白数字背后的真实含义了。用数据说话,让你的说服力爆表。现在职场上的人们,谁不要给领导汇报工作,或者团队之间讨论问题。当你汇报和讨论的时候,光说,“我觉得”,“我保证”,“根据我的经验”,这些个词太没有信服力了。必须说数据,摆事实。利用清晰的数据传达具有强有力说服的信息。体验一种与众不同的思维方式。很多人的思维方式,非黑即白。但世界上的很多事物并不是非黑即白。统计学的思维就是永远不肯定这个世界到底是什么样子的。统计学永远是讲概率的,就是可能性。这就是一种概率思维方式。懂因果,知报应。统计学常常研究两个因素之间的关系,叫做因果关系。例如,你的学历对你收入的影响。统计学家可能会说,学历每提升一个层次,年收入将提高1.2万元。所以不要相信读书无用论,你要相信概率。如果你相信自己能成为比尔盖茨,那读书对你确实没意义,同样,这只是小概率事件,基本不会发生在你身上。既然统计学这么厉害,这么牛逼,这么重要。作为统计学专业的我,我就忍不住要给大家好好梳理下统计学的知识框架,并且带着大家一点一点的学习下统计学和概率论的知识。在今后的关于统计学的文章中,我努力实现以下几个小目标。目标一:构建出统计学需要掌握的知识框架,让读者对这个知识体系一览无余。目标二:尽量阐述统计学每个知识在数据分析工作中的使用场景以及边界条件。目标三:为读者解答数据分析中碰到的各种统计学问题。今天这篇文章,主要还是带大家从宏观的层面理解下统计学。概率与概率分布稍微关注过统计学的人,可能会这么一个疑问。为什么大学里会有这样两门课,《概率论与数理统计》,《统计学》,它们有什么区别?我的理解,《概率论与数理统计》更专业一些,偏理工科,会有大量公式的推导,知其然,知其所以然;而统计学这本书更基础,侧重于概念现象的解释,一般会直接给出结论,而不要求掌握结论的数理推导过程,文理科皆可用。但不管是哪门课程,前期都是先讲概率和概率分布。概率论是统计学的基础,而随机事件的概率是概率论研究的基本内容。统计学不研究统计,它研究的是不确定性。我们的世界是一个充满不确定性的环境,整个世界并非严格按照某个制定好的路线运行的。多数事物之间也并非有因必有果,万物之间充满了不可控的随机事件,我们不会因为今天努力了明天就一定会成功。不确定性事件唯一的规律就是概率,独立随机事件我们没办法预测或控制它在某个时刻一定会发生,但却可以用概率来描述它发生的可能性。以概率论作为理论基础,为我们提供了认识不确定世界的方法。这一章节,需要大家掌握几个核心概念:随机事件概率概率分布数字特征用图表演示数据今年疫情期间,待在家里除了陪伴家人以外,每天讨论最多、关注最高的事件莫过于疫情的新动态,这些动态的展现形式大家有没有注意到,各种专业、好看、直观的图表和数据图,让数据呈现得一目了然。是的,工作中,一名数据分析师拿到了数据后,第一步要做的是数据初步探索,这也叫数据的预处理,这个时候,更多的就是利用各种图表探索数据。图表的好处是它可以很直观的看到数据的分布以及趋势,更有效的观察数据。这一章节,需要大家掌握几个核心概念:数据类型统计表统计图数据的概括性度量利用上面所讲的图表展示,我们可以对数据分布的形状和特征有一个大致的了解,但要全面把握数据分布就要反映数据分布特征的代表值。通常包含分布的集中趋势、分布的离散程度、分布的形状。数据分析中,最常见的场景,就是你手上拿到一组,一批或者一坨数据。不懂统计学的人,可能会不知所措,或者说,你不做些加工和处理,你不知道这些数据有啥用。这个时候,就需要通过这些概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。这一章节,需要大家掌握几个核心概念:众数/平均数方差/标准差偏度/峰度统计量及其抽样分布抽样好懂,抽样分布不好懂。抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,可以简单把样本理解为总体的一个子集,通过样本的结果来推测总体情况。比如我们想知道中国成年男性的平均身高,理论上最准确的办法是调查中国所有成年男性的身高,然后计算平均数。很显然,没人这样做。实际的做法总是抽取一部分人,然后计算这部分人的平均身高,由这个平均身高来大致估计总体的平均身高。理解了抽样,再来理解抽样分布。抽样分布说的是对谁的分布?答案是样本统计量,比如样本均数或者样本比例。以样本均数为例,一般说样本均数的抽样分布如何如何,这里,样本均数被当成了一个随机变量来看待。我们最希望大家记住的要点:样本均数是一个随机变量,但对于初学者,这确实是比较反直觉的。为何样本均数可以被当做一个随机变量?因为样本均数是依赖样本计算得出的:每抽取一组样本都可以计算出一个样本均数,而且这些样本均数或多或少都会有些差异。由此,样本均数会随着抽样的不同而随机变动。只是现实生活中我们一般只抽取一组样本,计算一个样本均数,因此,会觉得样本均数不变。这一章节,需要大家掌握几个核心概念:统计量抽样抽样分布参数估计当初大学里,学数理统计的时候,到了这块就感觉越来越难了,学习的过程中可以说就是囫囵吞枣,似懂非懂。但现在,经过漫长的实践过程,对统计学的知识有了更深一步的理解。统计推断,说白了,就两件事。第一个,参数估计。第二个,各类假设检验。学习到这里,假如你是做数据挖掘,机器学习的,你就会强烈意识到,数据挖掘和统计学之间是存在千丝万缕的联系。参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数就是说你认为或者知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样、采很多样本(实际值),通过这些样本的值去估计分布的参数就是参数估计。这一章节,需要大家掌握几个核心概念:参数点估计区间估计假设检验上面讲到,统计推断就需要明白两件事,一件是参数估计,另外一件是假设检验。假设检验是什么?说白了,假设检验就是先对总体猜一个参数值,然后利用样本的数据检验这个参数值准不准。互联网生产实践中的ABTEST方法,就经常会应用到假设检验的思想。举一个简单的例子:学而思网校App进行了改版迭代,现在有以下两个版本版本1:首页为一屏课程列表 版本2:首页为信息流如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。我们就需要对总体(全部用户)进行评估,但是并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。这一章节,需要大家掌握几个核心概念:假设检验P值回归分析大学里学习统计学的时候,最喜欢学回归分析,也是学的最明白的一部分。因为它的易懂性,也因为它的实用性。但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。数据挖掘中使用的各种高深的模型,任何模型都可理解成回归模型,包含因变量Y和自变量X,求解参数。在我看来,回归分析由两部分组成:业务分析和技术分析。其中,业务分析属于“道”的层面,而技术分析属于“术”的层面。从“道”的层面来看,回归分析是业务分析,其分析的不是数据,而是业务,是业务中的不确定性。通过业务分析,获得对业务不确定性的理解,进而将抽象的不确定性业务问题转换成一个具体的数据可分析问题。什么是数据可分析问题?一个业务问题,只要有清晰定义的因变量Y(不管是看得见的,还是看不见的)和清晰定义的自变量X,这就是一个数据可分析问题。一旦把业务问题规范成一个具体的数据可分析问题(有清晰定义的Y和X),那么接下来就是技术分析,属于回归分析“术”的层面。在这个层面,人们关心对于一个既定的Y和X,要研究其中的不确定性,应该选择什么样的模型设定,线性模型还是非线性模型,一元模型还是多元模型,简单的决策树还是随机森林,普通的神经网络还是深度学习。模型设定确定下来后,还需思考应该用什么方法估计,如何调优,等等。以上是对回归分析的一种广义上的理解,狭义上理解回归分析,需要理解以下几个核心概念:相关系数回归分析最小二乘法显著性检验多重共线性拟合优度当然,统计学的知识还包含很多,比如方差分析,时间序列分析,统计指数等等,这些知识在特定的应用场合,也有着广泛的应用,只是相比以上的知识点,应用范围更小点。一个数据人的自留地是一个助力数据人成长的大家庭,帮助对数据感兴趣的伙伴们明确学习方向、精准提升技能。
机器之心报道编辑:魔王、杜伟在近日发表的一篇论文中,图灵奖得主 Yoshua Bengio 等详细介绍了其团队当前的研究重心:将机器学习与因果推理相结合的因果表示学习。研究者不仅全面回顾了因果推理的基础概念,并阐释了其与机器学习的融合以及对机器学习的深远影响。该论文已被《Proceedings of the IEEE》期刊接收。一直以来机器学习和因果推理是两个相对独立的研究方向,各有优缺点。但在过去数年,两者开始互相借鉴,推进彼此的发展。如机器学习领域的蓬勃发展促进了因果推理领域的发展。采用决策树、集成方法、深层神经网络等强大的机器学习方法,可以更准确地估计潜在结果。在机器之心 2018 年的报道文章中,图灵奖得主、因果关系模型倡导者之一 Judea Pearl 也探讨了当前机器学习理论的局限性以及来自因果推理的七个启发。于是,近年来,将两者结合起来的因果表示学习(Causal Representation Learning)吸引了越来越多的关注,成为人类迈向 Human Level AI 的潜在方向。机器之心曾在 2020 年初,精选了几篇因果表示学习领域的最新文献,细致分析了不同方法的基本架构,帮助感兴趣的读者了解因果学习与机器学习可结合的方向和可能。(参考:反事实推理、特征分离,「因果表示学习」的最新研究都在讲什么?)今天,我们再为大家推荐一篇因果表示学习论文:Yoshua Bengio 团队发表的《Towards Causal Representation Learning》,该论文已被《Proceedings of the IEEE》期刊接收。在 2020 年底的一场讲座中,Bengio 称这是他们当前研究项目的核心。论文链接:https://arxiv.org/pdf/2102.11107.pdfYoshua Bengio 等人在这篇论文中回顾了因果推理的基础概念,并将其与机器学习的关键开放性问题联系起来,如迁移与泛化,进而分析因果推理可能对机器学习研究做出的贡献。反过来看也是如此:大多数因果研究的前提是因果变量。因此目前 AI 与因果领域的核心问题是因果表示学习,即基于低级观测值发现高级因果变量。最后,该论文描绘了因果对机器学习的影响,并提出了该交叉领域的核心研究方向。这篇论文的主要贡献如下:论文第二章介绍了物理系统中因果建模的不同层级,第三章展示了因果模型与统计模型的区别。这里不仅探讨了建模能力,还讨论了所涉及的假设与挑战。论文第四章将独立因果机制(Independent Causal Mechanisms,ICM)原则扩展为基于数据估计因果关系的核心组件,即将稀疏机制转移(Sparse Mechanism Shift)假设作为 ICM 原则的结果,并探讨它对学习因果模型的影响。论文第五章回顾了现有基于恰当描述子(或特征)学习因果关系的方法,覆盖经典方法和基于深度神经网络的现代方法,主要聚焦促成因果发现的底层原则。论文第六章探讨了如何基于因果表示数据学习有用的模型,以及从因果角度看机器学习问题。论文第七章分析了因果对实际机器学习的影响。研究者使用因果语言重新诠释了鲁棒性和泛化,以及半监督学习、自监督学习、数据增强和预训练等常见技术。研究者还探讨了因果与机器学习在科学应用中的交叉领域,并思考如何结合二者的优势,创建更通用的人工智能。因果建模的层级独立同分布设置下的预测统计模型是对现实的粗浅描述,因为它们只需建模关联。对于给定的输入样本 X 和目标标签 Y,我们可能会想近似 P(Y |X) 以回答如下问题:「该图像包含狗的概率是多少?」或者「在给定诊断测量指标(如血压)下,病人心脏衰竭的概率是多少?」。在合适的假设下,这些问题可以通过基于 P(X, Y) 观察足量的独立同分布(i.i.d.)数据来得到答案。分布偏移下的预测干预式问题(Interventional question)的挑战性要比预测更高,因为它们所涉及的行为超出了统计学习独立同分布设置。干预(intervention)可能影响因果变量子集的值及其关系。例如「增加一个国家中鹳鸟的数量能否促进人类生育率的增长?」、「如果烟草被更多地添加了社会污名化色彩,抽烟的人是否会减少?」回答反事实问题反事实问题需要对事情的发生原因进行推理,在事情发生后设想不同行为的后果,决定哪些行为可以达到期望的结果。回答反事实问题要比回答干预式问题更难。但是,这对于 AI 而言或许是关键挑战,因为智能体能从想象行为的后果和了解哪些行为带来特定结果中获益。数据的本质:观测、干预、(非)结构化数据格式在推断关系类型中发挥重大作用。我们可以辨别数据模态的两轴:观测数据 vs 干预数据,手动工程数据 vs 原始(非结构化)感知输入。观测与干预数据:人们常常假设但很少严格得到的一种极端数据格式是观测独立同分布数据,其每个数据点均独立采样自相同的分布。手动工程数据与原始数据:在经典 AI 中,数据常被假设成可结构化为高级和语义有意义的变量,这可能部分对应于底层图的因果变量。因果模型与推理这部分主要介绍统计建模与因果建模的区别,并用形式化语言介绍了干预与分布变化。独立同分布数据驱动的方法对于独立同分布数据,强大的泛一致性(universal consistency)可以确保学习算法收敛至最低风险。这类算法确实存在,例如最近邻分类器、支持向量机和神经网络。但是,目前的机器学习方法通常在面对不符合独立同分布假设的问题时性能较差,而这类问题对人类而言轻而易举。Reichenbach 原则:从统计学到因果关系Reichenbach [198] 清晰地描述了因果与统计相关性之间的联系:X 与 Y 一致的情况属于特例。在没有额外假设的情况下,我们无法利用观测数据区分这些情况。此时,因果模型要比统计模型包含更多信息。如果只有两个观测值,则因果结构发现会很难,但当观测值数量增多后,事情反而容易多了。原因在于,这种情况下存在多个由因果结构传达的非平凡条件独立性。它们将 Reichenbach 原则泛化,并且可以用因果图或结构因果模型的语言进行描述,将概率图模型与干预概念融合在一起。结构因果模型(SCM)SCM 考虑与有向无环图(directed acyclic graph, DAG)的顶点相关的一组观测值(或变量)X_1, . . . , X_n。该研究假设每个观测值根据以下公式得出:从数学角度讲,观测值也是随机值。直观来看,我们可以把独立噪声理解为在图上扩散的「信息探头」(就像在社交网络上扩散的流言的独立元素)。这当然并不只是两个观测值,因为任何非平凡条件独立语句都要求至少三个变量。统计模型、因果图模型与 SCM 的区别下图 1 展示了统计模型与因果模型之间的差异。统计模型可以通过图模型来定义,即带图的概率分布。如果图的边是因果性的,则该图模型为因果模型(这时,该图即为「因果图」)。结构因果模型由一组因果变量和一组结构方程构成,这些方程基于噪声变量 U_i 分布。独立因果机制独立性概念包含两个方面:一个与影响有关,一个与信息相关。在因果研究历史中,不变、自主和独立的机制以多种面目出现。例如,Haavelmo [99] 的早期工作假设改变 structural assignment 的其中一个,会使其他保持不变;Hoover [111] 介绍了不变准则:真正的因果序是在恰当干预下的不变性;Aldrich [4] 探讨了这些思想在经济学中的历史发展;Pearl [183] 详细探讨了自主性(autonomy),认为当其他机制服从外部影响时,因果机制能够保持不变。该研究将任意现实世界分布视为因果机制的产物。此类分布的变化通常是由至少一个因果机制的变化导致。根据 ICM 原则,研究者得出了以下假设:在 ICM 原则中,研究者表述了两个机制(形式化为条件分布)的独立性意味着这两个条件分布不应互相影响。后者可被理解为要求独立干预。因果发现与机器学习根据 SMS 假设,很多因果结构被认为需要保持不变。所以,分布偏移(如在不同「环境或语境」中观察一个系统)能够为确定因果结构提供很大的帮助。这些语境可以来自干预、不稳定时间序列或者多视图。同样地,这些语境可以被解读为不同的任务,从而与元学习产生关联。传统的因果发现和推理假设单元(unit)是由因果图连接的随机变量。但是,真实世界的观测结果最初往往并未结构化为这些单元,例如图像中的物体。因此,因果表示学习的出现试图从数据中学习到这些变量,正如超越了符号 AI 的机器学习不要求算法操作的符号预先给定一样。基于此,研究者试图将随机变量 S_1, …, S_n 与观测值连接起来,公式如下:其中 G 是非线性函数。下图 2 展示了一个示例,其中高维观测是对因果系统状态进行查看的结果,然后利用神经网络对其进行处理,以提取在多种任务上有用的高级变量。为了结合结构因果建模和表示学习,我们应努力将 SCM 嵌入到更大的机器学习模型中,这些模型的输入和输出也许呈现高维和非结构特点,但其内部工作至少部分由 SCM 控制(可使用神经网络对其进行参数化)。研究者在下图 3 中展示了一个可视化示例,其中恰当因果变量的变化很稀疏(移动手指导致手指和方块位置发生变化),但在像素空间等其他表示中变化则很稠密(手指和方块的移动导致很多像素值发生变化)。研究者从因果表示学习的角度讨论了现代机器学习面临的三个问题,分别是解耦表示学习、可迁移机制学习以及干预式世界模型和推理学习。因果推理对机器学习的影响上文所有讨论都需要一种不依赖常见 i.i.d. 假设的学习范式。研究者希望做出一种较弱的假设:应用模型的数据可能来自不同的分布,但涉及的因果机制(大多)相同。半监督学习(SSL)假设潜在因果图为 X → Y,并且同时想要学习映射 X → Y,则这种情况的因果因式分解如下:从 SSL 的角度来看,后续发展包括进一步的理论分析和条件式 SSL。将 SSL 视为利用边际 P(X) 和非因果条件式 P(Y |X) 之间的依赖性,这一观点与验证 SSL 合理性的常见假设一致。此外,SSL 领域的一些理论结果使用因果图中众所周知的假设(即使这些假设没有提及因果关系):协同训练理论陈述了无标注数据的可学习性,并且依赖预测器基于给定标签有条件独立的假设。我们通常期望该预测器(仅)由给定标签引起,即反因果设置。对抗脆弱性现在假设我们处在因果设置中,其中因果生成模型可因式分解为独立的组件,组件之一(本质上)是分类函数。因此,我们或许会期望,如果预测器近似具备固有可迁移性和鲁棒性的因果机制,则对抗样本应该更难找到。最近的工作支持了这种观点:对抗攻击的一种潜在防御方法通过建模因果生成方向来解决反因果分类问题,这种方法在视觉领域中被称为合成式分析(analysis by synthesis)。鲁棒性和强泛化性为了学习一个鲁棒的预测器,我们应该拥有一个环境分布的子集,并求解在实践中,求解公式 (18) 需要指定一个具有干预相关集合的因果模型。如果观测环境集合 ε 与可能的环境集合 Ρ_ɡ不一致,则我们将得到额外的估计误差,在最坏的情况下,该估计误差可能会任意大。预训练、数据增强与自监督学习用于解决 (18) min-max 优化问题的预测模型难度较高。该研究将机器学习中的多个常见技术解释为近似 (18) 的方法。第一个方法是丰富训练集的分布;第二个方法通常与前一个结合使用,即依赖数据增强来增加数据多样性;第三个方法是依靠自监督学习 P(X)。一个有趣的研究方向是将所有这些技术结合起来,即基于来自多个模拟环境的数据进行大规模训练、数据增强、自监督和鲁棒性微调。强化学习相比机器学习主流研究,强化学习 (RL) 更接近因果研究,因为它有时能够高效地直接估计 do-probabilities。但是,在离策略学习设置下,尤其是批(或观测)设置下,因果问题变得细微。应用于强化学习的因果学习可以分为两个方面:因果归纳和因果推理。强化学习设置下的因果归纳与经典因果学习设置下所面临的挑战大有不同,因为因果变量通常是给定的。但是,越来越多的证据表明恰当环境结构化表示的有效性。例如:世界模型;泛化、鲁棒性与快速迁移;反事实;离线强化学习科学应用当机器学习应用于自然科学领域时,一个基本的问题是:我们可以在多大程度上用机器学习来补充对物理系统的理解。一个有意思的方向是使用神经网络进行物理仿真,它与手工设计的模拟器相比效率要高得多。另一方面,缺乏系统的实验条件可能会在医疗等应用领域遭遇挑战。因果关系在帮助理解医学现象方面具有巨大的潜力。在新冠疫情期间,因果中介分析(causal mediation analysis)有助于,在观察到辛普森悖论的教科书式示例时,真正查出不同因素对病死率的影响。科学应用的另一个示例是天文学,研究者们使用因果模型在仪器混淆的情况下识别系外行星。多任务学习与持续学习多任务学习是指构建一个可以在不同环境中解决多个任务的系统。这些任务通常具有一些共同的特征。通过学习跨任务的相似性,系统在遇到新任务时可以更有效地利用从先前任务中获得的知识。在这一方面,我们显然已经走了很长一段路,且没有明确地将多任务问题视为因果问题。在海量数据和算力的推动下,人工智能在广泛的应用领域里取得了显著的进步。这也让人们产生了一个问题:「为什么我们不能直接训练一个巨大的模型来学习环境动态(如强化学习中的设定),使其包含所有可能的干预呢?」毕竟,分布式表示可以泛化至未见样本,如果基于大量干预进行训练,则我们可能会得到一个在大量干预之间实现良好泛化的大型神经网络。要这么做的话,首先如果数据的多样性不够,则最糟糕的情况是未见分布偏移造成的误差仍然可能很高。此外,如果我们拥有一个能够成功应对特定环境中所有干预的模型,则我们可能希望在具备相似动态的不同环境中使用它,尽管不一定动态完全相同。本质上,i.i.d. 模式识别只是一种数学抽象,因果关系对于大多数形式的 animate learning 而言可能是必不可少的。然而直到现在,机器学习仍忽略对因果关系的完整集成,该研究认为机器学习会从集成因果概念中获得收益。研究者认为,将当前的深度学习方法与因果关系的工具和思想结合起来,可能是迈向通用 AI 系统的必经之路。
全国人大常委会统计法执法检查组在江苏省徐州市睢宁县检查。□ 法制网记者 蒲晓磊 文/图5月19日上午,全国人大常委会统计法执法检查组在南京市召开座谈会,听取江苏省政府关于统计法实施情况的汇报。“统计贵在真实。如果统计数据不准确,所导致的结果就会有偏差甚至差之毫厘谬以千里;统计祸在虚假。如果统计数据作假,据此所做的工作势必会影响到经济社会发展质量和人民群众生活水平。”全国人大常委会副委员长吉炳轩在座谈会上强调。5月15日至19日,由吉炳轩带队的全国人大常委会统计法执法检查组在江苏省进行为期5天的执法检查工作。作为此次统计法执法检查的重点内容之一,数据质量和源头数据的情况备受检查组关注。“将弄虚作假作为统计领域最大腐败予以惩处”“‘十三五’规划中确定了13项约束性指标,其中就有关于资源环境的指标。在绿色统计指标体系方面,有没有数据造假的空间?”执法检查期间,全国人大常委会委员、全国人大财政经济委员会副主任委员尹中卿提出了这样的问题。“从整体上来看,这方面的造假空间非常小,我们通过开展统计数据现场核查、加强环境统计数据审核、建立污染源基础台账等方式,确保数据的真实准确。当然,具体到某家企业或者某项数据上,仍然有这种可能。例如,原环境保护部督察组在对我国一些地方进行空气质量专项督察发现,一些企业有在线监控数据造假的行为。”江苏省淮安市环保局局长崔泉说。上述对话,发生在5月17日举行的座谈会上。事实上,这样的场景只是整个执法检查期间的一个缩影。在执法检查过程中,经常有检查组成员“冷不丁”地提出这样的问题。江苏省统计局局长徐莹在向执法检查组汇报时坦言,部分地区领导干部新发展理念尚未完全形成,一定程度存在“速度情结”。正是这样的“速度情结”,在一定程度上导致了统计数据造假现象的发生。为确保数据真实性,江苏省制定出台了《关于深化统计管理体制改革提高统计数据真实性的实施意见》,要求建立健全防范统计数据造假、弄虚作假责任体系,对在统计上弄虚作假“零容忍”,坚决不碰统计工作“四条红线”,确保统计部门行使“三个独立”职权(独立行使统计调查、统计报告、统计监督)。“大力支持统计执法,将弄虚作假作为统计领域最大腐败予以惩处,态度鲜明、令行禁止。”江苏省常务副省长樊金龙在向执法检查组汇报时说,江苏在推进统计法贯彻落实过程中,严格执法,坚决遏制统计造假、弄虚作假。樊金龙介绍,在日常统计执法中,将“双随机”抽查、重点检查、立案审查、内部稽查有机结合,建立统计执法检查与纪检监察联动工作机制,坚决防范和惩治统计造假、弄虚作假,明确统计领域政务诚信建设是全省政务信用管理体系的重要内容,并将统计违法列入信用黑名单进行联合惩戒,形成了对统计造假、弄虚作假行为的强力威慑。吉炳轩指出,真实性、准确性是统计数据的核心价值,江苏坚决遏制统计数据造假行为,特别是对统计数据质量和源头数据的情况加以重视,突出体现了中央《关于深化统计管理体制改革提高统计数据真实性的意见》精神在江苏得到不折不扣执行。“保证统计数据的真实性、准确性,对于经济社会的发展至关重要。统计是要为经济社会发展服务的,没有真实准确的数据,就不可能有精确的预测、可靠的指导、正确的决策。江苏为此所做的一些努力,值得肯定。”执法检查组成员、全国人大代表张琳说。普查“入户难”仍需大力气解决住在淮安市淮安区螺蛳街村亿源国际小区的赵勇一家,是螺蛳街村抽中的住户调查记账户,从2017年10月份开始从事住户调查记账。5月17日下午,检查组一行来到赵勇家中,为了让赵勇显得不那么拘谨,检查组不仅限制了进屋人数,还讲究了聊天策略——以聊家常的方式谈统计工作。得知赵勇家里的住房面积是130多平方米后,吉炳轩笑着说:“那不错,都超过一个市委书记的住房标准了。”吉炳轩的一句话,引得屋里的人都笑了起来,也打开了赵勇的话匣子。负责帮助赵勇做好调查记账工作的伏媛媛介绍,这种调查记账的方式,主要是按住户调查工作要求,详细记载家庭每天的收入和支出情况,包括现金、收支日记账和实物收支日记账,所有记载内容均按日期、项目摘要、成员代码、单位、数量、金额等详细记载家庭每天的现金收入、现金支出,发生一笔记一笔,做到当天发生当天记。陪同检查的国家统计局工作人员告诉记者,对于统计数据的质量而言,源头环节的工作至关重要,如果调查对象都能像赵勇一样认真,那基层的统计工作就会顺利很多。但这样的期望,在现实中还是遇到了不小的阻力。淮安市市长蔡丽新在向执法检查组汇报时说,调查对象配合程度呈下降趋势,有的以保守商业秘密、保护个人隐私为由,拒报、迟报、瞒报有关统计信息,存在大型普查“入户难”等现象。江苏省泰兴市统计局也向检查组反映,近年来,虽然不断加大统计法宣传的力度,但全社会依法统计的意识依然不够强,对统计调查的配合程度还不够。一些个、私经营业主(如酒店、超市)基于自身利益的考虑,不提供真实统计资料甚至拒报统计资料的现象时有发生。“要破解这种阻力,需要长期的努力。既要加大依法统计的宣传力度、强化依法统计的舆论氛围,也要探索创新调查方法、加大激励力度。”执法检查组成员、全国人大代表何健忠说。抓好队伍建设和人才培养是关键统计工作系统性、专业性强,抓好队伍建设和人才培养是关键。徐州市贾汪区潘安湖街道办事处统计办公室主任张刚毕业于中国矿业大学,他手下的三个兵也都是毕业于重点大学的高材生。贾汪区统计局局长陆宝凤向检查组介绍,这一“充实统计力量,优化干部结构”的做法,就是为了确保统计工作的质量,为潘安湖地区的发展提供高质量的数据支撑。据介绍,江苏省不断加大保障力度,目前已经构建形成由12万名统计从业人员组成的统计调查网络。各级政府对开展统计工作所需经费给予应保尽保,重大国情国力普查所需经费列入相应年度财政预算,厚植了统计法治的保障基础。但这样的人员配备,仍然显得有心无力。蔡丽新在向执法检查组汇报淮安市贯彻实施统计法情况时说,在现行统计体制中,县乡两级统计部门位置重要、作用特殊,而统计业务面广量大的现状与基层统计部门人员力量薄弱的矛盾日益突出。“建议国家进一步整合精简统计报表、优化压缩统计指标体系,创新统计调查方式,以减轻基层的工作压力。”“统计源头数据质量‘短板’有待进一步拉长,统计人员力量不足与统计业务日益增多的矛盾比较突出,各级统计执法力量薄弱这一困境仍待实质性改善,基层统计队伍不稳定,难以适应统计工作需要。”徐莹对执法检查组说。全国人大常委会委员、全国人大财政经济委员会委员徐如俊认为,对于统计调查方法不够科学、统计人员力量不足等薄弱环节,需要加以重视并找出对策,只有将这些短板补齐,才能进一步提升统计数据的真实性,进而依法推动统计工作更好服务经济社会发展。
据国家统计局1月5日消息,1月5日,全国统计工作会议在京召开。会议以习近平新时代中国特色社会主义思想为指导,深入学习贯彻党的十九大和十九届二中、三中、四中全会以及中央经济工作会议精神,深入学习贯彻习近平总书记关于统计工作的重要讲话指示批示精神,传达学习国务院领导同志批示要求,总结2019年统计工作,研究当前统计事业面临的新形势新任务,部署2020年重点任务。国家发展改革委副主任兼国家统计局局长、党组书记宁吉喆代表国家统计局领导班子作了题为《担当作为 守正创新 奋力开创统计改革发展新局面》的工作报告。会议由国家统计局党组成员、副局长鲜祖德主持。局党组成员、副局长李晓超、毛有丰、盛来运,总统计师曾玉平,总经济师邢志宏,总工程师文兼武,中央纪委国家监委驻国家发展改革委纪检监察组副组长姜文鹏出席会议。会议指出,2019年是统计调查系统真抓实干、开拓创新的一年。一年来,在党中央、国务院的坚强领导下,统计调查系统紧紧围绕党和国家路线方针政策和重大战略部署,以提高数据质量为中心,以改革创新为动力,以统计督察为抓手,积极推动构建现代化统计调查体系,各项工作取得明显成绩。扎实开展“不忘初心、牢记使命”主题教育,统计调查系统全面从严治党开创新局面。高质量完成第四次全国经济普查,各类普查调查取得新成绩。精心组织首轮统计督察,防范和惩治统计造假弄虚作假实现新突破。稳妥推进地区生产总值统一核算改革,重点领域统计改革取得新进展。大力加强各项统计基础工作,统计生产效能得到新提高。加强改进统计分析和重大问题研究,统计新闻宣传和数据开发呈现新亮点。积极拓展国际合作交流机制和平台,统计对外开放谱写新篇章。不断加强和规范部门统计,部门统计工作再上新台阶。各地统计机构奋力开拓创新,地方统计改革发展结出新硕果。会议认为,当前中国特色社会主义进入新时代,我国正处于全面建成小康社会的关键时候,统计工作面临的环境、条件和任务都发生了深刻变化,既蕴含新的机遇,也带来新的挑战。面对推进国家治理体系和治理能力现代化的战略部署要求,坚持和完善中国特色社会主义统计体制机制和制度的任务更加重要而紧迫;面对新时代经济社会前所未有的深刻变革,加快统计改革创新的任务更加重要而紧迫;面对现代信息技术蓬勃发展的良好势头,用新技术新手段提高统计生产能力的任务更加重要而紧迫;面对防惩统计造假的长期性复杂性顽固性,推动形成良好统计生态的任务更加重要而紧迫;面对我国综合国力和国际地位的不断提升,加强我国统计国际交流合作的任务更加重要而紧迫。统计调查系统要切实增强辩证思维、战略思维、底线思维,坚持统筹发挥统计调查、统计分析、统计监督三大职能,坚持统筹推进经济统计与社会民生统计,坚持统筹安排普查与常规统计调查,坚持统筹运用全面调查与抽样调查、部门行政记录、大数据,坚持统筹推动统计改革创新与高质量发展,不断增强工作的原则性、系统性、预见性和创造性,把被动化为主动,把压力化为动力,把挑战化为机遇,不断把统计改革创新向纵深推进。会议指出,2020年是全面建成小康社会和“十三五”规划收官之年,也是统计改革发展的重要一年。统计工作的总体思路是:坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中全会精神,增强“四个意识”、坚定“四个自信”、做到“两个维护”,认真落实中央经济工作会议部署,紧扣全面建成小康社会目标任务,坚持稳中求进工作总基调,坚持新发展理念,认真贯彻落实党中央、国务院关于统计工作决策部署,自觉遵循统计科学规律,加快统计制度方法改革创新和统计信息化建设步伐,深入推进依法统计依法治统,切实保障统计调查数据质量,不断提升统计分析研判和服务水平,充分发挥统计监督职能作用,进一步完善统计体制,积极推进统计对外开放交流,扎实推进全面从严治党,加快构建与国家治理体系和治理能力现代化要求相适应的现代化统计调查体系,为决胜全面建成小康社会、夺取新时代中国特色社会主义伟大胜利提供坚实统计保障。会议对2020年统计工作重点任务作出部署。一是全面实施地区生产总值统一核算,健全工作机制,完善核算方法,夯实基础数据。二是认真开展第七次全国人口普查和国家脱贫攻坚普查,完善普查方案,组建普查机构,落实普查经费物资,组织好现场登记等各项工作。三是深度开发利用第四次全国经济普查成果,推进四经普数据发布共享,组织对普查资料进行多层次、全方位的研究分析。四是扎实推进统计监测与分析研究,强化月度、季度、年度宏观指标和先行指标监测,深入开展专题研究,为党中央、国务院科学决策和宏观调控提供优质统计服务。五是持续完善高质量发展统计体系,进一步完善“三新”统计监测,建立健全农业、制造业、服务业高质量发展统计监测制度,扎实开展区域发展战略监测。六是深化重点领域统计改革,扎实推进农业农村、服务业、消费、投资、科技等领域统计制度方法改革,强化统计方法整体设计。七是着力发挥统计监督职能作用,认真开展2020年统计督察工作,严肃查处统计造假、弄虚作假。八是加快推动大数据等新技术应用和新要素度量,积极探索大数据在普查、常规统计调查中的创新应用,加快推进统计云应用平台建设,认真开展数据生产要素统计和核算研究。九是深入做好完善统计体制和对外开放工作,着力夯实统计基层基础,积极推进部门间统计数据共享,大力开展国际统计交流合作。会议要求,统计调查系统要自觉在思想上政治上行动上同以习近平同志为核心的党中央保持高度一致,以加强党的建设保障和促进统计改革发展。要加强党的政治建设,认真贯彻落实习近平总书记等中央领导同志关于统计工作重要讲话指示批示精神;强化思想理论武装,为统计事业建设提供强大精神动力;树立大抓基层导向,切实发挥基层党组织战斗堡垒作用;狠抓正风肃纪,营造风清气正的干事创业氛围;坚持党管干部原则,建设忠诚干净担当的高素质专业化干部队伍。各省、自治区、直辖市和新疆生产建设兵团统计局局长,国家统计局各调查总队总队长,各副省级城市统计局局长、调查队队长,部分市县级国家调查队队长,有关部门和部分行业协会负责同志,国家统计局各司级行政机构和在京直属单位主要负责同志参加会议。会议还特别邀请了中央组织部、中央编办、国务院办公厅、审计署、中央军委战略规划办公室和部分院校的同志,国家统计局部分离退休局领导列席本次会议。原文转自:上海证券报
12月4日至6日,“2020深圳统计与数据科学国际前沿论坛”在南方科技大学举行。11位统计和数据科学大咖齐聚一堂,带来水平顶尖的学术报告。专家学者们围绕统计、数据科学等主题展开了交流和讨论,聚焦行业前沿焦点。据悉,参加此次论坛的专家阵容十分强大。除了中科院院士马志明、鄂维南、徐宗本,享有盛名的统计学界杰出学者范剑青等,还有深耕于业界的资深专家,如滴滴统计学首席科学家朱宏图教授等。主办方表示,希望此次论坛可以为来自国(境)内外统计学者提供一个自由的交流平台,就全球统计与数据科学前沿领域的发展现状和趋势,以及在相关领域科学研究、技术创新、应用推广等方面面临的机遇和挑战进行深入探讨。因为疫情的原因,论坛采取线上、线下相结合的方式进行,影响力进一步扩大。此次论坛的主办单位为南方科技大学统计与数据科学系。统计与数据科学系是南科大一个“年轻”的系,2019年4月才建立。系主任邵启满在接受记者采访时表示,虽然统计与数据科学系成立只有一年多时间,但发展迅速。到目前为止,已有12位专任教师和4位双聘教师,主要涵盖统计与数据科学基础理论、生物医学统计、金融统计、数据科学等研究领域。“我们不仅已有统计学本科专业,同时已申请数据科学本科专业。此外,也有硕士和博士授予权。”邵启满表示,统计与数据科学系已经搭建了完备的本硕博人才培养体系。邵启满表示,人工智能的时代已经到来,统计学开始渗透到各行各业之中,逐渐成为一门综合性、多科性的学科。“我们目前正处在一个人工智能迅速发展的时代,大数据、人工智能的发展与统计学息息相关。其中,《粤港澳大湾区发展规划纲要》中提出了共建粤港澳大湾区大数据中心的指示。”邵启满表示,南科大统计与数据科学系“生逢其时”。而有了统计学这个“支点”,也可以“撬动”多个学科的交叉融合。10月揭牌的南科大生物医学统计中心就是最好的例证。邵启满说:“生物医学统计中心已经与南科大医学院、生物系、化学系、深圳应用数学中心、南科大医院、深圳市儿童医院等科研机构和院系建立紧密联系,联合开展生物医学领域的研究。”邵启满表示,未来,统计与数据科学系还将继续致力于多学科交叉发展建设,打造一流的交叉学科科研平台,如金融统计中心、数据科学中心等。谈及未来的规划,邵启满表示,未来将继续致力于汇聚培育一流的师资队伍,打造世界级多学科交叉创新的统计研究平台。如:利用学校及学院的优势和特色,发展优势学科,努力打造独具特色的一流统计与数据科学学科,培养大批相关领域拔尖创新人才,早日实现建设国际一流的教育培养和研究基地的目标。“我的愿望是希望经过5至10年的努力,在中国的南方有一个可以被人记住的统计与数据科学系,会自然地想到南方科技大学。”邵启满充满期待地说。 (文章来源:深圳商报)
2019年11月19日,中国科技论文统计结果发布会在北京国际会议中心隆重举行,中国科学技术信息研究所权威发布了《2019年版中国科技期刊引证报告(核心板)自然科学卷》。据统计显示,中国卓越科技论文产出增加、热点及高被引论文均升至世界第二位。2018年,中国卓越科技论文共计31.59万篇,比2017年增加12.4%,国际卓越论文占我国国际论文总数的36.4%。临床医学,化学,生物学,电子、通讯与自动控制的卓越论文数量最多,上海交通大学、北京大学、浙江大学、清华大学是卓越论文高产机构,其中,清华大学的卓越论文占其全部论文的比例达到54%。中国高被引论文数为30755篇,占世界份额为20.0%,数量比2018年增加了23.9%,排在世界第二位,比上一年度上升一位。截至2019年9月统计的中国热点论文数为1056篇,占世界热点论文总数的32.6%,排在世界第二位,也比上一年度上升一位。各学科最具影响力期刊的论文数量世界第二,位次不变。而医护工作者特别关心的最新目录一起看看吧!新进科技核心的杂志有:分子影像学杂志、肝癌电子杂志、国际流行病学传染病学杂志、陕西中医、中华老年骨科与康复电子杂志、中华医院感染学杂志、中华重症医学电子杂志、中医药学报杂志、重庆医学杂志。其中重庆医学杂志之前掉了北核和科技核心,今年重登科技核心,下一届北核评选很有可能上北大核心了,而中华医院感染医学之前被剔除科技核心,但它始终还是北大核心。剔除统计源科技核心目录杂志:癌症进展杂志、实用癌症杂志、口腔颌面外科杂志、现代药物与临床杂志、牙体牙髓牙周病学杂志、医学临床研究杂志、中国地方病防治杂志。北核三年一评,科技核心一年以评,两者有时间差,中国地方病防治杂志虽然掉出科技核心,但仍然是北大核心。在这里提醒您:(1)如果您打算发表论文至科技核心期刊,请按照最新目录筛选合适的核心期刊;(2)如果您已经在上述被剔除期刊上发表了论文,且刊期不晚于2019年12月,那么尚且不用担心,文章仍然可以使用;(3)如果您已经在上述被剔除期刊上发表了论文,且刊期安排在2020年,建议您及时更换新核心目录的期刊,以免影响职称评审。
如果你第一次写统计论文也许可以帮助到你。统计方法的重要性:社会学科绝大多数情况都是写的定量论文,也就是会运用到统计软件进行写作。基本涵盖商科(经济管理贸易金融等),传媒,教育学,心理学等,虽然研究的内容不一样,但是研究方法和逻辑差不多。统计类论文的优点:写作到完成相对比较快(较之于定性论文),只要按照科学的研究方法,回顾现行研究,整理相关过往研究的成果和不足,提出自己论文的模型,运用统计软件,通过数据库或者问卷调查,就能得出相对科学的结论;这里区别于定性类的文献研究,往往定性类的研究需要大量的理论积累,论文新手如果稍有不慎可能会写成类似的报告书而非学术论文)一般定量论文的统计工具: STATA,SPSS, AMOS。STATA:一般涉及的是计量经济类的论文较多,需要掌握命令语,另外可以进行SPSS不能分析的面板数据分析,一般在处理宏观数据(比如利用国泰安数据库)等多数时候使用这个软件。SPSS: 我感觉对于统计第一次入门者,这个软件应该最容易,特别是做一些问卷调查类的定量论文,特别推荐。因为不需要掌握命令语,直接导入数据,按照相关操作点击就可以了。唯一就是不能分析面板数据。AMOS:一般在结构方程模型需要用这个软件,主要是为了更好说明变量之间的关系(特别是中介变量)的时候使用的特别多。可以和SPSS同时使用。第一次写统计论文:多数情况,很多人都没有统计知识背景的情况下看论文写论文都特别的抽象,对于社会科学者,我认为论文的本质是更好的去解决一些论文里涉及的本质的问题,通过数据分析得出研究想要达到的预期成果,而统计软件只是一个工具。对于多数特别是硕士并没有必要进行大量统计学的系统学习。建议: 以数据处理结果为导向性,也就是说想得出什么结论,需要什么方法,然后再学习那个方法,如果想要相对快读写成一篇论文,可以参考类似内容的论文,模仿着写(也就是他分析了什么你就分析什么,这时候可以找几篇论文结合着看,主要看他为了解决什么问题运用了什么方法,然后在看得出结论的时候主要分析了什么数据)。比如p,beta值,怎么描述,一般比照着写就可以(因为数据不一样,不算copy)。定量论文的选题的思维模式:1.找出想要研究的主题核心词汇然后搜索。2.找出相关的论文越多越好,看标题,觉得不错的看abstract;找出每个论文的研究模型。3.综述研究模型,组合出一个类似而又新的模型就定题目了(比如多个调节中介什么的)。后续继续更新。
当今世界,以网络化、数字化、智能化为标志的新一轮工业革命正在蓬勃兴起,经济统计遇到了重大挑战。随着新产业、新业态、新商业模式的出现,经济理论也正在酝酿重大变革。与此同时,经济统计的理论方法及其应用,经济统计的教育教学体系,经济统计的实践与政府统计工作也迎来了百年一遇的发展机会。为了推动经济统计学科发展,助力数字经济,在国务院学位委员会统计学科评议组、国务院学位委员会全国应用统计专业学位研究生教育指导委员会和教育部高校统计学类专业教学指导委员会的支持下,由中国统计学会、中国统计教育学会、中国现场统计研究会、全国工业统计学教学研究会、中国商业统计学会、中国国民经济核算研究会、北京应用统计学会和北京大数据协会联合主办,由首都经济贸易大学和首都师范大学承办的“新经济统计论坛”启动仪式于 2020 年 9 月 5日以线上线下相结合的方式在首都经济贸易大学成功召开。论坛开幕式由全国工业统计学教学研究会秘书长、首都经济贸易大学统计学院院长张宝学教授主持,首都经济贸易大学校长付志峰教授致欢迎辞,中国统计学会常务副会长、国家统计局总统计师曾玉平高级统计师,中国现场统计研究会理事长、教育部高校统计学类专业教学指导委员会主任委员、北京大学房祥忠教授,全国工业统计学教学研究会会长、中科院数学与系统科学研究院陈敏研究员, 中国商业统计学会会长、中国人民大学统计学院金勇进教授,中国国民经济核算研究会常务副理事长、中国人民大学统计学院高敏雪教授,国务院学位委员会统计学科评议组召集人、东北师范大学副校长郭建华教授,国务院学位委员会全国应用统计专业学位研究生教育指导委员会秘书长、中国人民大学统计学院赵彦云教授,北京应用统计学会会长、首都师范大学统计学系崔恒建教授,北京大数据协会会长、首都经济贸易大学统计学院纪宏教授出席会议并致辞。线下会场开幕式上,首都经济贸易大学统计学院院长张宝学教授向参会人员介绍了现场及线上参加的领导和嘉宾、本次论坛的筹备情况以及背景与宗旨,并感谢大家出席此次论坛启动仪式。进一步指出,此次论坛的目的是为了推动经济统计学科发展,助力数字经济,给身处各地的经济统计学者提供一个交流平台,与在线的各位领导、嘉宾、老师和同学们一起商讨经济统计学如何应对未来的挑战和发展。张宝学教授主持会议开幕式付志峰校长代表首都经济贸易大学向与会的各位领导、专家及学者表示热烈的欢迎和诚挚的问候。会上,付校长对首经贸统计学科的发展进行了简单介绍, 对国家统计局以及各专业学位、兄弟院校和专家学者对我校统计学发展的帮助表示衷心感谢,并在最后祝贺此次论坛启动仪式取得圆满成功。付志峰校长致欢迎辞此后,各位致辞嘉宾对新经济统计论坛的正式启动表示热烈的祝贺,向与会的专家学者表示热烈欢迎和诚挚感谢,并祝愿本次论坛启动仪式取得圆满成功!曾玉平总统计师指出,在大数据、互联网、人工智能迅猛发展的当下,以数字经济为代表的经济发展新动能,对统计学科产生了巨大的影响,经济统计的研究范围显著地扩大,内容也更加丰富。新经济统计的建设和研究将是一个复杂的系统。新经济统计对于学术概念提出后尚需要统计学界的各位专家学者通过学术讨论和实践探索进一步阐述其内涵和外延,需要循序渐进的建立完备,科学的新经济统计的理论基础,学科框架和方法体系,需要建立适应数字经济和智能时代开放的宏观经济体系,需要建立新经济统计的教育教学体系等。因此,新经济统计的研究与教育实践需要我们共同探索和完善。八家协会设立新经济统计论坛, 旨在以学术研讨和课题项目相相结合的方式,推进经济统计跨界创新,包容发展。他相信,集众人智慧,聚高等院校、政府、企业之能力一定能攻坚克难,推动中国经济统计理论和实践的新发展。曾玉平总统计师代表中国统计学会、中国统计教育学会致辞房祥忠教授对新经济统计的直接研究对象、经济数据的新特点谈了自己的感受。他谈到,经济统计是以经济数据为研究对象的,新经济统计所研究的数据, 发生了根本的变化,包括其广度和深度都有了巨大的变化。很多数据普遍存在偏移和缺失,这给我们的研究带来了新的挑战。因此需要发展新的分析方法和新的模式来研究新的数据以及新的经济问题,这需要所有的统计学家门共同努力,把统计研究成果用于国家建设。房祥忠教授代表中国现场统计研究会、教育部高校统计学类专业教学指导委员会 致辞陈敏研究员认为,在全国抗击新冠疫情取得全面胜利和全国经济全方位向好的形势下,此次论坛召开得十分及时和必要。他指出,“新经济统计”不仅仅是一个新概念,更是一个新的学科方向,需要全国统计同仁的齐心协力,搭建新经济统计应有新的理论、方法、标准和应用领域;加强新经济统计的理论与其他学科交叉融合;加强和政府统计部门的广泛合作,建设一流的统计智库,为社会经济发展承担应有的责任和做出应有的贡献。陈敏研究员代表全国工业统计学教学研究会致辞金勇进教授认为,数字经济与智能经济时代下数据是核心,经济统计是研究和探索经济数据的科学,一定会浴火重生,跨界创新,实现包容性发展。因此, 新经济统计论坛具有重大意义。同时,金教授提出了建设新经济统计的几个目标: 一是争取建立完备、科学的新经济统计的基础理论、学科框架和方法体系;二是争取建立适应数字经济和智能时代开放的宏观经济统计体系;三是争取建立柔性企业管理统计体系,开放可查询的案例仓库和智能决策系统;四是争取建立新经济统计的教育教学体系。为了实现目标,需要群思广义,需要持之以恒,也需要携手联合进行更深层次的探索。金勇进教授代表中国商业统计学会致辞高敏雪教授指出,国民经济核算是经济统计大家族的成员,在信息技术发展时代背景下,面向大数据、面向新经济,进行新经济统计探索,也应该是国民经济核算领域科学研究的重要议题。她强调,国民经济核算居于经济统计数据生产链的末端,国民经济核算体系在一定程度上具有统御专业统计规范之“规范”的性质。在大数据、新经济等背景之下,国民经济核算非常欢迎新经济统计的探索,特别期待新经济统计能够提供更好的基础数据和相应方法,为实现国民经济核算的改进提供助力。高敏雪教授代表中国国民经济核算研究会致辞郭建华教授认为数字经济和智能时代的叠加给我们带来了以下改变:一是社会和经济业态的改变,如数字经济的占比逐年增高,数字化生态系统开始形成; 二是数据环境变为全方位、全周期、全景式呈现,数据采集不再是一个瓶颈;三是思维方式的改变,我们应该用一种不确定性的眼光去看待世界。而统计学家的任务是用数据消除不确定性,统计学的宗旨是将数据转化为价值。因此,统计学要开启新篇章,也必须要学会改变,包括改变学科建设的思路,要面向国家经济主战场;改变统计研究的方法;改变我们统计教育的体系,要顺应时代,顺应社会需求。郭建华教授代表国务院学位委员会统计学科评议组致辞赵彦云教授谈到,自 2011 年以来,全国从不到 100 所高校设立应用统计专业学位,到现在已经超过 140 多个授权点。应用统计专业学位招生规模不断扩大, 社会认可度不断提高,但是发展还不平衡,实践平台方面还存在问题。如何培养国家产业急需的创新人才,如何提高统计学科的社会影响力?他指出,大思路是要面向互联网、面向大数据。因此,需要进一步明确应用统计面向大数据发展的一些方向,并加强实践平台的搭建。赵彦云教授代表国务院学位委员会全国应用统计专业学位研究生教育指导委员会 致辞崔恒建教授指出,“新经济统计学”就是适应数字经济和智能时代的统计学, 属于新兴的交叉学科,它的提出,高屋建瓴,极具鲜明的时代特色,其中突出的一个“新”字至少蕴含:在大数据背景下,重构新的经济统计学基础理论与基本方法;重建新的经济统计学的教育教学体系;推动与践行宏观经济统计的创新, 以及构建我国新型的企业管理统计、统计案例建设等。展望未来,新经济统计将以数据为核心,跨界创新为特色、实现多学科交叉融合、包容式发展。崔恒建教授代表北京应用统计学会致辞纪宏教授认为,经济统计是依据经济理论、使用统计方法、利用经济数据研究经济问题的交叉学科。但现在经济业态、统计方法、数据环境以及政府、企业、居民对数据的需求都发生了改变。经济理论正在孕壤着重大变更,这将改变经济统计的根基。此外,纪宏教授还指出,大数据破坏了传统经济统计的基础和分析方法,支撑新经济统计的理论基础、学科框架、方法体系尚未完全建立起来,这是我们需要长期研究的问题。最后,纪宏教授发布了新经济统计领域一些需要迫切解决的问题,供经济统计的理论工作者、实际工作者和教育工作者借鉴研究。纪宏教授代表北京大数据协会致辞开幕式结束后,国家统计局曾玉平总统计师、国家统计局原副局长,清华大学许宪春教授、哈尔滨工业大学李建中教授、东北师范大学郭建华教授、中国人民大学赵彦云教授、首都经济贸易大学纪宏教授、云南财经大学石磊教授、北京大学王汉生教授、中国科学技术大学王学钦教授、中国科学院数学与系统科学研究院张新雨研究员等 10 组团队,分别从大数据在政府统计工作中的最新应用、数字化时代经济统计的创新、数据可用性的理论与算法、文本大数据处理、广义统计对统计事业发展的推动、移动通信大数据下的人口动态监测、交叉学科视觉下的新经济统计、商业分析项目的国际发展趋势及国内机遇、医保基金预算与医保总额控制、波动性预测等多个方面做了大会报告,这些研究成果从不同角度反映了“新经济统计”的重大学术意义以及对社会经济发展的推动作用,并为“新经济统计”未来的发展方向带来了重要启示。国家统计局曾玉平总统计师作报告,浙江财经大学李金昌教授主持清华大学许宪春教授作报告,中央财经大学刘扬教授主持哈尔滨工业大学李建中教授作报告,黑龙江大学郑大渊教授主持东北师范大学郭建华教授作报告,北京师范大学宋旭光教授主持中国人民大学大学赵彦云教授作报告,李静萍教授主持首都经济贸易大学纪宏教授作报告,厦门大学朱建平教授主持云南财经大学石磊教授作报告,浙江工商大学苏为华教授主持北京大学王汉生教授作报告,姚方教授主持中国科学技术大学王学钦教授作报告,云南大学唐年胜教授主持中国科学院数学与系统科学研究院张新雨研究员作报告,孙六全研究员主持论坛报告结束后,华东师范大学统计交叉科学研究院周勇教授对本次论坛总结到:这次新经济统计论坛,对于学科发展,服务社会都具有重要的意义。“新经济统计”可以分两层含义去理解:一是新的经济统计,二是新经济的统计。无论是哪一层,都是强调新,即对统计发展及应用的新要求。新经济统计学告诉我们统计学大有作为,将在多领域多学科发挥着重要的作用。同时新经济统计学是教育界上学科急需,国家经济发展所急需、新技术发展所急需。总之新经济统计学正面临发展的机遇,同时也让统计学发展路径上更丰富,更有前景。华东师范大学周勇教授总结此次论坛启动仪式,专家们对“新经济统计”的内涵及外延、研究和应用领域、未来的发展等进行了深入分析,取得了一系列共识,为经济统计的学科发展指明了方向,本次论坛启动仪式取得了圆满成功!希望今后通过“新经济统计论坛”的系列专题活动,为相关领域的专家和学者搭建学习、交流和探索的平台,为经济统计的学科发展与变革助力,为中国特色社会主义市场经济蓬勃发展提供新动能,为人类社会发展做出更加卓越的贡献!
核心期刊是一般是期刊中学术水平比较高的刊物,是进行刊物评价而非具体学术评价的工具。相当一批教学科研单位申请高级职称、取得博士论文答辩资格、申报科研项目、科研机构或高等院校学术水平评估等,都需要在核心期刊上发表一篇或若干篇论文。目前,国内核心期刊有很多种。比如“北大核心”、“南大核心”、“浙大核心”、“武大核心”、“科技核心”等。很多单位对核心的认定方式也存在差别,在职称评定中一般认定某种或某几种核心。雅诗论文网根据多年经验,给大家介绍几种最常见的核心期刊。1、北京大学图书馆“中文核心期刊”;《中文核心期刊要目总览》是由北京大学图书馆及北京十几所高校图书馆众多期刊工作者及相关单位专家参加的研究项目,项目研究成果以印刷型图书形式出版,此前已由北京大学出版社出了六版:第一版(1992年)、第二版(1996年)、第三版(2000年版)、第四版(2004年版)、第五版(2008年版)、第六版(2011年版)。第七版(2014年版)于2015年9月由北京大学出版社出版。关于“有效期”问题。《中文核心期刊要目总览》只是一个科研课题成果,根据期刊的动态发展变化特点定期更新,主要目的是为图书情报部门期刊采购、典藏、导读等工作提供参考,不是学术评价标准,也不具备任何法律和行政效力,不存在“有效期”的说法,如何使用,由使用单位自行决定。在确定所谓“有效期”的问题上,考虑到本书出版与印制时间及作者投稿到期刊出版之间的时间差等问题,建议使用单位不要采取以《总览》出版年月为界一刀切的做法。目前全国中文核心期刊目录为2014版。2、南京大学“中文社会科学引文索引(CSSCI)来源期刊”;"中文社会科学引文索引"(CSSCI)由南京大学中国社会科学研究评价中心开发研制而成CSSCI来源文献检索界面,是国家、教育部重点课题攻关项目。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。目前收录包括法学、管理学、经济学、历史学、政治学等在内的25大类的500多种学术期刊。CSSCI索引的文献来自南京大学中国社会科学研究评价中心根据中文社会科学引文索引指导委员会确定的选刊原则和方法遴选并报教育部批准的来源期刊。来源期刊是根据期刊的影响因子、被引总次数等数量指标与各学科专家意见而确定的。确定之后,每年根据期刊质量的情况,增删、调整有关期刊。具体确定来源期刊的原则有:(1)入选的刊物应能反映当前我国社会科学界各个学科中最新研究成果,且学术水平较高、影响较大、编辑出版较为规范的学术刊物;(2)入选的刊物必须是正式公开出版发行,且具有ISSN或CN号;(3)入选的刊物其所刊载的学术文章应多数列有参考文献;(4)凡属索引、文摘等二次文献类的刊物不予收入;(5)译丛和以发表译文为主的刊物,暂不收入;(6)通俗刊物,以发表文艺作品为主的各类文体艺刊物,暂不收入。参照美国《科学引文索引》(SCI)选用期刊占世界科技期刊总量的比例与《中国科学引文数据库》(CSCD)选用期刊占我国科技期刊总量的比例,结合我国社科期刊出版发行的情况,确定CSSCI的来源期刊数量占我国正式刊行的社科期刊总数的8-15%。中文社会科学引文索引数据库已被北京大学、清华大学、中国人民大学、复旦大学、国家图书馆、中科院等众多单位包库使用,并作为地区、机构、学术、学科、项目及成果评价与评审的重要依据。教育部已将CSSCI数据作为全国高校机构与基地评估、成果评奖、项目立项、名优期刊的评估、人才培养等方面的重要指标。 目前CSSCI核心期刊目录为2017-2018版。3、中国科学技术信息研究所“中国科技论文统计源期刊”(又称“中国科技核心期刊”);"统计源期刊"全称为"中国科技论文统计源期刊"(亦称中国科技核心期刊),统计源期刊目录每年都会出现在中国科技信息研究所每年公布一次的《中国科技期刊引证报告》中。中国科技信息研究所(ISTIC)是受国家科技部委托,从1987年开始对我国科技人员在国内外表论文数量和被引用情况进行统计分析,并利用统计数据建立了中国科技论文与引文数据库(CSTPCD),受到社会各界的普遍重视和广泛好评。中国科技论文统计源期刊是CSTPCD的数据来源。通过中国科技期刊综合指标评价体系对期刊学术质量的考核,CSTPCD每年对收录期刊的范围进行调整。中国科技信息研究所每年4月或10月分两次给当年经过多项学术指标综合评定而被收录的期刊颁发收录证书,中国科技信息所每年年底(11月或12月)都会在北京向媒体召开 "中国科技论文统计结果发布会"。"中国科技论文统计源期刊"并非终身制,有效期三年,三年后中国科技信息研究所将对其进行重新评定,遵守"优入劣汰"原则。因此"统计源期刊"的学术影响力越来越被各学术单位和科研机构接受,用它作为科研论文的学术水平的评价指标之一。统计源期刊与核心期刊均能反映与某一专业有紧密联系的期刊,但在概念上、内容上又有一定的区别。前者包括社会(人文)科学和自然科学两大类,采用多指标综合筛选的方法,制定出核心期刊排名表。后者仅收录自然科学类,以文献引文数据为依据,选择多项指标进行综合筛选,再根据期刊论文引用情况列出排名顺序。两者用不同的方式、从不同的角度为读者提供参考价值比较大的一些期刊,为单位和个人订购、收藏、阅读、投稿选刊提供了重要的参考依据。核心期刊所涵盖的期刊数量多,读者面广,但收录的生物、医药学期刊较源期刊少,且由于4年出版1次,有一定的时差,所以不能完全反映当年的期刊状况。而源期刊则收录生物、医学期刊较多。由于每年公布1次,所以能较客观地反映期刊的当年情况。 目前中国科技核心期刊目录为2017版。4、中国社会科学院文献信息中心“中国人文社会科学核心期刊”;中国社会科学院文献信息中心1996年开始进行人文社会科学文献计量研究工作, 建有“社会科学论文统计分析数据库”、“中国人文社会科学引文数据库”、社科论文摘转量统计库。2000年印制出版的《中国人文社会科学核心期刊要览》,作为内部参考资料供有关方面人员交流使用,2004年正式出版了《中国人文社会科学核心期刊要览》(以下简称“要览”)。“要览”采用文献计量学方法。依据最新和最全的期刊各项统计数据进行分析, 突出反映期刊的学术影响力。在核心期刊的遴选过程中,选用的是有国内统一刊号(CN 号)的正式学术期刊,参照《中国图书馆分类法》第4 版的类目为期刊论文统计的学科分类基础, 将我国的人文社会科学学术期刊分为法学、管理学(含科学学 、人才学)、环境科学、教育学、经济学 、军事学、考古学、 历史学、马克思主义、民族学、人口学、人文地理学、社会学、体育科学、统计学、图书馆、情报与文献学、文化学、文学、心理学、 新闻学与传播学、艺术学、 语言学、哲学、政治学、宗教学等 52 个学科类目,主要统计数据来源于“全国报刊索引数据库”、“中国人文社会科学引文数据库”(2020 年版)、“中国人文社会科学摘转率统计数据库”等3个大型数据库。评价时,先统计出各学科的引证期刊,再确定这些引证期刊的各项评价指标(包括期刊总被引、期刊影响因子、期刊即年影响因子、学科自引量 、学科载文量、引文率 、摘转率),并赋予权重值。然后利用综合评判数学模型算出综合评价值,从而确定各学科的核心期刊预选范围,请专家定性评审。通过上述方法最终评选出了434 种期刊作为《中国人文社会科学核心期刊要览》(2004年版)的核心期刊,涉及52个重要学科。研究人员根据遴选结果分析认为,分学科统计的核心效应比较理想, 综合性核心期刊有较为明显的学科特点,专业核心期刊的学科分布不平衡。目前人文核心目录为2014版。5、中国科学院文献情报中心“中国科学引文数据库(CSCD)来源期刊”;中国科学引文数据库(Chinese Science Citation Database,简称CSCD)创建于1989年,收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域出版的中英文科技核心期刊和优秀期刊千余种,目前已积累从 1989 年到现在的论文记录 4496482条,引文记录53810552 条。中国科学引文数据库内容丰富、结构科学、数据准确。系统除具备一般的检索功能外,还提供新型的索引关系——引文索引,使用该功能,用户可迅速从数百万条引文中查询到某篇科技文献被引用的详细情况,还可以从一篇早期的重要文献或著者姓名入手,检索到一批近期发表的相关文献,对交叉学科和新学科的发展研究具有十分重要的参考价值。中国科学引文数据库还提供了数据链接机制,支持用户获取全文。中国科学引文数据库具有建库历史最为悠久、专业性强、数据准确规范、检索方式多样、完整、方便等特点,自提供使用以来,深受用户好评,被誉为“中国的SCI”。中国科学引文数据库是我国第一个引文数据库。曾获中国科学院科技进步二等奖。1995年CSCD出版了我国的第一本印刷本《中国科学引文索引》,1998年出版了我国第一张中国科学引文数据库检索光盘,1999年出版了基于CSCD和SCI数据,利用文献计量学原理制作的《中国科学计量指标:论文与引文统计》,2003年CSCD上网服务,推出了网络版,2005年CSCD出版了《中国科学计量指标:期刊引证报告》。2007年中国科学引文数据库与美国Thomson-Reuters Scientific合作,中国科学引文数据库以ISI Web of Knowledge为平台,实现与Web of Science的跨库检索,中国科学引文数据库是ISI Web of Knowledge平台上第一个非英文语种的数据库。目前CSCD核心期刊目录为2017-2018版。
近日,中国科学文献计量评价研究中心发布2019年中国高校南大核心发文数据,中国人民大学南大核心发文量位居全国第一。发文排行人大“南大核心发文量”位列高校榜首数据结果显示,中国人民大学2019年在南大核心期刊共计发文2699篇,位列全国高校第一,也是唯一一所发文量超过2000篇的高校,北京大学、南京大学、武汉大学、北京师范大学分列第二至五名。长期领先人大“南大核心发文量”连续保持第一据数据统计,自2006年起,中国人民大学南大核心期刊发文量始终保持全国第一,充分体现了我校在人文社会科学研究方面的高学术水平与强大影响力,在人文社科领域独树一帜。2006-2019年南大核心期刊发文量前五位高校发文情况对比:数据说明1. 统计数据来自《中国高校科研成果统计分析数据库》,由中国科学文献计量评价研究中心发布,当前数据统计时间范围为2006-2020年,数据采集截止时间为2020年1月13日。 2. 南大核心发文量:作者发表的学术性期刊论文属于南京大学研制的《中文社会科学引文索引(CSSCI)》收录刊范畴中的论文数量。来源:中国人民大学 设计:欣欣蔡