欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
统计学知识大梳理(终极篇)子来

统计学知识大梳理(终极篇)

作者介绍@大师兄混迹数据江湖十余载。主要负责大数据商业变现和产品运营工作。学好统计学,让你成为高富帅,迎娶白富美,走上人生巅峰,不是不可能,但可能性只有0.00001%。从统计学的角度,这是小概率事件。但是学好统计学的现实好处多多,我就随便举几个例子给大家听听。学会看问题,懂得数字的意义。新闻报道上,各种各样的数字随处可见,如果你不想被各种数字蒙骗,最好学点统计学。学过统计的人,当看到这样的数字的时候,就会多问几个为什么,就能明白数字背后的真实含义了。用数据说话,让你的说服力爆表。现在职场上的人们,谁不要给领导汇报工作,或者团队之间讨论问题。当你汇报和讨论的时候,光说,“我觉得”,“我保证”,“根据我的经验”,这些个词太没有信服力了。必须说数据,摆事实。利用清晰的数据传达具有强有力说服的信息。体验一种与众不同的思维方式。很多人的思维方式,非黑即白。但世界上的很多事物并不是非黑即白。统计学的思维就是永远不肯定这个世界到底是什么样子的。统计学永远是讲概率的,就是可能性。这就是一种概率思维方式。懂因果,知报应。统计学常常研究两个因素之间的关系,叫做因果关系。例如,你的学历对你收入的影响。统计学家可能会说,学历每提升一个层次,年收入将提高1.2万元。所以不要相信读书无用论,你要相信概率。如果你相信自己能成为比尔盖茨,那读书对你确实没意义,同样,这只是小概率事件,基本不会发生在你身上。既然统计学这么厉害,这么牛逼,这么重要。作为统计学专业的我,我就忍不住要给大家好好梳理下统计学的知识框架,并且带着大家一点一点的学习下统计学和概率论的知识。在今后的关于统计学的文章中,我努力实现以下几个小目标。目标一:构建出统计学需要掌握的知识框架,让读者对这个知识体系一览无余。目标二:尽量阐述统计学每个知识在数据分析工作中的使用场景以及边界条件。目标三:为读者解答数据分析中碰到的各种统计学问题。今天这篇文章,主要还是带大家从宏观的层面理解下统计学。概率与概率分布稍微关注过统计学的人,可能会这么一个疑问。为什么大学里会有这样两门课,《概率论与数理统计》,《统计学》,它们有什么区别?我的理解,《概率论与数理统计》更专业一些,偏理工科,会有大量公式的推导,知其然,知其所以然;而统计学这本书更基础,侧重于概念现象的解释,一般会直接给出结论,而不要求掌握结论的数理推导过程,文理科皆可用。但不管是哪门课程,前期都是先讲概率和概率分布。概率论是统计学的基础,而随机事件的概率是概率论研究的基本内容。统计学不研究统计,它研究的是不确定性。我们的世界是一个充满不确定性的环境,整个世界并非严格按照某个制定好的路线运行的。多数事物之间也并非有因必有果,万物之间充满了不可控的随机事件,我们不会因为今天努力了明天就一定会成功。不确定性事件唯一的规律就是概率,独立随机事件我们没办法预测或控制它在某个时刻一定会发生,但却可以用概率来描述它发生的可能性。以概率论作为理论基础,为我们提供了认识不确定世界的方法。这一章节,需要大家掌握几个核心概念:随机事件概率概率分布数字特征用图表演示数据今年疫情期间,待在家里除了陪伴家人以外,每天讨论最多、关注最高的事件莫过于疫情的新动态,这些动态的展现形式大家有没有注意到,各种专业、好看、直观的图表和数据图,让数据呈现得一目了然。是的,工作中,一名数据分析师拿到了数据后,第一步要做的是数据初步探索,这也叫数据的预处理,这个时候,更多的就是利用各种图表探索数据。图表的好处是它可以很直观的看到数据的分布以及趋势,更有效的观察数据。这一章节,需要大家掌握几个核心概念:数据类型统计表统计图数据的概括性度量利用上面所讲的图表展示,我们可以对数据分布的形状和特征有一个大致的了解,但要全面把握数据分布就要反映数据分布特征的代表值。通常包含分布的集中趋势、分布的离散程度、分布的形状。数据分析中,最常见的场景,就是你手上拿到一组,一批或者一坨数据。不懂统计学的人,可能会不知所措,或者说,你不做些加工和处理,你不知道这些数据有啥用。这个时候,就需要通过这些概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。这一章节,需要大家掌握几个核心概念:众数/平均数方差/标准差偏度/峰度统计量及其抽样分布抽样好懂,抽样分布不好懂。抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,可以简单把样本理解为总体的一个子集,通过样本的结果来推测总体情况。比如我们想知道中国成年男性的平均身高,理论上最准确的办法是调查中国所有成年男性的身高,然后计算平均数。很显然,没人这样做。实际的做法总是抽取一部分人,然后计算这部分人的平均身高,由这个平均身高来大致估计总体的平均身高。理解了抽样,再来理解抽样分布。抽样分布说的是对谁的分布?答案是样本统计量,比如样本均数或者样本比例。以样本均数为例,一般说样本均数的抽样分布如何如何,这里,样本均数被当成了一个随机变量来看待。我们最希望大家记住的要点:样本均数是一个随机变量,但对于初学者,这确实是比较反直觉的。为何样本均数可以被当做一个随机变量?因为样本均数是依赖样本计算得出的:每抽取一组样本都可以计算出一个样本均数,而且这些样本均数或多或少都会有些差异。由此,样本均数会随着抽样的不同而随机变动。只是现实生活中我们一般只抽取一组样本,计算一个样本均数,因此,会觉得样本均数不变。这一章节,需要大家掌握几个核心概念:统计量抽样抽样分布参数估计当初大学里,学数理统计的时候,到了这块就感觉越来越难了,学习的过程中可以说就是囫囵吞枣,似懂非懂。但现在,经过漫长的实践过程,对统计学的知识有了更深一步的理解。统计推断,说白了,就两件事。第一个,参数估计。第二个,各类假设检验。学习到这里,假如你是做数据挖掘,机器学习的,你就会强烈意识到,数据挖掘和统计学之间是存在千丝万缕的联系。参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数就是说你认为或者知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样、采很多样本(实际值),通过这些样本的值去估计分布的参数就是参数估计。这一章节,需要大家掌握几个核心概念:参数点估计区间估计假设检验上面讲到,统计推断就需要明白两件事,一件是参数估计,另外一件是假设检验。假设检验是什么?说白了,假设检验就是先对总体猜一个参数值,然后利用样本的数据检验这个参数值准不准。互联网生产实践中的ABTEST方法,就经常会应用到假设检验的思想。举一个简单的例子:学而思网校App进行了改版迭代,现在有以下两个版本版本1:首页为一屏课程列表 版本2:首页为信息流如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。我们就需要对总体(全部用户)进行评估,但是并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。这一章节,需要大家掌握几个核心概念:假设检验P值回归分析大学里学习统计学的时候,最喜欢学回归分析,也是学的最明白的一部分。因为它的易懂性,也因为它的实用性。但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。数据挖掘中使用的各种高深的模型,任何模型都可理解成回归模型,包含因变量Y和自变量X,求解参数。在我看来,回归分析由两部分组成:业务分析和技术分析。其中,业务分析属于“道”的层面,而技术分析属于“术”的层面。从“道”的层面来看,回归分析是业务分析,其分析的不是数据,而是业务,是业务中的不确定性。通过业务分析,获得对业务不确定性的理解,进而将抽象的不确定性业务问题转换成一个具体的数据可分析问题。什么是数据可分析问题?一个业务问题,只要有清晰定义的因变量Y(不管是看得见的,还是看不见的)和清晰定义的自变量X,这就是一个数据可分析问题。一旦把业务问题规范成一个具体的数据可分析问题(有清晰定义的Y和X),那么接下来就是技术分析,属于回归分析“术”的层面。在这个层面,人们关心对于一个既定的Y和X,要研究其中的不确定性,应该选择什么样的模型设定,线性模型还是非线性模型,一元模型还是多元模型,简单的决策树还是随机森林,普通的神经网络还是深度学习。模型设定确定下来后,还需思考应该用什么方法估计,如何调优,等等。以上是对回归分析的一种广义上的理解,狭义上理解回归分析,需要理解以下几个核心概念:相关系数回归分析最小二乘法显著性检验多重共线性拟合优度当然,统计学的知识还包含很多,比如方差分析,时间序列分析,统计指数等等,这些知识在特定的应用场合,也有着广泛的应用,只是相比以上的知识点,应用范围更小点。一个数据人的自留地是一个助力数据人成长的大家庭,帮助对数据感兴趣的伙伴们明确学习方向、精准提升技能。

大勇不歧

打造世界级多学科统计研究平台

12月4日至6日,“2020深圳统计与数据科学国际前沿论坛”在南方科技大学举行。11位统计和数据科学大咖齐聚一堂,带来水平顶尖的学术报告。专家学者们围绕统计、数据科学等主题展开了交流和讨论,聚焦行业前沿焦点。据悉,参加此次论坛的专家阵容十分强大。除了中科院院士马志明、鄂维南、徐宗本,享有盛名的统计学界杰出学者范剑青等,还有深耕于业界的资深专家,如滴滴统计学首席科学家朱宏图教授等。主办方表示,希望此次论坛可以为来自国(境)内外统计学者提供一个自由的交流平台,就全球统计与数据科学前沿领域的发展现状和趋势,以及在相关领域科学研究、技术创新、应用推广等方面面临的机遇和挑战进行深入探讨。因为疫情的原因,论坛采取线上、线下相结合的方式进行,影响力进一步扩大。此次论坛的主办单位为南方科技大学统计与数据科学系。统计与数据科学系是南科大一个“年轻”的系,2019年4月才建立。系主任邵启满在接受记者采访时表示,虽然统计与数据科学系成立只有一年多时间,但发展迅速。到目前为止,已有12位专任教师和4位双聘教师,主要涵盖统计与数据科学基础理论、生物医学统计、金融统计、数据科学等研究领域。“我们不仅已有统计学本科专业,同时已申请数据科学本科专业。此外,也有硕士和博士授予权。”邵启满表示,统计与数据科学系已经搭建了完备的本硕博人才培养体系。邵启满表示,人工智能的时代已经到来,统计学开始渗透到各行各业之中,逐渐成为一门综合性、多科性的学科。“我们目前正处在一个人工智能迅速发展的时代,大数据、人工智能的发展与统计学息息相关。其中,《粤港澳大湾区发展规划纲要》中提出了共建粤港澳大湾区大数据中心的指示。”邵启满表示,南科大统计与数据科学系“生逢其时”。而有了统计学这个“支点”,也可以“撬动”多个学科的交叉融合。10月揭牌的南科大生物医学统计中心就是最好的例证。邵启满说:“生物医学统计中心已经与南科大医学院、生物系、化学系、深圳应用数学中心、南科大医院、深圳市儿童医院等科研机构和院系建立紧密联系,联合开展生物医学领域的研究。”邵启满表示,未来,统计与数据科学系还将继续致力于多学科交叉发展建设,打造一流的交叉学科科研平台,如金融统计中心、数据科学中心等。谈及未来的规划,邵启满表示,未来将继续致力于汇聚培育一流的师资队伍,打造世界级多学科交叉创新的统计研究平台。如:利用学校及学院的优势和特色,发展优势学科,努力打造独具特色的一流统计与数据科学学科,培养大批相关领域拔尖创新人才,早日实现建设国际一流的教育培养和研究基地的目标。“我的愿望是希望经过5至10年的努力,在中国的南方有一个可以被人记住的统计与数据科学系,会自然地想到南方科技大学。”邵启满充满期待地说。 (文章来源:深圳商报)

彼非至人

日本统计研究发现:中美合著论文数量近些年激增

原标题:日本统计研究发现:中美合著论文数量近些年激增参考消息网8月12日报道 据日本《每日新闻》8月11日报道,日本文部科学省科学技术与学术政策研究所分析了2015年至2017年间多国研究人员合著论文的情况,发现美国研究人员的合著对象最多的是中国研究人员,其数量和近10年与英国、日本等国家的合著数量相比激增明显。日媒称,随着中国研究实力的崛起,美国深化了在科学研究层面与中国的合作关系。报道称,日本文部科学省按照研究人员所属机构的所在国分析了全球出版的论文,得出了三年的平均值。美国合著对象国的占比在2005年至2007年的情况为:英国12.9%,排名第一;中国8.7%,排名第四。然而,在10年后的2015年至2017年,中国占比大幅增加至24.3%,跃居首位;英国占比13.9%,降至第二。报道指出,中国的研究活动非常活跃,论文数量激增至10年前的近4倍。中国赴美在科学工程领域深造的研究生数量逐年增加,在美国从事研究的中国籍研究生2017年约有8万人。这些年轻人回国后可能会继续与美国的科学家合作研究,这或许是中美合著论文数量激增的一个原因。报道还称,2005年至2007年,日本和中国在国际合著论文数量上都是年均1.8万篇左右,但到了2015年至2017年,日本为2.59万篇,中国为8.05万篇,差距逐渐拉大。另一方面,日本国际合著论文占其论文总量的比例为32.9%,高于中国的27%。日本与中国最大的合著对象国与10年前一样,都是美国。更多资讯或合作欢迎关注中国经济网官方微信(名称:中国经济网,id:ourcecn)来源:参考消息

清而容物

安全统计研究的分析方法

安全统计研究的分析方法包括四大方法:空间自相关方法,聚类分析法、灰色统计法、实验数据统计方法。那么,怎么理解这四大方法呢?1.空间自相关方法1)空间自相关方法是研究空间中某空间单元与其周围空间单元就某种特征值,进行空间自相关性程度的计算,以分析这些空间单元在空间分现象的特征的统计分析方法2)研究对象是两个或多个属性变量间的相互关系及关联程度,以及同一属性值在不同空间位置上的相关关系及关联程度3)优点是可同时满足独立性和大样本两个假设,可以用图形示意区域集聚事故的类型,而且还可用一些量化指标,揭示研究区域内事故发生的空间格局空间自相关方法2. 聚类分析法1)聚类分析法就是输入一组未分类的数据,通过分析数据,确定每个记录所属的类别,把相似性大的对象聚集为一个类2)主要用于安全统计数据或样本的分类3)按原理可分为层次聚类法和非层次聚类法;按照分类的目的可分为指标聚类(R型)和样品聚类(Q型)4)具有客观性、科学性等优点5)如果数据量少会影响归纳精确性;需要介入主观因素确定该分成几类;只能对指标进行单一归类聚类分析法3. 灰色统计法1)灰色统计法是一种白数的灰化处理方法,以灰数的白化函数生成为基础,将安全统计数据按某种灰数所描述的类别进行归纳整理,判断安全指标所属的灰类2)具有可操作性强,分辨率高等优点,通过建立影响事故发生的安全统计核心指标,来对事故进行安全统计分析灰色统计法4. 实验数据统计方法1)实验数据统计方法是基于完全样本的安全统计方法,用此方法处理产品寿命数据是,检验产品寿命数据属于何种类型后采用相应的安全统计方法进行数据处理,做基于特征值的可靠性统计并归一化处理2实验数据统计方法包含正太分布、三参数威布尔分布、两参数Weibull分布、极小值分布、极大值分布等等;数据处理有图解法和解析法试验数据统计方法

天极

你真的懂了什么是统计学吗?其实统计学也是科学思维的训练

该来的医学统计学考试还是来了。掐指一算,距离上次我参加这门课程的考试已经有七年时间了。七年前,我怀揣着对于医学统计的巨大热忱、神秘感和好奇心以及对于数学的些许畏惧进入了这座神圣的殿堂,而结果竟然造就了我大学时代分数最低的一门课——63分,这让我久久难以释怀。七年之后,为了不再继续大学时代的噩梦以及洗刷多年来的耻辱,伴随着硕士研究生公共基础课网络教学新试点的步伐,我成为了一个完全意义上的统计学“自学人”,这听起来难免有那么点讽刺。这期间,看视频、做习题和与小伙伴儿的互相讨论成为了我学习的日常,在接近两个月的学习过程中我似乎又重拾了对于医学统计学的信心。过程中我结识了很多新人,与大家一起探讨问题的日子永远是快乐、美好、烧脑而又难忘的,我一方面暗自庆幸自己“笨鸟先飞”的正确抉择,另一方面又对自己思考和学习的不够深入而暗暗自责。虽然最后的考试并不是那么尽如人意,但是我觉得恰恰是这最后的考试,才能暴露出自己的问题,也才能进一步指导自己今后的学习之路。孙振球主编的医学统计学 医学统计学其实是一门非常考验个人逻辑思维能力的学科。从医学统计学的定义里我们可以完全贯穿基础统计学的所有章节。从统计描述到统计推断,各个章节内容严整,无毫发爽。好比我们学习每一种疾病,都要从发病机制到流行病学再到临床表现和治疗预后。但是作为临床医生,我们需要的并不是梳理单一疾病的知识而是要做到快速诊断和鉴别诊断。其实医学统计学也是如此,我们不仅仅需要掌握每一种统计学方法的定义、使用条件,更需要的是在实验设计阶段或者在给出的待处理的数据面前找到适合它们的正确的统计学方法,这才不失为一个成功运用统计学的医学人才。这里面不仅仅需要完整的贯穿于整个基础统计的逻辑思维,也需要我们能够“照方抓药”,我觉得这是非统计学专业的医学工作者学习医学统计学的最根本的目标。 说到存在的问题,我想无外乎以下几点。第一是基本概念仍然把握不清,很多时候对于概念的把握理解是最要命的东西,尽管我们自己认为整个学科只注重应用,须知应用的前提条件是正确理解,我们失去了这道防线肯定要在今后的工作中输掉某场战争,而这种对于概念的正确理解我个人觉得是网络课程远远不能解决的问题。第二是对于细节问题仍然不够清楚,其实我个人觉得这套卷子出的很好,基本概念是有的,同时又有很多的细节问题,你不能说这个细节不重要,打个比方,就是刚巧搔到你痒的那个部位,然而可怕的事实却是我根本在之前没有关注过它。第三我觉得我思考的不够深入,对于某些问题依然浅尝辄止,相比常旺同学的那种深入思考的能力我只能有“河伯不及海若”之感,研究生的“精进”能力还是没有培养出来,我觉得似乎又不能简单的归结为脑子够不够用的问题。第四我觉得是我太低估统计学教研室的实力了,我没想到他们大题居然也可以出原题,白纸黑字,真真儿的原题,这在根本上就犯了毛主席“战略上藐视敌人,战术上重视敌人”的错误,说白了也是一种能力的欠缺,看来人果然是会被同一块石头绊两次脚的。回过头讲考试的事情,我觉得既可以说重要也可以说不重要,重要的是分数,但其实它又是最不重要的,我们的关注点应该在“经世致用”上,也就是我们对于这门课程究竟能够运用多少?考试其实是我们自己的一个“反物质”,是我们的敌人,彰显我们的缺点,我们需要的是在今后的工作学习中避免重蹈覆辙,仅此而已。三联生活周刊911期 最近恰巧在读三联生活周刊的911期《巴黎高师:法国精英制造——共和国传统与知识分子摇篮》,使我对于法国教育体制的敬仰之情有如滔滔江水延绵不绝,它颠覆了我对于法兰西这个国家的印象——原来法国不仅是只有红酒和香槟而已。他们的“双轨制”的精英人才的培养模式让我一个所谓的“中国式精英”汗颜,更让我作为一个中国教育的反思者叹为观止。回过头来看我们的教育,就拿这门医学统计学的课程而言,我们到底离精英式的培养模式相差多远?前不久结束的研究生辩论赛中孙校长还在提作为二医大研究生应该具有的两种属性“静若处子、动若脱兔”和研究生应该培养的五种思维模式即“系统思维”“逻辑思维”“辩证思维”“创新思维”“逆向思维”,回忆起《医学统计学》课本里开篇绪论里提到的关于“统计思维”的培养,我突然觉得有很大的挫败感,试问我们两个月里都学到了些什么呢?或者说什么是真正意义上的统计思维?是要求我们质疑一切,要让所有的数字游戏都在统计学面前揭开它们伪善的面纱吗?我,不得而知。 随着考试结束铃声的响起,我们似乎都认为我们完成了某项浩大的工程,连我自己都为之一振。 然而,我觉得,我们,离真正意义上的统计思维的培养依然任重而道远。

知己知彼

数据分析必备——统计学入门基础知识

编辑导语:不论在什么岗位,都要懂得本岗位的基础知识,打牢基础后面才能稳步发展;数据分析也是如此,数据分析必须要掌握统计学的基础知识;本文是作者分享的关于统计学入门基础的知识,我们一起来学习一下吧。要做好数据分析,除了自身技术硬以及数据思维灵活外,还得学会必备的统计学基础知识!因此,统计学是数据分析必须掌握的基础知识,即通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域,而在数据量极大的互联网领域也不例外;因此扎实的统计学基础是一个优秀的数据人必备的技能。但是,统计学的知识包括了图形信息化、数据的集中趋势、概率计算、排列组合、连续型概率分布、离散型概率分布、假设检验、相关和回归等知识;对于具体的知识点,本文就不一一介绍了,感兴趣的同学请参考《深入浅出统计学》、《统计学:从数据到结论》等等专业书籍。统计学分为描述性统计学和推断性统计学。一、描述性统计定义:使用特定的数字或图表来体现数据的集中程度和离散程度。1. 集中趋势集中趋势集中趋势是指一组数据所趋向的中心数值,用到的指标有:算数均数、几何均数、中位数。算数均数:即为均数,用以反映一组呈对称分布的变量值在数量上的平均水平。几何均数:常用以反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。中位数:适用于偏态分布资料和一端或两端无确切的数值的资料,是第50百分位数。百分位数:为一界值,用以确定医学参考值范围。2. 离散趋势离散趋势是反映数据的变异程度,常用指标有极差、四分位间距、方差与标准差、变异系数。极差:为一组数据的最大值和最小值之差,但极差不能反映所有数据的变异大小,且极易受样本含量的影响。常用以描述偏态分布。四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布。方差与标准差:反映一组数据的平均离散水平,消除了样本含量的影响,常和均数一起用来描述一组数据中的离散和集中趋势。变异系数:也称作异常值,多用于观察指标单位不同时,可消除因单位不同而不能进行比较的困难。例如箱线图就可以很好反映其中部分重点统计值:3. 抽样方法和中心极限定理抽样方法:我们在做产品检验的时候,不可能把所有的产品都打开检验一遍看是否合格,我们只能从全部的产品中抽取部分样本进行检验,依据样本的质量估算整体的产品质量,这个就是抽样,抽样的定义是为了检验整体从整体中抽离部分样本进行检测,以样本的检测结果进行整体质量的估算的方法。抽样有多种方法,针对不同的目的和场景,需要运用不同的方法进行检测,常见的抽样方法有:1)概率抽样简单随机抽样;分层抽样;整群抽样(先将总体中若干个单位合并为组,这样的组称为群,再直接对群进行抽样);系统抽样(将总体中所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为初始单位,然后再按事先指定好的规则确定其他样本单位);阶段抽样(先抽群,然后在群内进行二阶段抽样)。2)非概率抽样方便抽样(依据方便原则自行确定);判断抽样(依据专业知识进行判断);自愿样本(调查者自愿参加);滚雪球样本(类似树结构);配额样本(类似分层抽样);3)两者抽样方法之间的比较:非概率抽样适合探索性的研究,为更深入的数据分析做准备,特点是操作简便、时效快、成本低;而且对于抽样中的统计专业技术要求不是很高;概率抽样的技术含量更高,调查成本更高,统计学专业知识要求更高,适合调查目的为研究对象总体,得到总体参数的置信区间。4)中心极限定理:若给定样本量的所有样本来自任意整体,则样本均值的抽样分布近似服从正态分布,且样本量越大,近似性越强。以30为界限,当样本量大于30的时候符合中心极限定理,样本服从正态分布;当样本量小于30的时候,总体近似正态分布时,此时样本服从t分布。样本的分布形态决定了我们在假设检验中采用什么方法去检验它。二、推断性统计定义:根据样本数据推断总体的数据特征。1. 基本步骤产品质检的时候用的几乎都是抽样方法的推断性统计,推断性的过程就是一种假设检验,在做推断性统计的时候我们需要明确几点:明确后可以对应我们假设检验的几个步骤了:提出原假设(H0)和备选假设(H1),确定显著性水平(原假设为正确时,人们把它拒绝了的概率);选择检验方法,确定检验统计量;确定P值,作出统计推理;假设对于某一个器件,国家标准要求:平均值要低于20。某公司制造出10个器件,相关数值如下:15.6、16.2、22.5、20.5、16.4、19.4、16.6、17.9、12.7、13.9。运用假设检验判断该公司器件是否符合国家标准:1)设假设:2)总体为正态分布,方差未知,样本为小样本,因此采用T检验。3)计算检验统计量:样本平均值17.17,样本标准差2.98,检验统计量为 (17.17-20)/(2.98/√10)=-3.00314)当置信度选择97.5%,自由度为9,此时为单尾检验,临界值为2.262。5)由于-3.0031<-2.262,拒绝原假设,因此接受备择假设,该器件满足国家标准。2. 假设检验类型单样本检验:检验单个样本的平均值是否等于目标值;相关配对检验:检验相关或配对观测之差的平均值是否等于目标值;独立双样本检验:检验两个独立样本的平均值之差是否等于目标值;3. 统计检验方法Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数>平均数的差异是否显著。T检验:用于样本含量较小(例如n<30),总体标准差σ未知的正态分布样本。F检验:F检验又叫方差齐性检验。在两样本t检验中要用到F检验。检验两个样本的方差是否有显著性差异 这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。(T检验用来检测数据的准确度,检测系统误差 ;F检验用来检测数据的精密度,检测偶然误差。)卡方检验:主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。4. 双尾检测和单尾检测这个和我们提出的原假设相关,例如我们检测的原假设:器件平均值>=20。我们需要拒绝的假设就是器件平均值<20,此时就是单尾检验;如果我们的原假设是器件平均值>20,则我们需要拒绝的假设就是器件平均值<20和器件平均值=20,此时就是双尾检测。5. 置信区间和置信水平在统计学中,几乎都是依据样本来推断总体的情况的,但在推断的过程中,我们会遇到各种各样的阻碍和干扰;所以我们推断出的结果不是一个切确的数字,而是在某个合理的区间内,这个范围就是置信区间。但整体中所有的数据都在这个范围也不现实,我们只需要绝大多数出现在置信区间就可以了,这里的绝大多数就是置信水平的概念,通常情况我们的置信水平是95%。置信区间[a,b]的计算方法为:(z分数:由置信水平决定,查表得。)a = 样本均值 – z*标准误差,b = 样本均值 + z*标准误差志在必得。不学自知,不问。自晓,古今行事未之有也!就数据分析而言,我们通过统计学可以用更富有信息驱动力和针对性的方式对数据进行操作;更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构确定数据分析的方法,来获取更多的信息。本文由 @木兮擎天@ 原创发布于人人都是产品经理。未经许可,禁止转载题图来自Unsplash,基于CC0协议

毋固

“统计大讲堂”开讲 “科学统计”成就新时代统计使命

人民网北京9月2日电 (杨曦)2019年北京政府统计开放日暨朝阳区第五届统计开放日8月30日在京举行。统计开放日是宣传统计、传播统计的重要品牌。本届朝阳区统计开放日是北京统计开放日的分会场之一,在北京“数说时代 统计有我”的主线下,以“科学的统计”为主题,围绕庆祝新中国成立70周年的背景,全面展现统计工作科学规范的显著特征,不断提高统计工作的权威性和公信力。朝阳区统计局局长韦小萍指出,科学规范是统计工作的显著特点和永恒主题。统计工作的科学性能不能落实,统计数据质量能不能提高,主要靠社会各界的配合。希望广大统计调查对象都能够参与统计、支持统计,也诚邀各位专家为朝阳统计发展建言献策,让科学成就统计,为朝阳区经济社会发展做出贡献。本届开放日创造性地采用了“统计大讲堂”形式,邀请来自统计系统和研究机构的多位专家,围绕统计工作的科学性进行演讲。清华大学中国经济社会数据研究中心主任许宪春作了题为《GDP核算的科学性》的演讲,通过“是谁创造GDP?”“什么活动创造GDP?”“消费和投资创造GDP吗?”“海洋中渔类的自然生长产生GDP吗?”等一系列与百姓生活密切相关的问题,激发了现场观众对GDP的科学核算的兴趣。带领观众全面了解统计指标的产生和使用过程,深入理解了统计指标的科学性。北京市统计局设管处处长邢洪丽从统从指标的元数据标准体系入手,系统介绍了国家统计法律制度、统计标准,以及北京统计“一级平台、三级监管、多方共享”业务流程,让观众理解到无论任何统计工作,都必须按照国家统计规则办事,让观众对统计方法制度的科学性有了更深入的体会。当前,随着信息技术迅猛发展,“大数据”成为最热门领域之一。如何将大数据与政府数据科学结合,利用新技术、新手段、新方法,为统计工作注入新的动能,是统计工作的重要课题。北京清华同衡规划设计研究院技术创新中心副主任李栋作了题为《促进政府数据与社会大数据融合与应用》的精彩演讲,让听众感受到大数据与政府数据融合发展的广阔前景,对统计工作的科学性有了全新的认识。朝阳区政府区长助理张小平认为,统计工作是经济社会发展的“晴雨表”,是领导决策的“参谋部”,是社会活动的“信息窗”。今年的开放日进一步提升统计工作透明度,扩大统计工作的公信力和影响力,让统计工作“飞入寻常百姓家”。北京市统计局副局长夏沁芳表示,今年是新中国成立70周年,是决胜全面建成小康社会第一个百年奋斗目标的关键之年。新时代、新任务,为统计工作提供了广阔的舞台,也对统计工作提出了更高要求。相信朝阳统计人会以科学、严谨的态度,努力践行时代赋予的使命。

受命于地

智库锐见:国家治理,离不开科学统计

党的十九大报告指出,全面深化改革总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。国家治理体系和治理能力是一个紧密联系、相辅相成的有机整体,它包括改革发展稳定、内政外交国防、治党治国治军等各个方面。可以看出,国家治理必须知己知彼,从这个角度上看,有一项极为重要的基础性工作必不可少,这就是统计。一个家要兴旺发达,离不开主人的精打细算;一个国家要长治久安,更离不开治理者心中有数,运筹帷幄。今天,小智邀请江苏省统计科学研究所所长、智库专家王思彤跟我们聊聊统计工作那些事,看看统计如何在国家治理中发挥重要作用。国家治理,离不开统计工作(图片来自网络)统计的一般职能和特点《中华人民共和国统计法》规定,统计的基本任务是对经济社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。我国统计界把统计的职能概括为三大职能,即信息、咨询与监督,这与《统计法》的界定是基本一致的。信息职能是保证咨询和监督职能有效发挥的基础,咨询职能是信息职能的延续和深化,监督职能是对信息、咨询职能的拓展。统计是国家治理体系中不可缺少的一个重要组成部分,统计的力量在于无处不在的应用性。统计作为一种计量手段和方法,从上古就开始服务于百姓生活了,史称“结绳记事”。随着阶级和国家的出现,统计又演变为国家管理的一种职能,为统治阶级提供统计服务,无论在中国还是外国都是如此。原始的统计工作即人们收集数据的原始形态已经有几千年的历史,而它作为一门科学,是以17世纪英国人威廉配第的《政治算术》出版为标志的,他被马克思称为“统计学创始人”。统计有数量性、总体性和具体性三个特点。数量性是指统计着眼于研究经济和社会现象的数量多少、数量关系、数量界限、数量变化趋势等;总体性是指统计是从整体上反映和分析事物数量特征,而不是着眼于个别事物,因为事物的本质和发展规律只有从整体上观察,才能做出正确的判断。例如,只有对大量的生育人口进行观察才能得出男孩、女孩的出生比例,若只对个别家庭观察是很难得出准确结论的;具体性是指统计关注某一具体事物的数量方面,而不是抽象的数学。《中华人民共和国统计法》于2010年1月1日正式施行(图片来自网络)统计在国家治理方面的作用量变能够引起质变,只有加强对变量的研究,才能把握规律,掌握主动,抢占先机,这是今天的治理者必须重视数量也必须重视统计的原因所在。要对国民经济这个庞大的系统进行有效的管理,必须全面掌握社会再生产的条件、过程、结果的数量信息,必须建立健全统计工作。抛弃了统计工作,就等于盲人骑瞎马,不可能做出科学正确的决策。新中国成立以后,统计工作一直在国家治理中发挥着重要作用。改革开放以来,县以上各级政府都建立了统计机构,有不少地区的统计工作向乡镇、村延伸,为准确及时地搜集和反映国民经济和社会发展情况奠定了扎实的基础。比如,1986年,党中央、国务院为了加强对固定资产投资的宏观管理,印发了《关于控制固定资产投资规模的若干规定》,其中专门规定“由国家统计局对基本建设、更新改造、车船购置和其他措施的投资规模每月统计一次,集体和个人的投资半年统计一次”,揭开了投资统计的序幕。2004年,国务院决定在我国正式建立劳动力调查制度,并以国务院办公厅名义印发了《关于建立劳动力调查制度的通知》,这为监测劳动力流转、制定用工政策和标准提供了可靠依据。统计信息、咨询、监督功能的发挥,不仅仅体现在每年出版的统计年鉴、每年发布的统计公报、定期召开的统计新闻发布会,以及经济普查、人口普查、农业普查等周期性的大型普查和调查上,更体现在日常的以党政领导为主要对象的统计服务中。比如,国家统计局每年向中央领导同志和“两办”报送的信息多达几百篇,被“两办”采用的也多达数百篇,并有数十篇次会得到党中央、国务院领导同志的批示。特别是在对经济形势的研判上,究竟是稳中有进、还是稳中有落,究竟是稳中向好、还是又好又快,如何看待新常态下的增速放缓,如何正确认识合理增长区间,怎样看待未来经济走势等等,都通过准确翔实的统计数据及时为高层提供科学分析及对策建议,很多观点被领导采纳,对宏观调控和国家治理产生了重要影响,发挥了智库和参谋助手作用。当然,统计工作也有从幕后走向前台的时刻。比如,2017年底我国首次公布全国及各省绿色发展指数,就是由国家统计局牵头,联合国家发改委、环保部、中组部等部门共同完成的,昭示了生态文明在国家治理体系中的重要性,产生了很大的影响力和引导力。统计在国际比较中也会发挥重要的作用。我国已经是世界第二大经济体,怎样才能成为十九大报告中提出的综合国力和国际影响力领先的国家,有没有可能培育出世界级先进制造业集群和具有全球竞争力的世界一流企业,有哪些发展指标需要向其他国家学习。要回答这些问题,只有依靠统计。我们强调统计要与国际接轨,目的是为了方便进行国际比较,在国际上有说服力、形成话语力。比如,上世纪80年代中期,针对改革开放中遇到的经济结构调整问题,国家统计局整理编发了题为《国外消费水平、消费结构和产业结构》的统计报告,从中外经济结构的比较中提出了中国经济发展战略中消费的地位问题,对当时国家决定大力发展服务业起到了推动作用。国家统计局logo(图片来自网络)统计,不能掉入这些陷阱陷阱一:统计数据不真实真实和准确是统计的生命,是统计咨询、监督功能发挥的基础,也是对统计工作最基本的要求。如果把决策产生过程当成一条流水线的话,那么统计数据就是源头。如果源头输入的统计数据是完全不可信的垃圾数据,最终输出的决策也会误国误民,所以要像爱护自己的眼睛一样爱护统计数据。比如大跃进时期,大部分领导干部对 “大炼钢铁”运动不敢提出不同观点,但当时的中央工业交通工作部副部长高扬同志到河南省检查工作,就不相信炼钢点上报的统计数字,自己组织干部实地带着磅称,到炼钢点去检验计量,给浮夸风揭了底,保证了提供的统计数据的真实性。统计数据造假现象还时有发生(图片来自网络)陷阱二:统计咨询不客观统计部门是没有部门利益、相对中立的部门,这是统计部门的独特优势,但是部门优势不等于生产的统计产品一定是客观的。统计部门必须要在实事求是的基础上,提供全面、尽可能反映实际的统计数据,提供咨询意见。比如,在今天大数据时代,国家的统计部门尽管还有官方的数据收集渠道,但是也要多方收集类似淘宝、京东这样市场化公司的数据,互相印证,去伪存真,同时还要做到不偏不倚,不带有政治色彩和倾向性地形成意见、建议。陷阱三:统计监督不到位统计监督是指对国民经济和社会发展情况进行的监督,即根据统计调查和统计分析,及时、准确地从总体上反映经济、社会和科技的运行状态,并对其实行全面、系统的定量检查、监测和预警。这是更高层次的监督,是政府统计功能的最高体现和升华。在这方面,统计工作还有很长的路要走,既不能越位,又必须到位、不能缺位,特别是要当好晴雨表和预报员,实时监测,及时预警,防患未然。比如,针对地方某个行业投资规模过大可能会引发经济过热,或者是产能过剩、库存积压、杠杆较高等现象,统计部门都有责任提前预警,给当地政府提供意见、建议。这时候,统计部门起到的作用是关键性的,是未雨绸缪,会避免决策出现偏差或走弯路。(人民日报中央厨房智观天下工作室出品)

弟子勉之

统计学案例分析

一、统计学的理论收获通过本学期在八教315线下授课的方式,我们深入学习了统计学这门课程,并认识到许多统计学的理论知识应用于现实生活中的案例,且具有重要意义;所以我们不仅仅要学会掌握课程内容,还学会运用其所学的知识与数据分析方法应用于实践。学习收获的总体内容有:1.总论:学习了统计学的定义是收集、整理、分析、解释数据并从数据中得出结论的学科;它的研究对象在统计学界观点不一,具有数量性、总体性、具体性、社会性、广泛性的特点。统计研究方法有大量观察法、统计分组法、综合指标法、统计模型与推断法;统计中的基本概念含有:总体、样本、参数、统计量、标志、指标。2.数据的收集:了解到了二手数据的来源渠道和评估、以及原始数据的直接来源,掌握到了数据的收集方法,可以通过线上与线下相结合的搜集方式,如:访问、调查问卷、电话调查等。老师重点讲解了统计调查的组织方式,分别有普查、抽样调查、统计报表等调查方式。其中普查是为某一特定目的而专门组织的非经常性全面调查,适用范围比较广,例如:我国进行的人口普查就是运用此调查方式;抽样调查具有节约、及时、准确、机动性的优势。3.统计整理,将统计调查所采集到的原始数据进行科学分类和汇总,可以反映总体的综合资料的工作过程,它的内容分别有:①统计调查资料的预处理,包括数据审核、筛选、排序和分类汇总以及数据透视表。②统计分组和分布数列汇总,可以利用Excel作频数分布表来分类数据整理,具有单变量和组距分组的分组方法。③统计结果的显示;用统计图表示(条形图、柱形图、折线图等等)。④统计资料的保存。4.平均分析:含概的内容有:(1)统计指标:有数量性、综合性、质的规定性特点;(2)总规模度量的总量指标;(3)比较度量的相对指标,也称为相对数,计算方法有计划完成相对数、结构相对数、比例相对数、比较和动态以及强度相对指数。(4)集中趋势的度量,包含有位置、数值平均数,以及各种平均数之间的关系;有众数和中位数、四分位数以及它们的分类。(5)平均数:按学习的内容分为:①算术平均数(均值),具有各变量值与均值的离差之和等于零以及离差平方和最小的性质;②调和平均数;③几何平均数;④众数、中位数、均值的关系。(6)离散程度的度量,包括有异众比率、四分位差、极差和平均差、方差及标准差,还有相对未知的测量:标准分数,以及相对离散程度:离散系数。(7)偏态与峰态的测度:都是运用偏态与峰态的图形来进行分析,把相应的数值放入相应的范围内,然后根据定义与相关性质来分析其数值所在的范围涵盖的意义。5.抽样与参数估计:抽样调查是一种非全面调查,是由部分推断总体的过程,如可以应用它进行社会调查和工业生产过程的质量控制等等;方法有重复与不重复抽样,通过计算抽样误差的范围来推测抽样估计的可靠程度。6.相关与回归分析:相关分析是通过采用相关表与相关图以及相关系数来反映相关关系的密切程度的统计分析指标;回归分析是利用直线回归方程的拟合与检测来确定变量之间的关系,进行估计和预测,也可以用电脑Excel进行一元回归和多元回归分析。7.假设检验:是利用样本对总体进行某种推断的过程,也称为显著性检验,检验方法有:原假设和备择假设、显著性水平、双边和单边检验。8.时间序列分析:分为绝对、相对、平均数时间序列,是由数值两部分组成,用来描述经济发展状况,并以此对未来发展情况进行预测;可以通过几何法和方程法来计算其发展水平与发展速度和它们的平均值来进行推测,然后利用长期趋势测定和季节变动测定的方法进行预测等等。以上便是我们本学期学习的总体内容,经过老师的仔细讲解,让我们能通俗易懂的掌握,并学以致用。二、统计分析方法的实际运用(一)时间序列分析法应用1.长期趋势测定的移动平均法分析长期趋势是指选取一段相当长的时间内的数据,发展过程表现为不断增长或不断下降的总趋势,选择适当的移动时距,然后运用其数据来进行对未来下一年的数据进行预测,通过移动平均法计算 。如借此方法来预测2020年山东省居民消费价格指数,因为选取的数据越长预测出来的结果就越接近实际,所以先线上查阅2000年至2019年的居民消费价格指数数据,如下图:对上述数据分别取移动间隔K=3和K=5,用Excel计算各期的居民消费价格指数的预测值,且算出预测误差以及预测平方,并将原序列和预测后的序列绘制成图形进行对比,如下图所示:利用简单移动平均制作出山东省居民消费价格指数移动平均趋势图:由以上图表得知当K=3和K=5时,预测2020年山东省居民消费价格指数分别为102.36%、102.116%,它们的误差均方为2.36、2.3578784。根据移动平均法的性质可知:平均误差:102.36>102.116,且误差均方2.36>2.3578784,因此,推测出5年移动平均预测值比3年移动平均预测值更稳定,所以选择5年移动平均误差推测出来的数值102.116作为山东省2020年居民消费价格指数的预测值。(二)统计指数的加权综合指数的应用统计指数是指用于测定多个项目在不同场合下综合变动的一种相对数,具有相对性、综合性、平均性的性质,按内容分类有数量指数和质量指数,而且也可以把其运用到实践中,如用其指数来分析中国粮油零售市场2018年和2019年大米、面粉、花生油三种商品的零售价格和销售量,从线上查阅资料如下图所示:由于拉氏指数在实际生活中的运用中数量指数比较常用,而帕氏指数的价格指数便被常用于实际分析,所以我通过拉氏指数来计算数量,帕氏指数来计算价格进行对比分析。如下:(帕氏)价格指数:结论:通过计算的数据对比得出,与2018年相比,2019年三种商品的零售价格平均上涨了21%。由于价格上涨,使销售额增加:(拉氏)数量指数:结论:通过计算的数据对比得出,与2018年相比,2019年三种商品的销售量平均上涨了11.4%。由于销售量增加,使销售额增长为:三、Excel在统计中的应用与实际用处本学期所学的统计学课程内容,我认为书本倒数第二章节:‘Excel在统计中的应用’对我在未来想从事的职业会有很大的用处。因为利用Excel可以把输入在电脑里的数据快捷的进行整理与分析,以及运用统计图或模型的方式来表示,便于人们更简单、直观的通过观察获得所需的数据以及借此来进行快速化分析,得出结果,节省了不必要浪费的时间;而且它还可以通过电脑计算器进行迅速计算和解决一些人们无法通过口算得出结果的数学问题等等;统计无处不在,如:若是我以后想在教师行业发展,我就可以运用Excel的数据分析工具来对学生的各科学习成绩以及所有学生的总成绩进行快速汇总,以及对各科的平均成绩的计算,还有在教学方式中也可以采用其制作相应的统计模型与图表来进行教学传授,让学生能直观、通过图形分析通俗易懂的对思维性知识的掌握与吸收,进而还可以提升学生大脑思维等等,促使高效率的完成教学任务;或者是我未来从事的是其它的行业职业,也可以应用Excel对该行业职业所需要整理的数据进行记录与汇总以及对某城市未来发展的预测与分析,如:运用时间序列分析法对某省的GDP以及CPI进行预测,或对月度、季度、年度报表可以转换成统计图的模式来显示,更便于工作人员分析,推测下一季度、下一年的发展状况,或对某一全体职工的工资表进行处理等等,避免造成失误。统计学广泛的应用于实际中,如描述本国GDP的变化以及对未来GDP的趋势推测、股票市场的股票指数图分析股市波动以及用数量图形来统计APP的用户数量等,都是运用Excel的数据分析工具制作统计图形来进行剖析的;所以通透并学会如何行使Excel在统计中的应用,可以让我们在以后的职业生涯中高效的提升工作效率,快速的对某一事物进行分析,而且也可以运用其来进行解析与预测以后自己想在某一地区发展的经济状况等。所以学好统计学,把理论与实践相结合的运用,对于我们来说尤为重要。

爱这里

专家热议新经济统计:丰富学科发展 赋能数字经济

人民网北京9月7日电 (任妍)近日,由首都经济贸易大学和首都师范大学承办的“新经济统计论坛”启动仪式以线上线下相结合的方式在京召开。国家统计局总统计师曾玉平在会上表示,大数据、互联网、人工智能等新技术快速发展,以数字经济为代表的经济发展新动能对统计学科产生了巨大的影响,经济统计的研究范围显著扩大,内容也更加丰富。新经济统计需要循序渐进的建立完备,科学的新经济统计的理论基础、学科框架和方法体系,需要建立适应数字经济和智能时代开放的宏观经济体系,需要建立新经济统计的教育教学体系等。何为“新经济统计”?华东师范大学统计交叉科学研究院周勇指出,“新经济统计”可以分两层含义去理解:一是新的经济统计,二是新经济的统计。无论是哪一层,都是强调新,即对统计发展及应用的新要求。新经济统计学告诉我们统计学大有作为,将在多领域多学科发挥着重要的作用。新经济统计学正面临发展的机遇,同时也让统计学发展路径上更丰富,更有前景。北京大学教授房祥忠表示,经济统计是以经济数据为研究对象的,新经济统计所研究的数据包括其广度和深度都有了巨大的变化。因此,需要发展新的分析方法和新的模式来研究新的数据以及新的经济问题,这需要所有的统计学家门共同努力,把统计研究成果用于国家建设。中国人民大学统计学院教授金勇进认为,数字经济与智能经济时代下,数据是核心。金勇进提出了建设新经济统计的几个目标:一是争取建立完备、科学的新经济统计的基础理论、学科框架和方法体系;二是争取建立适应数字经济和智能时代开放的宏观经济统计体系;三是争取建立柔性企业管理统计体系,开放可查询的案例仓库和智能决策系统;四是争取建立新经济统计的教育教学体系。为了实现目标,需要群思广义,需要持之以恒,也需要携手联合进行更深层次的探索。谈及数字经济和智能时代的叠加给我们生活带来的改变,东北师范大学副校长郭建华认为,一是社会和经济业态的改变,如数字经济的占比逐年增高,数字化生态系统开始形成; 二是数据环境变为全方位、全周期、全景式呈现,数据采集不再是一个瓶颈;三是思维方式的改变,我们应该用一种不确定性的眼光去看待世界。因此,统计学要开启新篇章,也必须要学会改变,包括改变学科建设的思路,要面向国家经济主战场;改变统计研究的方法;改变我们统计教育的体系,要顺应时代,顺应社会需求。