从统计学角度讲,医学研究的基本原则主要包括三个,即对照、随机化和重复。之所以要遵循这些基本原则,其目的主要是:从处理因素这个要素的角度讲,就是要保障尽量控制混杂因素;从研究对象这个要素的角度讲,就是要保障其同质性、代表性和均衡性;从实验效应这个要素的角度讲,就是要保障观察结果的精度。下面,医刊汇编译就这三个基本原则做简要说明。一、对照原则。在设置接受处理因素的实验组时,应该同时设置没有处理因素的对照组,因此,对照原则主要是从处理因素的角度来控制混杂因素的。设立对照应满足均衡性,它是指在设立对照时除给予的处理因素不同外,对照组和实验组的其它一切因素应尽可能一致。设立对照时,应把研究对象随机地分入对照组和实验组中进行平行试验。为避免倾向性偏倚,一般应采用盲法。设立对照的方式有安慰剂对照、空白对照、自身对照、标准对照(也称阳性对照)等。此外,各组的例数应尽可能相等。二、随机化原则。随机化是指采用随机的方式,使得每个研究对象都有同等的机会被抽取或分到不同的实验组和对照组中,它包括随机化抽样和随机化分组。因此,随机化原则主要是从研究对象的角度来控制混杂因素的。常用的随机化抽样方法有简单随机抽样、系统抽样、分层抽样、整群抽样等。常用的随机化分组方法主要有简单随机化、分层随机化及区组随机化等。随机化分组应在实施处理因素的干预前利用随机数字表或由计算机采用统计专业软件产生随机数来完成。临床试验研究中,由于研究的对象是陆续进入试验观察的,往往不能采用随机抽样的方法获取研究样本,只能根据事先确定的样本量利用“三标准”来获得,但无论是否是随机抽样,获得研究样本后分组原则上应是随机的。三、重复原则。重复原则是指在相同试验条件下进行多次研究或观察,以提高试验的可靠性和科学性。包括整个试验的重复、多个试验对象的重复、同一个试验对象的重复观测。样本量充分反映了重复原则,试验对象的重复观察次数越多,由样本计算出的频率或均数等统计量就越接近总体参数。但样本含量过大或试验次数过多,不仅会增加控制试验条件的难度,且会造成不必要的浪费。因此,为了获得科学、可靠的结果而又节约研究的成本,在设计中应从统计学的角度进行正确的样本量估计。
下文节选自《统计学七支柱》, 已获人邮图灵许可, [遇见数学] 特此表示感谢“统计学是什么?”早在1838年就有人提出过这个问题(与英国皇家统计学会有关),此后这个问题又被反复提起。多年来,铁打的问题和流水的答案已成为该讨论的特点。综合问题和答案可以看出,持续的疑问源于,统计学并不是一个单一学科。自诞生至今,统计学的工作内容经历了翻天覆地的变化:从极端强调“统计学家仅收集数据而不分析”,转变为从计划到分析的所有研究阶段皆积极寻求与科学家的合作。并且,统计学工作者面对不同的科学领域时,需要相应调整自身角色:在某些应用中,我们接受基于数学理论推导的科学模型;而某些应用中,我们构建如牛顿力学体系一样稳定的模型。在一些应用中,我们既是积极的计划者,又是消极的分析师;而在另一些应用中,我们的角色则恰恰相反。统计学工作者除了角色众多,还需要为了避免失误、保持角色平衡而面对种种挑战。这就难怪“统计学是什么”的老问题,无论面对哪个时代的新挑战,总会被重复提起。“统计学的挑战”在19世纪30年代指经济统计,在20世纪30年代指生物问题,而目前指定义模糊的“大数据”问题。统计学有各种各样的问题、方法和解释,那到底有没有自己的核心科学呢?如果统计学工作者总是致力于在诸多科学领域工作——从公共政策到验证希格斯玻色子的发现——甚至有时候只被视为服务人员,那统计学还能真正合理地被大家视为统一的学科吗?它能被视为我们统计学工作者自己的科学吗?这个问题就是我想在《统计学七支柱》书中解决的。我不打算告诉你统计学是什么或不是什么,而是尝试制定七个原则,即支撑统计学领域的七根支柱。它们在过去曾以不同方式支撑统计学,我保证,它们一定还会在无限的未来继续起到这样的作用。我会尽力使你相信,每根支柱的引入都是革命性的,并对统计学的发展产生了深远影响。本书书名借鉴了托马斯·劳伦斯(即阿拉伯的劳伦斯)完成于1926年的回忆录《智慧七柱》。这部回忆录的名称源于《旧约·箴言》,《箴言》9:1写道:“智慧建造了房舍,雕琢了七根支柱。”根据《箴言》,建造智慧的房屋是为了欢迎寻求知识的人。此外,本书还有一个目的:阐释统计推理的核心思想。将这七个原则称作“统计学的七大支柱”之前,我先强调,它们是七根“支撑”的柱子,是统计学的学科基础,而不是完整的体系。一方面,这七根支柱都有古老的起源;另一方面,现代学科通过自身结构的伟大独创性,以及华丽承诺不断产生的精彩的新思想,将统计学构建为多元化的科学。在不脱离现代工作的前提下,我希望在统计学核心中建立跨时代和跨应用领域的连接和统一。第一根支柱称为聚合(Aggregation)。我们也可以使用它在19世纪的名称“观测的组合”,甚至使用最简化的名称:均值。名字太简单可能误导读者,其实,虽然它现在看来已不新鲜,但在早年却真正地具有革命性,并且时至今日依然如此——无论它在何时进入新的应用领域。那么,它如何体现革命性?按照规定,给定一些观测值,你可以通过丢弃信息而真正获得信息!我们对观测值取简单的算术平均值,丢弃观测值的个别特征,而将其都纳入汇总值进行考虑。目前,这在重复测量中很常见,比如观测恒星在太空中的位置。然而在17世纪,可能需要忽略这样一些信息,比如法国是个酒鬼观测员做出的观测,俄罗斯人是用旧仪器做出的观测,英国是个很靠谱的朋友做的观测。事实上,抹去个体观测的细节比任何单个观测都能给出更棒的指示。根据记录,算术平均值的使用最早出现在1635年;而其他形式的统计汇总的历史则更为悠久,可以追溯到美索不达米亚文明最初出现文字的时代。当然,第一根支柱最近的重要实例更为复杂。最小二乘法及其衍生方法的本质都是均值,它们通过对数据进行加权汇总而抹去数据的个体特性——指定的协变量除外。甚至核密度估计和各类现代平滑器在本质上也是均值。第二根支柱叫作信息(Information),更具体地说是“信息度量”,也是说来话长又很有意思。我们什么时候有足够的证据证明一种药物的疗效?这个问题可以追溯到古希腊。而研究信息积累率的时代则要近很多。18世纪早期,人们发现在很多情况下,一个数据集的信息量仅与观测个数 n 的平方根成正比,而不与 n 本身成正比。这也是革命性的思想。假设你试图说服一名宇航员,如果他想将研究精度提高一倍,那么他需要用 4 倍数目的观测;又或者,第二组 20 个观测值与前 20 个观测值尽管同样精确,但第二组的信息量并不像第一组的那么大。我们将这个思想称为“根号 n 规则”。它需要一些很强的假设,并且在很多复杂的情形中使用时需要修正。无论如何,1900年就明确建立了这样的思想:数据中的信息可以测量,而测量的精度与数据量有关,某些情形下可以精确刻画相关性的形式。我将第三根支柱命名为似然(Likelihood),意味着使用了概率的推理的校准。显著性检验和普通的P值都是最简单的似然形式,但诚如其名,与“似然”有关的方法丰富多彩,其中许多方法或者与费舍尔推断的参数族有关,或者与贝叶斯推断的参数族有关。各种各样的检验可以追溯到至少一千年前,但最早使用概率的检验则出现在18世纪早期。许多例子出现在18世纪~19世纪,而系统性处理则出现在20世纪罗纳德·费舍尔的工作,以及耶日·奈曼和伊冈·皮尔逊的工作中。从那时起,统计学家开始认真发展了一整套似然理论。人们最熟悉的检验可能是用概率校准推断,但一个概率数字无论作为置信区间还是贝叶斯后验概率,都必须完全附属于一种推断。事实上,250年前发表的“托马斯·贝叶斯定理”就是为了完成这个目标。第四根支柱的名字是相互比较(Intercomparison)。这个名称借鉴了弗朗西斯·高尔顿的一篇论文,它表达了一个过去激进但现在普通的思想:统计比较常常可以采用数据自身的内部标准,而不必采用外部标准。相互比较最常见的例子是学生 t 检验和方差分析的检验。一方面,在复杂设计中,变化的划分可能错综复杂;另一方面,复杂设计允许区组设计、裂区设计,或完全根据手头数据评价的层次设计。这种思想非常激进,而且在“有效”的检验中,这种思想有着与最强大的工具一样的问题:可能由于忽略外部科学标准而导致错误方式的滥用。我们可以将自助法视为相互比较在假设弱化后的现代版本。第五根支柱叫作回归(Regression)。这个名称源于高尔顿1885年发表的论文,这份文献基于二元正态分布解释了什么是回归。达尔文的自然选择理论存在内部矛盾:选择需要增加多样性,但定义物种需要群体外观稳定。高尔顿尝试为这个理论设计一个数学框架,并成功地克服了这组矛盾。回归现象可简单解释为:假设有两个不完全相关的观测变量,你选择了其中极值远离均值的变量,那么可以预期另一个(以标准差为单位)不会那么极端。高个子的父母平均会孕育身高稍矮的子女,而高个子的子女平均会有身高稍矮的父母。但这一现象涉及的不只是一个简单的悖论:真正新奇的思想在于,提问的方式不同,答案就完全不同。事实上,这项工作引入了现代多元分析和任何推断理论都需要的工具。引入这个条件分布的工具前,真正一般化的贝叶斯定理无法使用。因此,这根支柱与因果、推断一样,是贝叶斯学派的核心内容。第六根支柱是设计(Design)。类似于在“实验设计”中的含义,但“设计”的范围更广泛,它的目标是:先设定观测的权重相同,再训练我们的思想。设计的某些要素历史悠久,《旧约全书》和早期的阿拉伯医学提供了相应的例子。从19世纪晚期,随着查尔斯·皮尔斯和费舍尔先后发现随机化在推断中的巨大作用,统计学出现了对设计主题的新理解。费舍尔认识到结合严谨的随机化方法将会带来好处,于是在实验法则中引入激进的改变。这些改变一反几个世纪以来的实验哲学和实践,将这一主题提升到了一个新的高度。多因素现场试验中,费舍尔的设计允许效应的分离和相互作用的估计;实施随机化后,有效推断不再需要正态性或者材料的均匀性的假设。第七根也是最后一根支柱称为残差(Resial)。“残差”表示“其他的一切”,你也许会怀疑这是一种托词,但我想表达一种更具体的思想。从19世纪30年代开始,有关残差现象的概念在关于逻辑的书籍中就很常见。正如一位作者所说:“复杂的现象……可以通过减去已知原因的影响进行简化……留下……需要解释的残差现象。通过这样处理……科学……得到了极大的促进。”而后,这种思想总体上归入古典的范围,却以一种新方式在统计学中得到使用。这种新方式结合了结构化模型族,并通过概率计算和统计逻辑在族内做选择,从根本上强化和规范了方法。模型诊断(画出残差)在统计学中极为常见,但通过拟合和比较嵌套模型探索高维空间的方法更具重大意义。每个对回归系数显著性的检验都体现了这种思想,针对时间序列的每一个探索亦是如此。我重新概括了七根支柱,用七种基本统计思想的作用来表达——尽管这样做也许会导致过度简化的风险。(1) 定向减少或压缩数据的价值。(2) 数据量上升,价值会减少。(3) 如何使用概率测量我们做的事?(4) 如何使用数据中的内部变化帮助分析?(5) 从不同角度提问可以产生有启发性的不同答案。(6) 规划观测的重要作用。(7) 所有这些思想如何用于科学探索和比较彼此矛盾的解释。但是,无论这些思想出现于过去还是现在,以上平淡的陈述都没有表现出这些思想出现时的革命性。在当时,这些思想——从放弃数据值的个体特点到降低新数据和等价值数据的权重,再到克服障碍使用概率测量博弈外部的不确定性——已经丢弃或推翻了既有的牢固的数学和科学信念。世界产生了数据,那么数据自身的变化如何能够测量世界的不确定性?高尔顿的多元分析向科学家揭示,科学家依赖的比例规则(流传自欧几里得时代的比例规则)不适用于数据有变化的科学世界。这推翻了3000年来的数学传统。费舍尔的设计直接否定了实验科学家和逻辑学家几个世纪以来深信的内容,他的模型比较方法对实验科学来说绝对新颖,而接受这种方法则需要几代人的思维改变。想知道以上所有思想的革命性和影响力有多大吗?只要考虑一下这些思想持续受到的强烈批评便可知一二。这些批评常常攻击那些我认为价值很大的地方,列举如下。● 批评统计将人视为纯粹的统计量,而忽略人作为个体的特性。● 批评大数据仅仅可以回答那些默认基于规模基础的问题。● 批评显著性检验会忽略问题的科学内容。●批评回归分析会忽略问题中更重要的内容。这些批判本身也有缺陷。虽然不乏正确之处,并且在某些极端的例子中直击要害,但是,这些批判常常只瞄准方法,而非方法在例子里的运用方式。1927年,爱德华· B. 威尔逊对此做了一番精彩的评论:“就像没有接受过工具训练的人会害怕仓库中的任何一件工具一样,缺乏统计学知识的人会相信科学方法论中的统计工具都非常危险。”我将讲述这七根支柱,并简单介绍它们的历史。这七根支柱都是优秀的工具,但人们需要足够的智慧和训练才可以有效使用它们。这些思想不是数学的一部分,也不是计算机科学的一部分,它们是统计学的核心内容。另外,我现在需要承认,虽然在本书开始直接否认了我的目的是解释统计学是什么,但到本书结尾,其实我已经完成了这个目标。现在,我要简短地回应一个未了结的问题:《箴言》9:1究竟说了什么?它是这样一条古语:“智慧建造了房舍,雕琢了七根支柱。”为什么一间房屋需要七根柱子?这种结构无论在古代还是在当代似乎都鲜有人知。最近的一项我比较信服的研究表明,那些负责为日内瓦1和詹姆斯王2翻译圣经的16世纪学者们,因为不太了解早期的苏美尔神话,错误地翻译了这一节。七根支柱根本不是建筑的结构,而是大洪水之前美索不达米亚的七个伟大王国。七位智者向国王进谏建立了七个城市,七个王国正是建立在这七个城市基础之上的。因此,智慧的房屋建立在这七位智者的意见之上。时代更近的学者提出了新的翻译:“智慧建造了房舍,七位智者奠定了其基础。”1指1570年在日内瓦出版的圣经译本。——译者注2英王詹姆斯一世下令将圣经译为英文,于1611年出版。——译者注正是由于远远多于七位的智者的不懈努力,我得以将他们的成果总结为七根支柱。其中一些智者的姓名已经淹没在历史的长河之中,在本书的相关部分,我们会读到他们的智慧成果。统计学七支柱作者:Stephen M. Stigler 译者者:高蓉, 李茂出版社:人民邮电出版社图灵新知出版年:2018年1月遇见数学, 遇见更精彩的自己非常感谢您的关注和支持!
统计学在医学科研工作中发挥着重要的作用,统计学方法种类繁多,各自的适用范围以及所需的前提条件又不尽相同,容易发生误用,导致论文质量不高,甚至结论错误而引起误导。为能有效促进统计学方法的正确使用,保证科研的科学性、可靠性,提高医学科研论文质量,赛恩斯编译对医学科研论文中常见的统计学问题进行梳理和总结如下:一、实验组与对照组没有可比性。实验组与对照组必须遵循均衡化的原则,即实验组与对照组除处理因素不同外,其他可控制的非处理因素要尽可能保持一致,从而尽量排除非处理因素对结果的影响。各组间均衡程度越高,可比性越强。如果分组时未注意到对照组与实验组的均衡性,两组之间就会出现差异,不具备可比性,结论有可能不准确,甚至相反。二、样本量过小。样本量的大小影响结论的可靠性。样本量过小,抽样误差大,结果可靠性差,且经不起验证;反之,若盲目加大样本量,不但会造成人、财、物的浪费,而且会造成非抽样误差增大。应在保证研究结果精确可靠的前提下,确定最小的样本量。三、混淆标准差与标准误的作用。实验数据一般综合表示为“均数±标准差”的形式,标准差表示数据相对于均数的离散程度,而标准误是表示抽样误差大小的指标,二者含义完全不同。有些作者误将标准差用于可信区间的表述,将标准误用于正常值范围的表述。四、假设检验方法运用不当。每一种假设检验方法都有其特定的适用条件和严格的适用范围。所研究变量的类型不同、设计类型不同、大样本还是小样本等,所用假设检验的方法也不同。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。同为数值变量资料,如将配对设计的资料按成组设计资料的方法进行假设检验,不但损失样本提供的信息、降低检验效率,而且可能使原本有统计学意义的结果表现为无统计学意义。五、未注明假设检验方法或不具体。有些论文对收集到的资料进行了统计学分析,但未说明使用的是什么方法。表现为论文中只有假设检验的结论,未注明检验方法、现有样本算得的检验统计量、检验水准、采用的是双侧检验还是单侧检验、P值的确切范围。这样读者就无法得出论文中统计学方法选择是否合理,无法核对结果是否准确。在论文写作时,不但要注明选用的是什么统计学方法,而且要尽可能详细、具体。六、错误理解假设检验中P值的含义。统计学上,根据假设检验原理推算出来的P值,表示拒绝无效假设犯假阳性错误的概率,P值越小,越有理由认为两种处理方法效果不同。P值不能反映相比较的两组或多组参数之间差异的大小,参数差异的大小只能根据专业知识来确定。七、只关心统计结论,忽视差异有无临床意义。评价一项医学研究结果,要看其是否具有临床意义和统计学意义。如果差异本身没有临床意义,可以不必进行假设检验,因为当样本含量足够大时,基本都会取得差异有统计学意义的结论。医学论文中,作者常根据假设检验有统计学意义,就断定研究结果有临床意义。直线相关分析中,只关心相关系数的差异是否有统计学意义,而不关心相关系数的大小有无实际意义。产生上述问题的原因,大多是由于对统计学在医学科研工作中的重要性认识不足,少数作者缺乏高度的责任感、科学严谨的态度,凭主观想象,甚至弄虚作假。参加科研设计、统计学、论文写作方面的培训较少,也缺少与医学科研设计专家的沟通。
随着科研人员对统计学分析方法的重视与应用能力的提高,医学论文中的统计学分析方法也越来越科学、越来越复杂。医刊汇编译认为,研究设计要在遵循“随机、对照、盲法、重复”原则的前提下,各组资料的基本要素应齐全,包括受试对象,处理因素及研究效应。需要明确受试对象的来源、纳入、排除标准及非处理因素的相关描述,保证同质性及代表性。一、计量资料的分析。一般来说,在遵循“随机、对照、盲法、重复”原则的基础上,依照研究因素及水平的不同,可将实验设计分为四类,即单因素单水平实验、单因素多水平实验、多因素单水平实验及多因素多水平实验。同时,还需要区分处理因素与非处理因素,两者往往同时存在,处理因素通常取决于研究者,是根据研究目的确定的,而非处理因素是人为不可改变的,但可能对实验结果产生影响的因素。故研究者在确定处理因素后,需要根据专业知识及实验条件,找出重要的非处理因素加以控制,保证同质性,以突出处理因素的主导作用。有些研究者往往忽视了重复测量资料的比较方法的选择。它适用于同一受试对象的同一观察指标在不同时间上多次测量的资料,分析观察指标在不同时间点上的变化。重复测量资料的比较应当重视同一受试对象数据具有相关性,且受试对象的处理因素随机分配,但各时间点往往是固定的。因同一受试对象在不同时间点的数据高度相关,需检测资料是否满足球形检验,即同一个体的多次测量结果之间是否存在相关性。并根据各因素间是否存在交互作用,以判断主效应的意义与相应水平均数比较的差异解读是否正确。多个样本均数经方差分析比较后,若有统计学意义,只能说明多组间数据比较不全相同,需采用两两比较的方法进一步明确哪些均数不等。通常有两种情形:一是未计划的每两个均属的事后比较;二是计划好的某些均数间的两两比较。此外,对不符合方差分析假定条件的资料,可通过某种形式的数据转换,如对数转换、平方根反正弦变换等;采用非参数检验;或采用近似检验。二、分类资料的分析。分类资料又称分类变量,其观察值是定性的,具体表现就是互不相容的类别或属性。这又有两种情况:一是无序资料,包括二项分类、多项分类;二是有序资料,各类之间有程度的差别,给人以“半定量”的概念,统计学上也称为等级资料。对于分类资料,最常用的就是卡方检验。很多研究者最常犯的错误,就是该用配对卡方检验的,却只是用了普通的卡方检验;该进行相关分析的,却只是使用了卡方检验。对于分类资料,如果要分析两者之间的相关性,就应当用相关性分析,因为卡方检验,只是检验两个定性变量之间是否有独立性,即分布是否不同;而大多数的作者都认为,在卡方检验拒绝了“独立性”之后就表明两者之间是相关的。三、相关分析与回归分析。对于相关分析与回归分析,作者不应单纯重视所要分析数据的类型,数据的类型决定了选择的分析方法。在进行相关分析前,作者应当绘制数据的散点图,以初步判断变量间是否存在相关趋势。最常用的Pearson相关分析和Speaeman秩相关分析,前者仅适用于双变量均正态分布的定量资料,后者适用于双变量均不服从正态分布或总体分布不明的资料及等级资料。但事实上,在进行相关分析时,往往需要进行相关分析的两变量可能会受到其他变量的影响,此时可以利用偏相关分析对其他变量加以控制,得出的偏相关系数能更好地反映两变量线性关系。
教育心理学研究的具体方法技术很多,而基本的研究方法可以概括为描述的定量研究方法和解释的质性研究方法。1.观察法观察法是一种有目的、有计划地观察记录被研究对象行为活动的研究方法。观察法是科学研究中应用最广泛的一种研究方法。科学的观察方法先要解决“观察什么”“如何观察”“如何记录”这三个问题。观察法可分为自然观察法和实验室观察法,常常要借助仪器设备记录被研究者的心理与行为。根据观察要求的不同,又可以将观察法分为长期观察和定期观察。观察法是搜集研究资料的初步方法。其使用方便,有经验的研究者或教师如能善于运用,往往能够收集到不少所需要的数据和资料。但是,观察法积累的资料只能说明“是什么”,而不能解释“为什么”。因此,对于观察所发现的问题还需要使用其他方法作进一步的研究。2.实验法实验法是有目的地控制一定的条件或情境,以引起被试一定的心理反应的研究方法。运用实验法不但能说明“是什么”,而且能够进一步解释“为什么”。以实验法进行心理学研究的目的,是要搞清楚在有控制的条件下,影响一系列心理变化的因素,即变量。其中有些变量是由实验者控制的实验条件,称之为自变量或实验变量;有些变量叫因变量或依从变量,它们是实验者所要测定的行为和心理活动。例如,我们如果想要检验一种新的教学改革方法的效果,就可以把这种新方法视为自变量,而新方法所引起的变化反应视为因变量。用实验法研究心理问题必须设立实验组和对照组,并使这两个组在无关变量方面大致相同,然后对实验组施加自变量(实验变量)的影响,对照组则不施加影响,以这样的方法来考察并比较这两组的反应是否相同,确定自变量的实验效果。实验法的关键是对变量的控制,因此必须精细地设计并控制影响实验结果的自变量、因变量和无关变量。同时,要以数学的方法分析处理实验数据在统计学上的差异水平,从而得出科学的结论。3.测量法测量法是指运用标准化的量表(问卷)测定人的某种心理品质的方法。常见的心理测量有智力测验、人格测验、成就测验、态度测验、创造力测验等。所谓标准化的测量工具是指由权威机构或学科专家负责组织编制的心理量表(问卷),其有客观而规范的标准,如信度、效度指标、评分标准、常模和解释系统,只有这样才能比较有效而可靠地测量出人们的心理品质。4.调查法调查法是以提问题的方式,了解被试心理活动的方法。调查法可以用于个体心理研究,也可以用于研究群体的心理。以调查法搜集资料有两种基本的方法,即问卷式调查和访谈式调查。运用调查法应当遵循的步骤是:①根据研究问题的性质,确定调查对象,选择恰当的调查类型和方式;②拟定调查的具体详细内容;③做好调查前的准备工作;④进行调查前的预测,以发现和纠正所要调查的问题及内容;⑤开展正式调查;⑥整理调查资料,统计分析调查结果。5.经验总结法经验总结法是教育心理学一个重要的研究方法,是指教育工作者从心理学的角度对自己或他人的工作经验进行总结。教育工作者,尤其是一线教师们在教学实践中常常积累起来了许多丰富的经验,并且提出一些值得研究的教育心理学问题。通过不断总结教育经验,提升教学科研水平,在教育实践中加以推广,常常能产生良好的教学效果。6.教育行动研究教育心理学主要研究教育实践领域中的各种心理学问题,因此教育实践是推动教育心理研究的强大动力,从这个意义上说,教师因为具备丰富的教育实践经验,因此也就具有掌握教育心理学的基本原理及其研究方法的实践基础。在以前,教学与学习的研究基本都是大学和研究机构的专家们的事,而当前,教学与学习的研究中出现了一个新趋势,即教师们自己开始越来越多地参与到研究中。科研兴教,让教师直接参与教学科研,这已经成了众多知名中小学的成功经验,也是国际上的重要倾向。
知识图谱继续我们的知识总结,本文总结包括:多选题研究、聚类分析研究、权重研究、非参数检验、数据分布。查看本系列之前的文章,可点击下面的链接:论文里的分析方法要用哪一种,SPSSAU告诉你答案论文常用数据分析方法分类总结-211. 多选题研究多选题分析-SPSSAU多选题分析可分为四种类型包括:多选题、单选-多选、多选-单选、多选-多选。“多选题分析”是针对单个多选题的分析方法,可分析多选题各项的选择比例情况“单选-多选”是针对X为单选,Y为多选的情况使用的方法,可分析单选和多选题的关系。“多选-单选”是针对X为多选,Y为单选的情况使用的方法。“多选-多选”是针对X为多选,Y为多选的情况使用的方法。12. 聚类分析聚类分析-SPSSAU聚类分析以多个研究标题作为基准,对样本对象进行分类。如果是按样本聚类,则使用SPSSAU的进阶方法模块中的“聚类”功能,系统会自动识别出应该使用K-means聚类算法还是K-prototype聚类算法。如果是按变量(标题)聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析。13. 权重研究权重研究-SPSSAU权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法包括:因子分析、熵值法、AHP层次分析法、TOPSIS、模糊综合评价、灰色关联等。因子分析:因子分析可将多个题项浓缩成几个概括性指标(因子),然后对新生成的各概括性指标计算权重。熵值法:熵值法是利用熵值携带的信息计算每个指标的权重,通常可配合因子分析或主成分分析得到一级权重,利用熵值法计算二级权重。AHP层次分析法:AHP层次分析法是一种主观加客观赋值的计算权重的方法。先通过专家打分构造判断矩阵,然后量化计算每个指标的权重。TOPSIS法:TOPSIS权重法是一种评价多个样本综合排名的方法,用于比较样本的排名。模糊综合评价:是通过各指标的评价和权重对评价对象得出一个综合性评价。灰色关联:灰色关联是一种评价多个指标综合排名的方法,用于判断指标排名。14. 非参数检验非参数检验-SPSSAU非参数检验用于研究定类数据与定量数据之间的关系情况。如果数据不满足正态性或方差不齐,可用非参数检验。单样本Wilcoxon检验用于检验数据是否与某数字有明显的区别。如果X的组别为两组,则使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果,SPSSAU可自动选择。如果是配对数据,则使用配对样本Wilcoxon检验如果要研究多个关联样本的差异情况,可以用多样本Friedman检验。如果是研究定类数据与定量(等级)数据之间的差异性,还可以使用Ridit分析。15. 数据分布数据分布-SPSSAU判断数据分布是选择正确分析方法的重要前提。正态性:很多分析方法的使用前提都是要求数据服从正态性,比如线性回归分析、相关分析、方差分析等,可通过正态图、P-P/Q-Q图、正态性检验查看数据正态性。随机性:游程检验是一种非参数性统计假设的检验方法,可用于分析数据是否为随机。方差齐性:方差齐检验用于分析不同定类数据组别对定量数据时的波动情况是否一致,即方差齐性。方差齐是方差分析的前提,如果不满足则不能使用方差分析。Poisson分布:如果要判断数据是否满足Poisson分布,可通过Poisson检验判断或者通过特征进行判断是否基本符合Poisson分布(三个特征即:平稳性、独立性和普通性)卡方拟合优度检验:卡方拟合优度检验是一种非参数检验方法,其用于研究实际比例情况,是否与预期比例表现一致,但只针对于类别数据。单样本T检验:单样本T检验用于分析定量数据是否与某个数字有着显著的差异性。上述分析方法均可在SPSSAU中使用分析,以及相关方法问题可查看SPSSAU帮助手册。
放假对于每一位上班族来说,都是一件比较期待的事情。若利用这个时间进行深造,可有效弥补个人能力不足,这时可以选择攻读在职研究生课程。此种课程班均由高校开办,并且设有多种专业。接下来,本文介绍关于统计学在职研的相关信息。在职研究生该专业招生信息已发布,引来多数人士的关注。大家可以从招生方式、招生条件、招生时间、学费学制等方面进行了解,详细内容如下:一、招生方式该专业招生院校主要有对外经济贸易大学、南昌大学、中南财经政法大学,都是以同等学力的方式进行招生。该方式采用先进校学习而后参加考试的模式,入学无需参加考试,通过院校审核后就可拥有录取资格。二、招生条件该专业除了对外经济贸易大学要求大专学历以外,另外两所院校均要求具备本科学位。在申请硕士学位时,要求学员拥有学士学位满3年,并且通过结业考试才能参加。三、招生时间本专业入学时间不固定,一般全年招生。若院校有招生名额,就可前来参加。对于想要参加深造的人士来说,需及时关注招生信息。另外,申请硕士学位的报名时间在每年3月左右,受疫情影响以申硕公告为准,而申硕考试在5月左右。四、学费学制此专业学费范围在2万到5万元之间,不同院校有不同学费。然而上课时间均安排在放假,另南昌大学开设网络班,不影响工作,因此对学费不会造成太大压力。学制统一为2年,通过申硕考试与论文答辩后,可获得硕士学位证书。以上就是关于统计学在职研究生的相关介绍。本专业入学门槛低,学习不耽误工作,还可有机会提升学位。因此,建议大家前来报考。
专业介绍统计学原本是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数 据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。随着统计学的不断发展它逐渐被广泛的应用在各门学科之上,从自然学科、社会科学到人文科学,甚至被用在工商业及政府的情报决策之上,并逐步发展为一个独立的学科。统计学的分支统计学的研究大致可以分为两类,一类偏向于理论统计学,另一类偏向于应用统计学。其中:1.1 理论统计学理论统计学从纯理论的角度,对统计方法加以推导论证,核心是统计推断问题,实质是以归纳方法研究随机变量的一般规律。研究内容包括:样本设计、数据挖掘、随机过程、建立统计模型、模型的选择、时间序列、非参数统计方法、蒙特卡罗法、生存分析、空间统计、贝叶斯推论、各种经典的统计模型和各种概率论理论的学习等等。1.2 应用统计学应用统计学是统计学的一般理论和方法在社会,自然,经济,工程等各个领域的应用,它是统计学和其他学科之间形成的交叉学科也 是理论统计学发展的源泉。研究方向包括:生物/医学统计、环境统计、经济/金融统计、工程统计、农业统计、化学统计、心理统计等等。其中生物/医学统计、工程统计、环境统计、经济/金融统计的发展非常最为迅速,成为目前国外统计学研究的热点。(1)生物统计是运用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。其最常见的是应用于生物学、医学、农学等的研究中,合理地进行调查或实验设计,科学地整理、分析收集得来的资料。在美国,现在很多学校都专门设立了独立的生物统计系,另外生物统计有很大一部分设置在公共卫生学院(School of Public Health) 里面,毕业后可以在医院或者科研机构进行研究工作。(2)环境统计是用数字反映并计量人类活动引起的环境变化和环境变化对人类影响的工作。环境统计可为政府部门制定环境政策和环境规划,预测环境资源的承载能力等提供依据。包括:土地环境统计,、自然资源环境统计、能源环境统计、人类居住区环境统计、环境污染统计等,以及反映环境保护专业人员的组成和工作发展情况的统计。(3)工程统计是结合工程问题,研究怎样去有效地收集、整理和分析带有随机性的数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议(4)经济统计也是比较热门的专业之一,主要是对于经济金融活动进行数量方面的调查﹑整理﹑分析的,目的是认识经济活动客观规律,对经济活动实行科学建议、管理与监督。(5)除了以上比较热门的分支之外,还有一些其他分支。随着学科的发展健全,统计学与其他学科间的融合越来越明显,统计专业与学校内其他各个系之间合作的越来越多、越来越深入。统计学在美国 正如前文所言,统计学应用性强,本身虽然只是一种工具,一件武器,这些特点决定了它的适用范围非常广。产业和行业的发展离不开教育,在美国共有 4,100 左右所大学中,从顶尖的斯坦福大学、哈佛大学等到最普通的社区大学,大部分学校都设置了统计学专业。但各所学校的统计学又各有侧重,统计专业大部分设在文理学院,有些则为了与应用方向结合的更紧密,将统计专业设在商学院,工程学院、农学院等不同学院。这样广泛的学校资源和研究方向为各种背景、各类条件的申请者都提供了多元化、多层次的选择空间。统计学在英国英国作为统计学的发源地,拥有非常悠久的历史。对于专业细化的英国院校,英国大学的统计学研究方向,可以开始出现多学科交叉的专业,例如:数理统计、社会经济统计、生物卫生统计、金融统计与风险管理和精算、应用统计等。英国大学统计专业主要包括:一般统计、经济统计、社会统计等多种专业方向。该校培养学生能够掌握统计学的基本理论和方法,熟练地运用计算机分析数据,能在企业/事业单位和经济/管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。申请要求申请者专业背景一般来说,美国和英国大学的录取委员会在招生的时候,比较倾向于具有理工科背景的学生,尤其是本科为统计学或者数学专业的学生。这些学生在低年级的基础课程大部分相同,只是在高年级的专业课有所不同,但还是有很大一部分交叉的课程,所以二者在申请的过程中差别不大。还有部分是转专业的申请者,录取委员会的教授们会比较注意这部分人的部分数学背景,比如一些数学类的基础课程,如数学分析,高等代数(或者是高等数学),统计的基础课程、实分析等课程。以斯坦福大学为例,该校的对申请者的专业要求为:A strong mathematics background, especially in probability, statistics and linear algebra, is important in the admission process. However, it is not the only factor that determines which applicants are admitted. If such is the case, it is strongly suggested that prospective applicants consider strengthening their math skills and apply later.软件要求(实习,科研,工作等等)1、对专业知识即专业软件的熟悉程度大部分学校需要申请者具有相应数学背景,即在数学相关的课程起码在五门以上,PHD 甚至要达到七门,一些计算软件,如 R、SPSS、Eviews、MATLAB、SAS 等的熟练操作和使用也是录取 委员比较看重的方面。2、参加科研项目情况这些是学生申请的基本条件之一,参加科研项目是录取委员会衡量你专业水平的首要标准,通 过申请者参与项目的多少,含金量的高低,以及从文书中所反应出你在这些项目中获得的能力和对专业的理解,都是录取委员会成员关注的内容。3、发表学术论文的情况针对本科生发表文章的要求不是太高,但是如果有的话,在申请前把论文摘要作为申请材料,无疑是吸引对方眼球的方法之一。4、实习/工作要求由于统计学是一个应用性非常强的专业,而实习或者工作无疑对于申请有很大的帮助。所以,我们强烈建议同学们能够利用课余时间参加相关实习。学费介绍以下是美国部分大学统计学专业学费的介绍,每年的学费范围基本在 $30,000~$95,000之间。(注:美国大部分统计学专业为一年半或者两年制)以下是英国部分大学统计学专业学费的介绍,每年的学费范围基本在20,000~30,000之间。(注:英国的大学统计学专业基本都是一年制)典型项目介绍Stanford University斯坦福大学统计学系近几年一直位居美国统计学专业排名的榜首。系内目前拥有全职教授29人,在读研究生近140人。学校致力于统计方法的应用而非统计理论的发展。学院的目标是培养学生具有使用概率和统计的观念和方法在理工科领域占有一席之地,给那些已经被普遍认为有用技术的理论和应用方面提供指导,培养在概率和统计方面的研究人员,学校为学生提供各种课程,同时也为他们提供在商业,政府,工业和教育方面的职业指导。统计学学位的要求非常灵活,取决于学生的需要和兴趣,学院很早就认识到统计理论和应用的关系,因此一直以来致力发展跟其它学科的联系:经济,教育,电子工各一,地理环境科学,健康研究和政策,数学,生物医学等方面.University of California—Berkeley加州大学伯克利分校统计学系目前拥有全职教授43人,在读研究生近90人。其主要研究领域包括理论统计学 (Theoretical Statistics)、应用统计学(Applied Statistics)和概率论(Probability)三大研究领 域,可授予统计学硕士(M.A. in Statistics)、统计学博士(Ph.D. in Statistics)、生物统计学硕士 (M.A. in Biostatistics)和生物统计学博士(Ph.D. in Biostatistics)四类研究生学位。学校在统计和概率上都有相应的研究内容和教育课程,除了发展基础理论和方法,同时也在解决多种环境下例如分子生物学,天文学,艾滋病学,神经生物学,社会,教育等领域出现的统计问题。学校也与其它领域和学科建立了广泛的联系,特别是数学,计算机和生物学,同时积极在新进研究生和教职员中找寻力量建立和稳固这些联系。John Hopkins University约翰霍普金斯大学统计学系是前十名学校中唯一一个隶属于工程学院的统计学系,其全名为“应用数学与统计学系” (Department of Applied Mathematics & Statistics)。系内目前拥有全职教授18人,在读研究生60余人。该校学位课程包括基础课程和各个领域的课程导论的所有课程,同时还有一些像统计,概率,运筹及优化方面的专业课程。学生,在咨询自己的指导老师后,可以申请一些富有挑战性的项目。 学院重视数学推导,数学建模等以解决问题为导向性的课程,目的是培养学生将来在数学或相关领域例如政府,工业部门和研究机构中具有专业技能。此外,JHU 还在公共卫生学院下设置生物统计系都设立在,因此学生物统计经常会与生物医学 背景的人打交道,从而沟通与交流的能力,统计方法和结果可以得到交流。专业研究包括:衰老研究,应用统计学,贝叶斯统计,生物信息学,癌症统计学,临床统计学主要研究临床实验(clinical trials) 的设计与数据分析等等。生物统计毕业的学生毕业后主要是做学术或者进药厂当 programmer 或 statistician,另外因为生物统计背景的学生也就是掌握了统计方面的知识,所以去 consulting、 nonprofit 甚至 finance 机构也是有可能的。Columbia University哥伦比亚大学统计硕士学位是为那些希望提高自己的统计理论与应用知识的学生设置的。大多数学生是为了从事统计学工作或提高自己的职业技能,还有一部分在读生打算攻读统计学的博士学位。学习该专业的学生,有部分是职场中人,哥大为了满足学生的要求,规定该硕士学位接受全职和兼职的学生。哥伦比亚大学的统计硕士学位的毕业生华尔街、纽约都从事着重要的公司职位,每位哥大的统计学系与华尔街、行业内人士、纽约的医学和基础科学研究人员保持着紧密的联系,同时也提高了当地的就业率。训练有素的统计学家在社会上是有持续的需求的。University College London (UCL)UCL统计学专业采用基础广泛的统计方法,为各类实践应用提供培训,让理论与应用之间达到极好的平衡。内容涵盖了应用贝叶斯方法,广义线性建模和面向对象统计计算在内的现代统计思想。核心课程包括:统计模型和数据分析,调查统计,统计计算和应用贝叶斯方法等,而可以选修的模块有:医疗统计,决策和风险,统计推断,预测,操作风险与保险分析的定量建模等。UCL的医学统计学位为学生提供了统计学理论的良好背景,以及在设计,分析和解释健康研究方面的实际操作经验。为学生配备了用于医疗经济评估的分析工具,该研究项目提供了使用真实临床数据集的经验。核心课程包括:统计推断,统计模型和数据分析,医疗统计和统计计算等。可以选修的模块有:贝叶斯方法在卫生经济学中的应用,流行病学和调查统计设计等。The University of Warwick华威大学的统计学课程为统计理论与技术提供了全面的基础,为涉及统计学的职业生涯提供了一个启动平台,学生将接受两门核心课程,统计方法和统计实践入门的培训,然后将其应用于可选修的六个模块。可选修的模块包括:高级统计设计,医疗统计,贝叶斯预测与高级主题干预和数据挖掘等。通过对数学和统计学的独立研究,进行更广泛深入的研究和实践。学生将从一开始就与世界一流的研究人员保持密切联系,帮助你就未来的研究主题做出明智的决定。学生将专注于分析,应用数学,数值分析,概率和统计等研究领域,整个项目非常灵活。毕业生受到工业,企业或政府机构的雇主以及实验室的高度重视,也将有条件继续在学术生涯更深一步探索。统计专业的就业情况 统计学专业作为应用性很强的专业,就业范围非常广泛统计学专业就业主要在医药类、工程类、金融/保险类等三个大方向,其他的都是小的分支。1、医药类 制药公司和生物技术公司往往有大量的医学/生物数据需要处理,这就决定了他们都需要一个稳定的统计学的团队来进行支持。尽管生物统计并不是公司里的核心部门,但作为药品开发,临床应用的所有决策的都需要来自公司统计部门的数据分析。尽管受到金融危机的影响,很多美国的大制药公司都先后进行了大规模的裁员, 但是这并不影响生物统计的就业,除非公司倒闭,否则从来没有任何作生物统计的被裁掉现在生物统计专业的员工。除了制药公司以外,统计学专业在制药类的另外一个就业方向就是在医院或者医疗类科研机构工作,在医学院,癌症,AIDS 研究中心这样单位也有很多的统计学的就业机会。尽管工资水平与制药公司相比稍低,这些岗位的工作环境舒适愉快,轻松,适合需要照顾家庭孩子的。如果附属在大学上的研究所,很多还提供减免学费的政策,如果想继续充电,可以边工作边上 PHD 的课,先学3-5 门再申请,再牛的学校都能申请成功。2、工程类 工程中为了实现利益和效益的最大化,必须合理的配置资源和人力,统计学在其中发挥着无可比拟和替代的作用,往往是需要的是一个统计学的团队,一个专家带领具有统计学博士背景的高级人员设计分析方法,然后硕士层次的专门的程序员去写实现,结果再由高级人员分析后提交给工程决策部门领导。对刚毕业的研究生来说,在工程类公司,年薪 9-10万非常普通,再少就比较少见,11-12 万的也很多见。虽然在工程类公司的工作比较忙一些,但升职空间很大,而且可以积累丰富的实际工作经验,是向更好公司跳槽重要筹码。3、金融/保险类 金融业的薪资待遇优厚,工作环境优越,吸引着很多人的目光是社会公认的白领阶层,是几乎所有毕业生向往的行业。虽然受金融危机的影响,虽然近几年金融行业受冲击最大,但仍是统计学毕业生的重要就业渠道之一。美国花旗银行副总裁柯林斯(Collins)在英国剑桥大学的讲演中叙述到:“从事银行业工作而不懂统计和数学的人实际上处理的是意义不大的东西。”足以证明统计和数学在在金融业界的重要性。在国外精算师是金融业金领中的金领,银行、证券公司、保险公司、投资公司对这类精算师的需求逐年上升。统计学毕业生能熟练地运用现代数学方法和数据对未来变化的趋势做出分析、判断,对风险具有敏锐的洞察力和处理各种可控风险的能力。所以具有良好的数学专业背景的统计学毕业生无疑能够在这个领域的就业中迅速进入角色。 目前金融业中级职员在国外的平均年薪达 10 万美元以上,国内月薪也在 1 万元以上。案例分享案例一毕业院校:国内非211院校主修: 金融学GPA: 3.8/4.0托福/雅思: 105+GRE/GMAT: 320+实习/工作: 两段银行投资部实习科研经历: 无录取院校: Columbia University, Georgetown University案例二毕业院校: 国内某211院校主修: 数学与应用统计学GPA: 2.8/4.0托福/雅思:6.5GRE/GMAT: 无实习/工作: 两段相关实习科研经历: 无录取院校: University of Glasgow, University of Sheffield, University of Lancaster案例三毕业院校:国内某985院校主修: 计算科学GPA: 2.4/4.0托福/雅思: 85+GRE/GMAT: 305+实习/工作: 两段相关实习科研经历: 两段相关科研录取院校: Marquette University, University of Missouri, Binghamton University案例四毕业院校:某美国top 50本科主修: 数学GPA: 3.5/4.0托福/雅思:WaiveGRE/GMAT: 320+实习/工作: 一段相关实习科研经历: 无录取院校: University of Southern California, University of Washington, Georgetown University案例五毕业院校:国内某中外合办院校主修: 应用数学GPA: 3.9/4.0托福/雅思:100+GRE/GMAT: 320+实习/工作: 一段相关实习科研经历: 一段相关科研录取院校: The London School of Economics and Political Science, Imperial College London, Cornell University, University of Michigan, Yale University案例六毕业院校:国内某985院校主修: 物理GPA: 3.4/4.0托福/雅思:105+GRE/GMAT: 325+实习/工作: 一段相关实习科研经历: 无录取院校: Columbia University, University of Southern California
数据分析目前是数据价值化的主要方式之一,也是大数据主要的落地应用方式之一,随着大数据技术逐渐普及到广大的传统行业,对于职场人来说,掌握一定的数据分析技术还是有必要的。数据分析目前有两种主要的分析方式,一种是机器学习的方式,另一种是统计学方式,对于基础比较薄弱的学习者来说,可以从统计学方式开始学起。通过统计学的方式进行数据分析可以使用多种工具,比如Excel就是比较常见的数据分析工具,在分析结构化数据,以及数据量并不是特别大的情况下,Excel还是比较方便的。对于职场人来说,Excel可以应付大多数情况下的数据分析任务。如果对于数据分析有进一步的要求,接下来就需要学习数据库知识了,重点在于Sql语言的学习,掌握数据库之后可以继续学习BI工具的使用,BI工具的数据分析功能还是比较强大的。机器学习也是目前比较流行的数据分析方式,相比于统计学方式来说,机器学习的数据分析方式可以应对更加复杂的数据分析任务。机器学习的步骤包括数据收集、数据整理、算法设计、算法实现、算法训练、算法验证和算法应用,机器学习的核心是算法设计,基础是数据收集。机器学习式的数据分析是一种基于“模型”的数据分析方式,目前在人工智能领域,通过构造模型能解决大量的问题。学习人工智能也可以说是学习如何构造各种“模型”,以及如何让模型能够动态适应各种场景。通过机器学习的方式来完成数据分析可以从编程语言开始学起,比如Python就是不错的选择。一方面学习Python可以完成“爬虫”的编写,这样就可以解决数据来源的问题,另一方面Python也是机器学习比较常见的实现语言,Python中的Numpy、Matplotlib、Scipy、pandas等库会在很大程度上提升实现的效率。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网方面的问题,或者考研方面的问题,都可以咨询我,谢谢!