量化研究与统计分析【量化研究与统计分析问答】

量化研究与统计分析的内容简介

从其强梁

硕鼠

本书融研究方法、统计知识、软件操作三者精华，二十余种常用量化分析技术讲解均有图文并茂、步骤详细的范例，十分便于读者学习领会并迅速上手。本书分别从量化研究的基本思路和方法、统计原理和技术、软件应用三部分进行材料的组织，并将三部分内容有机地结合了起来，并对二十余种常用量化分析技术辅以完整的范例。这种组织方式相对于目前流行的分别将统计学和软件应用分别成书的做法，更能帮助读者在整体上学会做量化研究。在难度的把握上，本书主要立足于为量化研究的初学者服务的思想，材料选择、内容设计都比较基础，因此，完全可以作为社会学、心理学、管理学、教育学等学科的本科生和研究生的量化研究方法课程的教材（南京师范大学教育科学学院邓铸老师已经将此书作为教育博士生的必读书目）。

展开

心理学研究方法中量化研究和质化研究的优缺点？

风行者

田鸠

量化研究：可以控制自变量和因变量，探讨因果关系或相关关系缺点：实验室操作可能与真实情况不符合，只用数据说明一切缺乏对心理深度内省资料的探测质化研究：用大量的观察，访谈和描述来分析一个人的心理现象，与真实情况较为符合，缺点：时间长，耗时长，可能被试缺失，样本量一般小，缺乏外部信度。

展开

量化分析的特性是什么?量化分析在商业运作中起什么作用?请举例~~~

颜钧

理禀

笨蛋，量化分析就是定量分析，答案自己找。赶紧给分，有什么不懂的找郑老师方老师都可以。。什么是定量研究？　　定量研究一般是为了对特定研究对象的总体得出统计结果而进行的。定性研究具有探索性、诊断性和预测性等特点，它并不追求精确的结论，而只是了解问题之所在，摸清情况，得出感性认识。定性研究的主要方法包括：与几个人面谈的小组访问，要求详细回答的深度访问，以及各种投影技术等。在定量研究中，信息都是用某种数字来表示的。在对这些数字进行处理、分析时，首先要明确这些信息资料是依据何种尺度进行测定、加工的，史蒂文斯（S. S. Stevens）将尺度分为四种类型，即名义尺度、顺序尺度、间距尺度和比例尺度。 [编辑]定量研究的四种测定尺度及特征　　名义尺度所使用的数值，用于表现它是否属于同一个人或物。　　顺序尺度所使用的数值的大小，是与研究对象的特定顺序相对应的。例如，给社会阶层中的上上层、中上层、中层、中下层、下下层等分别标为“5、4、3、2、1”或者“3、2.5、2、1.5、1”就属于这一类。只是其中表示上上层的5与表示中上层的4的差距，和表示中上层的4与表示中层的3的差距，并不一定是相等的。5、4、3 等是任意加上去的符号，如果记为 100、50、10 也无妨。　　间距尺度所使用的数值，不仅表示测定对象所具有的量的多少，还表示它们大小的程度即间隔的大小。不过，这种尺度中的原点可以是任意设定的，但并不意味着该事物的量为“无”。例如，O°C 为绝对温度 273°K，华氏32°F。　　名义尺度和顺序尺度的数值不能进行加减乘除，但间距尺度的数值是可以进行加减运算的。然而，由于原点是任意设定的，所以不能进行乘除运算。例如，5℃和 10℃之间的差，可以说与15℃和20℃之间的差是相同的，都是5°C。但不能说 20℃就是比5℃高4倍的温度。　　比例尺度的意义是绝对的，即它有着含义为“无”量的原点0。长度、重量、时间等都是比例尺度测定的范围。比例尺度测定值的差和比都是可以比较的。例如：5分钟与10 分钟之间的差和10分钟与15分钟之间的差都是5 分钟，10 分钟是2分钟的5倍。比例尺度可以进行加减乘除运算。　　下表是以上四种尺度的特征汇总表。在市场营销研究中，很多内容或研究项目都不具备比例尺度或间距尺度的条件，应注意在处理这些问题时，不要出现失误。　　四种测定尺度及其特征尺度允许的变量转换允许的四则运算允许的统计计算在市场营销中的应用举例名义 y=f(x)f(x)为对应 —— 百分比排列顺序卡方测定给属于特定群体的事物编号（男女、职业、商店种类、产品种类、品牌、销售区域等）顺序 y=f(x)f(x)只增加 —— 中位数百分位顺序相关符号测定集合测定对产品、企业的意见、态度（非常好、好、不好说、坏、非常坏），比较几种品牌的喜好程度，购买者的社会阶层等间距 y=a+bxB>0 加减范围算术平均均差标准差　t-检验 F-检验利用五等级法、七等级法测对产品或企业的意见、态度。比例 y=axa>0 加减乘除几何平均调和平均变动系数消费者的年龄、收入、顾客量、销售数量，销售金额 [编辑]定性研究与定量研究的区别　　定性研究（qualitativeresearch）和定量研究（quantitativeresearch）的根本性区别有三点：　　首先，两种方法所依赖的哲学体系（philosophyofreality）有所不同。作为定量研究，其对象是客观的、独立于研究者之外的某种客观存在物；而作为定性研究，其研究对象与研究者之间的关系十分密切，研究对象被研究者赋予主观色彩，成为研究过程的有机组成部分。定量研究者认为，其研究对象可以像解剖麻雀一样被分成几个部分，通过这些组成部分的观察可以获得整体的认识。而定性研究者则认为，研究对象是不可分的有机整体，因而他们检视的是全部和整个过程。　　第二，两种研究方法在对人本身的认识上有所差异。量化研究者认为，所有人基本上都是相似的；而定性研究者则强调人的个性和人与人之间的差异，进而认为很难将人类简单地划归为几个类别。　　第三，定量研究者的目的在于发现人类行为的一般规律，并对各种环境中的事物作出带有普遍性的解释；与此相反，定性研究则试图对特定情况或事物作特别的解释。换言之，定量研究致力于拓展广度，而定性研究则试图发掘深度。　　由于方法论上的不同取向，导致了在实际应用中定量方法与定性方法明显的差别。这主要体现在如下几个方面：　　1、研究者的角色定位（roleoftheresearch）。定量研究者力求客观，脱离资料分析。定性研究者则是资料分析的一部分。对后者而言，没有研究者的积极参与，资料就不存在。　　2、研究设计（design）。定量研究中的设计在研究开始前就已确定。定性研究中的计划则随着研究的进行而不断发展，并可加以调整和修改。　　3、研究环境（setting）。定量研究运用实验方法，尽可能地控制变数。定性研究则在实地和自然环境中进行，力求了解事物在常态下的发展变化，并不控制外在变数。　　4、测量工具（measurement）。定量研究中，测量工具相对独立于研究者之外，事实上研究者不一定亲自从事资料筹集工作。而在定性研究中，研究者本身就是测量工具，任何人都代替不了他。　　5、理论建构（theorybuilding）。定量研究的目的在于检验理论的正确性，最终结果是支持或者反对假设。定性研究的理论则是研究过程的一部分，是“资料分析的结果”（datadriven）。

展开

试比较定量研究与定性研究的优缺点

殻

孔伋

定量研究定量研究的优势在于可以提供描述性的数据，比如允许我们一览用户总体。但是解释它们则会遇到困难（不知道为什么）。在研发产品的环境下，这一数据缺失会导致产品设计的严重错误。例如，调查发现，大部分用户喜欢3D展示，这可能会导致产品团队考虑将3D展示整合进产品中。但是，如果大部分用户只是喜欢裸眼3D，或只是在电视上观看体育赛事或动作片时才喜欢3D展示。那么，带上3D眼睛在移动设备上观看数据的可视化呈现就不是一个合理的设计方向。此外，只有对如何使用和理解定量数据有着深刻领会的人才应当实施一项定量研究。在定量研究中，你可以通过操纵样本量来改变p值（p值说明了你的研究发现是随机性结果的可能性），但你需要足够的样本量以获得足够的统计检验力，以确定结果是否准确。如果因为样本量太小导致你的研究统计检验力过低，你可能没法达到统计显著性，即便结果是准确的。另一方面，如果在小样本的情况下你就达到了统计显著性，你无需再增加样本量，不管怎样结果都是真实的。通过增加样本量，你可以提高研究的统计检验力，但到一定程度，结果（统计显著性）可能是没有意义的。在这种情况看下，你需要考察效应量（effect size）——告诉你研究变量对变异影响程度的统计量。总而言之，统计显著性告诉你研究结果是否是真实的，而效应量告诉你它们的重要性有多大。通常情况下，如果你能够在小样本的条件下达到统计显著，这说明效应量是相当大的。解释你的数据时需要同时考虑统计显著性和效应量。定性研究数据收集后，研究者不是进行数据分析而是从数据中寻找趋势。这时候，研究者会寻找在不过研究参与者之间含义相似的陈述。一个经验法则就是，从一个参与者那里听来的话是一段轶事，从两个参与者那里听来的话可能是巧合，从三个人那里听来的话可能就是一个趋势了。你发现的趋势可以知道产品研发、商业决策和市场策略。由于你不能通过计算p值和效应量来验证趋势，你在应用它们时要格外小心。而且，你应该通过不断进行的定性研究项目来继续验证这些数据。定量定性，齐头并进你可以使用定性研究来发现影响研究变量的因素，然后利用这些信息来构思定量研究以评价这些因素如何影响用户偏好。同时，你也可以通过定性研究来建立趋势，然后用定量研究来验证它。

展开

新学SPSS用哪本书比好

爱妻家

民知其母

介绍几本个人觉得不错的教材1、吴明隆《SPSS统计实务》2、张文彤《SPSS统计分析基础教程》3、邱皓政《量化研究与统计分析——SPSS中文视窗版数据分析范例解析》4、罗纳德·D·约克奇著译者:刘超、吴铮《SPSS其实很简单》您好，请问您是想知道新学SPSS用哪本书比好吗？

展开

如何在临床科研中选用正确的统计分析方法

红跑道

拜下

统计学方法的正确抉择一。统计方法抉择的条件在临床科研工作中，正确地抉择统计分析方法，应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误，都有可能导致统计分析方法的抉择失误。此外，统计分析方法的抉择应在科研的设计阶段来完成，而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法抉择时，应考虑下列因素：1.分析目的对于临床医生及临床流行病医生来说，在进行统计分析前，一定要明确利用统计方法达到研究者的什么目的。一般来说，统计方法可分为描述与推断两类方法。一是统计描述（descriptivestatistics），二是统计推断（inferentialstatistics）。统计描述，即利用统计指标、统计或统计表，对数据资料所进行的最基本的统计分析，使其能反映数据资料的基本特征，有利于研究者能准确、全面地了解数据资料所包涵的信息，以便做出科学的推断。统计表，如频数表、四格表、列联表等；统计，如直方、饼，散点等；统计指标，如均数、标准差、率及构成比等。统计推断，即利用样本所提供的信息对总体进行推断（估计或比较），其中包括参数估计和假设检验，如可信区间、t检验、方差分析、c2检验等，如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。还有些统计方法，既包含了统计描述也包含了统计推断的内容，如不同变量间的关系分析。相关分析，可用于研究某些因素间的相互联系，以相关系数来衡量各因素间相关的密切程度和方向，如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析；回归分析，可用于研究某个因素与另一因素（变量）的依存关系，即以一个变量去推测另一变量，如利用回归分析建立起来的回归方程，可由儿童的年龄推算其体重。2.资料类型资料类型的划分现多采用国际通用的分类方法，将其分为两类：数值变量（numericalvariable）资料和分类变量（categoricalvariable）资料。数值变量是指其值是可以定量或准确测量的变量，其表现为数值大小的不同；而分类变量是指其值是无法定量或不能测量的变量，其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类，无序分类变量表现为没有大小之分的属性或类别，如：性别是两类无序分类变量，血型是四类无序分类变量；有序分类变量表现为各属性或类别间有程度之分，如：临床上某种疾病的“轻、中、重”，治疗结果的“无效、显效、好转、治愈”。由此可见，数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。资料类型的划分与统计方法的抉择有关，在多数情况下不同的资料类型，选择的统计方法不一样。如数值变量资料的比较可选用t检验、u检验等统计方法；而率的比较多用c2检验。值得注意的是，有些临床科研工作者，常常人为地将数值变量的结果转化为分类变量的临床指标，然后参与统计分析，如患者的血红蛋白含量，研究者常用正常、轻度贫血、中度贫血和重度贫血来表示，这样虽然照顾了临床工作的习惯，却损失了资料所提供的信息量。换言之，在多数情况下，数值变量资料提供的信息量最为充分，可进行统计分析的手段也较为丰富、经典和可靠，与之相比，分类变量在这些方面都不如数值变量资料。因此，在临床实验中要尽可能选择量化的指标反映实验效应，若确实无法定量时，才选用分类数据，通常不宜将定量数据转变成分类数据。3.设计方法在众多的临床科研设计方法中，每一种设计方法都有与之相适应的统计方法。在统计方法的抉择时，必须根据不同的临床科研设计方法来选择相应的统计分析方法。如果统计方法的抉择与设计方法不一致，统计分析得到的任何结论都是错误的。在常用的科研设计方法中，有成组设计（完全随机设计）的t检验、配对t检验、成组设计（完全随机设计）的方差分析、配伍设计（随机区组设计）的方差分析等，都是统计方法与科研设计方法有关的佐证。因此，应注意区分成组设计（完全随机设计）与配对和配伍设计（随机区组设计），在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计（随机区组设计）的资料当做成组设计（完全随机设计）来处理，如配对设计的资料使用成组t检验、配伍设计（随机区组设计）使用成组资料的方差分析；或将三组及三组以上的成组设计（完全随机设计）资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较，都是典型的错误。如下表：表1常见与设计方法有关的统计方法抉择错误设计方法错误的统计方法正确统计方法两个均数的比较（成组设计、完全随机设计）成组设计的t检验、成组设计的秩和检验多个均数的比较（成组设计、完全随机设计）多个成组设计的t检验完全随机设计的方差分析及q检验、完全随机设计的秩和检验及两两比较数值变量的配对设计成组设计的t检验配对t检验、配对秩和检验随机区组设计（配伍设计）多个成组设计的t检验、完全随机设计的方差分析随机区组设计的方差分析及q检验、随机区组设计的秩和检验及两两比较交叉设计成组设计的t检验、配对t检验、配对秩和检验交叉设计的方差分析、交叉设计的秩和检验4.分布特征及数理统计条件数理统计和概率论是统计的理论基础。每种统计方法都要涉及数理统计公式，而这些数理统计公式都是在一定条件下推导和建立的。也就是说，只有当某个或某些条件满足时，某个数理统计公式才成立，反之若不满足条件时，就不能使用某个数理统计公式。在数理统计公式推导和建立的条件中，涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律，许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从（符合）某种分布，即可使用该分布所具有的数理统计规律来分析和处理该实际资料，反之则不能。在临床资料的统计分析过程中，涉及得最多的分布有正态分布、偏态分布、二项分布等。许多统计方法对资料的分布有要求，如：均数和标准差、t和u检验；方差分析都要求资料服从正态分布，而中位数和四分位数间距、秩和检验等，可用于不服从正态分布的资料。所以，临床资料的统计分析过程中，应考虑资料的分布特征，最起码的要求是熟悉正态分布与偏态分布。例如：在临床科研中，许多资料的描述不考虑资料的分布特征，而多选择均数与标准差。如某妇科肿瘤化疗前的血象值，资料如下表：某妇科肿瘤化疗前的血象值指标名例数均数标准差偏度系数P值峰度系数P值血红蛋白（g/L）98111.9918.820.1800.4590.0250.958血小板（×109/L）98173.5887.111.3530.0001.8430.000白细胞（×109/L）986.79302.7671.2070.0001.2020.013从上结果可见，若只看三项指标的均数和标准差，临床医生也许不会怀疑有什么问题。但是经正态性检验，病人的血红蛋白服从正态分布，而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布（P<0.05）。因此，描述病人的血小板和白细胞平均水平正确的指标是中位数，而其变异程度应使用四分位数间距。除了数据的分布特征外，有些数理统计公式还有其它一些的条件，如t检验和方差分析的方差齐性、卡方检验的理论数（T）大小等。总之，对于临床科研工作者来说，为正确地进行统计方法的抉择，首先要掌握或熟悉上述影响统计方法抉择因素；其次，还应熟悉和了解常用统计方法的应用条件。二。数据资料的描述统计描述的内容包括了统计指标、统计和表，其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用，而统计表的正确使用请参阅其他书籍。1.数值变量资料的描述描述数值变量资料的基本特征有两类指标，一是描述集中趋势的指标，用以反映一组数据的平均水平；二是描述离散程度的指标，用以反映一组数据的变异大小。各指标的名称及适用范围等见表2。表2描述数值变量资料的常用指标指标名称用途适用的资料均数（X——）描述一组数据的平均水平，集中位置正态分布或近似正态分布中位数（M）与均数相同偏态分布、分布未知、两端无界几何均数（G）与均数相同对数正态分布，等比资料标准差（S）描述一组数据的变异大小，离散程度正态分布或近似正态分布四分位数间距（QU-QL）与标准差相同偏态分布、分布未知、两端无界极差（R）与标准差相同观察例数相近的数值变量变异系数（CV）与标准差相同比较几组资料间的变异大小从表中可看出，均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征；中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。这些描述指标应用时，最常见的错误是不考虑其应用条件的随意使用，如：用均数和标准差描述偏态分布、分布未知或两端无界的资料，这是目前在临床研究文献中较为普遍和典型的错误。

展开

如何进行临床试验数据统计分析

始觉

式

统计学方法的正确抉择一。统计方法抉择的条件在临床科研工作中，正确地抉择统计分析方法，应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误，都有可能导致统计分析方法的抉择失误。此外，统计分析方法的抉择应在科研的设计阶段来完成，而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法抉择时，应考虑下列因素：1.分析目的对于临床医生及临床流行病医生来说，在进行统计分析前，一定要明确利用统计方法达到研究者的什么目的。一般来说，统计方法可分为描述与推断两类方法。一是统计描述（descriptivestatistics），二是统计推断（inferentialstatistics）。统计描述，即利用统计指标、统计或统计表，对数据资料所进行的最基本的统计分析，使其能反映数据资料的基本特征，有利于研究者能准确、全面地了解数据资料所包涵的信息，以便做出科学的推断。统计表，如频数表、四格表、列联表等；统计，如直方、饼，散点等；统计指标，如均数、标准差、率及构成比等。统计推断，即利用样本所提供的信息对总体进行推断（估计或比较），其中包括参数估计和假设检验，如可信区间、t检验、方差分析、c2检验等，如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。还有些统计方法，既包含了统计描述也包含了统计推断的内容，如不同变量间的关系分析。相关分析，可用于研究某些因素间的相互联系，以相关系数来衡量各因素间相关的密切程度和方向，如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析；回归分析，可用于研究某个因素与另一因素（变量）的依存关系，即以一个变量去推测另一变量，如利用回归分析建立起来的回归方程，可由儿童的年龄推算其体重。2.资料类型资料类型的划分现多采用国际通用的分类方法，将其分为两类：数值变量（numericalvariable）资料和分类变量（categoricalvariable）资料。数值变量是指其值是可以定量或准确测量的变量，其表现为数值大小的不同；而分类变量是指其值是无法定量或不能测量的变量，其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类，无序分类变量表现为没有大小之分的属性或类别，如：性别是两类无序分类变量，血型是四类无序分类变量；有序分类变量表现为各属性或类别间有程度之分，如：临床上某种疾病的“轻、中、重”，治疗结果的“无效、显效、好转、治愈”。由此可见，数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。资料类型的划分与统计方法的抉择有关，在多数情况下不同的资料类型，选择的统计方法不一样。如数值变量资料的比较可选用t检验、u检验等统计方法；而率的比较多用c2检验。值得注意的是，有些临床科研工作者，常常人为地将数值变量的结果转化为分类变量的临床指标，然后参与统计分析，如患者的血红蛋白含量，研究者常用正常、轻度贫血、中度贫血和重度贫血来表示，这样虽然照顾了临床工作的习惯，却损失了资料所提供的信息量。换言之，在多数情况下，数值变量资料提供的信息量最为充分，可进行统计分析的手段也较为丰富、经典和可靠，与之相比，分类变量在这些方面都不如数值变量资料。因此，在临床实验中要尽可能选择量化的指标反映实验效应，若确实无法定量时，才选用分类数据，通常不宜将定量数据转变成分类数据。3.设计方法在众多的临床科研设计方法中，每一种设计方法都有与之相适应的统计方法。在统计方法的抉择时，必须根据不同的临床科研设计方法来选择相应的统计分析方法。如果统计方法的抉择与设计方法不一致，统计分析得到的任何结论都是错误的。在常用的科研设计方法中，有成组设计（完全随机设计）的t检验、配对t检验、成组设计（完全随机设计）的方差分析、配伍设计（随机区组设计）的方差分析等，都是统计方法与科研设计方法有关的佐证。因此，应注意区分成组设计（完全随机设计）与配对和配伍设计（随机区组设计），在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计（随机区组设计）的资料当做成组设计（完全随机设计）来处理，如配对设计的资料使用成组t检验、配伍设计（随机区组设计）使用成组资料的方差分析；或将三组及三组以上的成组设计（完全随机设计）资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较，都是典型的错误。如下表：表1常见与设计方法有关的统计方法抉择错误设计方法错误的统计方法正确统计方法两个均数的比较（成组设计、完全随机设计）成组设计的t检验、成组设计的秩和检验多个均数的比较（成组设计、完全随机设计）多个成组设计的t检验完全随机设计的方差分析及q检验、完全随机设计的秩和检验及两两比较数值变量的配对设计成组设计的t检验配对t检验、配对秩和检验随机区组设计（配伍设计）多个成组设计的t检验、完全随机设计的方差分析随机区组设计的方差分析及q检验、随机区组设计的秩和检验及两两比较交叉设计成组设计的t检验、配对t检验、配对秩和检验交叉设计的方差分析、交叉设计的秩和检验4.分布特征及数理统计条件数理统计和概率论是统计的理论基础。每种统计方法都要涉及数理统计公式，而这些数理统计公式都是在一定条件下推导和建立的。也就是说，只有当某个或某些条件满足时，某个数理统计公式才成立，反之若不满足条件时，就不能使用某个数理统计公式。在数理统计公式推导和建立的条件中，涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律，许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从（符合）某种分布，即可使用该分布所具有的数理统计规律来分析和处理该实际资料，反之则不能。在临床资料的统计分析过程中，涉及得最多的分布有正态分布、偏态分布、二项分布等。许多统计方法对资料的分布有要求，如：均数和标准差、t和u检验；方差分析都要求资料服从正态分布，而中位数和四分位数间距、秩和检验等，可用于不服从正态分布的资料。所以，临床资料的统计分析过程中，应考虑资料的分布特征，最起码的要求是熟悉正态分布与偏态分布。例如：在临床科研中，许多资料的描述不考虑资料的分布特征，而多选择均数与标准差。如某妇科肿瘤化疗前的血象值，资料如下表：某妇科肿瘤化疗前的血象值指标名例数均数标准差偏度系数P值峰度系数P值血红蛋白（g/L）98111.9918.820.1800.4590.0250.958血小板（×109/L）98173.5887.111.3530.0001.8430.000白细胞（×109/L）986.79302.7671.2070.0001.2020.013从上结果可见，若只看三项指标的均数和标准差，临床医生也许不会怀疑有什么问题。但是经正态性检验，病人的血红蛋白服从正态分布，而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布（P<0.05）。因此，描述病人的血小板和白细胞平均水平正确的指标是中位数，而其变异程度应使用四分位数间距。除了数据的分布特征外，有些数理统计公式还有其它一些的条件，如t检验和方差分析的方差齐性、卡方检验的理论数（T）大小等。总之，对于临床科研工作者来说，为正确地进行统计方法的抉择，首先要掌握或熟悉上述影响统计方法抉择因素；其次，还应熟悉和了解常用统计方法的应用条件。二。数据资料的描述统计描述的内容包括了统计指标、统计和表，其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用，而统计表的正确使用请参阅其他书籍。1.数值变量资料的描述描述数值变量资料的基本特征有两类指标，一是描述集中趋势的指标，用以反映一组数据的平均水平；二是描述离散程度的指标，用以反映一组数据的变异大小。各指标的名称及适用范围等见表2。表2描述数值变量资料的常用指标指标名称用途适用的资料均数（X——）描述一组数据的平均水平，集中位置正态分布或近似正态分布中位数（M）与均数相同偏态分布、分布未知、两端无界几何均数（G）与均数相同对数正态分布，等比资料标准差（S）描述一组数据的变异大小，离散程度正态分布或近似正态分布四分位数间距（QU-QL）与标准差相同偏态分布、分布未知、两端无界极差（R）与标准差相同观察例数相近的数值变量变异系数（CV）与标准差相同比较几组资料间的变异大小从表中可看出，均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征；中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。这些描述指标应用时，最常见的错误是不考虑其应用条件的随意使用，如：用均数和标准差描述偏态分布、分布未知或两端无界的资料，这是目前在临床研究文献中较为普遍和典型的错误。

展开

内容分析法的研究对象、研究目的和优缺点

蓝花

皆入于机

去百度文库，查看完整内容>内容来自用户:liyihua7内容分析法的研究对象、研究目的和优缺点1．内容分析法的研究对象：主要是以各种文献为研究对象的研究方法。研究的内容是明显的传播内容，指以任何形态被记录和保存下来，并具有传播价值的内容，包括有文字记录形态、非文字记录形态、影像记录形态等。2．内容分析法的研究目的：目的是对信息内容加以归类统计，总结出各分析维度（类目）特征及相互关系，并根据研究目标进行比较，得出关于研究对象的趋势或特征、或异同点等方面的结论。3．内容分析法具有以下几个方面的优点：（1）研究方法较为客观。内容分析是一种规范的方法，对类目定义和操作规则十分明确与全面，要求研究者根据预先设定的计划按步骤进行，研究者主观态度不太容易影响研究的结果；不同的研究者或同一研究者在不同时间里重复这个过程都应得到相同的结论。（2）结构化研究。内容分析法目标明确，对分析过程高度控制，结果便于量化与统计分析，便于用计算机模拟与处理相关数据。（3）非接触研究。内容分析不以人为对象而以事物为对象，研究者与被研究事物之间没有任何互动，研究者主观态度不易干扰研究对象，这种非接触性研究较接触研究的效度高。（4）定量与定性结合。这是内容分析法最根本的优点，它以定性研究为前提，找出能反映文献内容的一定本质的量的特征，并将它转化为定量的数据。能够达到对文献内容所反映“质”的更深刻、更精确、更全面的认识，得出科学、完整、符合事实的结论，获得一般

展开

统计学概念

金翅雀

取人妇女

1、同质（homogeneity）与变异（variation）严格地讲，同质是指被研究指标的影响因素完全相同。但在医学研究中，有些影响因素往往是难以控制的（如遗传、营养等），甚至是未知的。所以，在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时，要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同，而不易控制的遗传、营养等影响因素可以忽略。同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上，客观世界充满了变异，生物医学领域更是如此。哪里有变异，哪里就需要统计学。若所研究的同质群体中所有个体一模一样，只需观察任一个体即可，无须进行统计研究。2、总体（population）与样本（sample）任何统计研究都必须首先确定观察单位（observed unit），亦称个体（indivial）。观察单位是统计研究中最基本的单位，可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。总体是根据研究目的确定的同质观察单位的全体，或者说，是同质的所有观察单位某种观察值（变量值）的集合。例如欲研究山东省2002年7岁健康男孩的身高，那么，观察对象是山东省2002年的7岁健康男孩，观察单位是每个7岁健康男孩，变量是身高，变量值（观察值）是身高测量值，则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体（finite population）和无限总体（infinite population）。有限总体是指在某特定的时间与空间范围内，同质研究对象的所有观察单位的某变量值的个数为有限个，如上例；无限总体是抽象的，无时间和空间的限制，观察单位数是无限的，如研究碘盐对缺碘性甲状腺病的防治效果，该总体的同质基础是缺碘性甲状腺病患者，同用碘盐防治；该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果，没有时间和空间范围的限制，因而观察单位数无限，该总体为无限总体。在实际工作中，所要研究的总体无论是有限的还是无限的，通常都是采用抽样研究。样本是按照随机化原则，从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体（山东省2002年7岁健康男孩）中，按照随机化原则抽取100名7岁健康男孩，他们的身高值即为样本。从总体中抽取样本的过程为抽样，抽样方法有多种，详见第14章。抽样研究的目的是用样本信息推断总体特征。统计学好比是总体与样本间的桥梁，能帮助人们设计与实施如何从总体中科学地抽取样本，使样本中的观察单位数（亦称样本含量，sample size）恰当，信息丰富，代表性好；能帮助人们挖掘样本中的信息，推断总体的规律性。3、资料（data）与变量（variable）及其分类总体确定之后，研究者应对每个观察单位的某项特征进行测量或观察，特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值（value of variable）或观察值（observed value），亦称为资料。按变量的值是定量的还是定性的，可将变量分为以下类型，变量的类型不同，其分布规律亦不同，对它们采用的统计分析方法也不同。在处理资料之前，首先要分清变量类型。1）数值变量（numerical variable）：其变量值是定量的，表现为数值大小，可经测量取得数值，多有度量衡单位。如身高（cm）、体重（kg）、血压（mmHg kPa）、脉搏（次/min）和白细胞计数（×10 9 /L）等。这种由数值变量的测量值构成的资料称为数值变量资料，亦称为定量资料（quantitative data）。大多数的数值变量为连续型变量，如身高、体重、血压等；而有的数值变量的测定值只能是正整数，如脉搏、白细胞计数等，在医学统计学中把它们也视为连续型变量。2）分类变量（catagorical variable）：其变量值是定性的，表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类：（1）无序分类变量（unordered categorical variable）是指所分类别或属性之间无程度和顺序的差别。，它又可分为①二项分类，如性别（男、女），药物反应（阴性和阳性）等；②多项分类，如血型（O、A、B、AB），职业（工、农、商、学、兵）等。对于无序分类变量的分析，应先按类别分组，清点各组的观察单位数，编制分类变量的频数表，所得资料为无序分类资料，亦称计数资料。（2）有序分类变量（ordinal categorical variable）各类别之间有程度的差别。如尿糖化验结果按－、±、＋、＋＋、＋＋＋分类；疗效按治愈、显效、好转、无效分类。对于有序分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表，所得资料称为等级资料。变量类型不是一成不变的，根据研究目的的需要，各类变量之间可以进行转化。例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时，可按二项分类资料分析；若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时，可按等级资料分析。有时亦可将分类资料数量化，如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。4、随机事件（random event）与概率（probability）医学研究的现象，大多数是随机现象，对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件，亦称偶然事件，简称事件。例如用相同治疗方案治疗一批某病的患者，治疗转归可能为治愈、好转、无效、死亡四种结果，对于一个刚入院的患者，治疗后究竟发生哪一种结果是不确定的，可能发生的每一种结果都是一个随机事件。对于随机事件来说，在一次随机试验中，某个随机事件可能发生也可能不发生，但在一定数量的重复试验后，该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值，常用P表示。例如，投掷一枚均匀的硬币，随机事件A表示“正面向上”，用 n表示投掷次数；m表示随机事件A发生的次数；f表示随机事件A发生的频率（f=m/n），0≤m≤n, 0≤f≤1。用不同的投掷次数n作随机试验，结果如下：m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498, 501/1000=0.501, 10001/2000=0.5000，由此看出当投掷次数n足够大时,f=m/n→0.5，称P(A)=0.5，或简写为：P=0.5。当n足够大时，可以用f估计P。随机事件概率的大小在0与1之间，即0<P<1，常用小数或百分数表示。P越接近1，表示某事件发生的可能性越大；P越接近0，表示某事件发生的可能性越小。P＝1表示事件必然发生，P＝0表示事件不可能发生，它们是确定性的，不是随机事件，但可以把它们看成随机事件的特例。若随机事件A的概率P(A)≤a，习惯上，当a=0.05时，就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如，某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万，但大街上仍有行人，这是因为 “被撞”事件是小概率事件，所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。“小概率”的标准a是人为规定的，对于可能引起严重后果的事件，如术中大出血等，可规定a=0.01，甚至更小。

展开

首页

考研

考博

院校选择

专业选择

研究生动态

研究生题库

量化研究与统计分析