研究方法作为知识生产的工具,其实跟背后的本体论是有很大的关系。我们完全可以不关注研究方法背后的本体论。很多人认为不需要关注,但是如果不关注的话,会导致研究方法的使用上会有很大的一个误差。那么定量研究方法和质性研究方法的区别何在?表面上看,一个是用数学,一个不用数学。也就是说是研究形式上的区别:一个采取量化的手法,一个不采取量化的方法,而是用文字表述的方法。但二者的区别,根本原因在于社会本体论预设的不同。量化方法本体论预设:社会世界类似于自然世界。所以社会科学可以模仿物理学,采取类似于自然科学的方法,数量化是必不可少的特征。科学性体现在实证性(或者经验性,注重可观察的证据),精密性(数学是特征)和揭示一般规律(从而可以做出预测)质性方法的本体论预设:社会世界不同于自然世界,因为社会是由人构成,人是有思想,情感,价值观念,信念等主观主义。人的行动是意义驱动的,而不是自然界中的刺激—反应行动。对意义的把握要通过理解,自然科学的客位立场无法达到对意义的理解。比如说对人的现象进行研究,就要理解人。比如说你要理解穆斯林的行为,你就要去读伊斯兰教的教义。如果不理解这个教义,怎么能理解它呢?我们很可能就是从一个非宗教徒的角度用自己的想法来裁剪它的行为,扭曲了它的行为,那这已经是违背现实了。意义可以定量的测量,但测量不是理解,因为测量可能是从客体立场来裁剪意义,甚至是研究者把自己的意义强加给研究对象。对意义的把握要从主体的立场出发。科学性首先体现在方法与社会科学研究对象的属性的匹配性。量化方法与社会现实的本体论属性不匹配。质性研究在实证上,与定量研究者一样。质性研究者也追求揭示规律,但社会规律与自然规律有不同的表现形式。科学性不在于严密性,严密性是我们追求的,但不仅仅在于严密性,它还在于研究方法和研究对象的本性的匹配性。
今天继续教大家写留学论文,选择定性分析还是定量分析?1什么是定性分析?分析方向:---定义---得出的数据方向---如何采集---是否具有目的性---研究类型---主客观---数据类型2什么是定量分析?分析方向:---定义---得出的数据方向---如何采集---是否具有目的性---研究类型---主客观---数据类型3定性分析的3种方式定性分析的3种方式:---Focus Group---Depth Interview---Photo Enthnography4定量分析的3种方式定量分析的4种方式:---Telephone Surveys---Personal Interviews---Web Surveys---Hybrid Method
定量研究其实没那么难,本文笔者通过对量化研究方法的一些最常见用例的介绍,以及对每个实例的成本和难度进行估计,来帮大家更好地去找我定量研究的方法。你是否需要有关产品用户体验的数字数据, 但却不确定应该如何做?许多从事用户体验及研究的专业人士倾向于定性方法论, 而这也这被广泛认为比定量 (量化) 研究更容易。但不得不承认,定性研究可能回避了较大的样本规模和量化相关的统计数据问题。而量化方法却是经验丰富的用户体验研究员的工具包中应当包含的重要组成部分。量化方法允许你:用数字为产品的可用性打上一个标签;数字有时比质量测试的结果更有说服力 (特别是当你试图说服像 CEO 这样的高管时);比较不同的设计 (例如, 产品的新版本与旧版本, 或你的产品与竞争对手的产品), 并确定你所观察的差异是否具有统计学意义, 而不是随机偶然;改进用户体验权衡决策。例如, 如果建议的设计改进预计会花费很大的成本来实现, 它值得做吗?如果你估计了更改将在一定程度上提高可用性,那么量化方法可以帮助你决定是否值得重新设计;将用户体验改进与组织目标和关键绩效指标联系起来 (从而显示你的投资回报并证明用户体验研究团队的价值)。定量研究,首要确定的是:到底需要哪种量化研究方法?在此,我们介绍一些目前最流行的量化研究类型:定量可用性测试 (基准测试)网络分析 (或 App Analytics)A/B 测试或多变量测试卡片分类树测试调查和问卷调查聚类定型数据可取性研究眼动测试每种方法都产生有价值的数量数据, 但这些技术在所收集的数据类型,以及所需的资源和工作量方面差别很大。本文列出了这些方法的最常见用例,并估计了每个实例的成本和难度。此外,应该知道,这些方法中都需要不同的最小样本量来确定统计意义。一、定量可用性测试(基准测试)用途:随时跟踪可用性、与竞争对手比较费用:中等收集难度:中等分析难度:中等方法类型:行为使用环境:基于任务虽然不经常使用,但定量可用性测试(有时称为可用性基准测试)很像定性可用性测试——用户被要求使用产品执行实际任务。两者之间的主要区别在于,可用性测试优先考虑观察,例如识别可用性问题。相比之下,量化可用性测试侧重于收集任务或成功时间等指标。一旦你收集了具有相对较大样本量(大约 35 个参与者或更多)的指标,你就可以使用它们跟踪产品的可用性随时间推移的进度,或者将其与竞争对手产品的可用性进行比较。你选择的可用性测试类型(面对面,远程主持或远程未经调度)将影响成本,由于定量和定性可用性研究的目标不同,测试的结构和使用的任务也需要不同。二、网络分析(或 App Analytics)用途:检测或优先排序问题、监控性能。成本:低收集难度:低分析难度:高方法类型:行为使用环境:live分析数据描述了人们对你的实时产品做了什么:他们去哪里、他们点击了什么、他们使用了什么功能、他们来自哪里,以及他们决定离开网站或应用程序的页面。此信息可以支持各种用户体验活动。特别是它可以帮助你监控产品中各种内容:UI 或功能的性能,并确定哪些是真的不起作用。三、A / B 测试或多变量测试用途:比较两个设计选项成本:低收集困难:低分析困难:低方法类型:行为使用情况:live虽然你可以使用分析指标来监控产品的性能,但你也可以创建实验来检测不同的 UI 设计如何通过 A / B 测试或多变量测试来更改这些指标。在 A / B 测试中,团队创建同一 UI 的两个不同的实时版本,然后将每个版本显示给不同的用户,以查看哪个版本的性能最佳。例如,你可以创建相同号召性用语按钮标签的两个版本:“获取定价”与“了解更多信息”,然后,你可以跟踪按钮在两个版本中收到的点击次数。多变量测试类似,但涉及一次测试多个设计元素(例如,测试可能涉及不同的按钮标签,排版和页面上的位置。)这两个基于分析的实验都非常适合决定同一设计的不同变体,并且可以结束团队关于哪个版本最佳的争议,但这种方法的一个主要缺点是它经常被滥用。四、卡片分类用途:确定信息架构标签和结构成本:低收集难度:低分析难度:中等方法类型:态度(人们怎么说)使用环境:不使用产品在卡片分类研究中,参与者被给予内容项目(有时字面上写在索引卡片上),并要求以对他们有意义的方式对这些项目进行分组和标记。该测试既可以亲自进行,也可以使用实体卡进行,也可以使用卡片分类平台进行远程测试。这种方法为你提供了进入用户信息空间的心理模型的机会。他们使用什么术语?他们如何在逻辑上将这些概念组合在一起?对创建类似分组的参与者的百分比进行定量分析可以帮助确定大多数用户可以理解哪种分类方法。五、树测试用途:评估信息架构层次结构成本:低收集难度:低分析难度:中等方法类型:行为使用环境:基于任务,不使用产品在树测试中,参与者尝试仅使用你站点的类别结构来完成任务。它本质上是一种评估你的信息架构的方法,通过将其与 UI 的所有其他方面隔离开来。假设你的产品是宠物用品网站,这是你的顶级层次结构,你可能会要求参与者完成一项任务——找到狗项圈。树测试结果的定量分析将显示人们是否能够在信息层次结构中找到该项目的正确路径,以及有多少参与者选择了错误的类别。此方法可用于识别 IA 结构,标签和展示位置是否符合人们的期望。六、调查和问卷调查用途:收集有关您的用户他们的态度和行为的信息成本:低收集难度:低分析难度:低方法类型:态度使用环境:任何调查是一种灵活的用户研究工具。你可以在各种环境中管理它们:在实时网站、电子邮件或可用性测试之后进行短暂拦截调查等。它们可以产生定量和定性数据的组合——评级,多项选择题中每个选项的答案比例,以及开放式答案。你甚至可以将对调查的定性响应转换为数值数据。你可以创建自己的自定义调查,也可以使用许多已建立的问卷中的一个(例如,系统可用性量表或净推荐值得分)。调查问卷的一个优点是,你通常可以将结果与行业或竞争对手的分数进行比较,以了解你的工作情况。即使你创建自己的自定义调查问卷,也仍然可以跟踪你的平均分数以监控产品改进。七、聚类定性数据用途:识别定性数据中的重要主题成本:低收集难度:中等分析难度:中等方法类型:态度(人们怎么说)使用环境:任何这种技术不是数据收集方法,而是更多的定性数据分析方法。它涉及根据共同主题对来自定性研究(例如日记研究、调查、焦点小组或访谈)的观察进行分组。如果你有大量观察结果,则可以计算提及特定主题时的实例数。例如,假设你进行日记研究,要求参与者每次在日常生活中使用你的产品并进行一周报告,目的是了解他们在何种环境中使用你的产品。此方法可以识别特定主题或情况的普遍性或频率,例如,用户投诉的频率或 UI 问题。这种方法是从大量定性信息中挖掘数值数据的好方法,但它可能非常耗时。八、可取性研究用途:识别与您的产品或品牌相关的属性。成本:低收集难度:低分析难度:低方法类型:态度使用环境:基于任务定量可取性研究试图量化和衡量产品的某些质量,例如美学吸引力、品牌强度、语调。这些研究可以根据你的研究问题进行定制,但通常包括首先将参与者暴露给你的产品(通过向他们展示静止图像或要求他们使用实时产品或原型)。然后,你将要求他们通过从描述性词汇列表中选择选项来描述设计。随着样本量越来越多,一些趋势则开始出现。 例如:你可能有 84% 的受访者将设计描述为“新鲜”。九、眼动测试使用:确定哪些 UI 元素分散注意力,可查找或可发现。成本:高收集难度:高分析难度:高方法类型:行为使用环境:基于任务眼球跟踪研究需要特殊的设备,来跟踪用户在界面上移动时的眼睛。 当许多参与者(30 个或更多)在同一界面上执行相同的任务时,有意义的趋势开始出现,你可以通过一些可靠性告诉页面的哪些元素会吸引人们的注意力。眼动测试可以帮助你确定需要强调或强调哪些界面和内容元素,以使用户能够实现其目标。运行眼球跟踪研究的一个主要障碍是高度专业化、极其昂贵且有些不稳定的设备以及需要大量的培训才能使用。在尝试确定使用哪种定量方法引导你的研究问题时,你需要了解什么?例如:我们的产品可用性如何随时间而变化?与竞争对手相比,我们的表现如何?我们哪个问题影响最大?我们应该如何优先排序?对于这些类型的问题你可能希望使用定量可用性测试、网站分析或调查。当你想要回答更具体的问题时,或许其他方法更佳。 例如:我们应该如何修复我们的全球导航类别?我们的大多数用户对我们的视觉设计有何看法?我们应该在仪表板中使用这两种设计方案中的哪一种?对于这些研究问题,你可能希望使用 A / B 测试、卡片分类、树木测试、编码定性评论,可取性研究或眼球跟踪。但是,这些建议中有一些灰色地带。 例如:出于安全或技术原因,A / B 测试可能不是贵公司的选项。如果是这种情况,你可以进行面对面的量化可用性研究来比较两个原型。但是,这不是定量可用性测试的典型用法,所以没有在这里讨论它。在研究问题之后,选择方法的第二个最有影响力的因素是成本。这些方法的成本会有很大差异,具体取决于你实施研究的方式。你使用的工具、你拥有的参与者数量以及研究人员花费的时间都将影响最终成本。低预算团队将依赖数字方法——远程可用性测试、在线卡片分类平台、如 OptimalSort、A / B 测试以及 Web 或应用程序分析。根据经验,现场方法(例如:面对面的可用性测试,面对面的卡片种类)往往更昂贵,因为它们需要更多消耗研究人员更多的时间。此外,他们可能需要旅行和设备租赁。眼动测试是这里列出的最昂贵的方法,应该只有具有大预算和研究问题的团队才能使用它。一旦选择了方法,就要了解它,并确保你获得有用的成果。警告:不能只收集指标并开始做出决策而不进行任何统计分析。仅收集来自 5 个用户的评级规模响应,取平均值并继续前进是不够的。对于此处讨论的每种方法,都建议最小样本量以获得可靠的数据并确定统计显着性。如果你不这样做,你无法保证你的发现不只是侥幸。无论你选择哪种方法,一定要考虑研究相关统计概念所需的时间。我保证,定量研究不像它看起来那么难,对于你的定量数据来说非常值得。作者:研如玉,神策数据·用户行为洞察研究院 公众号(ID:SDResearch)本文作者:Kate Moran文章来源:Nielsen Norman Group本文由 @研如玉 翻译发布于人人都是产品经理,未经许可,禁止转载题图来自Unsplash,基于CC0协议
DOI:10.16298/j.cnki.1004-3667.2020.09.12摘要量化研究的客观性与教育研究的主观性存在冲突,因此,运用量化研究方法进行教育研究的适切性引人深思。在教育研究领域,量化研究方法的运用常面临以下问题:量化研究具有表层化倾向;调研数据的信度难以保证;受强调学术发表的风气和形式主义的影响,部分量化研究者时常容易陷入“数据”的泥沼,或热衷于使用“高级”统计方法,但这无益于探寻教育行为和现象背后的现实意义与内涵。应忠实于教育研究中测量结果的宽松尺度,不能一味迷信精确的“数字化”测量;掌握较完善的量化研究技能和哲学思辨能力,并在教育研究过程中始终保持思考。关键词教育研究;量化研究;实证主义;统计方法社会科学的量化实证取向源自19世纪中叶以孔德为代表的实证主义,最初主要受自然科学领域的启发。20世纪二三十年代,美国社会学界一方面为了吸引学生,满足学生对实用性、工具性知识的需求,另一方面为迎合政府和财团法人对现实问题调查研究的资助偏好,推行“实用为本”的改革。与此同时,受自然科学领域“客观、科学”的数学化研究方法和沃森(Watson J B)行为主义(Behaviorism)的影响,统计方法逐渐在社会学研究中取得主导地位。由此,美国社会科学研究走向量化与反规范性论述的“科学”方向。而教育研究以社会科学的量化研究传统为依据,20世纪初以来,美国的主流教育研究也往往带有定量性质。一、教育研究中的量化研究方法教育研究方法是人们在研究教育问题时所采取的步骤、手段和方法的总称,它是决定教育研究质量的关键因素。近年来,我国教育研究领域出现了一些推崇实证研究方法的声音,以统计方法为主的量化研究是其重要组成部分,它通过实验、调查、测验、结构观察以及已有的数量化资料,对教育现象进行客观分析,并将所得结果作相应的统计推断,使研究结论具有普遍适应性。研究方法决定教育学的科学性质。尽管伦德伯格(Lundberg G A)意识到社会现象与自然现象有所差异,如人有态度、动机、意向等,但他依旧坚定地认为,问题的关键在于如何处置这些差异。他认为,诸如渴望、希望、恐惧、价值、目的、意图等的心灵状态均可被客观地观察和记录,即“自然科学”化。对于社会科学的发展而言,研究方法的“自然科学化”成为其“科学性质”的重要体现,同时加强了社会科学自身的合法性地位。在崇尚实证研究的研究者意识里,通过将教育现象或研究对象的态度、看法与意见等转化为量化的客观材料与数据进行研究,至少抽离了人的个体性和主观色彩,避免陷入“自说自话”的窠臼,得出的结论更客观、可靠,具有较高的可信度。这无疑也更符合科学研究中价值无涉的标准。此外,在日常生活中,统计方法在经济消费取向、文化观念和政治意向等方面的运用屡见不鲜,人们也已经习以为常。因此,运用量化方法进行教育研究,有着广泛的社会现实基础。但运用此方法研究教育问题的适切性和具体操作过程中存在的问题着实引人深思。笔者将以教育研究中最常见、运用最频繁的量化研究方式——通过对研究对象进行问卷调查,并将所得的资料与数据进行统计分析,进而验证或推断结论,这一研究形式为例,阐述其在具体操作过程中存在的争议与问题。二、在教育研究中运用量化研究方法面临的问题马克思曾说:“一种科学只有在成功地运用数学时,才算达到真正完善的地步。”“数学化”的研究方式一度促进了社会科学的发展,但运用该方法进行研究,不可避免地带有鲜明的精确化和机械的“测量”印记。教育现象是一种复杂、独特、富有价值色彩的社会现象,其运行、发展与变化都有与其他现象不同的特点和规律:教育研究的对象,是具有自组织能力的人及其在教育过程中的多层次、多维度的关系,非任何自然现象和生物现象所能比拟。然而,当前对“数学化”、以统计分析为重点的量化研究方法的推崇常常容易使人们忽略了该方法用于探究特定教育问题的适切性及方法本身的缺陷。不假思索地套用自然科学精细化的数学模式,很可能导致研究结论与教育现实并不相符,不但无法揭示客观的教育规律,也贬损了教育研究的科学性。在教育研究中运用量化研究方法面临着如下诸多问题。(一)量化研究存在简单的“数学化”取向物理测量数据的每个数字都有其确定的位置与意义。在教育研究中,量化研究者经常将不可观察与直接测量的被研究者主观态度或意见等概念操作化为测量量表,并赋予相应数字以程度高低之含义。以李克特五分态度量表为例,“1至5”这之间的5个整数分别代表被研究者“非常不同意——非常同意”的态度。这些数字没有绝对零点和单位,两个相邻数值之间的数字如4.5,它介于同意与非常同意之间,但在被调查者的认知中,这个数值是未被赋予意义的,且无法说明被调查者赞成4.6即代表同意程度高于4.5。因此,研究者擅自赋予除五分量表中五个整数之外的数值以内涵,其与被研究者本人的初衷可能不符。拜尔考(Berka K)指出,在大多数情况下,心理或社会测量是一种较为精致的分类,或者可以说,它是一种理念的或概念的方法,具有相对参考性,与实际意义上的“测量”还存在一定差距。社会学家邓肯(Duncan O D)也注意到了社会学研究中态度量表可能面临的基本问题,他认为,在“非常不同意——非常同意”的数轴上,每个人都有他独特的位置,只有他自己才可能恰当地指出这个位置在哪里。人们对数轴上每个态度的判断标准是有差异的。如有人对事物的态度比较宽容,有人则比较严格,前者“非常同意”的选择标准可能相当于后者“同意”的判定尺度。因此,同样选择“非常同意”,对被调查者而言,可能具有不同的含义。在分析时,研究者一律将在李克特五分量表中回答“非常同意”的人赋值5分,并直接将其作为等距且等比的物理测量数据进行计算,如此便能将他们作为类别或等级变量时获得更多信息,且能用更高级的统计分析方法来处理数据,以显示分析的复杂性与研究的深刻性。这样的做法体现了当前教育领域的量化研究对精确的追求,带有简单化、易操作倾向,却忽略了问题的真正焦点:能否如实呈现被研究者的态度与想法。(二)量化研究具有表层化倾向基于问卷调查的量化研究,其价值与深刻性时常遭到质疑。弗莱克斯纳(Flexner A)指出,调查问卷在花了大量的时间和精力之后被整理成各种图表,但最后得出的结论却要么是凭调查开始前的常识就能直接判断的,要么是最终得不到可靠证据支持的。他对问卷调查进行了强烈批判,称其只是一种廉价、方便和快速获取信息资料或非信息资料的方法,问卷填答的随意性也令其不具备科学特征。他强调,不管多么巧妙地收集资料与信息,报告和检查等都不构成研究。尽管许多研究者指出,量化研究是通过对数据和资料的统计分析以探求各个研究变量背后的因果关系。但当前教育领域许多的“量化文章”,甚至相当部分教育学领域的学位论文,更类似于调研报告,而不是科学研究文本。在教育研究中,量化研究往往只提供了一种呈现教育现象的方式,它能向我们展示“实然”的状态,却无法指引我们“应然”的方向。如我们可以通过问卷调查,知晓大学当前及以往的所作所为,以及这如何影响社会;或根据调查,揭示政府、教师或学生对大学行为的态度与期待。但这都不能回答“大学应该扮演什么样的角色”这个问题。无论量化研究结果如何,我们都可以合理发问:这是大学应该做的吗?在收集了所有的调研数据,并进行统计分析后,这个问题仍然存在。无怪乎有研究者指出,量化其实只是一种近乎没做什么决定的决定。与此同时,量化的数字将人们的认知限缩在表层化的维度内,量化研究者时常容易忘记在教育研究中这些数字代表的概念与内涵,陷入纯粹计算数值间各种关系的狂热之中。对于这一现象,孔德曾指出:在实证体系下,基于盲目联系的本能作用,我们热衷于为同时存在或相继出现的现象建立联系,但对外部世界的合理探索和考察却证明,世界的连带关系比我们所设想或希望的松弛得多,许多这类关联在现实生活中纯属虚妄。另一方面,量化研究者根据数据或统计结果“看图表写话”,这一模式促使其习惯于将重心置于数据或数量关系的解释,忽视了对教育现象自身更深层次内涵的关切,也不利于个人创新思维的发展。正如弗莱克斯纳所说,无休无止的计算绝不会产生理论、原理或思想。教育研究中的测量无法让人们触及蕴藏在表象下的内涵,而且也导致人们不想往深处继续挖掘。工具实证主义倾向导致量化研究者选择性地关注当前研究工具所能解决的范围内的问题,之所以使用量化,其实是因为看到了该问题可运用与自然科学类似的测量指标进行测算与分析。在教育研究领域,这表现为部分定量研究者越来越倾向于研究能够直接用测量量表(特别是西方广泛使用的、较成熟的量表)进行定量分析的教育问题。就如卡西尔(Cassirer E)所说的方法决定论,方法本身决定了“科学性”,因而也决定了“事实性”和“真理性”。在当前社会科学崇尚实证研究的环境下,这体现了一种片面追求量化,研究方法决定研究问题的不良倾向。(三)量化研究的信度难以保证数量化资料的可靠性是量化研究具备一定信度的基础。通过问卷调查获取调研数据的方式,因其高效、便捷和易量化等特点,在社会学、心理学和教育学等社会科学领域被广泛使用。在教育研究中,问卷类型主要以自填式调查问卷为主,这意味着被研究者能否根据自身的现实情况,如实、准确地填答问题是数据真实可靠与否的关键。但是,有些学者指出,中国是一个低信任度的国家,中国人缺乏以共同的信任和制度保障为基础的对一般人的“普通信任”。在问卷填答过程中,低信任度的人际关系可能导致被调查者不愿意填写问卷;不完全相信调查的匿名性,戒备心较强,未依据自己的真实情况或态度回答问题;对一些通过行政手段收发的问卷,鉴于行政压力与社会称许性的影响,被研究者在填答问卷时倾向于美化组织或自身形象。有研究进一步指出,即使在匿名回答的基础上,采用投射、情境故事等技术性手段,中国被试仍对问卷调查保持较高的防御性。这都导致问卷调查所回收的数据可能并不反映被研究者的真实情况与想法。除了天然存在的人际信任问题,教育研究对象的特质与调查工具的设计也深刻影响着调研数据的信度。在教育研究中,调研对象经常包含多维度的人的态度、情绪与意见等具有强烈主观特质的概念尺度。人的多变性、不同的问卷填答情境,往往也意味着这些主观概念的测量结果可能并不稳定。例如,同一位被调查者填答两次相同的问卷可能会得到不同的结果;是否有人监督、问卷发放者的身份、以及调查是否关涉自身利益等,这些因素也显著影响着被调查者的问卷填答情况。而我们无法通过观察等客观手段对问卷的信度进行监测,以确保收集到他们真实的想法。此外,问卷设计的合理性也极大影响了可靠数据的回收。一些研究者希望通过一次问卷调查尽可能多地收集信息,在设计问卷时,未考虑问卷篇幅的科学性,也未设身处地地感受被调查者填答问卷时的心理状态,经常出现一份问卷包含上百甚至几百个问题的情况。通过这样的问卷收集而来的数据,其信度是存疑的。一项量化研究的论证依据与结论建立在调研数据的分析之上,常有学者用“Garbage in, garbage out!”来形容数据品质对量化研究的重要性,即如果你收集回来的数据质量(指数据的信度、效度)很低,则不论你使用何种分析方法,得出的研究结论都将无法令人信服。因此,能否收集到人们的真实信息与想法,并合理地将其转化为可信和有效的数据,是进行规范、科学的量化研究的基础,同时也是得到可靠结论的重要保证。(四)量化研究者容易陷入数据的泥沼学术发表在很大程度上象征着一位学者的科研能力与声誉,且与其职称评定、晋升、薪酬待遇等一系列现实问题有着千丝万缕的联系。在教育领域推崇实证研究的当下,逐渐有些研究者,特别是一些研究新手开始注意到基于数据(尤其是大样本数据)撰写的文章在学术发表中的优势:量化文章在部分教育期刊中的比例逐渐增加,有了数据的论证,论文可能更易发表;相比哲学思辨而言,运用基于数据的量化分析方式撰写文章的门槛较低;量化研究更关注教育领域中的现实问题,很多研究成果被采用为政府决策的依据,这为研究成果和研究者带来更高的社会关注度和认可度。这些特点使得部分研究者对数据的收集与运用趋之若鹜,也因此时常容易陷入数据的泥潭:倾向于探究能够用数据分析和回应的教育问题,对于教育领域中不可操作化的理论或伦理问题不感兴趣,也束手无策;将数据作为“原材料”,企图通过“概念-属性-变项-测量-因果关系-统计”这一套特定程序,解释其所研究的所有教育问题;只看到数值及其之间关系的测算与内涵,将教育研究对象抽离出具体的历史-文化情境,使其成为“没有历史”的人与物。另一方面,量化研究者希望从数据出发,让数据为现实发声,但这需要建立在对数据科学严谨和实事求是的处理、分析与解释之上。然而,在测量、探索变量关系等环节,部分研究者的量化操作却并未严格遵守统计要求或学科研究规范。他们忽视数据特点,简单套用各种统计方法,极度关注统计结果的“价值性”;操纵甚至篡改原始数据,直到获得各项指标良好的模型和符合其预期假设的统计结果。这样“数据至上”,却又随意对待数据的行为,是一种典型的为了发表而研究,缺乏信仰和思想,没有精神、没有灵魂、没有价值追求的“投机行为”。(五)量化研究者热衷于使用“高级”统计方法由于数理概率理论提供统计学科学的基础,以致统计学连带地提供了社会学量化研究以科学的基础。依据此认知模式,数理统计得以被“正当化”为科学。在自然科学研究中,越高级的技术越有利于揭示复杂、未知的科学问题,以此类推,数理统计作为量化研究在教育领域中的分析工具,这是否意味着,越繁复和高阶的统计方法就越有利于分析深奥的教育问题,或是将问题分析得愈深刻呢?但事实似乎并不是这样。部分教育研究虽然运用了回归分析、结构方程模型等看似“高级”的统计方法,但其要处理或说明的问题,其实使用较为简单的交叉表分析或差异分析等“普通”方法就能解决,因为基础与高阶的统计方法之间往往存在着部分相似的功能。但当前许多量化研究者却乐于“化简为繁”,倾向于使用复杂而不是简单易懂的统计方法来分析问题,以使研究过程看起来更有深度,结论更具“科学性”。然而,方法的“精进”并无助于厘清事实或揭示更深刻的道理。在教育研究中,同时运用基础或高阶的统计方法,得出的结论别无二致的情况时有发生。“给小孩一根铁锤,他会发现,任何他看到的东西都需要给它一锤。”科塞(Coser L A)用这个有关工具的法则讽刺20世纪70年代那些热衷于使用当时被视为“先进”的结构方程模型等量化社会学家的做法与想法——以为严谨而复杂的方法即是具备了刚性科学的特质,因此可以克服理论上的薄弱。仔细阅读教育类量化文章会发现,研究者使用“高级”统计方法,通常建立在将量表“数学化”操作的基础上,它意味着数轴上的每个数字都具有内涵,且每位选择同一数值的被研究者的态度都是一样的,但这样精细的“数学化”操作可能并不恰当。这一量化研究的客观性与教育研究的主观性冲突,笔者已在上文进行了详细阐述。在数值意义尚未明晰的前提下,“精深”的统计方法或精巧的计量模型无法增加研究的价值。另一方面,“高级”统计方法是易复制的,片面追求“高级”统计方法的技术主义倾向无助于学科知识的积累,也背离了“研究方法始终应为研究问题服务”的初衷。三、结论与反思在教育领域推崇实证研究的当下,定量研究由于其数学化的“科学”特性而备受关注。但教育研究的主观性与量化研究的客观性之间的冲突、量化研究的表层化倾向、调研数据的难以确信、部分研究者对“数据”和“高级”统计方法的偏执,这些都表明:将定量方法运用于教育研究领域应当是谨慎的。所以,我们应该始终明晰对教育研究怀抱着的期待。为了把社会学推进以物理学为典范的“科学”殿堂而一味向自然科学的认知模式倾斜,将只是一种东施效颦的作为,更是一种自我矮化与异化的行止。鉴于教育研究情境和研究对象的复杂性,我们不能迷信问卷调查和统计方法。但不可否认的是,他们的确是教育研究方法体系中非常重要的数据采集与分析工具,服务于教育研究目的,有助于提示教育活动或现象的特点和规律。所以,我们也不能因噎废食,应在深刻意识到量化研究方法局限性的同时,更慎重地使用它。量化研究中的教育测量需要还原被调查者最真实的想法与状态,这意味着研究者要忠实于被调查者的选择和测量结果的宽松尺度,对数据的解读保持谨慎的态度。如将量表的数值作为有序变量进行操作与分析,而不是一味追求精确的数字化表达,也许这样更有利于探寻教育行为和现象背后的现实意义与内涵。此外,对量化研究浅层化的诟病一定程度上源于部分教育研究者对量化研究方法的不当使用,且量化研究的数据收集、处理与分析过程绝大部分在私下进行,往往不为人所知,这导致人们无法监督和检测其分析过程和研究结论的科学性。因此,我们应掌握扎实的问卷设计、数据处理与统计分析方法,严格遵守量化研究程序,对数据与客观事实始终保持敬畏之心,科学地操作数据,谨慎地解释结论,以此提高教育研究中量化研究方法的价值。同时加大对量化研究中学术不端行为的伦理审查与惩戒力度,遏制“为了发表而发表”的形式主义。最后,教育研究的成功取决于研究人员在遵守基本研究原则的背景下,对其研究实践的不断反思。所以,最重要的是,在量化操作的过程中,我们不能只关注数据和计算而牺牲了思考,漠视数字背后“人”的内涵。量化研究方法的价值与局限性也提示我们,作为一名教育研究者,我们不仅要具备较完善的量化研究能力,还需重视对哲学思辨能力的培养,对于它的重要性,孔德早就做出了预判:如果缺乏某种既定的思辨观念作一贯的指引,那么人的才智就绝不可能组织、甚至不可能收集必不可缺的材料。作者蔡红红,华东师范大学高等教育研究所博士研究生,上海200062原文刊载于《中国高教研究》2020年第9期第61-65页教育研究方法研究中国高教研究投稿平台:http://editor.cahe.e.cn/中国高等教育学会学术立会 服务兴会 规范办会 创新强会网址:https://www.cahe.e.cn/【来源:中国高等教育学会】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn
当你需要关于自己产品的用户体验数据时,然而,你却不知道从哪里获取?那么首先,你需要选择正确的研究方法。接下来,我们来看看这些当下最流行的定量研究方法。许多用户体验专家倾向于采用定性的研究方法,原因在于他们认为:定性的研究方法要比定量的研究方法更容易操作和节约成本。其实,他们忽略了与定量分析联系紧密的大样本量以及数据统计的巨大前景。如果你也是这样认为的,那你也就错了!定量的研究方法是任何有经验的UX研究人员必须掌握的重要技能。定量用户研究的方法允许你做以下事情:用一个数值来表示你产品的可用性。数值有时比质量检测的结果和视频更有说服力(特别是当你试图说服像高管这样的人)时。比较不同的设计(比如,你的产品的新旧版本,或者是你的产品与竞争对手的产品相比),并且确定你观察到的差异是否具有统计学意义,而不是随机的。改进用户体验权衡决策。比如,如果预期的设计改进成本很高,那么它值得做吗?如果你已经想到这种改变会提高可用性,那么定量研究方法可以帮助你验证重新设计是否值得。将用户体验的改进与企业目标以及关键绩效指标结合起来(从而证明你的投资回报并且证明你的用户体验团队存在的价值)。这篇文章可以让你清楚的知道,用户研究的第一步是:确定要使用哪种定量的研究方法。接下来,我们将会给大家介绍一些当下最流行的定量研究方法:定量可用性测试(基本测试)网站分析(或APP分析)A/B测试或者多变量测试卡片分类法树状测试调研或者问卷调查聚类定性评价满意度调研眼动测试以上每种方法都会产生有价值的定量数据,但是这些方法在收集的数据类型以及所需的资源和工作量方面差别很大。一、九种定量用户研究方法概述本文列出了这些方法最常见的示例,并对每种方法的成本和难度进行了评估。与其它任何研究方法一样,这些方法中的每一种都可以适用各种不同的需求。根据具体情况,你的成本和困难可能与我们的粗略估计有所不同。此外,你应该意识到,这些方法中的每一种都需要不同的最小样本量来确定统计的意义。1.定量可用性测试(基本测试):用途:随着时间的推移跟踪可用性;与竞争对手比较。成本:中等收集难度:中等分析难度:中等方法类型:行为(用户做了什么?)使用的情境:基于任务尽管不常用,但是,定量可用性测试(有时也称为可用性基准测试)与定性可用性测试其实非常相似:两种方法都要求用户使用产品去执行实际的任务。两者的主要区别在于:定性可用性测试优先考虑如何观察用户行为,比如,识别可用性问题。相比之下,定量可用性测试的重点则是收集数据指标,比如任务时间或者成功率。一旦你收集了相对较大的样本量(大约35个或者更多),你就可以使用它们来跟踪产品的可用性,或者将其与竞争对手产品的可用性进行比较。如果在产品的迭代过程中,你一直追踪着一些产品的可用性指标,那么你就可以创建一张类似这样的趋势图。这种类型的信息可以帮助你持续关注产品的用户体验,并确保它随着时间的推移而逐步改进。你所选择的可用性测试的类型(现场测试、远程引导测试或远程无引导测试)将对成本产生影响,并且难以与此方法相关联。由于定量和定性可用性研究的目标不同,测试的结构和进行的任务也需要有所不同。2.网站分析(或者APP分析):用途:发现问题或确定问题的轻重缓急;监测性能。成本:低收集难度:低分析难度:高方法类型:行为(用户做了什么?)使用情境:现场分析数据,描述了用户使用线上产品的各种操作行为,比如,他们去了哪里,点击了什么,使用了什么功能,他们从哪里来以及到哪里去。这些信息可以帮助你做各种各样的用户体验活动。特别是,它可以帮助你监测各种内容、UI或产品功能,并识别哪些不能正常运行。3.A/B测试或者多变量测试:用途:对比两种设计方案成本:低收集难度:低分析难度:低方法类型:行为(用户做了什么?)使用情境:现场虽然,你可以使用分析指标来监控产品的性能(如上所述),但你也可以创建一些实验,来检测不同的UI设计,然后,通过A/B测试或多变量测试来改变这些指标。在A/B测试中,团队需要创建同一界面的两个不同的最新版本,然后将每个版本展示给不同的用户,用来确定哪个版本的性能更好。例如,你可以创建同一个操作按钮标签的两个版本:“获得定价”或“学习更多”。然后,你就可以跟踪统计两个版本中按钮的点击次数。多变量测试的操作方式也是类似的,但是,它与A/B测试不同的是:多变量测试需要同时测试多个不同的设计元素(例如,测试可能涉及不同的按钮标签、排版和页面上的位置)。这两个基于分析的实验,对于决定同一个设计的不同变体非常有用,并且可以结束团队关于哪个版本最好的争论。A/B测试是将网站流量(用户)拆分为两部分:一部分导入到A方案,另一部分则导入到B方案。这种方法的一个主要缺点是:它经常会被滥用。有些团队没有尽可能长时间地运行测试,收集不到足够的样本,就匆忙的下了结论,这样的结论往往失败的风险很大。4.卡片分类法:用途:确定信息架构的标签和结构成本:低收集难度:低分析难度:中方法类型:态度(用户说了什么?)使用情境:不使用产品在卡片分类研究中,参与者会拿到一些内容项(有时是写在索引卡上的),并要求以一种对他们有意义的方式对这些项目进行分组和标注。这个测试既可以亲自进行,也可以使用物理卡片或者使用类似于OptimalSort这样的卡片排序平台进行远程测试。当卡片排序测试是亲自进行时,用户对物理卡片进行排序和分类,每张卡片都包含了它所代表的内容的描述。这个方法可以让你有机会了解用户的心理模型。他们使用什么术语?他们是如何将这些概念组合在一起的?对创建类似分组的参与者的百分比进行定量分析,可以帮助确定哪种分类方法对大多数用户来说是可以理解的。5.树状测试:用途:评估信息架构的层次结构成本:低收集难度:低分析难度:中方法类型:行为(用户做了什么?)使用情境:基于任务而不是使用产品在树状测试中,会让参与者尝试使用网站的分类结构来完成任务。这种方法本质上是一种评估界面信息架构的方法,通过这种方法可以将界面上的其它信息区分开来。例如,假设你的产品是一个宠物用品网站,而这是它顶层的层次结构。网站信息层次结构的显示可能看起来是这样的,树状测试要求参与者在这样的层次结构中找到一个特定的条目(例如,项圈),他们首先看到的只是顶层的分类(例如,狗狗、猫咪、小鸟等)。一旦他们做出一个选择(例如,狗狗),就会看到自己选择相应选项的子类别。你可以要求你的参与者在一个任务中找到狗项圈。对树状测试结果的定量分析将显示人们是否能够在信息层次结构中找到该项的正确路径,以及可以确定有多少参与者选择了错误的类别。这种方法有助于确定界面信息架构的结构、文案以及放置的位置是否符合用户的心理预期。6.调研或者问卷调查:用途:收集调研用户的态度和行为信息成本:低收集难度:低分析难度:低方法类型:态度(用户说了什么)使用情境:任何问卷调查是一种灵活的用户研究工具。你可以在不同的环境中进行测试,比如,在一个实时网站、电子邮件或可用性测试之后进行简短的拦截调查。调研时可以同时获得定量和定性的数据,比如评分、多项选择题中的答案的比例,再加上开放式问题的答案。你甚至可以把对调查的定性回答转化为数字数据(参见下面的代码质量评论部分)。像这样的语义差别等级量表,每个单选按钮代表一个数值。被调研的用户可以选择:1.容易使用;5.难以使用;或选择介于两者之间的选项。对这个问题的平均回答来衡量你的应用程序在使用上的难易程度。你可以创建自己的自定义问卷,也可以使用其它已经建好的问卷模版(例如,系统可用性量表或网络推广者评分)。问卷的一个优点是:可以经常将你的调研结果与行业或竞争者的分数进行比较,看看你做得怎么样。即使你创建了自己的自定义问卷,也可以随时间的推移对自己产品平均分数进行追踪,来监控产品的改进情况。7.聚类定性评价:用途:确定定性数据中的重要主题成本:低分析难度:中收集难度:中分析类型:态度(用户说了什么?)使用情境:任何这种技术不是数据收集的方法,而是定性数据的分析方法,它包括根据共同主题对定性研究(例如日记研究、调查、焦点小组或访谈)的观察结果进行分组。如果你进行了大量的观察,你就可以计算出一个特定主题被提及的实际数量。例如,假设你做了一个日记本研究,让参与者在他们的日常生活中,每周都要报告他们使用产品的时间,目的是理解他们使用产品的背景,你可以算一下用户在工作、家中或外出的时候使用产品的比例。这种方法可以识别特定主题或情况的流行程度或频率,例如,用户抱怨的频率或UI问题。这种方法可以很好地从大量的定性信息中挖掘数值数据,但它可能耗时会非常长。8.满意度调研:用途:确定与你的产品或品牌相关的属性成本:低分析难度:低收集难度:低分析类型:态度(用户说了什么?)使用情境:基于任务定量可用性测试试图使用量化的方式来衡量产品的质量,比如:审美情趣、品牌实力、语气等。这些研究可以根据你的研究问题进行定制,但这些方法通常会首先让参与者接触到产品(通过向他们展示静态图片或者要求他们使用现场产品或原型)。然后,要求用户通过从描述性的词语列表中选择一个来描述当前设计。如果你获取自身目标用户的样本量足够大,那么整体趋势就会显示出来。例如,你可能会有84%的受访者将此设计描述为“最新”。9.眼动研究:用途:确定哪些UI元素是分散注意力的、可发现的或可找到的成本:高分析难度:高收集难度:高分析类型:行为(用户做了什么?)使用情境:基于任务眼球追踪研究需要特殊设备来追踪用户的眼睛注意力轨迹,因为他们在界面间移动。当许多参与者(30个或更多)在同一个界面上执行相同的任务时,有意义的趋势就会出现,你可以清楚地看出页面的哪些元素会吸引用户的注意力。眼动跟踪可以帮助你确定哪些界面和内容元素需要强调或者弱化,从而使用户能够轻松的实现他们的目标。眼球追踪软件可以使用聚合的凝视数据(用户在这里查看界面,用绿点表示)来创建各种可视化效果。进行眼球追踪研究的一个主要障碍是高度专业化、价格昂贵和不稳定的设备,这些设备需要大量的培训才能使用。二、选择一种方法(九种方法概况表)上表提供了上面讨论的研究方法的概况。三、从你的研究问题开始1.当你要确定使用哪种定量研究的方法时:首先,你得先确定你要研究的问题:你想知道什么?以上方法中有一些非常适合一般性的研究问题。例如:我们产品的可用性是如何随着时间变化的?和竞争对手相比,我们做得怎么样?我们的哪些问题对于产品的影响最大?我们该如何确定其优先级?对于这些类型的问题,你可能需要使用:定量的可用性测试、web分析或调查问卷。2.当你有一个想要回答的具体问题时:以上方法中也会有好的方法来研究以下这些问题。例如:我们应该如何调整我们的全球导航分类?我们的大多数用户怎么看待我们的视觉设计?在dashboard中,我们应该使用这两种设计方案中的哪一种呢?对于这些研究问题,你可能需要使用:A/B测试,卡片分类,树状测试,编码定性评论法,满意度调研,或眼球追踪。然而,在这些建议的方法中有一些不可控的因素。例如,由于安全或者技术原因,你的公司可能不会选择A/B测试的方法。如果是这样的话,你能做的就是发起一个面对面的可用性研究来对比两个原型。然而,这并不是定量可用性测试的典型应用,所以我在这里就不讨论它了。四、考虑研究成本在研究问题之后,选择研究方法的第二大影响因素是成本。这些方法在成本上的差异很大程度上取决于你如何实现该研究。你使用的工具,要求的参与者数量,以及研究人员花费的时间都将影响最终的成本。更复杂的是,许多团队的研究预算也有很大差异。再者,这里的成本估计是相对的。预算相对较低的团队可能需要依靠数据收集分析的方法,比如,使用远程可用性测试、在线卡片排序平台(如OptimalSort)、A/B测试以及网站分析(或APP分析)的方法。根据经验,面对面的方法(比如面对面的可用性测试,面对面的卡片排序)往往成本比较高,因为它们需要很多的研究人员和时间成本。此外,他们还要求外出和租赁专业设备。眼动测试应该是这里列出的最昂贵的方法了,只有那些拥有大量预算和专门的用研团队才会使用它。这张图显示了本文中讨论的定量研究方法的位置,即它们适合于研究问题(一般到特定)的不同维度级别。五、总结一旦你选择了一个方法,就要去了解和学习!结束之后,确保你能够按照你想要的方式和计划进行研究,并保证能得到对自身有用的结果。要注意的是:你不能只收集数据指标,不做任何统计分析就开始做决定。仅仅收集5个用户的评级响应是不够的,要取一个平均值,然后再继续。对于这里讨论的每种方法,都有不同的建议最小样本量。为了获得可靠的数据和确定统计的意义,你可能需要收集数据点的数量需要达到最小样本量才行。如果不这样做,就不能保证你的发现或者结论是正确的。不管你使用哪种方法,一定要把握好需要你研究相关统计学概念的时间,以及获取正确的最小样本量的成本。你要相信,这并不像表面看起来那么困难,而你最终获取的定量数据一定是有价值的。原文作者:Kate Meyer原文链接:s/quantitative-user-research-methods/译文校对:不器#专栏作家#熊猫小生,,人人都是产品经理专栏作家。高级交互设计师,UED负责人。关注互联网C端产品设计相关,擅长移动端产品交互设计,前沿设计风格探索,设计流程优化和管理,欢迎交流~本文翻译发布于人人都是产品经理。未经许可,禁止转载。题图由译者提供
十年磨一剑。中国社科院近代史研究所云妍副研究员与香港大学经济与工商管理学院陈志武教授、中国人民大学历史学系林展博士合作的《官绅的荷包——清代精英家庭资产结构研究》(后文简称《官绅的荷包》)一书,历时十年,在2019年岁末由中信出版社出版了。就选题而言,官绅群体家庭资产的系统研究在清史中尚不多见,该书为理解清代社会的阶层分化和中上层经济生活提供了新看法。同时,对一些家喻户晓的“名官大贪”,如年羹尧、和绅等真实家资规模的再讨论本身也充满了话题性。就方法而论,该书以构建官绅资产数据库为基础,以量化研究为主要手段。量化历史数据库的构建与研究,是当前学界前沿性的新方法。量化历史研究的优势在于整合大规模系统史料,提供新的历史发现,但在具体操作上,对材料和方法又有着很多要求,开展起来并不容易。最近几年来,虽然量化历史研究与数字人文、数字史学等概念、提法有日渐火热之势,但真正成功和有广泛学术影响的研究并不多见。这种反差加深了许多学者对这一方法的困惑:量化历史研究是否能够在历史学界推广?如果是,又该如何做?在阅读了《官绅的荷包》一书后,个人觉得或许可以这一新著为例,从问题、材料、方法和研究者等最核心的要素出发,在讨论此书特点与价值的同时,尝试回应这样的疑问。一、问题和材料的选择一项量化史学研究要想取得广泛的影响,首先必须有一个高学术价值的研究问题,研究的是深入理解某种社会结构或群体行为的关键环节,是无论擅长哪种研究方法的学者都能理解和必需回答的问题。《官绅的荷包》一书,以官绅家庭资产为研究选题,即兼具很高的社会关注度和重要学术价值。近些年中国的反腐大潮,使得官员家庭资产成了社会性话题,是一个高关注度的“显题”。在学术领域,贫富差距大、社会不平等是全球所有国家都面临的共同困境,也是学术研究的核心议题。对中国社会而言,要理解不平等形成的原因、机制等,就必须深刻思考家庭资产积累的形成以及其中财产权利与政治权力的互动与角力。研究官绅群体的家庭资产规模和结构,能直接反映社会财富的分配模式与社会阶层差异,可以从侧面展示社会经济的特点与发展阶段,学术价值可谓“显要”。越重要的研究问题往往难度也越大,家庭资产研究便是如此。决定个人社会阶层属性最重要的指标,通常包括财富、职业与教育水平等等。但几乎在所有的国家和社会中,家庭财富信息都是其中最不公开,最难以获得的信息。而且越是社会上层,获得可靠信息的难度也越大,这给研究带来了巨大挑战。对于当代社会,学者们会采用纳税或公开的工资收入代替财富。但工资往往只反映个人的部分收入,不能全面反映家庭资产,这种不足对官员家庭资产的研究可能更为致命。因此,虽然像台湾学者赖惠敏曾利用内务府档案研究过清代皇族的经济收入,但史学界对官绅家庭资产的研究并不充分,这也反过来凸现了《官绅的荷包》一书选题的价值。要完成一项成功的量化历史研究,是否有足够有效的材料能保证研究是更为关键的问题。实际上,任何史学研究都应该是以史料为中心,以尽可能多的获取史料为前提的。量化研究对史料的要求一样是苛刻的,材料不仅要有一定的数量,还需有一定的质量(内容),才能实现研究的目的。《官绅的荷包》作为一项成功的量化史学研究,充分地体现了这样的研究路径:官方保存的抄家档案是难得的有效理解官绅家庭资产的材料,是本书能够成功的保证。清代官员的抄家档案具有规模大,连续性强和保存好的特点。民间社会虽然也广泛存在记载家庭资产的“分家书”等文书,但过于零散,没有系统整理几乎无法为研究使用。此外,抄家档案不仅覆盖的对象范围广,全国各地官员都有涉及,而且涵盖的时代长,清前、中、后期各朝都有。云妍此前关于抄家的研究还表明,被抄家的官绅,绝不都是“贪官污吏”,有相当多是政治斗争的牺牲品,如文字狱等。官员之外还包括一些幕友和地方绅士,如云南布政使钱度幕中的叶士元,文字狱中的江西举人王锡侯等。这大为提升了研究样本的代表性。抄家档案的内容更是珍贵,具有很高的学术价值。它们非常全面地“穷尽”了被抄家者的全部家庭财产,大到田地房产,小到日常用品,一般都有细致的具体记录。有些家产清单中还留有当时的原始估价,这种完整性和详细度是分家书、私人日记及人物传记等其他资料无法达到的。正是因为有了这样的核心资料,《官绅的荷包》一书才能够既展现出很多生动的具体案例,又能实现系统的多变量量化分析。因此,能否获取具备一定规模、时间长度和群体代表性的史料,是能否成功的完成一项量化史学研究的前提和基础。《官绅的荷包:清代精英家庭资产结构研究》,云妍、[美] 陈志武、林展著,中信出版集团2019年11月出版二、方法与表述的使用手握可靠的资料和好的选题,一项量化研究看似成功在望,但绝非唾手可得,如何合理有效地运用研究方法是下一个关键。很多人会认为,量化研究的项目在方法上一定要追求最高明、最前沿的计算工具或分析模型,凸现“技术”的能力。但《官绅的荷包》一书在研究方法上最值得赞许的,恰恰是不过分迷恋各类高级分析工具,而是突出以史料为中心,利用各种手段和方法实现史料收集范围的最大化,努力对不同主题数据库的信息进行连接和结果互证,在平衡定性描述与定量分析方法的同时,让史料更好地服务研究问题。量化研究论著给人的印象常常是过于专注数据计算和各类图表呈现,干巴巴的公式和结构较多,对历史进程中具体而丰满的人物和事件的描述少,可读性不强,只服务于专家同行,而将大量的普通读者抛在一边。《官绅的荷包》则不同,该书分上、下两篇。上篇是描述性的“案例篇”,对研究样本中有典型意义的案例进行具体描述,以家产资料的解读和家产的追踪复原为中心,贯穿以必要的案情叙述。其中对和绅、年羹尧等家庭资产的描述,如破案般抽丝剥茧,层层递进,不断呈现出新数据,引人入胜,令人有很好的阅读体验。虽然量化研究的基础是数据,但有学者指出:“数据”两个字有着量化的微弱气息,把过往丰富的人生经验直接降维成一些数字。因此,量化研究不能排斥定性描述。实际上,数据并非数字,而是“信息”。信息的串联、集合,可以用于统计,也可以用于描述。《官绅的荷包》开篇不是公式加计算,而是案例描述,着实令人耳目一新。下篇“量化分析篇”则是定量分析,通过对上篇185个官绅家庭资产案例的数据汇总和分析,探讨清代官绅阶层家产结构的总体性特征,发现了一些有趣且重要的新现象。如在清代官绅家庭资产中,金融业类资产比重不低,同时各种贵重实物占据相当的份额,这与过去认为的官绅家庭财产以田地、房屋为主的认识很不同。又如发现官员家产非法性程度越高,其持有土地资产的比重越低,持有隐匿性更强的金融商业资产比重越高。这些结论是具有很强冲击力的,可以帮助学界重新认识传统时代官绅家庭的资产组成及其特点。三、数据与人员的连接量化数据库的建设与研究,还需要强调史料数据的连接与研究人员的连接。所谓史料数据的连接,包括“内连接”与“外连接”两方面。“内连接”是指一方面,某一数据库在建设时力争利用多来源史料中能相互匹配的信息进行连接以扩充数据库内容;另一方面,在利用某一数据库进行研究时,应注意其中信息的相互连接,以拉长研究的时段、代际或空间范围等。“外连接”主要指不同主题但内容等具有连接可能的数据库,在开放的前提下,实现相关数据信息的连接,突破单一主题数据库信息范围与广度上的局限,实现数据库建设与研究的“共享”与“共赢”。数据的“内连接”与“外连接”,一个最要的目的就是使存储于数据库中的相关信息逐步从静态走向“追踪”,即通过多种材料或数据库的互相连接,连缀起某个个人和某些群体不同时间节点的信息,形成一种“追踪数据”,使得某些历史上个人的经历能够丰富和连续得呈现出。在很好地平衡定性描述与定量分析之外,《官绅的荷包》的作者们很好地开展了不同来源史料(包括历史数据库)的连接,尽可能地完善数据的内容和覆盖面,提升研究结论的可靠性。如作者发现很多人物家产资料不完整或无法一次性找全,案例人物的背景信息(官职、籍贯、履历等)同样需要搜集汇总。于是他们充分利用互联网资源,将不同时空、不同出处的史料有效集中起来,形成相对完整的内容拼接。如雍正元年登州知府李元龙被抄,家产资料中并没有田产记录,但通过网上资料搜寻,在北京碑刻资料中发现了李元龙的田产信息。在完善官绅家产信息数据库的同时,作者特别注意与一些主题接近的相关数据库进行连接或结论互证、补证。如陈志武、林展等构建的“历史中国吏治数据库”,是基于《二十五史》和明清实录里面皇帝惩罚官员的记录建立的。《官绅的荷包》根据这一数据库计算了官员被惩罚的次数,以此作为官员被惩罚概率的数据以理解为官的风险。香港科技大学李中清-康文林团队构建的“清代缙绅录量化数据库”,其数据信息与本书研究内容相关性很高,作者也部分利用了这一数据库来补充自身数据。《官绅的荷包》一书表明,从技术和研究实践角度看,充分利用技术方法进行电子化史料信息的连接、追踪的努力是非常必要的,哪怕只依靠最基础的方法,这些连接、追踪依然对提升研究质量帮助甚大。实际上,史料连接、追踪本就是史料考订、史实发现的应有之意,是今后开展量化研究必须更为关注的方向。过去学界多认为利用数据库进行史学研究,最重要的优点是对史料的大规模使用,能够“广”而“全”地使用史料。现在随着越来越多的数据库被建设起来并向学界开放,数据库数据的“连接”可能大为增加,“数据追踪”将越来越成为数据库研究的重要方法。数据库研究不仅能够“广”而“全”,也能够“专”且“深”。数据连接之外,《官绅的荷包》一书的成功还在于研究者的“连接”,即组建了一个有分工、有实力的研究团队。一般来说,大规模量化历史研究项目往往是跨学科的,历史资料的收集与考证,量化方法的选择与使用,量化结果的研究与描述等会涉及到历史、统计和相关社会科学等多个专业领域,需要建立一直各有所长的研究团队,这与传统史学研究主要是“单打独斗”的个人研究有所不同。《官绅的荷包》作者中,陈志武教授出身金融学界,对复杂的数据分析很有心得,多年来也一直在倡导量化史学研究,对把握项目研究方向和获取资金支持等都可能很关键,云妍副研究员有着扎实的经济学学习基础和长期的史学研究经历,是研究第一负责人,年轻的经济学博士林展,对很多具体的计算分析可以做出贡献。这样的团队组合展示了量化史学研究团队化的要求。近年来在网络数字技术发展的支持下,学界逐步形成以建设大规模量化历史数据库为基础的史学研究新风气,并逐步影响到中国史研究和进入中国学界。从全球学界来看,一些有影响力的中国史学量化研究团队开始出现,包括香港科技大学的李中清-康文林团队,香港大学龚启圣教授团队以及香港大学陈志武教授团队。这些团队都是在资深教授领导下,包括年轻教员、博士后以及研究生组成。四、“大样本”与“偏差”量化历史数据库的建设与研究,虽有方兴未艾之势,但毕竟是探索中的新事物。一方面,学者们有必要对各项具体研究中形成的方法和心得及时地进行总结、展示;另一方面,新方法、新尝试的不成熟之处,也需要学界的同仁一起来讨论。《官绅的荷包》在取得突破的同时,个人觉得也有些不够成熟或令我疑惑的地方。比如本书是基于185个官绅抄家案例进行的量化研究,研究者称之为“大样本”。但无论针对全体清代官员,还是所有被抄家的官绅,这一比例都很低,与一般理解的“大样本”、“全样本”概念似乎并不相符。作者能否称之为“大样本”?在量化历史研究中,又该如何具体的定义“大样本”?作者似乎应该做出必要的说明。还有一些研究案例,研究材料可能存在掌握不够充分的问题。如有一些官绅完全没有田产记录,作者据此认定没有此类资产。在传统中国社会家族和城乡关系体系之下,官绅家庭没有任何田产,似乎很难令人信服,应该需要作者们继续深入发掘资料,简单作为无田产处理可能会造成量化结果的偏差。当然,瑕不掩瑜,《官绅的荷包》总体上是一项非常成功的量化历史研究。期待在这些好的研究示范和鼓励之下,中国学术界能够出现越来越多有影响的量化史学研究。(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
写好METHODOLOGY的技巧本文的方法论是研究该论文的一种正确而有效的方法。撰写英国论文时,由于研究方法的复杂性,其方法论往往是最具挑战性、最耗时的部分。那如何写出论文的 methodology呢?怎样选择合适的方法?质量分析与定量分析的区别?本文主要介绍什么是方法论,重点介绍了方法论的两种基本研究方法,分享了一些实用的写作技巧,并给出了论文中的 methodology实例,供大家参考。Contents1 什么是方法论2 方法论部分的重要性3 研究方法的基本类型:定性和定量3.1 Quantitative methods :定量分析法3.2 Qualitative methods:定性分析法4 Methodology怎么写:实用的技巧1. 什么是方法论方法学(methodology)描述了用来调查研究问题的行动,以及用于确定、选择、处理和分析信息用于理解问题的特定应用的基本原理或技术,从而使读者能够对研究的总体有效性和可靠性进行批判性的评估。在研究论文的方法论部分,需要回答两个核心问题:数据是如何收集和产生的?如何分析这些数据呢?书写应直截了当,准确,并应经常使用过去时。2. 方法论部分的重要性教学法部分,同学们必须说明你是如何取得并分析你的成果的,原因如下:读者群需要知道数据是如何获取的,因为你选择的方法会影响到结果,进而影响到你在论文讨论部分如何解释它们的重要性。方法学在学术研究中起着非常重要的作用,因为不可靠的方法会导致不可靠的结果,从而损害你的分析价值。一般情况下,学者可以选择几种方法来研究问题。文章中的 methodology部分应该很清楚地说明了学者们选择特定程序和技术的原因。读者希望了解数据的收集或生成是否符合该研究领域公认的惯例。举例来说,如果你用的是多重选择问卷,读者需要知道它提供了一个合理的答案范围来供应答者选择。研究者使用的研究方法必须符合实现研究总体目标的要求。举例来说,你需要确保有足够大的样本数量,才能对研究结果进行总结并提供建议。这种方法应该涉及到所期望的问题和你所采取的措施来防止它们发生。至于出现了哪些问题,你必须描述它们是如何被最小化的,或是为什么这些问题不会以任何有意义的方式影响你对结论的解读。3. 研究方法的基本类型:定性和定量你要用什么方法来准备一篇论文,很大程度上取决于你所研究的主题,以及你的论文要回答的问题。多数情况下,你会采用定量或定性的研究方法,虽然一些项目会从两者的结合中获益。3.1 Quantitative methods :定量分析法什么是定量分析?跟随科学范式的研究者常常采用这种方法。这一方法是对数据进行量化,并从目标人群的样本中归纳结果。按照结构化数据收集流程,将数据输出为数字。量化研究也采用统计方法进行客观分析。对于量化研究,要获得有效的、可概括的结果,你应该足够详细地描述你的方法,让其他研究者接受你的研究。说明您是如何处理测量变量的概念,抽样方法或纳入标准,以及您用来收集数据的工具,程序和材料。定量分析方法有哪些?调查 (Surveys)描述调查的地点、时间和方式,需要解答以下几个问题:你是如何设计题目的?题目的形式是什么?(如多项选择题、力克特量表)你用什么抽样方法选择参与者?你是通过电话、邮件、网络还是当面进行调查的?参与者需要多长时间回复?样本量和反应率是多少?你可以将完整的问卷作为附录,以便你的读者能够确切地看到所收集的数据。实验 (Experiments)详细说明你用来进行实验的工具、技术和程序:你是如何设计这个实验的?你是如何招募参与者的?你是如何处理和测量这些变量的?你们试验时用到哪些工具和技术?提供足够的细节,以便其他研究者能在实验研究中复制你的结果,这一点非常重要。现有数据 (Existing data)解释你如何收集和选择相关资料(例如出版物或档案数据)以包含在你们的研究中:你从哪里获得资料的?数据最初是如何产生的?你选择材料的标准是什么(比如日期范围)?3.2 Qualitative methods:定性分析法什么是定性分析?不同于量化研究方法,它的目的是用计数来解释观察到的事物,而定性研究方法的目的是以研究者的身份,对你所观察到的事物进行全面详细的描述。定性分析不是提供预测和因果解释,而是提供背景和对所收集数据的解释。该研究方法具有主观性,对调查对象的选择要求较低。因为定性研究的方法更灵活,更主观,所以反思你所采用的方法并解释你所做的选择非常重要。探讨您用于选择参与者或来源的标准,您进行研究的背景,以及您在收集数据方面所起的作用(例如,您是一个主动参与者还是被动的观察者?定性数据分析法有哪些?访谈或小组讨论 (Interviews or focus groups)描述采访的地点、时间和方式,需要解答以下几个问题:你是如何发现和选择参与者的?有多少人参加?访谈的形式是什么(结构化、半结构化、非结构化)?采访时长是多少?采访内容是如何录制的?参与观察 (Participant observation)描述你在哪里、何时以及如何进行观察或进行人种学研究:你观察了哪些团体或社区?你是如何接触到他们的?你花了多长时间进行这项研究,研究地点在哪里?你在社区里扮演了什么角色?你如何记录你的资料(例如视听记录、笔记)?现有数据 (Existing data)解释你如何选择案例研究材料(例如文本或图像)作为你分析的焦点:你分析了什么类型的材料?你是如何收集和挑选它们的?定性分析例子:Mixed methods:混合研究方法将传统的定量和定性方法结合起来,产生了现代方法。根据Brannen和Moss (2012),混杂研究方法的存在源于其潜在性,通过将定量和定性研究方法融合在一起,使研究者能够更清楚地认识到两者之间的社会关系和复杂的关系。在社会研究中,混合方法还以三角划分的概念而著名。据 Haq所说,三角测量通过在一项研究中运用不同的定量和定性方法,使研究人员有机会就单一现象作出多种发现。Methodology应该包含的内容以下是一篇论文方法论应该包含的内容,也就是methodology的基本机构:目标您需要重申您的研究主题或问题,并概述您打算如何研究该问题。如需考虑伦理或哲学方面,请详述。所选研究方法论的概述确定您是选择使用定量研究还是定性研究,或两者结合。当选择定性研究和定量研究方法时,你需要进行初步的文献和教科书研究,以便建立标准的研究方法,通常在你选择的研究领域中使用。若您不确定从何处开始,您可以访问您的大学图书馆,请图书管理员帮助您选择最适合的参考文本。解释说明你选择的方法论说明您选择研究方法的理由。您也应该提供一个概览,解释为什么这些方法比其他研究方法更适合。仔细想想下面,你的研究是在什么时候和什么地方进行的,研究对象是谁。这可能包括,例如,关于访谈地点或焦点团体的资料,日期和时间范围,以及参与者是否属于某一特定人群。数据是如何被分析的?若要采用定量研究的方法,则需要在分析数据前准备数据。比如,你需要检查变量,丢失的数据,以及异常情况。假如你用电脑软件协助分析,这些资料也应包括在内。关于质量数据,你需要从原始数据中找出你的想法和主题并分类和编码。您也可以使用一些技巧,如叙事分析或话语分析,来解释回答背后的意义。在研究过程中使用了什么材料和设备?它可以包括任何东西,从用于科学实验的实验室设备到分析结果的计算机软件。在研究过程中遇到了什么障碍或困难吗?如是,所有的问题和困难是什么呢?您如何克服它们?找参与者、获得同意或缺乏进行科学实验所需的资源等都可能造成这种情况。评论这个短语应该用来评估你已经做过的研究,并且证明你选择了这个方法。您不必深入了解更多细节,因为您将在论文的结论部分对结果进行深入讨论。您需要简要地说明您的结果是否具有结束性,有无任何可变因素,以及您选择的方法是否实际有效。4. Methodology怎么写:实用的技巧方法论的目标不仅仅是描述你的研究方法。您也需要说明为什么选择使用它们以及如何应用它们。重点在于表明你的研究是认真地进行的。所以尽可能保持你的写作风格的简洁,这将确保读者易于理解和消化。以下是 paper代写专家在撰写论文时所采用的5种 methodology写作技巧:看看其他论文的方法论部分请指导老师为你提供以前所写论文的不同范例。通过阅读以往学生所写的方法,你可以对你最后完成的方法论部分有个大致的了解。计划你的结构不管你选择哪种研究方法,你的论文方法论应该是一个结构清晰,文字精炼的部分,它能为你选择的研究方法提供有力而合理的论证。在草拟提纲时,向导师询问有没有遗漏什么,结构是否合乎逻辑。考虑你目标读者写方法论的时候,要考虑到那些可能会阅读你的方法论的读者。举例来说,如果你选择了通常属于自己研究领域或学科范畴的研究方法,你就不必给出太多的理由或背景资料。当您决定使用一个不那么流行的方法时,建议您详细了解如何和为什么选择使用这个方法。保持专注于你的目标和研究问题论文方法学应提供清晰的解释,说明你选择的研究方法为何适合你的研究目标。在写论文的时候,要确保你选择的研究方法要与论文的总体目标和目的相联系。为帮助您集中精力,在方法论一节的开头就可以清楚地定义需要解决的问题。提及你遇到的障碍或困难若您在数据收集或分析阶段遇到任何问题,请使用“方法集”小节来讨论您为解决这些问题所采取的措施,并将其影响降到最低。但愿以上提供的 methodology范例,能让同学们更好的了解方法学,也能帮助大家区分定量与定性。不管你是在读本科还是读硕士,论文的方法通常被认为是完成主要研究项目中最困难、最耗时的部分。写作方法部分的成功关键在于构思得清楚。请记住,你研究项目的方法部分的目标是确保读者完全理解你所选择的方法。您应当使用方法论部分提供为什么选择特定的研究方法而非其他可能的研究方法的明确理由。不要在教学法中提到你的个人观点、想法或兴趣,要保留你的真实信息,并且要确保所有内容都有适当的学术参考来支持。如果同学仍然不清楚论文的methodology怎么写或者有任何不明白之处,欢迎随时联系专业论文辅导机构 - 英伦译制社。我们的专家在学术论文写作方面有着丰富的经验,对定性和定量分析法有深刻的理解。还等什么?赶快咨询吧!我们客服给同学们7×24小时全天候服务!
原文选自:雅思真题阅读—Quantitative Research in Ecation编辑:小kMany ecation researchers used to work on the assumption that children experience different phases of development, and that they cannot execute the most advanced level of cognitive operation until they have reached the most advanced forms of cognitive process.许多教育研究者都曾经立足于这样一个假设,即儿童会经历不同的认知发展阶段,在他们的大脑达到最高形式的认知之前,大脑无法执行最高级的认知操作。词汇解析assumptionn. 假设The whole argument rests on a false assumption.整个论证都是基于一个错误的假设executev. 执行We are going to execute our campaign plan to the letter.我们将严格执行我们的竞选方案。advancedadj. 高级的There were only three of us on the advanced course.只有我们三人学高级课程。cognitiveadj.认知的As children grow older, their cognitive processes become sharper.随着孩子们长大,他们的认知过程也变得越来越敏锐了。operationn.操作Operation of the device is extremely simple.这个装置的操作非常简单。For example, one researcher Piaget had a well-known experiment in which he asked the children to compare the amount of liquid in containers with different shapes. Those containers had the same capacity,but even when the young children were demonstrated that the same amount of fluid could be poured between the containers, many of them still believed one was larger than the other.比如,其中一名研究者皮亚杰曾做过一个十分著名的实验。在实验中,他要求孩子们比较两个不同形状容器中液体体积的大小。事实上着两个容器的容积相等,但当皮亚杰向儿童展示一个容器中的液体刚好可以倒入另一个容器后,孩子们依然认为其中一个容器的容积更大。词汇解析capacityn. 容量Two water tanks provide a total capacity of 400 litres.两个水箱的总容量为400升。demonstratedv.展示Catherine demonstrated the proper way to cleanse the face.凯瑟琳展示了洁面的正确方法。Piaget concluded that the children were incapable of performing the logical task in figuring out that the two containers were the same size even though they had different shapes, becaouse their cognitive development had not reached the necessary phase.皮亚杰由此得出结论,儿童无法理解两个不同形状的容器具有相同的体积,因为这个问题需要孩子使用逻辑思考能力,但是他们的认知能力还没有达到更高级的水平。词汇解析Incapableadj.无能力的If people keep telling you you're incapable, you begin to lose confidence in yourself.如果人们不断地对你说你无能,你就开始失去自信了。
欢迎关注“雄安学术”,后台为大家准备了90余款分析绘图软件,15种语言包及其他素材。欢迎来寻宝喲~完全精准的数学模型,可以完美解决定量指标的运算,然而数学工具并非万能的,面对大量的无法定量化的指标(如TA爱你的程度),精准的数学模型和工具顿时无法施展拳脚。如何完成定性指标的定量化分析,成为软科学与硬科学(自然科学)之间的研究论题。层次分析法(AHP),一言蔽之就是通过构建一套多层次的评价指标体系,完成对定性指标的定量化分析。层次分析法(AnalyticHierarchy Process,AHP)由美国运筹学家、匹兹堡大学教授SattyT.L.于二十世纪70年代提出,是一种将与决策有关的元素分解成目标、准则、方案等层次,在此基础上进行定性和定量分析的决策方法。常被运用于多目标、多准则、多要素、多层次的非结构化的复杂决策问题,特别是战略决策问题,可以较好地解决多要素相互关联、相互制约的复杂系统的评价,具有十分广泛的实用性,是一种新型简洁化、实用化的研究方法。在实际工作中,层次分析法经常和德尔菲法、百分权重法结合,用于确定评价指标的权重。举个栗子:如TA爱你的程度,可以用联系你的频率、关心你的程度、为你付出时间、为你付出的购买力等因素。先对这几个指标进行权重赋值,随后结合你的TA这些指标相应的得分,进行权重*得分的乘积运算,并将所有要素进行加和,即可得到TA爱你的程度(指数,手动狗头·-·)1971年AHP首次应用于美国国防部研究“应急计划”,随后又开展了多项研究,奠定了AHP在定性研究领域的基础,1982年AHP在“中美能源、资源、环境”学术会议上被首次介绍到中国。喵博士结合相关研究现状,梳理了当前主要涉及领域应用如下:适宜性评价、环境保护措施评价、安全性评价、危化物危害性评价、城市应急灾害能力评价、空间格局安全性评价。同时,亦可用于指导消费者在生活领域决策提供一定指导,如购房影响因素评价、购车影响因素评价、专业选择与就业倾向评价等,均可以发挥其优秀的功效。如在居住区适宜性评价(如上图)时,根据既有研究成效,居住区园林景观适宜性评价可以划分为:绿化种植景观、道路景观、场所景观、硬质景观、水景景观和庇护性景观等六个一级指标(准则层),每个一级指标又可以细分为若干二级指标,以完成定性指标的定量化分析。基于层次分析法(AHP)先分解后综合的基本工作思路,先将要分析的要素进行层次化、步骤化,构建形成多层次分析评价模型,最终确定各层级指标的重要程度(权重),或优先次序。AHP把一个复杂的问题表示为一个有序的递阶层次结构,并通过主管判断和科学计算给出备选方案的优劣顺序(或权重)。简而言之,层次分析法人如其名,首先要构建合理的层次,其次要分析层次内部各因素的优劣。层次分析法的使用流程:1) 根据需求对目标层进行分解,如适宜性可以分解为6个一级指标;2) 建立层次结构图,及判断矩阵;3) 计算权重系数(主要基于德尔菲法,或曰专家打分,对各指标要素的权重进行赋值);4) 进行一致性检验(在AHP软件中可自行设定),若一致性指标CR<0.1,则满足研究需要,进入下一环节。不满足时则需要对各指标权重重新赋值(重新进行第三步分析);5) 层次总排序,选出最优方案。如在评价购房影响要素时,可以细分为房价要素、区位要素、户型要素、口碑要素等一级指标,并分别对各一级要素进行深度开发,构建相应的二级评价指标以完成对一级指标的评价。1)建立层次结构模型将决策的目标(城市空间格局安全)、考虑的决策准则因素(空间结构安全、空间要素安全、空间环境安全)和决策对象按它们之间的相互关系分为最高层、中间层和最低层,绘出层次结构图(如下图,强迫症的患者有意见,在“雄安学术”公号文末留言啊~,获取宝贝啊)。2)构造判断矩阵在确定各层次各因素之间的权重时,如果只是定性的结果,则常常不容易被别人接受,因而Saaty等人提出:一致矩阵法,即:不把所有因素放在一起比较,而是两两相互比较。对比时采用相对尺度,以尽可能减少性质不同因素相互比较的困难,以提高准确度。由专家对同一层次内N个指标的相对重要性(两两因素之间)进行打分。相对重要性的比例标度取1-9之间。同时,对各同级指标的重要性评价时,存在三种标度范畴(如下图),根据研究需要自行选择。构建判断矩阵A(正交矩阵),用aij表示第i个因素相对于第j个因素的比较结果:3) 计算权重将矩阵A的各行向量进行几何平均(方根法),然后进行归一化,即得到各评价指标权重和特征向量W:4) 一致性检验判断矩阵的一致性检验,所谓一致性是指判断思维的逻辑一致性。如当甲比丙是强烈重要,而乙比丙是稍微重要时,显然甲一定比乙重要。这就是判断思维的逻辑一致性,否则判断就会有矛盾。计算最大特征根λmax:计算一致性指标CI(Consistency Index)、随机一致性指标RI(Random Index)和一致性比例CR(Consistency Ratio):一般情况下,当CR<0.1时,即认为矩阵具有满意的一致性,否则需要对判断矩阵进行调整。5)层次排序层次排序,可分为层次单排序和层次总排序。所谓层次单排序是指,对于上一层某因素而言,本层次各因素的重要性的排序。层次总排序,确定某层所有因素对于总目标相对重要性的排序权值过程,称为层次总排序。这一过程是从最高层到最底层依次进行的。对于最高层而言,其层次单排序的结果也就是总排序的结果。1)构建评价结构一位顾客决定要买一套新住宅,经过初步调查研究确定了三套候选的房子A、B、C,问题是如何在这三套房子里选自一套较为满意的房子呢? 下面给出有关的数据和资料:将影响购买新房的因素归纳为4个标准:· 房子的地理位置及交通;· 房子的居住环境;· 房子结构、布局与设施;· 房子的每平方米建筑面积地单价(模型如下)。2)邀请专家(20-30名)打分对同一层次内4个指标的相对重要性(两两因素之间)进行打分。经过专家的打分,每个标准相对的权重,即标准的特征向量如下表。3)用规范列平均法求权重 第一步:先求出两两比较矩阵每一列的总和。 第二步:把两两比较矩阵的每一元素除以其相应列的总和,所得商所组成的新的矩阵称之为标准两两比较矩阵。 第三步:计算两两比较矩阵的每一行的平均值,这些平均值就是各方案在地理位置及交通方面的权重。我们称最后求得的行平均值为房子选择问题中地理位置及交通方面的特征向量。三个方案在其它三个方面的特征向量。每个标准相对的权重,即标准的特征向量。通过两两矩阵比较,可求得标准的特征向量如下:地理位置及交通:0.398居住环境:0.218结构布局设施:0.085每平米单价:0.2994)两两比较一致性检验两两比较矩阵的元素是通过两个因素比较得到的,而在很多这样的比较中,往往可能得到一些不一致性的结论。例如,当因素i、j、k的重要性很接近的时候,在两两比较时,可能得出i比j重要,j比k重要,而k又比i重要等矛盾的结论,这在因素的数目多的时候更容易发生。 第一步:由被检验的两两比较矩阵乘以其特征向量,所得的向量称之为赋权和向量。 第二步:每个赋权和向量的分量分别除以对应的特征向量的分量。1.803 / 0.593 =3.0401.034 / 0.341 =3.0320.197 / 0.066 =2.985 第三步:计算出第二步结果中的平均值,记为λmax。λmax = (3.040+3.032+2.985)/ 3 = 3.019 第四步:计算一致性指标CI。CI = (λmax– n ) / (n - 1)CI = (3.019 – 3 ) / (3 – 1 ) = 0.010 第五步:计算一致性率CRCR = CI / RI,在这里,RI是自由度指标(修正值)。本例中可计算得CR = 0.01 / 0.58 = 0.017 < 0.1我们已经求出了四个标准的特征向量,以及四个在单一标准下的三个购房方案的特征向量,如表:5)最优方案求解方案 A:0.398*0.593+0.218*0.123+0.085*0.087+0.299*0.265=0.349方案 B(最优)0.398*0.341+0.218*0.320+0.085*0.274+0.299*0.655=0.425方案 C:0.398*0.066+0.218*0.557+0.085*0.639+0.299*0.080=0.226层次分析法优点:· 系统性的分析方法层次分析法把研究对象作为一个系统,按照分解、比较判断、综合的思维方式进行决策,成为继机理分析、统计分析之后发展起来的系统分析的重要工具。系统的思想在于不割断各个因素对结果的影响,而层次分析法中每一层的权重设置最后都会直接或间接影响到结果,而且在每个层次中的每个因素对结果的影响程度都是量化的,非常清晰明确。这种方法尤其可用于对无结构特性的系统评价以及多目标、多准则、多时期等的系统评价。· 简洁实用的决策方法这种方法既不单纯追求高深数学,又不片面地注重行为、逻辑、推理,而是把定性方法与定量方法有机地结合起来,使复杂的系统分解,能将人们的思维过程数学化、系统化,便于人们接受,且能把多目标、多准则又难以全部量化处理的决策问题化为多层次单目标问题,通过两两比较确定同一层次元素相对上一层次元素的数量关系后,最后进行简单的数学运算。计算简便,并且所得结果简单明确,容易为决策者了解和掌握。· 所需定量数据信息较少层次分析法主要是从评价者对评价问题的本质、要素的理解出发,比一般的定量方法更讲求定性的分析和判断。由于层次分析法是一种模拟人们决策过程的思维方式的一种方法,层次分析法把判断各要素的相对重要性的步骤留给了大脑,只保留人脑对要素的印象,化为简单的权重进行计算。这种思想能处理许多用传统的最优化技术无法着手的实际问题。层次分析法缺点:· 不能为决策提供新方层次分析法的作用是从备选方案中选择较优者。在应用层次分析法的时候,可能就会有这样一个情况,就是我们自身的创造能力不够,造成了我们尽管在我们想出来的众多方案里选了一个最好的出来,但其效果仍然不够企业所做出来的效果好。而对于大部分决策者来说,如果一种分析工具能替我分析出在我已知的方案里的最优者,然后指出已知方案的不足,又或者甚至再提出改进方案的话,这种分析工具才是比较完美的。但显然,层次分析法还没能做到这点。· 定量数据较少,定性成分多,不易令人信服在如今对科学的方法的评价中,一般都认为一门科学需要比较严格的数学论证和完善的定量方法。但现实世界的问题和人脑考虑问题的过程很多时候并不是能简单地用数字来说明一切的。层次分析法是一种带有模拟人脑的决策方式的方法,因此必然带有较多的定性色彩。· 指标过多时,数据统计量大,且权重难以确定当我们希望能解决较普遍的问题时,指标的选取数量很可能也就随之增加。指标的增加就意味着我们要构造层次更深、数量更多、规模更庞大的判断矩阵。那么我们就需要对许多的指标进行两两比较的工作。由于一般情况下我们对层次分析法的两两比较是用1至9来说明其相对重要性,如果有越来越多的指标,我们对每两个指标之间的重要程度的判断可能就出现困难了,甚至会对层次单排序和总排序的一致性产生影响,使一致性检验不能通过。不能通过,就需要调整,在指标数量多的时候比较难调整过来。· 特征值和特征向量的精确求法比较复杂在求判断矩阵的特征值和特征向量时,所用的方法和我们多元统计所用的方法是一样的。在二阶、三阶的时候,我们还比较容易处理,但随着指标的增加,阶数也随之增加,在计算上也变得越来越困难。不过幸运的是这个缺点比较好解决,我们有三种比较常用的近似计算方法。第一种就是和法,第二种是幂法,还有一种常用方法是根法(来自百度百科)。
这里是与可杂谈,喜欢可以点上方蓝色背景按钮加关注哦!封城的第52天,天气回暖,楼下的声音多了起来。今天分享一下调查研究要用到的方法。方法是为了达到某种目的(解决某个问题)而采取的测量手段,如购物网站、点评平台用到的星级评定。以这么一个问题为例,玩暴力游戏会让人变得暴力吗?先用实验的方法,在实验组中,实验人员玩双人对战暴力游戏,对照组中,实验人员玩双人非暴力游戏,赢家可以选择对输家进行惩罚,结果表明,玩暴力游戏的一组选择的惩罚力度更强。再用最不暴力的游戏测试,俄罗斯方块和巴斯特,结果显示,挫败感会让人们产生暴力情绪。用文本的方法,媒体中对暴力游戏和现实暴力行为的所有报道的梳理,但其有一种偏向性,尽管努力靠近客观的态度。用二手数据的方法,得出,同时期暴力游戏销量增加,青少年的犯罪率显著降低。用访谈或问卷的方法,有深度访谈、焦点小组访谈,调查问卷这么几种形式。还可以使用观察的方法,看暴力游戏和暴力行为是否有相关关系。研究问题在制定计划、收集、分析、综合、得出结论的过程中,收集和分析就是调查方法。定性的调查方法可以有一个总体和大概的判断,揭示事物的本质,适合于小规模、深入细致、长期的调查。定性多用于创造想法,以文字形式报告,问题是开放式的探索,缺点是广而不深。定量的调查方法选取一定数量有代表性的样本,用数学工具分析,计算机录入、整理,多以数字形式呈现。定量多用于验证想法,问题是封闭式的选择,优点是代表性强。定性是定量的基调,定量是定性的准确化。定量中有自变量与因变量,自变量的变化要优先于因变量,因变量的变化由自变量引起,没有其他原因。相关变量无法确定谁影响谁,比如媒介偏好和风险感知。共变变量是两者同时变化,不是因为对方的影响,而是同时受第三方的影响,如春晚期间抖音和快手的注册用户明显增加是因为春晚中的红包活动。测量结果的衡量标准有信度,即使用相同调查方法重复测量同一个对象得到相同研究结果的可能性,比如体重用目测和体重秤测量的信度是不一样的。效度,即有效性,测量工具或手段能够准确测出所需测量事物的程度,如菜市场里的公平秤,肩负着准确测量的使命。在调查与研究方法中,属于定量的有问卷调查、实验、内容、文本、话语分析,属于定性的有观察法(民族志)、深度访谈、焦点小组访谈。有任何想法,欢迎告诉我哦!来评论区留言吧!期待听到你们的看法与建议!喜欢可以关注,收藏,转发哦!你们的支持是最大的鼓励!比心!