欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
探索型和定性分析型数据分析工具不知就后

探索型和定性分析型数据分析工具

数据可视化工具包含许多非常先进的技术。这些技术方法可以通过使用图像,图形和计算机视觉来可视化数据。在进行数据分析时,有许多类型的数据,那么主要用什么类型的数据可视化工具进行数据分析?今天,DataFocus将为您提供详细的介绍。 市面上常用的数据分析工具可以简单的分为两大类。一个是探索性数据分析,另一个是定性数据分析。它们与其他同类产品不同,分析功能非常强大,交互方式也非常丰富,允许用户及时掌握信息,发现问题,找到答案并采取行动。 1.分析定性数据。数据可视化工具可以分析非数字数据或数据,例如照片,单词和观察。它也被称为定性研究,定性数据分析或定性研究数据分析。 如Tableau这类老牌的传统数据分析工具就有这这一类的鲜明特征。 2.分析探索性数据。这种方法由美国着名统计学家命名。它是对传统统计假设检验方法的有效补充。它是形成一个值得假设的测试。也是新一代可视化工具的一个主要特征。注重敏捷、探索和智能,比起工具,更像一个辅助的帮手,常常在可用性上做到极致,比如新一代的DataFocus数据分析工具。 近年来,数据可视化工具基本上基于视觉元素,例如图形,表格或地图。可以通过分析动态分析数据,例如钻孔,过滤,跳跃,链接和突出显示。它可以提供各种数据表示形式,以及各种图形渲染形式,还可以支持商业逻辑动态脚本引擎和丰富的人机交互等。可以说它是一个非常强大的工具,能够为公司的发展提供很多帮助。 除非注明,否则均为DataFocus企业大数据分析系统,让数据分析像搜索一样简单原创文章,转载必须以链接形式标明本文链接。

皆重失之

定性研究数据的敏捷量化分析

用户调研得来的数据该如何处理?笔者在本文给出了敏捷量化分析方法,可供同学们参考并交流。上一篇文章讲了B端用户调研的一些灵活方法,当收集到用户调研的数据之后,接下来就是做问题的整理、分析和优化了。实际工作中,用户调研阶段可能会已经花费了较长的时间,出于对时间成本、工作进度、问题时效性等多方面的考虑,总是希望能尽快的输出一个用户调研数据结果,给产品的迭代优化提出改进方向和计划。本问将会讲一种简单迅速的处理用户调研问题优先级的量化方法。一、用户调研数据分析思路数据收集整理→问题优先级排序→解决方案设计→解决方案的优先级排序二、步骤详细说明第一步:数据收集整理关于用户调研的数据收集、整理,每个企业、团队、产品经理等都有自己的记录分析的方法和规范体系,为了方便最后的敏捷量化分析,数据的收集整理请注意以下几点:团队内建立一个问题识别的规范体系,更加快捷地识别问题的严重性;标注出问题发生在哪里,如屏幕、模块、用户界面组件、流程等;清楚用户反馈问题时,正在参与的具体任务;一个简洁的问题描述。《量化用户体验》的参考示例表格:“1”代表此用户出现此问题,“0”代表没出现。第二步:问题优先级排序先来说一下,问题严重性评分的几个影响因素:任务的关键性:任务的未完成对业务及用户产生的影响;问题发生频率:在不同的参与者中这个问题发生了多少次;问题的影响:对于用户顺利完成任务的影响程度。具体优先级分析步骤:1)给测试中的每个任务设立关键性评分K。根据任务对于业务或用户的重要性来设置分值,可以结合实际工作情况,合理安排分支区间。我们实际工作中按5分制,即1、2、3、4、5。2)给任务中出现的每个问题,设立影响力评分I。参考标准一:5分:该问题阻碍了用户完成任务(障碍)3分:该问题导致用户产生挫败感或者延误任务的完成时间(严重)2分:对于完成任务的行为表现产生较小的影响(轻微)1分:参与者提出的建议(建议)参考标准二:5分:影响任务完成的行为3分:导致用户“偏离航线”的行为2分:用户表达出来的挫败感1分:用户说自己完成任务但实际未完成3)计算问题发生频率F=问题反馈人数/用户总人数。4)计算问题综合严重性评分S=关键性评分K*影响力分值I*发生频率F,并按评分S进行由大到小排序。对前面的表格进行优化后,示例如下(仅以两个用户示例):模板下载详见文末,计算过程已在Excel加入公式自动实现计算操作(包括根据添加用户数量自动计算F,根据F自动计算S=K*I*F)。第三步:解决方案设计注意:有时解决方案十分明确,或者只有1~3种解决方案,可以通过综合考虑业务逻辑、交互体验、研发成本等方面问题,就可以确定解决方案,而不需要精确的数据化分析。但是当问题没有那么明显或者存在多种解决方案时,为了降低做出错误设计的风险,可以设计多种备选方案,分析选取最佳方案。对于每个问题,需要准备大量的解决方案(注意与开发、设计、需求、业务等成员合作讨论)。重新整理解决方案,确保描述具体详细。标记出方案可能解决的其他问题:在实践中,一个好的方案可以解决多个问题,好的解决方案是通用的。第四步:解决方案的优先级排序计算效力值E=解决问题1关键性评分*自定义加权数+解决问题2关键性评分*自定义加权数+…量化解决方案复杂度C(团队评估出的每个解决方案的复杂度)计算投资回报率(RIO)=效力值/复杂度(E/C)三、视觉工具(便利贴、白板等)——分析方法作为设计师或者产品经理,大家更喜欢团队人员,在一个会议室,使用便利贴或者白板来工作,这样分析更加方便、有趣、直观,也便于团队内部之间的合作。如下图:四、分析方法选择视觉工具分析快速随性,可以促进团队之间的协作,但也可能降低数据的准确性。敏捷量化的分析方法,数据直观,更方便整理问题排序。所以,要根据实际情况,选择最符合自己产品特点、用户调研方法、用户量和调研目标的方法。五、注意事项对于优先级的理解需要注意的是,根据上述方法得到的问题优先级排列是用研人员基于用户的测试而给出的参考结果,结果也可能会因为样本选择、统计方法等因素而出现误差。所以,这个优先级顺序并不是产品开发的实际优先级顺序。所以,用研应该和公司相关业务、运营、开发等成员,一起从用户的角度来理解这些问题的重要程度,再由相关人员决定实际的优先级排次序。使用的局限性在优先级阶段我们只关注了可用性问题,用户在测试过程中表现出来的态度以及行为并未涉及到。可以选择分开记录这类数据,使用它来补充和平衡测试结果。但是,我们在实际工作中,远程测试居多,也可以通过用户语气、停顿时间等做记录。在可用性测试中,当用户提到产品的某个或某些优点时,我们同样需要记下来,并在事后的报告中提及,特别是一些被多次提及的优点。有利于可用性测试等用户研究后续的合作、沟通;重视用户提及多的优点,为后续迭代做参考。六、最后陈述定性研究数据的分析还有许多种方法,本次只是分享了一种比较敏捷的量化分析方法,希望对大家的工作有帮助,更期待大家“批阅”后多提意见!模板下载链接:提取码:8ziz本文由 @Ace-老糊 原创发布于人人都是产品经理,未经作者许可,禁止转载。题图来自Unsplash,基于CC0协议。

健忘症

10种较好的Web分析工具:如何充分利用它?

数据。数字。分析–跟踪所有过程可能是一个乏味的,压倒性的过程。但是,借助Web Analytics工具,数字运算和数据意义变得非常简单!曾经是数据科学家的独家助手,现在已经成为每个数字营销者的朋友。Web Analytics是关于弄清楚什么有效和什么无效。它有助于找出可行的策略,并有助于在计划下一步行动时做出明智的决定。您如何有效地使用Web Analytics?假设不起作用。在您根据假设按下按钮进行更改之前,请等待一秒钟。也许……长于一秒钟?作为数字营销商,您的决策应包括对网站数据的定性和定量分析(是的,两者!)。你已经知道了吗?好。然后,让我们开始,看看从1到3应该做什么。另外,请阅读何时使用定性和定量数据步骤1 –设定目标不要寻找热门。我的意思是,不要只寻找热门歌曲。专注于目标。网站访问应转化为转化,因此您应将重点从匹配转换为转化。作为数字营销商,您需要不断问自己一些问题,例如:转换率是多少?漏斗中滴下了多少视图?有瓶颈吗?根据您希望访客采取的行动来决定您的目标:他们应该下载您的内容吗?您要他们注册课程吗?*眨眼眨眼*还是您诱使他们购买您的产品?根据您希望访客采取的行动来设定目标。设定目标之后,就可以进行第2步了。步骤2 –了解问题所在“您为什么离开我?”您的Ex可能无法为您提供正确的答案,但Web Analytics工具肯定可以。查找退出率高的页面。这将使您深入了解用户行为并帮助您优化内容。一旦了解了人们离开的原因,您就会知道是什么原因导致他们离开–并且可以弄清楚如何留住他们。就这么简单。现在,只要您可以将其应用于您的个人生活,事情就不会容易吗?步骤3 –优化用户体验如果您的网站不友好,那么恭喜您!您已经成功地推走了数百万的用户。吓坏了 别担心!只需在设计中避免这5个不好的UX元素,就可以进行重大改进:加载时间慢(主要罪过)错误404(链接缺失,用户缺失)不良的颜色组合(关闭某人的最快方法)没有社交分享按钮(这个数字时代最大的错误)找不到详细联系信息(那么,您的网站要点是什么?)有罪?记下您需要解决的问题,解决这些问题,然后查看它如何影响您的网站数据。您会感到惊讶!Amber Leigh Turner在这篇精彩的文章中解释了UI和UX的注意事项您可以从Web Analytics工具获得哪些详细信息?根据您计划使用这些工具的方式,您可以从各种Web Analytics工具收集的数据中获得很多详细信息。但是,我列出了一些您应该注意的重要细节。1.用户搜索什么?您可以找到人们搜索的关键字,这些关键字通过搜索结果将其引导到您的网站。这可以帮助您:在关键字集之间绘制相似之处了解点击(字面上)和不点击创建用户感兴趣的内容实际上,您现在正在阅读的博客文章是通过从营销人员搜索的关键字变体(即“ Web Analytics Tools”)中得出的见解来撰写的。2.表现最佳和最差的内容根据您的内容效果报告分析并重新设计您的策略。例如,您可以:更新文章内容通过添加信息图表,幻灯片共享和案例研究等元素来重新利用内容尝试不同的促销方式使用付费促销来获得额外的提升也许,借助Web分析工具的洞察力设计出的一种新的改进方法将使您的内容正常工作!即使不是这样,您也一定会从分析工具中了解它。3.人们放弃您的网站的原因用户何时,何地,为什么停止在您网站上的旅程?知道这对互联网营销人员来说是最好的事情,不要放弃您的整个策略,而要摆脱不起作用的因素。是价格吗?烦人的付款程序?还是用户不想采取的强制性措施?确定这一点,重新设计其上的体验,然后发现不同之处!4.有效的广告活动市场营销的先驱之一约翰·沃纳梅克(John Wannamaker)曾说:“我花在广告上的钱浪费了一半;问题是,我不知道哪一半。”好吧,你没有那个问题!衡量在线广告活动的成功和失败,了解有效的方法,并尝试新事物。在各种URL上设置UTM标签,以标记正在运行的文章/广告系列。每当我做访客留言时,我都会使用这种方法。这可以帮助我了解该帖子是否导致了我博客的访问量增加。这是有关UTM标签构建器的分步指南。5.基于位置的数据网站是通用的。但并非所有企业都是如此。如果您的业务仅适合一个国家或城市,则Web Analytics(分析)需要根据您的位置反映数据。如果在俄亥俄州的一家本地商店的网站从胡志明市获得大部分流量,那没有什么意义呢?这就是位置如此重要的原因:您的客户根据您所在地区的节日或特殊场合寻找优惠和折扣内容中使用的语言,语调或主题与您所在位置的人有关目标受众的敏感度与其他对象不同6.用于查看您网站上内容的设备我知道您以前听过,而且我相信您到处都读过,但是我会再说一遍移动是现在和未来。不要忽略它。实际上,如果你们中有人在手机或平板电脑上阅读本文,我不会感到惊讶。有数百万人使用移动设备定期访问互联网并完成任务(全球将近53%的移动用户)。实际上,在未来几年中,通过手机访问互联网的人数将增加10%!现在,您是否可以想象如果您的网站不符合此要求,会对您的业务造成损害?检查您的观众最喜欢使用哪些设备和浏览器,并进行相应的优化。现在,您已经了解了Web Analytics Tools可以为您做些什么,让我们看一些最佳工具。Google Analytics(分析)获胜!这就是为什么:它可以帮助您跟踪投资回报率内部拆分测试功能真的很酷它有一个很棒的转化跟踪软件与AdSense进行数据集成是其独特之处报告生成简单而相关除此之外,我还分两部分列出了10种Web分析工具:免费和付费。5种最佳的免费网络分析工具及其功能1. ClickyClicky最好的事情是简化的仪表板,这使检查统计信息和快速采取措施变得非常方便。另外,它还提供:实时数据Twitter搜索跟踪费用:免费。专业版每月$ 9.99起我特别喜欢它们的“间谍”功能,类似于Google Analytics(分析)上的在线功能。直观易用,并提供了有关用户在您网站上正在做什么的详细视图,这些用户来自何处,被推荐的国家/地区以及用于访问您内容的浏览器和平台。所有这些都是实时的。拉姆齐·塔普林(Ramsay Taplin)对Clicky给出了扎实的评论,并且可以说它比Goggle Analytics好!亵渎,就是这样!2. 开放式Web分析(OWA)几个功能:开源的自托管热图和鼠标跟踪渠道分析费用:免费而它绝对不可抗拒的是它的速度快。您会看到,已经采取了特别的措施使信息在视觉上更具吸引力并易于阅读。3. PiwikPiwik的功能如下:自托管(PHP,MySQL)隐私权和数据所有权定制仪表板,带有可调整的小部件以显示统计信息更快的界面和更快的见解社区支持53种不同语言费用:免费;Piwik pro每月65美元起如果您打算创建自己的插件,除了可以完全控制数据之外,Piwik确实很有帮助。这基本上是因为它是基于插件的工具。WebAppstorm在这里详细介绍了Piwik Analytics。4. WoopraWoopra的这些功能使其值得尝试:与访问者进行实时聊天的能力其“ Appconnect”功能为每个用户定制的仪表板费用:免费(至30000名访客),每月支付$ 80- $ 1200 +可获得更多。我发现最有趣的是它的“ Appconnect ”功能。借助它,您可以通过Woopra利用第三方应用程序的服务和功能。这还可以包括分析用户行为并触发第三方应用程序。例如,基于某个用户行为触发实时聊天。Trey Ratcliff在快速视频中评论Woopra,您可以查看详细的评论。5. 堆分析这就是我对堆分析的印象:用户友好的点击式界面定义自定义事件以使用事件可视化器费用:免费;专业版$ 59- $ 399美元起这是一个有效跟踪所有内容的工具-视频播放,文件下载,表单提交以及几乎所有您可以放置跟踪代码的内容!堆记录所有数据位,这可以帮助您回答以后遇到的任何问题。现在,我们继续使用付费工具,这些工具可以带给每个营销人员最深的忧虑。但是请相信我,我将列出的那些将物有所值。马丁·布莱恩特( Martin Bryant)解释了堆分析(Heap Analytics)如何带来一种巧妙的方法来跟踪您网站上的交互。5种最赚钱的Web分析工具及其功能1. 薄荷那么,为什么要为Mint付款呢?自托管和可下载的分析程序实时统计可自定义,具有一项称为“ Peppermill”的特殊功能从图像生成流量的单独视图费用:一次性费用为30美元!Mint使您能够更好地控制站点的分析,其极其友好的用户界面仪表板的易用性是一个巨大的优势。令人耳目一新!(难怪他们称其为“薄荷”!)它也使用本地Web图表而不是Flash。2. KissmetricsKissmetrics的一些功能:分析用户行为的变化访客时间线视图易于理解的视觉格式通过添加参数来跟踪URL费用:每月149美元,可免费试用30天!“路径报告”是最重要的功能之一,它可以帮助您分析用户与网站互动的模式。Kissmetrics中缺少一些Google Analytics(分析)必不可少的功能,例如“流量数据”。Leslie Poston告诉您如何将Kissmetrics与Google Analytics(分析)结合起来。3. 鼠标流这是MouseFlow的一些功能:鼠标跟踪,单击,移动和滚动热图表单和渠道分析性能和可用性测试费用:每月19美元滚动热图功能是最好的功能,因为它可以告诉您用户使用用户的完整鼠标轨迹向下滚动内容的程度。此外,还有注意,地理位置,移动和点击热图。Ashwin Satyanarayana解释了如何通过Mouseflow成为数据驱动的营销商。4. 疯狂的鸡蛋为什么要疯蛋?它的“滚动图”可以告诉您访问者在哪里放弃了页面,在何处需要添加元素以保持他们的兴趣名为“五彩纸屑”的功能:根据引荐来源和搜索字词等类别区分点击SEO更新跟踪图表情报– Google Analytics(分析)覆盖列表列出了已发布的Google更新。费用:每月$ 9- $ 99(基于不重复的页面)您可以阅读SeriouslySimpleMarketing对Crazy Egg的深入评论。5. Clicktale使Clicktale点击的功能可视化的用户交互指南,就像《疯狂的鸡蛋》鼠标移动并单击热图JS错误工具和退回报告表格分析费用:99-790美元之间我最喜欢他们的表单分析-它显示用户填写了哪些字段,而他们遗漏了哪些字段。在分析退出率时,这一点变得非常重要。SeoChat回顾了Clicktale,这是他们对于该工具的评价。您可以先查看这些工具的详细评论,然后再投资。但是,为了让您的生活更轻松,这是一份清单,该清单提供了上述所有Web Analytics工具(其中有10种)的比较,以供您参考。永远不要忽略网络分析–这通常是普通营销人员和功能强大,精明的数字营销人员之间的区别!如果您有任何建议或要补充的地方,请发表评论!

推推搡搡

超级实用的定性研究论文写作指南!

本文转载自【微信公众号:社科学术圈,ID:shkxquan】经微信公众号授权转载,如需转载与原文作者联系今天小编推荐的这篇文章,语言精练,实用性强。大部分的学术论文,基本遵循了“前言/背景介绍→文献回顾→研究方法/设计→研究结果→讨论”的框架。换句话说,当你在写作一篇学术论文时,完全可以按照上述路径架构自己的论文,然后在这个框架中,填充自己的具体研究内容就可以了。很多学者认为的“学术论文的八股文写作方法”,其实就是这个道理。1.前言/背景介绍 描述研究所涉及的相关社会背景和清晰阐述具体研究问题。如研究在哪里开展的,研究的社会背景和脉络是什么,以及本研究对该领域的实践和政策等方面的有什么重要意义。将本研究问题和具体的研究目标跟与此相关的社会问题、健康问题或相关知识、理论联系起来。简要论述为什么定性研究方法适用于该研究问题。2.文献回顾 首先,回顾与本研究问题相关的最新研究发现。其次,简要讨论相关的,尤其是研究对象相关理论视角。然后,指出在回应类似研究问题的复杂性时采用不同研究方法可能会遇到的局限。最后,总结以往研究的优点和不足。3.研究方法 研究方法部分应详细阐述开展本研究的原因、研究过程以及执行步骤。应注意,如果定性研究只是研究所采取的混合研究方法(mixed methods)的一个组成部分,那么在文章中应尽早明确这一点。描述研究者的价值判断或者所持观点和立场,包括可能会影响到研究过程和结果的研究者的个人特征和背景。描述作者的反身性(reflexivity)不仅能使读者清楚地认识到作者是如何看待研究对象和研究本身,而且对透明化(transparent)研究过程具有重要意义。此部分一般需交代以下各方面要求的内容,但也视具体研究而定,如不适用,请简述原因:01具体研究方法确定具体的研究视角或方法(例如传记法、叙事研究法、民族志法、扎根理论法、现象学法和影像发声方法等)。简要描述研究中用到的理论视角和关键概念(允许使用图表来帮助理解这些概念)。告诉读者关于选择研究方法的基本原理,为什么这个方法适合此研究问题,以及所选的研究方法将如何完成论文所描述的研究目标。02招募和抽样过程详细阐明研究成员是如何招募来的。如果研究的对象是人的话,他们是如何参与到本研究中的。清楚描述抽样方法和抽样的类型(如目的性抽样、方便性抽样、滚雪球抽样等)。汇报样本量以及样本的特征,被调查者是否存在中途退出或拒绝参与的情况,并解释为什么该样本量足够满足本研究需求。详细描述本研究抽样方法在内的研究单位、涉及物质环境及调查环境,但需要保护被调查者的隐私。描述样本饱和状态是如何执行、记录和实现的(例如,不再进一步收集新的数据,是因为增加的数据对产生的理论贡献很少,或对研究结果/主题几乎没有新的影响和变化)。03数据收集过程收集数据的方法。详细描述收集数据的方法(例如访谈法、观察法、文献资料法等),从而帮助读者了解该研究数据的潜在充分性(如对每一位被调查者不仅只是一次访谈,还在研究过程中进行了长期细致的观察)。谁收集数据。汇报数据收集者的信息,以及他们是否接受过相关定性研究训练等简要的背景信息。如何保证数据准确度。数据是否经过三角校正(triangulation,即有三个以上研究人员对定性数据和结果进行相互检验与核查)。假如是单个研究人员在单个时间点收集的数据,则应标注此研究局限。说明研究中是否采取了特殊的数据收集方法。详细介绍这些特殊的方法,解释为什么选择此方法,或是此方法与其他方法相比的优势之处。“在哪”及“何时”收集的数据。标注数据收集的地点,以及数据收集的时间。如果采用了多种数据收集方法,那么还需要汇报不同方法之间是如何相互补充的。04数据分析提供数据分析的详细步骤,以及得出结论的过程。对研究主题分析进行充分描述,以帮助读者更好地理解这些研究主题是如何产生的;这些信息是增强研究发现可信度的关键。描述用于提炼研究主题的标准。避免使用模糊的词语来表述数字或频率,比如若干(a number of)或者一些(some);相反地,可以使用一些能相对清楚表达频次概念的词汇,例如很少(few)、许多(many)、最多(most)、大多数(a majority)。确定编码者(coder)的数量。如果有多个编码者,需解释编码者之间一般是如何保持一致的(编码标准),以及对不一致的编码是如何处理的。描述设计和检验编码过程的步骤。描述所有步骤中如何建立内部信度(interrater reliability)或者一致性(concordance)。描述如何提高研究结果的可信度(credibility)、可转换性(transferability)、可核查性(auditability)、可确定性(confirmability)或者其他方面的好的标准。例如,同行核检(peerdebriefing)、审核追踪(audit trail)、负性个案分析(negative case analysis)、长期的参与观察(prolonged engagement)、数据三角校正(datatriangulation)、内部成员校验(member checking)等。如使用了软件辅助分析数据,可考虑标注所使用的定性数据分析软件的类型。例如,如果软件的使用对于如何进行数据分析具有重要影响,那么标明软件的类型就是比较关键的信息。05研究伦理明确说明该研究是否获得相关伦理审查委员会(如Institutional Review Board,IRB)的审核和批准(或者豁免)。描述知情同意书的发放过程(如口头或书面形式)。简要描述如何保护被调查者的隐私,以及匿名化的具体措施,特别是在论文报告中应使用化名。此外,还应描述如何确保研究数据的安全。文章应避免汇报那些对了解调查方法或理解研究发现的不重要的信息,以防止不经意间暴露被调查者的身份。例如,当研究场所的相关信息并不是解释选择该研究方法的关键因素,那么应该避免长篇大论地对研究场所进行过于详细的描述。4.结果或发现 结果(或研究发现)部分应该呈现从分析中提炼出来的主题,换言之,这部分的内容不应只是简单的描述性内容,而应挖掘现象背后的东西,如:检验不同研究主题之间的关系,讨论某些现象之间的规律,而非简单地报告一系列主题。此外,应考虑是否能找到某些理论来帮助解释研究发现。指出研究发现之间的可能存在的复杂性,如果有可能,还应指出那些意想不到的研究发现。谨慎引用研究对象的语录以丰富文章,从而让研究对象自己“发声”来支持所要呈现的研究主题或对其他观点进行进一步阐释。确保引文充分和准确地表达想要呈现的主题、话题或概念等。确保研究发现和文章的阐释跟引文之间是相互联结的。研究的引文可以来自多种渠道和形式。例如,为了防止信息遗忘,研究人员可能引用来自数据刚收集完后的详细的田野笔记。必要的话,可加入能更好地帮助读者理解研究的图表。但是,这些图表不应该重复文本可以表达清楚的内容,而应该用于帮助阐明那些靠文本很难完全描述的某个概念或某种关系。这些图表应该清楚易懂,作者应清楚地标注图例或注释来帮助读者理解图表。5.讨论 总结研究发现,并将这些发现跟研究问题联系起来。讨论本研究的优势和不足。例如,有关定性研究普遍会遇到的抽样的局限性,或是相对较少的样本量或缺乏深度的数据也许会降低研究的推广性(transferability)。不过需要注意的是,在定性研究中,缺少普遍性或概括性(generalizability)并非是一种不足。阐述研究发现如何有助于丰富社会工作相关实践知识,或对发展相关政策起到的影响或贡献作用。解释研究发现可以应用到社会工作相关实践、研究或者公共政策领域的方法。描述研究发现是如何丰富和贡献相关领域知识,即描述研究发现是否与以往相关文献或理论相符合,或者对现有的知识或理论进行了补充。

菲德尔

定性分析or定量分析的7种研究方法

今天继续教大家写留学论文,选择定性分析还是定量分析?1什么是定性分析?分析方向:---定义---得出的数据方向---如何采集---是否具有目的性---研究类型---主客观---数据类型2什么是定量分析?分析方向:---定义---得出的数据方向---如何采集---是否具有目的性---研究类型---主客观---数据类型3定性分析的3种方式定性分析的3种方式:---Focus Group---Depth Interview---Photo Enthnography4定量分析的3种方式定量分析的4种方式:---Telephone Surveys---Personal Interviews---Web Surveys---Hybrid Method

柯南

科研必备:23种常用的资料分析方式汇总!

本文转载自【微信公众号:社科学术圈,ID:shkxquan】经微信公众号授权转载,如需转载与原文作者联系一、社会科学的研究步骤在每一个环节都需要理论的指导。其中,在检验研究假设结束之后,需要与现有的文献对话,再次发现新问题,开始新一轮的研究过程。在这个环节之中,资料分析作为重要一环,对于社会科学的研究极为重要。二、资料分析的方式分类教育研究包含多样化的研究方法及分类。一般情况下,按照认识论基础,研究方法可以分为定量研究、定性研究和混合研究。也有部分学者按照研究目的、手段等对研究方法进行分类。比如别敦荣和彭阳红将研究方法分为:理论思辨、经验总结、历史研究、调查研究、比较研究、数学分析、质的研究和个案研究;在国内,根据刘良华对研究方法的分类大体上有三个基本类型:实证研究(量化的、质化的)、思辨研究(又称理论研究)、实践研究(常以教育对策、教育反思、教育改革形式显现)。实证研究是基于“事实”的方式进行论证并有规范的研究设计和研究报告。陈向明指出,“研究方法”一般包含三个层面:第一,方法论,即指导研究的思想体系,其中包括基本的理论假定、原则、研究逻辑和思路等;第二,研究方法或方式,即贯穿于研究全过程的程序与操作方式;第三,具体的技术和技巧,即在研究的某一阶段使用的具体工具、手段和技巧等。文中所采取的分类是按照陈向明定义中的第三个层面为标准进行的分类。在实际的研究过程中大多数时候是以一种研究方法为主,其他为辅,交叉使用的。以下内容是介绍每一种具体的方式。那么资料搜集上来了?该如何分析呢?三、具体的资料分析方式01.思辨分析(1)历史研究方法历史研究法是运用历史资料,按照历史发展的顺序对过去事件进行研究的方法。亦称纵向研究法,是比较研究法的一种形式。在政治学领域中,它着重对以往的政治制度、政治思想、政治文化等的研究。历史研究的目的在于解决政治制度的现状及其演变趋向。但不是断章取义地分析政治制度的现状,而是系统地研究它们以往的发展及其变迁的原因。历史研究法主要是研究政治制度的发展历史,从各种事件的关系中找到因果线索,演绎出造成制度现状的原因,推测该制度未来的变化。(2) 比较研究方法比较研究法就是对物与物之间和人与人之间的相似性或相异程度的研究与判断的方法。比较研究法可以理解为是根据一定的标准,对两个或两个以上有联系的事物进行考察,寻找其异同,探求普遍规律与特殊规律的方法。按属性的数量,可分为单向比较和综合比较。按时空的区别,可分为横向比较与纵向比较。按目标的指向,可分成求同比较和求异比较。按比较的性质,可分成定性比较与定量比较。按比较的范围,可分为宏观比较和微观比较。(3)文献研究方法文献研究法主要指搜集、鉴别、整理文献,并通过对文献的研究形成对事实的科学认识的方法。文献法是一种古老而又富有生命力的科学研究方法。文献法的一般过程包括五个基本环节,分别是:提出课题或假设、研究设计、搜集文献、整理文献和进行文献综述。文献法的提出课题或假设是指依据现有的理论、事实和需要,对有关文献进行分析整理或重新归类研究的构思。研究设计首先要建立研究目标,研究目标是指使用可操作的定义方式,将课题或假设的内容设计成具体的、可以操作的、可以重复的文献研究活动,它能解决专门的问题和具有一定的意义。02.话语分析话语分析作为一种专门的学科研究对象的出现,特别是在法语领域的出现,一般来说,是语言学发展过程中,特别是自20世纪60年代末以来,必然会出现的现象。这个新领域与语言学保持着复杂的关系,而这种关系又是经济被重新定义的。话语分析作为一种活动,正如它的内涵一样,它存在的前提是:特殊对象的生成、观念系统的状态、新颖恰当的研究对象的方法论的框架系统的状态。批评话语分析(critical discourse analysis),以下简称CDA是当代语言学研究的一个新兴分支。批判话语分析的主要方法:系统功能语法分析、语篇体裁交织性分析、话语历史背景分析。例如:如果有一部有关第三世界的纪录片始终把第三世界的穷人当做及物动词性的宾语,那就必然给读者、听着留下这样的印象:穷人是被动的牺牲品,而不是斗争的参与者。例如:对何人使用何种称谓,体现着作者(讲话者)的态度。情态是人际功能的体现形式之一,主观情态反应话语生成者与陈述者的亲近性,而客观情态则模糊了个体和团体的观点。03.内容分析内容分析法:是一种对于传播内容进行客观,系统和定量的描述的研究方法。其实质是对传播内容所含信息量及其变化的分析,即由表征的有意义的词句推断出准确意义的过程。内容分析的过程是层层推理的过程。内容分析法的信度指两个或两个以上的研究者按照相同的分析维度,对同一材料进行评判结果的一致性程度,它是保证内容分析结果可靠性、客观性的重要指标。ROST content mining是一款免费的大型内容分析研究性工具平台,主要功能包括:辅助各学科进行研究,协助完成文本分析和内容分析方面的研究,凡是需要分析论文、微博、博客、论坛、网页、书籍、聊天记录、电子邮件、本地文本类格式文件、数据库中各类文本字段的学科,都可以使用本软件,分析方法目前支持:分词、字频统计、词频统计、聚类、分类、情感分析(含简单和复杂)、共现分析、同被引分析,依存分析、语义网络、社会网络、共现矩阵等分析方法。04.质性研究一种在社会科学及教育学领域常使用的研究方法,通常是相对量化研究而言。质性研究实际上并不是一种方法,而是许多不同研究方法的统称,由于他们都不属于量化研究,被归成同一类探讨。其中包含但不限于民族志研究,人类学研究,论述分析,访谈研究等。(1) 民族志研究民族志,是一种写作文本,是人类学独一无二的研究方法,是建立在人群中田外野地工作基础下第一手观察和参与之上的关于习俗的撰写。民族志内容主要为相关人的访问内容、档案记录的检视、与衡量与访问内容的可信度,从此内容,可找出特定团体与组织之间的关联,并为关心大众以及专业的同行撰写整个故事的来龙去脉。而民族志学家则记录人们的日常生活。研究的焦点放在人类思想和行为中较可预测的型态上。为了真实纪录,1930年代后,民族志的产生通常需要相当冗长时间的实际体验。(2) 口述史研究口述史亦称口碑史学。口述史在国际上是一门专门学科,即以搜集和使用口头史料来研究历史的一种方法,或由此形成的一种历史研究方法学科分支。1948年,美国哥伦比亚大学的艾伦内文斯(Allan Nevins)教授在该校创立了口述史研究中心,第一次使用了“口述史”这个概念。标志着现代口述史学术领域的成立口述历史是通过有准备、以音像设备为工具的采访,记述人们口述所得的具有保存价值和尚未得到过的原始资料。(3) 行动研究行动研究是一种适合于广大教育实际工作者的研究方法。它既是一种方法技术,也是一种新的科研理念、研究类型。行动研究是从实际工作需要中寻找课题,在实际工作过程中进行研究,由实际工作者与研究者共同参与,使研究成果为实际工作者理解、掌握和应用,从而达到解决问题,改变社会行为的目的的研究方法。它是一种行动研究理论与实践相结合,在于资料收集、合作探讨、自我反省、多方总结最后解决问题的方法;一种主题明确、思路清晰的解决问题的方法。(4) 扎根理论研究扎根理论研究法是由哥伦比亚大学的AnselmStrauss和BarneyGlaser两位学者共同发展出来的一种研究方法。是运用系统化的程序,针对某一现象来发展并归纳式地引导出扎根的理论的一种定性研究方法。(5) 个案研究个案研究(case study)也称个案调查。对某一特定个体、单位、现象或主题的研究。这类研究广泛收集有关资料,详细了解、整理和分析研究对象产生与发展的过程、内在与外在因素及其相互关系,以形成对有关问题深入全面的认识和结论。个案研究的单位可以是个人、群体、组织、事件或者某一类问题,由此而产生人员研究个案,各生活单位或社会团体个案、传播媒介个案,以及各种社会问题个案等。(6) 文本分析从文本的表层深入到文本的深层,从而发现那些不能为普通阅读所把握的深层意义。新批评细读法“新批评”细读法不是一种自我感兴趣的印象式批评,而是一种“细致的诠释”,是对作品作详尽分析和解释的批评方式。其操作过程大致分为以下三个步骤:首先是了解词义,然后是理解语境,再次是把握修辞特点。叙述学分析法叙述是人类社会性活动中的一个重要部分。“叙述学”分析法,主要是故事分析(包括故事序列分析,故事类型分析等等),与叙述视角分析(包括叙述者的人称、位置、可信度;叙述者的声音、叙述的速度等)。05.社会网络分析社会网络分析用于描述和测量行动者之间的关系或通过这些关系流动的各种有形或无形的东西,如信息、资源等。根据分析的着眼点不同,社会网络分析可以分为两种基本视角:关系取向和位置取向。关系取向关注行动者之间的社会性粘着关系,通过社会联结本身——如密度、强度、对称性、规模等——来说明特定的行为和过程。位置取向则关注存在于行动者之间的、且在结构上相处于相等地位的社会关系的模式化(patterning),它讨论的是两个或以上的行动者和第三方之间的关系所折射出来的社会结构,强调用“结构等效”来理解人类行为。06.引文分析引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。引文分析的主要内容:引文年代分析、引文量分析、集中和离散规律分析、引文类型分析、引文语种分析、引文国别分析。引文分析的主要作用是:测量学科的影响和重要性、研究学科结构、研究学科信息发布、确定核心期刊、研究文献老化规律等。07.统计学分析(1) 统计描述它研究如何用科学的方法去搜集、整理、分析经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的关系和变动规律,也是进一步学习其他相关学科的基础。(2) 方差分析方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。(3) 二元相关因果关系分析方法之一种。二元线性回归分析法是在一元回归基础上的延伸,式中y是因变量;x1、x2是自变量;a、b1、b2是回归系数。二元线性回归法适用于分析有两个主要自变量的预测,一般运用计算机进行计算。(4) 元分析元分析(meta-analysis)统计方法是对众多现有实证文献的再次统计,通过对相关文献中的统计指标利用相应的统计公式,进行再一次的统计分析,从而可以根据获得的统计显著性等来分析两个变量间真实的相关关系。元分析程序输入参数包括:各个观察到的相关系数(已有研究文献中变量间的相关计分析,从而可以根据获得的统计显著性等来分析两个变量间真实的相关关系。(5) 多元回归“多元回归”在工具书中的解释:1、研究一个依变量、依两个或两个以上自变量的回归。2、亦称为多元线性回归,是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律。3、建立多个变量之间线性或非线性数学模型数量关系式的统计方法。在肥料试验中广泛应用。(6) 多元变量分析多元分析,是指同时考虑多个反应变量的统计分析方法。其主要内容包括两个均值向量的假设检验、多元方差分析、主成分分析、因子分析、聚类分析和典范相关分析等。(7) 因子分析因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。(8) 主成分分析主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。(9) 聚类分析聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。(10) 非参数检验非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。(11) 结构方程模型结构方程模型(Structural·Equation·Modeling, SEM)是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟,可惜国内了解的人并不多。在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。

古之人乎

使用定量还是定性分析法去写方法论呢?写好METHODOLOGY的技巧

写好METHODOLOGY的技巧本文的方法论是研究该论文的一种正确而有效的方法。撰写英国论文时,由于研究方法的复杂性,其方法论往往是最具挑战性、最耗时的部分。那如何写出论文的 methodology呢?怎样选择合适的方法?质量分析与定量分析的区别?本文主要介绍什么是方法论,重点介绍了方法论的两种基本研究方法,分享了一些实用的写作技巧,并给出了论文中的 methodology实例,供大家参考。Contents1 什么是方法论2 方法论部分的重要性3 研究方法的基本类型:定性和定量3.1 Quantitative methods :定量分析法3.2 Qualitative methods:定性分析法4 Methodology怎么写:实用的技巧1. 什么是方法论方法学(methodology)描述了用来调查研究问题的行动,以及用于确定、选择、处理和分析信息用于理解问题的特定应用的基本原理或技术,从而使读者能够对研究的总体有效性和可靠性进行批判性的评估。在研究论文的方法论部分,需要回答两个核心问题:数据是如何收集和产生的?如何分析这些数据呢?书写应直截了当,准确,并应经常使用过去时。2. 方法论部分的重要性教学法部分,同学们必须说明你是如何取得并分析你的成果的,原因如下:读者群需要知道数据是如何获取的,因为你选择的方法会影响到结果,进而影响到你在论文讨论部分如何解释它们的重要性。方法学在学术研究中起着非常重要的作用,因为不可靠的方法会导致不可靠的结果,从而损害你的分析价值。一般情况下,学者可以选择几种方法来研究问题。文章中的 methodology部分应该很清楚地说明了学者们选择特定程序和技术的原因。读者希望了解数据的收集或生成是否符合该研究领域公认的惯例。举例来说,如果你用的是多重选择问卷,读者需要知道它提供了一个合理的答案范围来供应答者选择。研究者使用的研究方法必须符合实现研究总体目标的要求。举例来说,你需要确保有足够大的样本数量,才能对研究结果进行总结并提供建议。这种方法应该涉及到所期望的问题和你所采取的措施来防止它们发生。至于出现了哪些问题,你必须描述它们是如何被最小化的,或是为什么这些问题不会以任何有意义的方式影响你对结论的解读。3. 研究方法的基本类型:定性和定量你要用什么方法来准备一篇论文,很大程度上取决于你所研究的主题,以及你的论文要回答的问题。多数情况下,你会采用定量或定性的研究方法,虽然一些项目会从两者的结合中获益。3.1 Quantitative methods :定量分析法什么是定量分析?跟随科学范式的研究者常常采用这种方法。这一方法是对数据进行量化,并从目标人群的样本中归纳结果。按照结构化数据收集流程,将数据输出为数字。量化研究也采用统计方法进行客观分析。对于量化研究,要获得有效的、可概括的结果,你应该足够详细地描述你的方法,让其他研究者接受你的研究。说明您是如何处理测量变量的概念,抽样方法或纳入标准,以及您用来收集数据的工具,程序和材料。定量分析方法有哪些?调查 (Surveys)描述调查的地点、时间和方式,需要解答以下几个问题:你是如何设计题目的?题目的形式是什么?(如多项选择题、力克特量表)你用什么抽样方法选择参与者?你是通过电话、邮件、网络还是当面进行调查的?参与者需要多长时间回复?样本量和反应率是多少?你可以将完整的问卷作为附录,以便你的读者能够确切地看到所收集的数据。实验 (Experiments)详细说明你用来进行实验的工具、技术和程序:你是如何设计这个实验的?你是如何招募参与者的?你是如何处理和测量这些变量的?你们试验时用到哪些工具和技术?提供足够的细节,以便其他研究者能在实验研究中复制你的结果,这一点非常重要。现有数据 (Existing data)解释你如何收集和选择相关资料(例如出版物或档案数据)以包含在你们的研究中:你从哪里获得资料的?数据最初是如何产生的?你选择材料的标准是什么(比如日期范围)?3.2 Qualitative methods:定性分析法什么是定性分析?不同于量化研究方法,它的目的是用计数来解释观察到的事物,而定性研究方法的目的是以研究者的身份,对你所观察到的事物进行全面详细的描述。定性分析不是提供预测和因果解释,而是提供背景和对所收集数据的解释。该研究方法具有主观性,对调查对象的选择要求较低。因为定性研究的方法更灵活,更主观,所以反思你所采用的方法并解释你所做的选择非常重要。探讨您用于选择参与者或来源的标准,您进行研究的背景,以及您在收集数据方面所起的作用(例如,您是一个主动参与者还是被动的观察者?定性数据分析法有哪些?访谈或小组讨论 (Interviews or focus groups)描述采访的地点、时间和方式,需要解答以下几个问题:你是如何发现和选择参与者的?有多少人参加?访谈的形式是什么(结构化、半结构化、非结构化)?采访时长是多少?采访内容是如何录制的?参与观察 (Participant observation)描述你在哪里、何时以及如何进行观察或进行人种学研究:你观察了哪些团体或社区?你是如何接触到他们的?你花了多长时间进行这项研究,研究地点在哪里?你在社区里扮演了什么角色?你如何记录你的资料(例如视听记录、笔记)?现有数据 (Existing data)解释你如何选择案例研究材料(例如文本或图像)作为你分析的焦点:你分析了什么类型的材料?你是如何收集和挑选它们的?定性分析例子:Mixed methods:混合研究方法将传统的定量和定性方法结合起来,产生了现代方法。根据Brannen和Moss (2012),混杂研究方法的存在源于其潜在性,通过将定量和定性研究方法融合在一起,使研究者能够更清楚地认识到两者之间的社会关系和复杂的关系。在社会研究中,混合方法还以三角划分的概念而著名。据 Haq所说,三角测量通过在一项研究中运用不同的定量和定性方法,使研究人员有机会就单一现象作出多种发现。Methodology应该包含的内容以下是一篇论文方法论应该包含的内容,也就是methodology的基本机构:目标您需要重申您的研究主题或问题,并概述您打算如何研究该问题。如需考虑伦理或哲学方面,请详述。所选研究方法论的概述确定您是选择使用定量研究还是定性研究,或两者结合。当选择定性研究和定量研究方法时,你需要进行初步的文献和教科书研究,以便建立标准的研究方法,通常在你选择的研究领域中使用。若您不确定从何处开始,您可以访问您的大学图书馆,请图书管理员帮助您选择最适合的参考文本。解释说明你选择的方法论说明您选择研究方法的理由。您也应该提供一个概览,解释为什么这些方法比其他研究方法更适合。仔细想想下面,你的研究是在什么时候和什么地方进行的,研究对象是谁。这可能包括,例如,关于访谈地点或焦点团体的资料,日期和时间范围,以及参与者是否属于某一特定人群。数据是如何被分析的?若要采用定量研究的方法,则需要在分析数据前准备数据。比如,你需要检查变量,丢失的数据,以及异常情况。假如你用电脑软件协助分析,这些资料也应包括在内。关于质量数据,你需要从原始数据中找出你的想法和主题并分类和编码。您也可以使用一些技巧,如叙事分析或话语分析,来解释回答背后的意义。在研究过程中使用了什么材料和设备?它可以包括任何东西,从用于科学实验的实验室设备到分析结果的计算机软件。在研究过程中遇到了什么障碍或困难吗?如是,所有的问题和困难是什么呢?您如何克服它们?找参与者、获得同意或缺乏进行科学实验所需的资源等都可能造成这种情况。评论这个短语应该用来评估你已经做过的研究,并且证明你选择了这个方法。您不必深入了解更多细节,因为您将在论文的结论部分对结果进行深入讨论。您需要简要地说明您的结果是否具有结束性,有无任何可变因素,以及您选择的方法是否实际有效。4. Methodology怎么写:实用的技巧方法论的目标不仅仅是描述你的研究方法。您也需要说明为什么选择使用它们以及如何应用它们。重点在于表明你的研究是认真地进行的。所以尽可能保持你的写作风格的简洁,这将确保读者易于理解和消化。以下是 paper代写专家在撰写论文时所采用的5种 methodology写作技巧:看看其他论文的方法论部分请指导老师为你提供以前所写论文的不同范例。通过阅读以往学生所写的方法,你可以对你最后完成的方法论部分有个大致的了解。计划你的结构不管你选择哪种研究方法,你的论文方法论应该是一个结构清晰,文字精炼的部分,它能为你选择的研究方法提供有力而合理的论证。在草拟提纲时,向导师询问有没有遗漏什么,结构是否合乎逻辑。考虑你目标读者写方法论的时候,要考虑到那些可能会阅读你的方法论的读者。举例来说,如果你选择了通常属于自己研究领域或学科范畴的研究方法,你就不必给出太多的理由或背景资料。当您决定使用一个不那么流行的方法时,建议您详细了解如何和为什么选择使用这个方法。保持专注于你的目标和研究问题论文方法学应提供清晰的解释,说明你选择的研究方法为何适合你的研究目标。在写论文的时候,要确保你选择的研究方法要与论文的总体目标和目的相联系。为帮助您集中精力,在方法论一节的开头就可以清楚地定义需要解决的问题。提及你遇到的障碍或困难若您在数据收集或分析阶段遇到任何问题,请使用“方法集”小节来讨论您为解决这些问题所采取的措施,并将其影响降到最低。但愿以上提供的 methodology范例,能让同学们更好的了解方法学,也能帮助大家区分定量与定性。不管你是在读本科还是读硕士,论文的方法通常被认为是完成主要研究项目中最困难、最耗时的部分。写作方法部分的成功关键在于构思得清楚。请记住,你研究项目的方法部分的目标是确保读者完全理解你所选择的方法。您应当使用方法论部分提供为什么选择特定的研究方法而非其他可能的研究方法的明确理由。不要在教学法中提到你的个人观点、想法或兴趣,要保留你的真实信息,并且要确保所有内容都有适当的学术参考来支持。如果同学仍然不清楚论文的methodology怎么写或者有任何不明白之处,欢迎随时联系专业论文辅导机构 - 英伦译制社。我们的专家在学术论文写作方面有着丰富的经验,对定性和定量分析法有深刻的理解。还等什么?赶快咨询吧!我们客服给同学们7×24小时全天候服务!

性知

运用好定性研究与定量研究相得益彰的方法

习近平总书记在哲学社会科学工作座谈会上指出:“对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。需要注意的是,在采用这些知识和方法时不要忘了老祖宗,不要失去了科学判断力。”这为我们在社会科学研究中把准研究方法和选择好研究方法提供了根本遵循。新时代,把准定性研究与定量研究的本质与联系,注重两者的有机结合,促进哲学社会科学“以我国实际为研究起点,提出具有主体性、原创性的理论观点”,“推进学科体系、学术体系、话语体系建设和创新”,“构建具有自身特质的学科体系、学术体系、话语体系”,具有重要的理论意义和实践价值。一、定性研究与定量研究的出场社会科学以人类的经济活动、政治活动和精神活动等社会现象为研究对象,从其产生开始,便有了自己相应的研究方法。从属性来看,定性研究和定量研究以及两者的有机结合,是其重要的研究方法。定性研究与定量研究或者说定性的方法与定量的方法,一直在科学发展的道路上随影而行。人类早期,科学整体发展水平不高,没有达到系统的程度,不能非常确定未知世界,图画简化、记号改造和文字描述,成为人们认知世界的主要方法;同时,手指计数、石子计数、结绳计数和刻痕计数等也运用在社会活动之中,成为人类早期将定性方法与定量方法相结合认识世界的雏形。一直以来,在社会科学研究中,对定性研究没有明确定义。但是,大致认为,所谓定性研究,主要是依据社会现象或事物具有的属性,从内在的规定性来研究现象或事物。定性研究,主要通过语言文字描述、现象分析归纳、图像展示说明等方式,从中寻找事物“质”的特征和规律。比如,标志着经济学诞生的《国富论》,以定性为主进行阐述,马克思的《资本论》采用大量定性研究进行分析,定性研究方法阐释出从整体上把握事物内在本质和规律的光辉思想。20世纪20、30年代,定性研究因社会调查方法得到发展,采用田野调查、参与观察等方式开展研究,加快了定性研究方法的步伐。通过定性研究,人们对研究对象有相对偏于感性的了解。假以将考察目光投向中国古代思想文化的辉煌殿堂,不难发现,儒家的解释系统成为了绝对主流。这至少源于相对封闭的农业社会,生产力不够发达,整个社会结构高度同质化,分析社会现象,更多从礼和文化的角度去考察。这也是部分学者认为,我国在很长时间里没有自身社会科学研究方法的原因。其实,这是相对现代社会科学的内涵以及具有多学科性、多方法而言得出的一种推论。近代以来,大批仁人志士在寻求国家与民族的图存路上,常常借用现代社会科学的方法研究中国社会问题,寻求解决良方。经过真理标准问题的大讨论,思想理论界空前解放。在“政治学、社会学等等需要‘补课’”的指引下,我国社会科学开启重建之路,面对改革开放的宏大场景,社会科学在研究社会问题时,更多使用的是定性研究方法,展示出许多抽象的理论推导和思辨阐述。一则,这是继承传统的研究方法;另一则,是社会科学与哲学、历史学和文学有着本土的人文基因和关系。相对定性研究来说,定量研究在社会科学研究中的应用迟缓许多,但是发展迅速。回顾科学发展的历程,人类对自然现象的观察、日常生活的需要以及为满足这种需要而从事的生产活动等构成了科学的起源。古代东方民族和古希腊对古代科学的萌芽均作出重要贡献。但直到伽利略摒弃神学的宇宙观,倡导数学实验方法,揭示出动力学、天文学的变换状态和存在规律,才开启近代科学以及定量研究之先河。近代科学快速发展,工业文明大步向前,社会现象纷繁复杂,实证主义迅速兴起,用“量”的表达、数学的语言研究社会对象越来越深、越来越广。威廉·配第、奥古斯特·孔德、埃米尔·迪尔凯姆等均在其著作中大量运用定量的方法分析经济社会等现象,尤其是经济学的后边际革命爆发,越来越多的定量分析被应用到经济理论研究中;萨缪尔森将数学分析方法引入经济学,其影响延续至今。这些研究方法为后来社会科学的研究和学科建立,提供了许多有价值可借鉴的具体定量研究方法。定量研究试图在一定的假定条件下,借助工具、公式或模型推理将研究对象的各组合要素的相互关系以及外部条件对研究对象的影响揭示出来,以期对研究对象有相当精准的认识和分析。数学基础和计算机应用基础,在社会科学的定量研究中起了非常重要的作用,成为了定量分析研究对象不可或缺的手段。方法、模型和指标构成了定量分析的主干要素。二、定性研究与定量研究的起伏宏观上讲,大千世界,气象万千,社会现象,林林总总,凸显世界的复杂性,这使得定量研究难以精确计量研究对象中各因子的相互关系,必易导致定量研究的或然性。微观上讲,社会个体的独特性,特别是个体情感、精神等研究,一般较难采用定量方法加以研究。方式上看,在社会科学研究中,只看到连串数学公式、得出系列数字结论,易导致见物不见人,驶离研究初衷。这也是定性研究可成为社会科学最基本的研究方法的重要缘由。当然,纵览近些年社会科学通过定性获得的研究成果,定性研究也在经历着从传统到现代、从阐释理论到对接现实等的转化与应对。定量研究诞生以来,主要经历过实验法、测量法、问卷法和数学模型法等多种量化研究方法的演变与综合,发展至20世纪70年代达到一个高峰。期间,面向现实世界、重视实践、主张实证和理性的风气异常兴盛,促进了自然科学的许多研究方法转化成了社会科学的研究方法。一些综合性、应用性、交叉性的社会学科,采用定量方法进行研究,解决了许多实际问题。目前在研究中,因其借用定量方法取得的大量新颖、精细且具备数字说服力的成果,也难完全以客观姿态接纳传统定性方法研究出的深刻思想成果。可以说,定量研究在一定程度上打破了定性研究传统思维模式,促进了研究的技术化。但是,无论提出怎样合理的假设,建立多么精致的模型,估算参数,验证理论,预测未来,仍然还是其不足之处。随着人类生产力总体水平不断提升,自然科学技术也为社会科学的研究提供了许多素材。社会问题与科技问题结合愈发密切,有时甚至科技问题直接演变成社会问题,对其的研究,需要借助定量研究去精准探究;与此同时,由于社会生产、生活的急剧网络化、大数据化、信息化、复杂化和快速化,对有关社会问题采取定性研究,也不能完全适应社会的需求以及解决认识问题。三、让定性研究与定量研究相得益彰习近平总书记指出:“哲学社会科学研究范畴很广,不同学科有自己的知识体系和研究方法。对一切有益的知识体系和研究方法,我们都要研究借鉴,不能采取不加分析、一概排斥的态度。”我国哲学社会科学涵盖历史、经济、政治、文化、社会、生态、军事、党建等众多领域,这些领域都有其相应知识体系和话语表达,都应增强问题意识,坚持问题导向,要坚持用科学的方法分析和研究问题。定量研究与定性研究,在社会科学研究中都有用武之地。只是针对不同研究对象、借助不同学科视角、发现不同问题和达到不同研究目标而采用的不同方法而已,没有孰优孰劣。从这点上讲,两种方法应在哲学社会科学的研究方法中相得益彰。过度仰仗定量,易在学术研究方面过度模型化,势必导致认识世界的价值理性缺失;过度仰仗定性,易在研究内容方面出现空泛化,势必导致认识世界的精准度不够。没有定性的定量,容易导致盲目的定量;没有定量支撑的定性,容易产生无本质的定性。在定量分析基础上的定性分析,更能因接近事物的属性而得出科学的结论;在定性分析基础上的定量分析,更能把握社会的变化动态和趋势走向,有利于科学得出事物的“质性”。无论是归纳与演绎、实证与思辨、证实论与证伪论,还是解释与理解,都预示着研究思维的理性进步。社会科学的时代属性、价值本性和民族特性,决定了我们在新时代面临信息化加速发展,原本在工业化时代建立起来的许多社会科学的研究范式、研究方法,必然受到学科分立、方式转换、话语创新等方面的影响。此时,我们要认清每种方法具有不同的特征和功能。对于有些定量研究,分析严谨,数据清晰,但我们更要注意其根本思想和原理意蕴。因为,西方有些流派和理论背后,藏有自己的问题意识,而快速发展的中国的诸多问题,不在西方学术视野之内。对于有些定性研究,看起来,理论先进、论证充分,但我们不能简单横向移植,要注意其论述的立场和基本价值取向。因为,我们要有我们的自主性、主体性和独立性。新时代,许多传统学科再展新颜、新兴学科不断涌现、前沿学科快速变革、交叉学科蓬勃发展、冷门学科焕发生机。在繁荣发展我国哲学社会科学的进程中,需要把马克思主义的方法与各门具体社会科学的研究方法结合在一起,同时还要借鉴西方社会科学研究的优秀成果和方法,不断创新研究,才是我们应走之路,而不必只是在纠结定性研究与定量研究的孰优孰劣中兜圈子,不必在对定性研究产生固化与偏见、对定量研究产生痴迷与排斥中迷失了方向。其实,不管是定性研究还是定量研究,要根据社会科学的研究内容、研究目标和学科特点而定,其目的都是为了更好地结合中国实际、中国经验和中国社会,解决我们正在做的事情中遇到的一系列重大社会问题。【本文系湖北省高等学校哲学社会科学重大项目“新形势下进一步完善湖北高校网络意识形态建设研究”(18ZD019)阶段成果】(作者单位:三峡大学马克思主义学院)来源:中国社会科学网 作者:曾德贤精彩推荐:推动形成全面开放新格局中非抗疫合作成效显著百年中国艺术歌曲创作述论欢迎关注中国社会科学网微信公众号 cssn_cn,获取更多学术资讯。

换子记

定量研究方法真的比定性研究复杂难懂吗?

定量研究其实没那么难,本文笔者通过对量化研究方法的一些最常见用例的介绍,以及对每个实例的成本和难度进行估计,来帮大家更好地去找我定量研究的方法。你是否需要有关产品用户体验的数字数据, 但却不确定应该如何做?许多从事用户体验及研究的专业人士倾向于定性方法论, 而这也这被广泛认为比定量 (量化) 研究更容易。但不得不承认,定性研究可能回避了较大的样本规模和量化相关的统计数据问题。而量化方法却是经验丰富的用户体验研究员的工具包中应当包含的重要组成部分。量化方法允许你:用数字为产品的可用性打上一个标签;数字有时比质量测试的结果更有说服力 (特别是当你试图说服像 CEO 这样的高管时);比较不同的设计 (例如, 产品的新版本与旧版本, 或你的产品与竞争对手的产品), 并确定你所观察的差异是否具有统计学意义, 而不是随机偶然;改进用户体验权衡决策。例如, 如果建议的设计改进预计会花费很大的成本来实现, 它值得做吗?如果你估计了更改将在一定程度上提高可用性,那么量化方法可以帮助你决定是否值得重新设计;将用户体验改进与组织目标和关键绩效指标联系起来 (从而显示你的投资回报并证明用户体验研究团队的价值)。定量研究,首要确定的是:到底需要哪种量化研究方法?在此,我们介绍一些目前最流行的量化研究类型:定量可用性测试 (基准测试)网络分析 (或 App Analytics)A/B 测试或多变量测试卡片分类树测试调查和问卷调查聚类定型数据可取性研究眼动测试每种方法都产生有价值的数量数据, 但这些技术在所收集的数据类型,以及所需的资源和工作量方面差别很大。本文列出了这些方法的最常见用例,并估计了每个实例的成本和难度。此外,应该知道,这些方法中都需要不同的最小样本量来确定统计意义。一、定量可用性测试(基准测试)用途:随时跟踪可用性、与竞争对手比较费用:中等收集难度:中等分析难度:中等方法类型:行为使用环境:基于任务虽然不经常使用,但定量可用性测试(有时称为可用性基准测试)很像定性可用性测试——用户被要求使用产品执行实际任务。两者之间的主要区别在于,可用性测试优先考虑观察,例如识别可用性问题。相比之下,量化可用性测试侧重于收集任务或成功时间等指标。一旦你收集了具有相对较大样本量(大约 35 个参与者或更多)的指标,你就可以使用它们跟踪产品的可用性随时间推移的进度,或者将其与竞争对手产品的可用性进行比较。你选择的可用性测试类型(面对面,远程主持或远程未经调度)将影响成本,由于定量和定性可用性研究的目标不同,测试的结构和使用的任务也需要不同。二、网络分析(或 App Analytics)用途:检测或优先排序问题、监控性能。成本:低收集难度:低分析难度:高方法类型:行为使用环境:live分析数据描述了人们对你的实时产品做了什么:他们去哪里、他们点击了什么、他们使用了什么功能、他们来自哪里,以及他们决定离开网站或应用程序的页面。此信息可以支持各种用户体验活动。特别是它可以帮助你监控产品中各种内容:UI 或功能的性能,并确定哪些是真的不起作用。三、A / B 测试或多变量测试用途:比较两个设计选项成本:低收集困难:低分析困难:低方法类型:行为使用情况:live虽然你可以使用分析指标来监控产品的性能,但你也可以创建实验来检测不同的 UI 设计如何通过 A / B 测试或多变量测试来更改这些指标。在 A / B 测试中,团队创建同一 UI 的两个不同的实时版本,然后将每个版本显示给不同的用户,以查看哪个版本的性能最佳。例如,你可以创建相同号召性用语按钮标签的两个版本:“获取定价”与“了解更多信息”,然后,你可以跟踪按钮在两个版本中收到的点击次数。多变量测试类似,但涉及一次测试多个设计元素(例如,测试可能涉及不同的按钮标签,排版和页面上的位置。)这两个基于分析的实验都非常适合决定同一设计的不同变体,并且可以结束团队关于哪个版本最佳的争议,但这种方法的一个主要缺点是它经常被滥用。四、卡片分类用途:确定信息架构标签和结构成本:低收集难度:低分析难度:中等方法类型:态度(人们怎么说)使用环境:不使用产品在卡片分类研究中,参与者被给予内容项目(有时字面上写在索引卡片上),并要求以对他们有意义的方式对这些项目进行分组和标记。该测试既可以亲自进行,也可以使用实体卡进行,也可以使用卡片分类平台进行远程测试。这种方法为你提供了进入用户信息空间的心理模型的机会。他们使用什么术语?他们如何在逻辑上将这些概念组合在一起?对创建类似分组的参与者的百分比进行定量分析可以帮助确定大多数用户可以理解哪种分类方法。五、树测试用途:评估信息架构层次结构成本:低收集难度:低分析难度:中等方法类型:行为使用环境:基于任务,不使用产品在树测试中,参与者尝试仅使用你站点的类别结构来完成任务。它本质上是一种评估你的信息架构的方法,通过将其与 UI 的所有其他方面隔离开来。假设你的产品是宠物用品网站,这是你的顶级层次结构,你可能会要求参与者完成一项任务——找到狗项圈。树测试结果的定量分析将显示人们是否能够在信息层次结构中找到该项目的正确路径,以及有多少参与者选择了错误的类别。此方法可用于识别 IA 结构,标签和展示位置是否符合人们的期望。六、调查和问卷调查用途:收集有关您的用户他们的态度和行为的信息成本:低收集难度:低分析难度:低方法类型:态度使用环境:任何调查是一种灵活的用户研究工具。你可以在各种环境中管理它们:在实时网站、电子邮件或可用性测试之后进行短暂拦截调查等。它们可以产生定量和定性数据的组合——评级,多项选择题中每个选项的答案比例,以及开放式答案。你甚至可以将对调查的定性响应转换为数值数据。你可以创建自己的自定义调查,也可以使用许多已建立的问卷中的一个(例如,系统可用性量表或净推荐值得分)。调查问卷的一个优点是,你通常可以将结果与行业或竞争对手的分数进行比较,以了解你的工作情况。即使你创建自己的自定义调查问卷,也仍然可以跟踪你的平均分数以监控产品改进。七、聚类定性数据用途:识别定性数据中的重要主题成本:低收集难度:中等分析难度:中等方法类型:态度(人们怎么说)使用环境:任何这种技术不是数据收集方法,而是更多的定性数据分析方法。它涉及根据共同主题对来自定性研究(例如日记研究、调查、焦点小组或访谈)的观察进行分组。如果你有大量观察结果,则可以计算提及特定主题时的实例数。例如,假设你进行日记研究,要求参与者每次在日常生活中使用你的产品并进行一周报告,目的是了解他们在何种环境中使用你的产品。此方法可以识别特定主题或情况的普遍性或频率,例如,用户投诉的频率或 UI 问题。这种方法是从大量定性信息中挖掘数值数据的好方法,但它可能非常耗时。八、可取性研究用途:识别与您的产品或品牌相关的属性。成本:低收集难度:低分析难度:低方法类型:态度使用环境:基于任务定量可取性研究试图量化和衡量产品的某些质量,例如美学吸引力、品牌强度、语调。这些研究可以根据你的研究问题进行定制,但通常包括首先将参与者暴露给你的产品(通过向他们展示静止图像或要求他们使用实时产品或原型)。然后,你将要求他们通过从描述性词汇列表中选择选项来描述设计。随着样本量越来越多,一些趋势则开始出现。 例如:你可能有 84% 的受访者将设计描述为“新鲜”。九、眼动测试使用:确定哪些 UI 元素分散注意力,可查找或可发现。成本:高收集难度:高分析难度:高方法类型:行为使用环境:基于任务眼球跟踪研究需要特殊的设备,来跟踪用户在界面上移动时的眼睛。 当许多参与者(30 个或更多)在同一界面上执行相同的任务时,有意义的趋势开始出现,你可以通过一些可靠性告诉页面的哪些元素会吸引人们的注意力。眼动测试可以帮助你确定需要强调或强调哪些界面和内容元素,以使用户能够实现其目标。运行眼球跟踪研究的一个主要障碍是高度专业化、极其昂贵且有些不稳定的设备以及需要大量的培训才能使用。在尝试确定使用哪种定量方法引导你的研究问题时,你需要了解什么?例如:我们的产品可用性如何随时间而变化?与竞争对手相比,我们的表现如何?我们哪个问题影响最大?我们应该如何优先排序?对于这些类型的问题你可能希望使用定量可用性测试、网站分析或调查。当你想要回答更具体的问题时,或许其他方法更佳。 例如:我们应该如何修复我们的全球导航类别?我们的大多数用户对我们的视觉设计有何看法?我们应该在仪表板中使用这两种设计方案中的哪一种?对于这些研究问题,你可能希望使用 A / B 测试、卡片分类、树木测试、编码定性评论,可取性研究或眼球跟踪。但是,这些建议中有一些灰色地带。 例如:出于安全或技术原因,A / B 测试可能不是贵公司的选项。如果是这种情况,你可以进行面对面的量化可用性研究来比较两个原型。但是,这不是定量可用性测试的典型用法,所以没有在这里讨论它。在研究问题之后,选择方法的第二个最有影响力的因素是成本。这些方法的成本会有很大差异,具体取决于你实施研究的方式。你使用的工具、你拥有的参与者数量以及研究人员花费的时间都将影响最终成本。低预算团队将依赖数字方法——远程可用性测试、在线卡片分类平台、如 OptimalSort、A / B 测试以及 Web 或应用程序分析。根据经验,现场方法(例如:面对面的可用性测试,面对面的卡片种类)往往更昂贵,因为它们需要更多消耗研究人员更多的时间。此外,他们可能需要旅行和设备租赁。眼动测试是这里列出的最昂贵的方法,应该只有具有大预算和研究问题的团队才能使用它。一旦选择了方法,就要了解它,并确保你获得有用的成果。警告:不能只收集指标并开始做出决策而不进行任何统计分析。仅收集来自 5 个用户的评级规模响应,取平均值并继续前进是不够的。对于此处讨论的每种方法,都建议最小样本量以获得可靠的数据并确定统计显着性。如果你不这样做,你无法保证你的发现不只是侥幸。无论你选择哪种方法,一定要考虑研究相关统计概念所需的时间。我保证,定量研究不像它看起来那么难,对于你的定量数据来说非常值得。作者:研如玉,神策数据·用户行为洞察研究院 公众号(ID:SDResearch)本文作者:Kate Moran文章来源:Nielsen Norman Group本文由 @研如玉 翻译发布于人人都是产品经理,未经许可,禁止转载题图来自Unsplash,基于CC0协议

狸御殿

开源软件的量化分析

20世纪末以来,开源软件取得了令人瞩目的成就。无论是开发质量,还是开发效率,成功的开源软件都可以与商业软件相媲美;很多开源软件在市场上的占有率已经远超同类商业软件,对全球软件产业的格局产生了重大影响。与传统商业软件相比,开源软件在开发模式上呈现出充分共享、自由协同、无偿贡献、用户创新等特征。分布在全球的开源软件开发者在基于互联网的虚拟社区中交互与协同,颠覆了经典软件工程的许多基本假设和理论。开源软件的巨大成功及其颠覆传统的开发模式对软件研究领域产生了巨大的冲击,吸引了一大批研究者对其展开研究。基于数据的开源软件量化分析是全面揭示开源开发新机理的重要研究途径,也是近年来非常活跃的一个研究方向。1. 从定性到定量基于经验理解软件开发活动,进而制定相应的开发原则和方法,是软件工程领域采用的基本研究方法。例如,模块化是软件工程的一个重要原则,而这一原则正是帕纳斯(Parnas)从开发经验中提炼产生的。基于经验的软件工程需要解决两个核心问题:一是如何从经验中提取出抽象的原则;二是如何将抽象的原则应用到新的软件开发活动中。从目前来看,能否将定性的抽象原则有效地应用到实践中,取决于实施者的经验和软件项目的具体环境(例如,针对一个具体的软件如何实现模块化,这个问题并不存在兼具一般性和易操作性的答案)也就是说,将一个项目的成功经验复制到另一个项目中,是一件非常困难的事情。导致出现这种问题的根本原因是,不同项目的具体环境(如规模、应用领域、实现技术、开发团队等)会在开发实践中产生差异,而我们目前仍然无法对其差异进行准确的刻画。软件开发实践对项目环境具有敏感性,其主要原因是软件开发具有智力密集的特征,人的因素始终是软件工程无法回避的一个关键因素。传统的定性研究对人的因素给出了很多具有深刻洞察力的结论国。但是,由于缺少量化方法,这些结论很难在软件开发实践中定量实施,进而难以得到有效传播和普及。目前,互联网上积累了海量开放的软件开发和应用数据,为软件开发活动的量化分析提供了良好条件。软件开发支持工具(如版本控制系统和问题追踪系统等)的广泛应用积累了大量数据,记录了软件代码的演变、开发任务的流程等。截至2015年4月,GitHub中的软件仓库数量超过1600万。近些年兴起的软件知识分享社区(如StackOverFlow)记录了大量的软件问答和软件评价等数据。截至2014年9月,StackOverflow的问答数量超过1300万。这些数据从不同阶段、不同侧面反映了软件开发和应用的历史和动态,并提供了庞大的项目样本,为软件工程研究和实践带来了新的思维模式,提出了新的研究问题,例如,如何有效地收集、组织和运用这些数据来重新审视软件工程的本质复杂性问题?如何在新的开发模式下探寻新的软件过程规律,建立可复制的软件开发最佳实践?大数据的存在使得人们可以突破传统宏观层次的软件过程,在微观层次上对不同具体环境下的开发活动进行观察和分析(我们将这种从微观层次度量到的开发活动模式称为微过程)这些挑战和机遇对于软件工程乃至整个信息技术领域的发展都具有重要的理论价值和现实意义,但相关的研究工作尚处于起步阶段。2. 数据的处理和量化分析方法近些年来研究人员研发了各种技术和工具来获取和处理开源数据并加以利用。例如,CVSAnaly实现了版本控制系统数据的处理;SoftChange能够从源代码中推断各种隐含的事实;GHTorrent将GitHub站点上项目的相关数据存储在一个数据库中,供研究人员离线使用等。同时,许多研究者尝试引入经典的统计分析和机器学习方法来利用软件开发活动数据。例如,将传统的集成学习方法应用于软件工作量估算,将迁移学习方法应用到缺陷预测问题等。也有一些工作尝试建立软件开发数据的量化分析方法,例如莫卡斯(Mockus)提出一个量化研究的经典步骤包括:获取原始数据并进行清洁和处理,针对特定的研究问题建立相应的量度,然后围绕量度展开分析,最后验证结果并审查检查研究假设以确定是否对上述步骤进行迭代。特别值得一提的是,数据质量对软件数据分析至关重要,正逐步成为一个重要研究方向。例如,我们提出了一种利用数值分布来定位和修正错误数据的方法。