近年来涌出了许多关于提高研究可重复性必要性的文章,也有许多呼吁提高统计分析技术训练的声音。但在本文中,我们仅讨论科学文献中常见的十种统计错误。尽管许多研究者强调了透明度和科研伦理的重要性,一些显而易见的统计学错误仍然在论文中出现,这些统计错误可能让作者们推断出数据并不支持的结论。重要的是,尽管这些论文是错误的,人们也常会信以为真。我们认为,防止发表错误结果的最恰当时机是在期刊的同行评审过程,或者是在预印本出版后的线上讨论。本文的主要目的是为审稿人提供一个可以识别和处理这些常见错误的工具。本文讨论的这些错误都是众所周知,并且在很多文章中被提及的,但是仍持续出现在期刊中。此前对这一话题的讨论大多集中于一个或几个相关的错误:我们希望能通过讨论十种最常见的错误,为作者和审稿人提供一个可参考的错误列表。这对研究者设计实验,分析数据和撰写文章都会有所帮助。我们的错误列表来源于伦敦可塑性实验室的文献讨论中,包括对神经科学,心理学,临床和生物工程杂志上论文的报告与讨论。之后,我们作为读者、审阅者和编辑的经验进一步完善了该列表。尽管该列表中的错误来自与神经科学有关的论文,但与任何使用统计学评估结果的学科都是有关的。本文中,我们讨论了这些错误的产生,作者和/或审稿人如何发现错误,并提出了解决方案。我们发现,这些错误通常是相互依存的,一个错误很可能会导致其他错误,这意味着许多错误无法被单独纠正。此外,处理这些错误通常有多种方法:例如,我们通常使用频率参数统计,但我们未讨论的贝叶斯方法也是可行的解决方案。为了促进这些错误的进一步讨论,并提出解决这些问题的最佳方法,我们鼓励读者在本文的线上版本中评论,为我们提供不同的解决方案(点击“annotations”图标)。这样的话,其他读者也会从多样的想法和观点中受益。我们希望对这些常见错误更好的认识可以使作者和审稿人更加小心,从而使(本文中的)错误不再那么常见。1. 缺乏适当的控制条件或者控制组在多个时间点进行测量是科学研究中评估干预效果的常见方法。例如,在检验某种训练的效果时,研究者通常会测量行为或生理指标的变化。但是,测量结果的变化,也可能是研究中与干预(训练)无关的因素导致的。因此,就算在没有干预的情况下,重复相同的任务,干预前后的测量结果也会发生变化。例如,被试的练习效应或疲劳效应。因此,对于任何研究,只要探索实验操纵对某一变量随时间变化产生的影响,都需要有控制组,以供与实验组进行比较。有时候研究者确实设置了控制组/控制条件,但由于这些控制条件(控制组)不包括可能会影响被测量变量的关键因素,实验设计或实施(往往)是不完整的。例如,控制组没有接受“假”干预,或者没有进行双盲处理,使得主试对结果有预期,进而导致效应量的夸大。其他常见的错误,则是:1) 由于采用了样本量过小的控制组,没有充足的统计检验力检测到测量变量的变化。2) 采用了一个使用不同基线测量(baseline measure)的控制组而导致虚假交互。同样重要的是,控制组和实验组必须同时取样并随机分配,以最大程度地减少偏差。理想情况下,控制组和实验组的操纵应该在实验设计和统计检验力上相同,并只在特定刺激维度和操纵变量上有所不同。只有这样,研究者才能确保实验操纵对变量的影响大于时间对变量的影响。因此,如果对变量进行前后测比较,应添加控制组。如何发现该错误结论是在没有充足的控制情境而根据单个组的数据得出的,或者对照情境/组没有捕捉实验操纵的核心特征。解决方案如果实验设计不能将时间效应与干预效果区分开,那么有关实验干预效果的任何结论都是不准确的。2. 没有直接比较两个效应强弱时解读效应的强弱之别有时研究者发现在实验组中某个干预有显著效应,而在控制组没有产生显著效应。(他们往往会据此)做出干预有效的结论。基于(干预)在这两个(组中效果)显著性不同的结果,研究者有时会认为实验组中的效应大于控制组中的效应。这种推论非常常见,但却是错误的。例如在图表1A中,测量两个变量X和Y,采用两组被试,每组20人。两组测量在统计显著性上可能会有不同的结果:A组中,两个变量之间的相关系数可能显著(即,p≤0.05),而B组中相似的相关系数可能不显著。即使这两个变量之间的关系在两组中几乎相同,这种一组数据有显著效应另一组没有的情况也可能发生(图表1A),因此,我们不能认为一个相关关系比另一个强。图1 没有直接比较两个效应强弱时解读效应的强弱之别首先,两个变量X和Y,在A和B两组中进行测量。很明显,这两个变量之间的相关关系在这两组测量中都没有区别。然而,如果计算皮尔逊相关系数r的显著性,将两个相关系数与0相比较,却可能得到一个组(组A;黑色圆点;n=20)的相关性在统计学上显著(基于p≤0.05的阈值),而另一个组(组B;红色圆点;n=20)不显著。然而,这并不说明变量X和Y之间的相关关系在两组之间不同。可以用蒙特卡罗模拟来比较两个组的相关关系。其次,在实验研究的情境中,可以看到两组之间在某一特定测量结果上的差异(例如,训练前后的差异)。组C和D的均值相同,但是D组的方差更大。如果使用独立样本t检验将每一组的结果指标分别与0比较,会发现一组的变量与0之间有显著差异(组C;左侧;n=20),但是另一组不存在显著差异(组D;右侧;n=20)。然而,这并不能说明两个组的测量结果存在不同。这时应该使用配对样本t检验(顶部)直接比较两个组:结果表明两组的测量结果没有差异。在不同的两组中评估一个干预的效果时也会出现类似的问题:干预会在一个组中产生显著效果,而在另一组中不出现显著效果(图表1B)。然而,这并不意味着干预的效果在两组之间不同;实际上在这种情况下,两组并没有明显的不同。通过两种效果间直接的统计比较,只能得出干预效果与控制干预(control intervention)的效果不同。因此,必须使用一个统计检验来比较这两种效果,而不能只是分别两次单独的检验然后根据它们在显著性上的差别进行推断。图2 虚假相关:单个离群值和子组对皮尔逊相关系数的影响A-C中,我们用19个样本(黑色圆圈)模拟了两个不同的非相关变量,并添加了一个额外的数据点(红色实心圆圈),该数据点与主要数据的距离会系统地变化,直到成为完全的离群值(C组)。注意,随着主要数据与红色数据点之间距离的增加,皮尔逊相关系数R值会人为增加,这表明单个数据点可能会导致虚假的皮尔逊相关。D-F中,我们用20个样本模拟了两个不同的不相关变量,这些变量被随机分为两个子组(红色vs.黑色,每组n=10)。从D组到F组,我们系统地改变了两个子组之间的距离。同样,R的值会随着子组之间距离的增加而人为地增加。这表明在未考虑子组存在的情况下相关变量会产生虚假相关。置信区间(CI)用灰色表示,并通过Bootstrap 程序获得(灰色区域代表所获得的相关值分布的2.5%和97.5%之间的区域)。如何发现该错误这个错误往往发生在我们想比较两种效果之间的差异,却没有用统计学方法对两种效应进行直接比较时。该问题也经常在研究者没有进行必要的统计分析就进行推断的情况下发生。解决方案研究者进行组间比较时,应直接比较各组。两组的相关关系可以用蒙特卡罗模拟进行比较。对于多组比较,可能适合用ANOVA。非参数统计也提供了一些方法,但这些方法需要根据具体情况使用。3. 分析单元虚高实验单元是可以被随机独立分配的最小观测(smallest observation),即可以自由变化的独立数值(independent value)的数目(Parsons et al., 2018)。在经典统计学中,此单元反映的是自由度(df):例如,当推断组间结果(group results)时,实验单元就是被试的数量,而不是对每个被试观测的次数。但研究者经常将这些指标混为一谈,从而导致理论和实践上的错误。理论上讲,如果没有清楚地确定恰当的实验单元来评估观测值的变异,那么统计推断就是有缺陷的。从实践上讲,这会导致实验单元的数量虚高(例如,对所有被试的观察次数通常大于被试的数量)。当df增加时,用来判断统计显著性的阈值会降低,这种情况下,如果效应是真实的,则更容易观察到显著结果(增大统计检验力)。这是因为检验结果会因为df增加有更大的可信度。为了说明这个问题,(我们可以)假设要用一个样本量为10的简单前后测纵向研究设计来研究干预的效果,研究者想要通过简单回归分析来评估主要指标和临床状况之间是否存在相关性。分析单元应该是数据点的数量(每个参与者为1个数据点,共10个),df为8。df=8时,达到显著性的临界R值(α水平为.05)为0.63。也就是说,高于0.63的任何相关性都是显著的(p≤0.05)。如果研究者将所有参与者的前后测数量加起来,最终的df=18,则临界R值就会变成0.44,从而更容易观察到统计学上的显著作用。这是不恰当的,因为把被试内和被试间的分析单元混淆,导致了测量结果之间的依赖,而特定题目的前测分数不会变化,也不会影响后测分数,这意味着实际上只有8个独立df。这通常会导致即使没有足够证据证明效应的存在,结果也被解释为是显著的。如何发现该错误审稿人应该思考分析单元的恰当性。如果一项研究旨在了解组间效应,则分析单元应该反映被试间的差异,而不是被试内。解决方案也许最可行的解决方案是使用线性混合效应模型,研究者可以将被试内的变异定义为固定效应,将被试间的变异定义为随机效应。这种日渐流行的方法允许将所有数据放入模型中,且不会违反独立性假设。但是,它很容易被滥用,并且需要丰富的统计知识,因此在应用和解释时应该谨慎。对于一个简单回归分析,研究者也有几种解决方法,最简单的方法是分别计算每个观测值的相关(例如,前测、后测)并根据现有的df解释R值。研究者还可以计算所有观测的平均值,或单独计算前测/后测的相关性然后对所得的R值求平均(在使用正态化的R分布后,例如,R分布转化为z分布),并据此进行解释。4. 虚假相关相关是科学中评估两个变量之间关联程度的重要工具。然而,参数相关(例如皮尔逊相关系数R)的使用是依赖于一系列假设的,(不违背这些假设)非常重要,因为违反这些假设将导致虚假相关。虚假相关最常发生在其中一个变量存在一个或多个极端值的情况中。如图表2的第一行所示,在分布中远离其余值的单个值会增大相关系数。另外,虚假相关还可能源于集群,例如,当两组的两个变量不同时,把两组的数据合并在一起(正如图表2下面一行)。请务必注意,极端值很可能会提供一个真实的、遵循规律的观测结果(这个规律可能正是你想发现的)。也就是说,观测值本身不一定是虚假的。因此,去除“极端”数据点时也应该格外谨慎。但是,如果这种真实的观测是有违反你的统计检验假设的风险的,那它就是虚假的,并需要使用其他统计工具(进行检验)。如何发现该错误审稿人应该特别注意相关性(研究)缺少散点图的情况,并思考删除数据的理由是否充分。此外,如果将数据合并在一起,审稿人需要考虑到组间或情境间的差异(参见上面的“夸大分析单元”)。解决方案在大多数情况下,应该选择稳健的相关分析方法(例如,bootstrapping, datawinsorizing, skipped correlations),因为它们对异常值不那么敏感,这是由于这些测验考虑了数据的结构。使用参数统计时,应筛选数据以避免违反关键的假设,例如数据点的独立性,以及异常值的存在。5. 使用小样本当样本量很小时,只能检测到较大的效应,这使得对效应量真正大小的估计充满不确定,进而导致对实际效应量的高估。在显著性阈值α=0.05的频率统计中,有5%的统计性检验在没有实际效应的情况下将产生显著性结果(假阳性,I类错误)。但是,研究者更倾向于认为高相关(例如,R>0.5)比中等相关更可靠(例如,R=0.2)。如果样本量较小,则这些假阳性的效应量会很大,从而导致显著性谬误:“如果一个假设效应量大到用小样本就能检测到,那它一定是正确的。”重要的是,更大的相关性并不是两个变量之间更强关系的结果,而只是因为在实际相关系数为0时,小样本更可能出现较大的相关。例如,当不断从两个不相关的变量中抽取N=15的样本并计算其相关时,得到虚假相关(即假阳性)的可能性大约在|0.5-0.75|之间,而不断抽取N=100的样本时,则假阳性为|0.2-0.25|。小样本的设计也可能无法检测出真实的效应(II型错误)。对于给定的效应量(如,两组之间的差异),抽取的样本量更大,(成功)检测该效应的可能性更大(这种可能性被称为统计检验力,或者统计功效,statistical power)。因此,使用大样本,可以减少效应存在却未被检测到的可能性。另一个与小样本量有关的问题是样本的分布更有可能偏离正态。有限的样本量通常无法严格地验证正态性假设。在回归分析中,分布的偏差可能会产生极端值,从而导致虚假的显著相关(参见上面的“虚假相关”)。如何发现该错误审稿人应该严格检查论文中使用的样本量大小,并判断样本量是否足够。基于有限数量被试的特殊结论应被特别标注出来。解决方案来自小样本的单个效应量或单个p值的价值是有限的。研究者首先应该证明他们使用的统计检验有足够的统计检验力,例如呈现先验统计力分析,或研究的重复检验。计算统计功效的困难在于,它应该基于对独立数据集的效应量的先验计算,而这在综述中很难进行评估。贝叶斯统计提供了确定事后比较统计检验力的机会。在样本量难免受到限制的情况下(例如,对罕见临床群体或非人类灵长动物的研究),应该努力重复实验(案例内和案例间),并进行足够的控制(如,确定置信区间)。6. 循环验证循环验证指以任何形式,回溯地选择数据的某个特征作为因变量进行分析,从而扭曲统计检验结果。循环验证有很多种形式,但本质上都包含先使用数据刻画(characterize)某需要被检验的变量,然后再对该批数据进行分析并进行统计推断,因此通常被称为“双重浸渍”(double dipping)。循环验证最常见的做法是:找到一个与统计结果非常相关的选择标准,回溯性地使用这个标准以完整的数据进行分析(如分组、分成不同的子集)或者删减数据(例如在神经成像研究中定义感兴趣区,或者排除极值)。(HCP注:原文在这里的表达也不是特别清晰,以定义感兴趣区为例。)假如研究者先在全脑范围寻找与特质焦虑相关的大脑区域,比如小脑;使用这一标准将小脑选择出来,然后再计算小脑与特质焦虑之间的相关,并推断:小脑与特质焦虑高度相关。这就是典型的循环论证。)例如,一个研究关注神经元集群在某一实验操纵后的发放率。使用该神经元集群的整体数据时,发现操纵前和操纵后没有显著差异。但是,研究者发现集群中一些神经元在该操纵后的发放率增加,而另一些神经元则降低。他们因此将整个神经元集群进行分组,依据是神经元在操纵前神经元的发放率。分组后再进行统计分析。这样一来,就得到显著的交互作用——操纵前发放水平低的神经元在操纵后增加了,而操纵前发放水平高的神经元则在操纵后反应降低了。但是,这种显著的交互作用完全是由于人为的选择标准加上数据中的噪音(例如,神经元活动可能只是随着时间的变化,在操纵前后回归到均值水平)共同导致的,这种交互作用完全可以在纯粹的随机噪音中观察到。循环验证的另一种常见形式是在自变量和因变量之间创建依存关系。继续上文神经元集群的例子,研究者可能报告操纵后神经元反应水平和操纵前后神经元反应水平之间差值的相关。但是这两个变量都高度依赖于操纵后测量到的神经元反应水平。因此,由于偶然因素在操纵后有更高活动水平的神经元,也可能会表现出更大的操纵前后的差异,因此研究者报告的相关可能是夸大的。在零假设前提下,如果统计分析的结果与数据选择标准独立,选择性分析是完全合理的。但是,循环验证将(存在于任何数据中的)噪音也纳入到结果之中,会夸大统计结果,并导致歪曲和无效的统计推论。如何发现该错误循环验证可以以多种形式表现,原则上来说,筛选统计指标的选择标准本身偏向于证实目标假设时,就属于循环验证。在某些情况下这非常明显,比如统计分析的数据所基于的标准是为了显示期望的效应,或者统计分析的数据本身就与感兴趣的效应存在内在联系。在另一些情况下,(发现)循环验证可能会很复杂,并且需要对数据选择和数据分析步骤中的相互依赖关系有更细微的了解。审稿人应该警惕理论上不可能达到的,和/或基于相对不可靠的测量得到的过高效应量(如果两个测量工具的内部一致性很差,这种内部一致性会是有意义相关的上限)。在这些情况下,审稿人应要求作者对选择标准与期望效应之间独立性进行说明。解决方案提前且独立于数据的情况下确定分析标准,可以避免循环验证。此外,由于循环验证将噪音纳入分析,从而使想要的效应虚高,最直接的解决方案是分别使用不同的数据集(或者数据集的不同部分)来确定分析的参数(例如,选择亚组)和检验你的预测(例如,检验不同亚组之间的差异)。这种分组方法可以在被试水平(使用不同组来确定缩减数据的标准)或试次水平(使用来自全部被试的不同试次)完成。可以使用bootstrapping方法在不降低统计检验力的情况下实现。审稿人可以要求作者进行模拟,证明想要的效应与噪音的分布、选择标准之间彼此独立。7. 分析方法的多样性:p-hacking变换数据分析方法(例如变换结果的参数,添加协变量,不确定的或不稳定的预处理程序,根据统计结果来排除异常值或题目,会增加得到显著p值的可。)这是因为一般的统计方法依赖于概率,使用的检验方法越多,得到假阳性结果的可能性就越大。因此,在某个数据中得到显著的p值并不困难,且对于显著的效应总能进行合理的解释,尤其是在没有明确假设的情况下。但是,在分析程序中的变换越大,观察到的结果不真实的可能性就越大。当一个团队在论文中报告的是用不同方法计算的同一变量的值时,或者当临床实验改变其结果时,分析方法的变换尤为明显。可通过使用标准化的分析方法,进行实验设计和分析的预注册或进行重复实验来避免此问题。可以在得到第一次实验结果之后和在重复实验之前进行实验的预注册。但是,防止p-hacking最好的方法也许是在一定程度上接受边缘显著或不显著的结果。换句话说,如果对实验进行了精心设计,执行和分析,审稿人不应该因为结果而“惩罚”研究者。如何发现该错误研究者是否采用了多种分析方法很难被检测出来,因为研究者很少报告所有的必要信息。在进行预注册或临床实验注册的情况下,审稿人应比较实际使用的与计划使用的分析方法。在没有预注册的情况下,某些形式的p-hacking是几乎不可能检测到的。但是,审稿人可以评估对所有分析方法的选择是否合理,相同的分析计划是否在以前的出版物中使用过,研究者是否提出了可疑的新变量,或者他们是否收集了大量的指标,却只报告了显著的那些。Forstmeier等人(2017)总结了检测可能的阳性结果的实用技巧。解决方案研究者应该明晰报告的结果,例如,区分事先计划的分析与探索性分析、预期结果与意外结果。正如我们在下文讨论的,如果进行透明地报告和解释,灵活地进行探索性分析并没有问题,尤其它们作为下一步有着具体分析方案的重复研究的基础时,是合理的。这些分析方法可以为额外的研究提供有价值的依据,但不能作为强有力的结论的基础。8. 未进行多重比较校正当研究者检验任务效应时,他们经常检验多个任务条件对多个变量(行为结果,问卷条目等)的影响,有时还存在先验假设不确定的情况。这种方法被称为探索性分析,与有更多限定条件的验证性分析相对。使用频率统计时,在探索性分析中进行多重比较可能会对显著结果的解释产生很大的影响。在包含两个以上条件(或两组的比较)的实验设计中,探索性分析将涉及多重比较,也会在没有真实效应的情况下增加统计显著结果的可能性(即假阳性,I类错误)。在这种情况下,因子数量越多,可以进行的检验就越多,观察到假阳性的可能性就越大(family-wise error rate)。例如,在一个2×3×3的实验设计中,即使效应实际上是不存在的,至少得到一个显著主效应或交互作用的概率也有30%。进行多重独立比较时,此问题尤其突出(例如,神经影像分析,多重记录的神经元或脑电图)。在这种情况下,研究者在每个体素/神经元/时间点内进行严密的统计检验,由于设计中包含大量指标,检测到假阳性结果的可能性很大。例如,没有对多重比较进行校正时,Bennett及其同事在死三文鱼中发现了被激活的体素(在“心理模拟”任务中激活)。此例说明了得到(identify)假阳性的结果有多么容易。尽管这个问题在探索性分析中更突出,但在验证性分析中设定大量的检验时,也可能出现问题。如何发现该错误未被校正的多重比较,可以通过测量的自变量的数量和使用的分析方法的数量来检查。如果这些变量中只有一个与因变量相关,那么其余变量可能就是纯粹为了增加得到显著结果的可能性而被纳入的。因此,当对大量的变量(例如基因或MRI体素)进行探索性分析时,如果研究者没有明确的理由解释未经矫正的多重比较结果,那这个结果就是完全不可接受的。即使研究者提供了粗略的假设(例如,应该在特定的脑区或在近似潜伏期观察到效应),如果这个假设需要多个独立的比较进行检验,也需要对多重比较进行校正。解决方案探索性分析可能是没有问题的,但必须承认这是探索性分析。研究者应该报告所有测得的变量,并恰当地使用多重比较程序。例如,标准的多重比较校正肯定会发现在死三文鱼脑中没有激活。请记住,有多种方法可以校正多重比较,有些方法比其他方法更为研究者所接受,因此仅呈现某些形式的校正还不一定能完全解决假阳性的问题。9. 过度解释不显著结果使用频率分析时,科学家使用统计阈值(通常α=.05)来判断统计显著性。有关此阈值主观性的文章很多,并且也有不少研究者试图提出替代方案。除了这些我们将在结语部分阐述的问题,错误地解读不显著的统计检验结果也是严重的问题,且却极为普遍。这是因为不显著的p值无法区分无效应的结果是由于效应确实客观上不存在(与假设相反的证据),还是由于当前研究的数据不足以让研究者去严格地评估假设(如,缺乏统计检验力、不恰当的实验设计等)。简单来说——效应不显著可能有非常不同的含义——真正的无效应、缺乏统计力去探测真实的效应,或模糊的效应。因此,如果研究者用不显著的结果作为证据去否定有效应的假设,就需要说明该证据本身是有意义的。但p值这一统计方法不能达到此目的。将不显著结果混淆为支持无效应,还意味着研究者有时可能会(错误地)忽略p未达到0.05阈值的结果,认为该结果毫无意义,即使这个结果可能实际上提供了足够反对零假设的证据,或者至少有趋势表明需要进一步的检验。如何发现该错误研究者可能将不显著的p值解释或描述为不存在效应。这个错误非常常见,应该得到重视。解决方案首先,重要的是在报告p值的同时报告效应量,以提供有关效应大小的信息,这对于元分析也很重要。例如,如果大样本的研究中效应不显著,同时效应量也很小,那么就不太具有理论意义,而具有中等效应量的结果可能值得进一步研究(Fethney, 2010)。可能的话,研究者应考虑使用能够区分不充分(或模糊的)证据与支持零假设证据的统计方法。除非研究者已经事先确定他们的研究是否有足够的统计检验力来探测出想要的效应,或者有足够的统计检验力来确定所预期的先验效应的置信区间是否包含0。否则,研究者不应过度解释不显著结果。10. 相关和因果这可能是解释统计结果时最悠久和常见的错误(参见例如,Schellenberg, 2019)。在科学中,相关通常用于探索两个变量之间的关系。当发现两个变量之间存在显著相关时,我们很容易认为一个变量是导致另一个变量变化的原因。然而,这是不正确的。因为两个变量的共变并不一定意味着它们之间一定存在因果关系,即使存在这种可能。例如,不同国家的巧克力年消费量与诺贝尔奖获得者数量之间的显著相关性(r(df = 20)=.79;p<0.001),曾经使我们(误)认为摄入巧克力为诺贝尔奖获得者的产生提供营养基础。仅有相关不能作为因果关系的证据。相关性的存在可能反映了正向或反向的因果关系,但也可能是由(未知的)常见原因引起的,或者可能仅仅是巧合。如何发现该错误每当研究者报告的两个或多个变量之间的关系不是由操纵导致的,却进行了因果推论,就很可能是混淆了相关和因果。研究者应该仅在精确操纵变量时进行因果推论,即使如此,也要小心无关变量的影响。解决方案可能的话,研究者应该尝试检验这两个变量与第三个变量之间的关系,来进一步支持他们的解释,例如,使用结构方程模型或中介分析(前提是有足够的统计检验力),通过检验竞争模型或直接在随机对照实验中操纵目标变量。否则,如果证据证明只具有相关性,就应避免使用因果说法。避免这十个推断错误是确保结果不被严重曲解的第一步。但是,此清单的一个关键假设是,显著性检验(由p值表示的)对于科学推断是有意义的。具体而言,除了少数错误外( “缺乏适当的对照情境/组”和“相关和因果”),上述的大多数错误及其解决方案,都和p值紧密相关,与p值的意义有关,即特定统计检验中的p值代表的是实际上的犯错率。当前,关于零假设显著性检验的有效性和显著性阈值的使用仍然处于争论之中。我们承认,仅一个p值不能揭示关系或效应的合理性、是否存在、真实性或重要性。但是,禁用p值并不一定能防止研究者对结果的错误推论。当合理地进行使用时,p值可以对结果进行有价值的描述,当前也可以辅助学术的交流,至少在就如何解读统计效应的新共识达成之前如此。我们希望本文能在这些主要问题上,对作者和审稿人有所帮助。见译文的PDF版:https://osf.io/2qj6k/files/文中代码(包括模拟的数据)源于github.com/jjodx/InferentialMistakes (Makin and Orban de Xivry, 2019DOI: https://doi.org/10.7554/eLife.48175.002参考文献Makin, T. R., & Orban de Xivry, J.-J. (2019). Ten common statistical mistakes to watch out for whenwriting or reviewing a manuscript. eLife, 8, e48175. doi:10.7554/eLife.48175作者:Makin, T. R., & Orban de Xivry, J. J.译者:李芊芊排版:华华
今天我们走近复旦大学管理学院的李婷同学。管理学院 李婷对未来复旦人说的话“ 我想对未来的复旦人说:努力去做自己想做的事情,多读好书,多交好朋友,珍惜在复旦的日子!”李婷是来自管理学院2016级统计系的博士生。李婷始终认为,对于统计的科学研究,基础知识的储备非常重要。在2014年9月进入到管理学院的硕博连读项目后,她努力学习专业课程,在学习中反复思考、反复讨论和反复琢磨取,这种对思考的享受和热爱让她与科研结下了不解之缘,最终也取得学位课绩点3.894的成绩。进入博士阶段,在导师朱仲义教授的指导下,李婷很快确立了自己的研究方向,主要对函数型数据、高维数据和分位数回归进行理论研究。那个时候的她对未来充满期待,希望自己能够多读好论文,努力做一流的研究,勇于去挑战难题,并能将自己的理论研究应用于实际问题。为了锻炼自己的学术思维,她将自己的本科毕业论文进行整理和完善,写成了英文文章,发表在了国内A类期刊上。这样的经历,让她对学术研究有了更深入的了解,拉开了统计研究的序幕。博一期间,通过阅读文献,李婷的第一个课题是有关广义部分函数型线性模型的估计和假设检验,这个时候她也真切地体会到读文献和自己动手做“真的是两件事情”。短短的几行公式,她可能需要一个月的时间去梳理、推导、证明其理论性质。大概有五六个月的时间,她每天做的事情只有两件:读文献,写证明。她每天都对着草稿纸和文献焦头烂额,在求证、推翻,再次求证,再被推翻的循环当中。过程枯燥且磨炼心性,但是她坚持下来了,克服了这个难题。“那一刻像哥伦布发现新大陆的欣喜,所有的愁苦和辗转反侧都是值得的。”耗时一年,完成了70页的论文,并被国际A类期刊接收。这也增添了她继续统计研究的信心。博二期间,李婷通过申请csc去到德州大学MD安德森癌症中心的生物统计系进行联合培养。在那里,研究人员尝试将统计理论研究和实际的阿兹海默症数据分析相结合,建立理论模型探究大脑区域白质和大脑认知功能之间的关系。她会因为能够将自己的理论研究应用于实际的阿兹海默症数据分析而感到兴奋,但同时也会因为自己完全不懂阿兹海默症相关知识而感到不足。于是,她一头扎进统计和医学的文献中、在读文献、写程序、理论推导和数据处理中争分夺秒地去试错、发现问题、解决问题,跟两位导师讨论,向身边的师兄师姐不断请教。耗时近两年,凝结成64页的论文,并在国际顶级期刊上二轮审稿。他们进一步地挑战难题,希望建立理论模型刻画这个数据中的一些独特的数据特性。比如在泛函空间讨论异步纵向函数型数据,这也导致理论证明难度非常大。在去年的这个时候,李婷表示自己一度处于崩溃的状态,因为她尝试了很多种证明方法都走不通,每周也跟导师讨论新的可能的解决方法,但都失败了。“觉得看不到希望,那一刻,想放弃。”但是导师说:“你再试一试,我相信你的能力。”在导师的鼓励下,她度过了那一段最艰难的时光。坚持下去,不要轻言放弃是她从科研当中学到的很重要的一课。去年暑假,李婷访问香港中文大学统计系,尝试开拓新的研究方向,将函数型数据分析和亚组分析以及聚类回归相结合,并继续用于阿兹海默症数据分析。对于学术边界由点及面的扩展,对于新方向的探索,都让她感受到了科研无穷的魅力。这一次,有了此前的积累,遇到困难时她见招拆招,完成了40页的论文,并已投稿至国际A类期刊。回首这六年在复旦的生活,学术的海洋让李婷遇到了一位又一位倾囊相授的老师和一群交心的朋友。未来她也会坚守、努力,继续攀登学术高峰。来源:复旦大学党委研究生工作部 编辑:丁辰琦、李玲
笔者先依据自己的学习经验,将论文的写作分为四大类,这四大类的写作训练是循序渐进的。分类的目的之一就是为各位大家提供一定的写作思路,以免自己费了很大力气,却写了自己水平达不到的论文,最后被退稿受挫的局面。这四大类论文分别为:1、书评类论文很多人认为书评很好写,且价值不大。其实不然。若想写好一篇书评并不容易。因为书评不仅要告知读者该书的主要内容,还要进行精到的点评。若只有“书”,而没有“评”,那“书评”二字便名不副实了。而且,“评”在这里要比“书”更为重要。通过训练,提高自己“评”的能力,那么在写研究综述时,便不会被老师批评“你的综述只是在堆砌材料”。至于如何写好书评,这里不展开说了。但一定要明确,书评其实并不简单,知网有许多这方面的写作指导,可自行学习。2、研究综述类论文在经过书评的训练之后,便可以进行研究综述类论文的写作了。综述,又叫“述评”。也就是说,综述主要由“述”和“评”两部分构成。读到这,应该了解笔者为何主张先练习书评了吧。当然,也可以跳过书评,直接进入综述类的写作。因为书评与述评的写作思路是一致的,只不过前者相对简单一些。为何一定要练习写研究综述呢?因为这涉及到之后论文选题的成功与否。众所周知,若自己选择的论题已经有人做了,而且做得很全面、很透彻了,那你再做就没有任何意义与价值了。所以,任何一篇学术论文都应该先将研究现状调查清楚,通过研究综述的撰写,便可知道某个课题被别人研究了多少,又是从什么角度进行研究的,还存在哪些不足,而通过梳理文献,找出不足,这就为自己的研究找到了一个较好的选题。因此,练习研究综述的意义重大:一是锻炼搜索文献的能力。论文的写作首先就要全面占有材料,若查阅的材料不全,有较大的遗漏,那么你的研究也就很难有所突破;二是锻炼梳理与分析材料的能力。述评中的“述”,并不是把所有的文献资料堆在一起,而是要将这些材料,分类、对比有规律地“述”;三是锻炼思辨能力。因为在“评”的过程中,要对他人的论文进行思考,思考其论文好在什么地方,更重要的是看到其不足之处。当找到不足之处,就可以在前人基础上,进行更为深入的研究。可见,综述是初学者首要且必须练习的项目。3、原因考证类论文在学会写研究综述之后,便可尝试着写原因考证类的文章。这类文章可以说只要下足文献调查的功夫,就可以写出一篇质量还可以的论文。原因类论文,其关键之处在于找出几个角度来论证这个问题。那如何选择角度呢?思考的时候,大体可分为“内因”与“外因”两个方面进行考虑。如“唐诗三百首为什么不收李贺诗?”笔者通过其选诗标准、作者的文学观念(内因)以及当时的政治、文化背景(外因)等多个角度对其进行思考,最终撰写成文。这里还有一个问题,如何去找到这种原因类的论文呢?这就需要大家在平时看书的时候,敢于质疑权威,勤于思考,读书贵在疑,做学问更是如此,若人云亦云,那么读书之后自己又有什么收获呢?因此,在读书或者看论文时,凡是没有定论的东西,即使学术大家写的,也要问一下为什么,也要反驳他。如著名古典文学家孙次舟曾指出“屈原是文学弄臣”(即同性恋),那自己就“故意”和他观点相反,认为“屈原并不是文学弄臣”,然后再找论据证明自己的观点,或者一一破解孙先生的论据。质疑,不在于观点正确与否,更不在于高深与否,幼稚与否,而重在“疑”了,随着自己不断的积累,做学问的基本素养便逐渐形成了。日后,也不必为自己找不到论题写而发愁了。所以,原因类的论文亦是平时训练的基础,它锻炼了你质疑与思考问题的能力。考证类的文章,关键在于考证的方法和视角。如何寻找这些方法和视角,是很多学生最头痛的问题。这里可以教给大家最实用的方法:移植法。笔者曾读河南大学郭宝军的《宋代文选学研究》一书,起初仅是为了了解《文选》在宋代的传播状况,最后写篇书评,但结果发现是书考证的手法十分值得借鉴。因此,在写完书评后,笔者将其考证的手法移植到楚辞学方面,撰写了《宋代楚辞传播地域考》一文。是文首先利用《宋志》调查了当时行政区域分布的状况,次再查阅与《楚辞》相关的文献,考证了《楚辞》在当时各个行政区域的流传情况,结果发现,《楚辞》传播的接受主体大部分在南方。这就是一个值得进一步思考的问题,为什么没有在北方传播呢?所以,接下来笔者就找到几个证据,来解释这个现象。这篇论文即将考证类与原因类结合起来了。总之,在学会写综述之后,便可以多写几篇原因考证类的文章,以此来锻炼自己思考问题的能力。4、理论类论文在上述论文类型练习差不多的时候,便可尝试写理论类的文章。这类文章可以说是层次较高的了,也是相对难写的了。很多人一上来就写这类文章,结果发现自己无非是在重复别人说过的观点,别人说过的话。因为自己并未有足够的知识支撑,自然说不出来,说不出来就只能照搬照抄。因此,不要在自己知识不足的情况下写这类文章。如自己从来不具备宋明理学的知识,甚至没有搞清楚何为“理学”,而上来就要探讨朱熹的理学思想,不用想也会知道结果是什么。大家可以拿自己的文章与《文学评论》、《文学遗产》等核心期刊的文章比较一下,就会只有一种感觉:自己写得太浅显了,考虑的问题没有深度,论证亦不够严谨。这也是笔者为何不主张刚入门径的同学上来就写这类文章的原因之一。上面谈到了四大类论文,为各位提供了写作的思路与训练的步骤,接下来就需要明确一篇“小论文”撰写的步骤与方法。1、选题与研究现状的调查在论文写作的过程中,最重要的一步便是选题。只有撰写的论文有一定理论价值或社会价值,你的论文才会被刊用。很多人并不注重论文的选题,随意找到一个题目,上知网随意搜索一下,感觉没有多少人研究,便开始下笔去写。但如果选题的意义不大,即使论文写得再规范,语言写得再漂亮,论证得再严谨,亦是徒劳。可以说,选题在一定程度上决定了发表论文的级别。那么选题如何才能有价值、有意义呢?主要在于两个字:创新。那如何创新呢?基于此,可将选题分为三大类型:(1)旧题新说。这一类是比较多的。所谓“旧题新说”,就是虽然选题较旧,但你的观点与前人相左或不同。相左比较简单,就是别人说1+1=2,你非说1+1不等于2,然后找到证据证明1+1为什么不等于2。因为观点完全相反,所以题目虽旧,但观点却新,即等于创新,你的论文也就具备了一定的价值。如很多学者认为“唐代是楚辞学的衰落期”,但你要与这些观点相左,认为“唐代的楚辞学并不落没”。因此,大家在读他人论文或书籍时,一定要敢于质疑,一定要多与他人“相反”。只要没有定论的东西,都可以发表自己的见解。在找到相反的观点时,剩下的就是寻找证据,来证明自己是对的即可。与观点相左比较,观点不同是有一定难度的。因为观点相左,是已经有现成的观点了,将其完全反过来即可。但是观点不同,需要自己提出一种全新的观点。那如何做到“不同”呢?这就要求研究的视角和研究的方法不同。研究的视角是指研究者主体意识介入研究客体的途径。任何文章都有自己的角度,由于角度的不同,同一研究对象可能呈现不同的风貌。如有人从儒家角度研究《西游记》,有人从道教角度研究《西游记》,有人从佛教角度研究《西游记》,还有的人从“三教合一”的角度研究《西游记》,由于视角的不同,所得出的观点自然不同。再者,研究的方法不同,其结论亦不会相同。论文的研究方法多种多样,大致有:文献研究法、比较法、定量分析法、定性分析法、个案研究法、跨学科研究法、功能分析法、数量研究法、统计研究法、经验总结法、思维方法、系统科学方法等。这些方法可以同时使用,如利用比较法,可以将《文选》中的某一文体与《文心雕龙》中的某一文体对比研究,这样得出观点自然是新的,但比较的对象一定要有关联性才行。再如通过跨学科法,可从美学角度研究《西游记》,亦可以从文学角度研究,更可以将多种学科的方法交叉起来研究。(2)旧题补说。相较第一类,这一类的论文并不多见。所谓“旧题补说”,是指赞同旧题的观点,但之前的论证并不完整充分,因此需要对其进行补充完善。如旧说认为清代学者江藩卒于道光十年,但由于前人的论据多是推测之语,故可作一补正来将此说完善。这便是典型的“旧题补说”。其实,这类论文虽在观点上没有任何创新之处,但是由于“补”的成分是“新”的,且让旧说更为可靠,更有说服力,所以此类论文亦具有一定的价值。如果补充得好,没有创新,胜似创新。(3)新题新说。可以说,想找到一个别人一点都没有研究的课题,是相当困难的。所以,如果找到,那么无论你的观点和研究方法是什么,都属于创新。不过,在这里需要强调的是,别人没有研究过的并不代表一定就有价值。也许正是因为没什么价值,所以才没人研究。当自己找到一个别人没有研究过的课题时,要问自己一句,研究这个有什么学术意义。上述是如何选题,但在这个过程中,还必须对研究现状做一番彻底的调查,这样才能知道哪些论题属于旧题,该旧题研究到了什么程度,又从什么视角研究的,还存在哪些不足;才能分辨出哪些论题属于新题。注意的是在调查研究现状时,千万不要直接将文章题目直接复制到知网上去查询,因为这样调查出来的文献一定不是全的。因为有的文章或许根本就没用你这个题目,而是以隐晦的标题出现,又或者别人的论文只是研究了你要研究课题的一小部分。那么正确的检索方法是什么呢?即不断变化关键词,范围从小到大,或者从大到小,且需要二次检索。如写《西游记》中的道教哲学思想,可以先在知网上搜“《西游记》 思想”,次搜“《西游记》道教思想”,再搜“《西游记》 道教哲学思想”。再上百度搜索一下(因为有写论文并不录入知网)。在将其搜索殆尽时,其实文献并没有收集全,这个时候可以看看各个论文中的参考文献,这时会发现还有很多文献,包括著作,因为关键词以及题目等因素的影响而未被发现。最后,通读搜索的文献,很可能会发现你探讨的课题还可以分成几个“小块”,那么就需要按照这些“小块”进行二次文献的搜索。如在读完《西游记》中的道教思想方面的论文后,会发现其思想可以细分为神仙观、宇宙观、伦理观等,这个时候就需要分别检索神仙观、宇宙观以及伦理观。在这里可以看出,有些人是直接研究《西游记》中的道教思想,但有些人却之研究其中的一小部分,这样就造成了关键词的不同,所以在检索时才会遗漏。只有这样反复的进行检索,才能将文献搜集全,才能避免与前人的研究相重复。2、引言部分引言得主要内容就是交代研究的背景、现状、研究问题、研究方法(视角)、研究意义。一般而言,引文字数在200-500字之间,但也不必拘泥于这个字数,只要把该交代的交代清楚就行了,有的文章几句话就可以交代清楚,有的则需要更多笔墨才行。3、主体论证部分主体部分,一般就是选择几个角度,来论证自己的观点。这部分没办法详细展开说明,只能简要说明一下需要注意的事情。(1)每个角度都拟个小标题。如笔者的论文《六艺略命名考》,分三个角度来探讨,分别是:一、“六艺”的词义发展;二、“六艺”与《论语》、《孝经》的关系;三、“六艺”与“六经”的关系。通过这三个角度的探讨,便可自圆其说。这三点最好要有逻辑上的递进关系,像剥洋葱一样,一层一层地进行论证。若有的文章实在没有办法拟出小标题,或者拟出的小标题过长时,就可以不用拟标题,直接按照一、二、三分条论证(不推荐学生和青椒使用这种方法)。此外,孤证不立论,所以找到的论据越多越好,这样论证才会严谨。(2)论证要有逻辑性。这是主体部分最为重要的一点。很多人在写论文时,往往前言不搭后语,有着明显复制、粘贴、拼凑的痕迹。这表明作者在论证时,没有进行构思,只是写一点粘贴一点,最终导致论文读完前句,感觉还没论证完,下一句就说了与其不相干的话。那么论证如何才能有逻辑性呢?首先,一定要明确自己的小论点是什么,然后在论证的时候,需要找到相关的书证,最后对书证进行解释,进而说明这个小论点。在句与句之间,有逻辑关系的要用一些关系连词。一般在论证时,往往是小论点+书证+解释。有的人写论文,上来就是书证,再提出论点,且这个论点与书证的关系并不大,然后又直接说了下一句与其不相关的话,其模式变为:“书证+小论点+不相关的话”,这就导致读者并不知道作者要说明什么,逻辑变得十分混乱。此外,在大部分情况下,是需要对书证进行解释的。很多人在论证问题时,往往就是小论点+书证;小论点+书证;小论点+书证 ……,一直是这个模式进行下去,所以老师经常会说你的论证很单薄,不够深入。引书证的目的在于说明论点,但有些书证并不易读者理解,或者说得很隐晦,这就需要作者对其进行详细地解释,进而使这个小论点的论证更加充分。如果全都不解释,那这样的“论文”不就谁都可以了写了吗? (3)防止“文不对题”。有的人在写论文时,往往大论点是在讲这一问题,但后面的论证重点并不在此,只是少有论及,这就属于“跑题”了。其实,这种感觉我们都曾经历过,那就是高中语文作文。往往是写到一半,才发现自己写的与主题不太相关,然后在后面极力地往主题上靠,这样写出来的文章自然显得生硬,逻辑性差。在论文中,尤其是理论类的论文,更是常见。所以,自己在写完论文时,一定要再通读一遍,然后反问自己,写的问题是什么,论据是什么,结论是什么。通过这三问,相信便不会“跑题”了。4、结语或结论部分在主体部分过后,论文会以结语或结论的字样收尾。但很多论文没有结尾,又或者结尾另起一段,用“综而言之”之类的语词,进行简短的叙述(如《文学遗产》上的很多文章都是这种,但不推荐这种结语)。在用结语、结论字样收尾时,要分清楚这两个名词的概念。“结论”:主要是客观地表达重要的创新性研究成果所提示的原理及期普遍性,语气表达的客观性较强。“结语”:内容较宽泛,是对全文的总结性、概括性表述或进一步说明书。如再次点明论题,概括本文主要内容和研究结果,指出本研究之不足或局限性,提出需要深入研究的课题或指明研究方向,阐明论题及研究结果的价值、意义和应用前景,对有关建议及相关内容作补充说明。限语气表达的客观性较“结论”弱,主观性较强。因此,一般文科类论文常用“结语”二字结尾,理工科类论文常用“结论”二字结尾。但不是说一定要严格区分二者,现在很多论文的结语和结论没有明显的区别。5、参考文献部分很多人不重视参考文献这部分,殊不知审稿的编辑最开始便会看你论文的标题、摘要以及参考文献。为什么一定要先看参考文献呢?因为当研究某一课题时,若连一些最基本的有代表性的权威论文或著作都没有参考到,不用想,你论证的内容也不会好到哪去。而且,编辑最不喜欢格式不符合学术规范的稿子,若连最起码的格式问题都做不到,何谈学术研究呢?下面挑几点最常见的问题加以说明:(1)参考文献与注释的概念与区别。参考文献,说得简单些,就是你在论文的写作过程中,都看了谁的文章。你也许不会引用其中的话,但是你是受这些论文的启发才有的灵感。说白了,重在“参考”二字。放在论文结尾,用序号[1]、[2]、[3]顺次排列。注释是指对正文中某一内容作进一步解释或补充说明或直接引用的文字,包括尾注和脚注。尾注一般位于文档的末尾,序号用①、②、③顺次排列;脚注一般位于每一页面的底部,序号用①、②、③标识,但是每页需要重新排序。(2)小论文中参考文献与注释的处理方法。小论文的写作毕竟不同于学位论文,学位论文必须有参考文献与注释,而小论文由于发表在期刊上,编辑会考虑到版面等因素,因此往往要求将注释变为参考文献的形式,一律放到论文结尾,统一以参考文献的规范去写。当然,因为注释不仅仅是引用原文,当必须对某一问题进行补充说明时,即使在小论文中还是需要用脚注的。(3)小论文中多次引用同一参考文献的处理方法。有时候会多次引用同一篇文献,这该如何处理呢?据笔者投稿的经验,期刊一般青睐于这种方式:凡是多次引用同一篇文章或著作的时候,在参考文献中不必标注页码,而是在参考处,以“[3] (p480)”上角标的形式标注。若只引用一次,则在原文中只标注序号,不标注页码,但需要在参考文献中加页码。(4)参考文献的数量。一般来讲,期刊论文的参考文献数量不宜太少。太少,证明作者并未很好地调查研究现状。处于青椒阶段的我们,更是应该多多参考他人的研究成果,否则就会出现“闭门造车”的状况。6、中英文摘要及关键词部分摘要是论文最为精要的部分,很多人并不会写摘要,大多数情况就是从正文中随便摘抄几句,而且还经常会犯些语言表述方面的错误。下面挑几条最为重要的点加以说明:(1)内容主要包括:研究了什么、怎么研究的(研究的方法/视角)、研究的结论、研究的价值/意义等(“意义”这部分不推荐写,有夸大自己论文价值的嫌疑,容易引起部分编辑反感)(2)小论文摘要的字数:一般在200~300字之间,但这个字数也不是固定不变的规定,而是由文章的需要所决定,但也不宜过多。(3)摘要避免的字眼:不要出现“我”、“本文”、“笔者”、“不揣简陋”、“才疏学浅”等主观、口语和谦虚的字词。这是大部分人最常犯的错误。其实,不仅是摘要,整个论文中尽量不要出现这些字眼。有很多人会在引言中写自己才疏学浅之类谦虚的话,实际上是不适宜的。(4)摘要不能介绍常识:不要在摘要中写类似于“李白,字太白,是唐代著名诗人”、“《文心雕龙》是梁刘勰的代表作”等常识,而是应该开门见山,直接交代研究的背景、内容、角度/方法和意义。摘要写过之后,还要挑选关键词。关键词最重要的功能就是让别人能够在相应的知识系统中快速定位到你的文章,查阅到你的文章。关键词如何挑选?一般是从论文的标题、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组。最后,中文的摘要和关键词都写完之后,还要将其翻译成英文,附在论文的结尾。很多期刊是要求有英文摘要和关键词的,所以为了更加符合各个期刊的学术规范,应将这部分附上。那如何翻译呢?一般的方法是先将中文摘要和关键词放到谷歌翻译中,一定是谷歌翻译,而不能用有道翻译、百度翻译等。但谷歌翻译并不代表翻译出来的就是正确的,只是相对其他翻译器来说,较为准确。因此,谷歌翻译完,还要依靠自己的语法知识重新将语句进行调整,做到没有任何语法错误。此外,有些专有名词或汉语较为隐晦的词语,谷歌翻译得并不适当,这个时候需要去知网查阅与之相关的论文,尤其以硕博论文为主,看看别人的论文是如何写的。7、找老师或他人进行修改初稿在写完之后,一定要找自己的导师进行修改。一般导师会以批注与评语的方式,对学生论文中的标点、语言、观点、结构等进行修改。为何一定要找导师修改呢?这是一个语言、思维锤炼的过程。很多人在初写论文时,会发现自己写的都是白话,一点学术味道也没有。这是个十分正常的现象,也是每位初入门径的人必经之路。笔者也是从这一路走来,感触较深。最初,论文的语言特别浅白,经常会出现“我认为”、“的、地、得不分”、“病句较多”等问题,但每一篇小论文笔者都会发给导师,导师亦耐心对其进行如上修改。笔者在收到老师的批改稿之后,并没有直接复制老师改过的地方,而是一点一点地对照原文,找到自己语言、标点等不足之处,然后在原文中重新修改。而且,并不是改过一遍就可以了,而是反复修改,反复发给导师,直到导师觉得文章还可以,才进行发表。这个过程虽然看似麻烦,但却十分有效。经过几次这样的训练,笔者发现自己的语言表述能力逐渐提高,逻辑思维亦不断增强。如果自己的导师没有时间,那也可以找上届在这方面有心得的师兄师姐修改。8、论文发表在论文经过反复修改之后,便可以投稿了。很多人最开始写文章时,其目的就是为了投稿,但当自己投稿的时候,会发现在长时间的等待中,收到了退稿通知,甚至没有通知,这个时候自己会备受打击。其实,仔细想想,如果论文在写的时候,就下足功夫,不着急发表,反复修改,根本就不用愁稿子没有期刊录用。虽然论文经过笔者上述的修改步骤,看似繁琐,花费的时间较长,但如果稿子优秀,在投出去之后,用不上一个礼拜就可以得到用稿通知(快的就两三天)。实际上,上述论文撰写花费的时间要比你经过耐心等待最后被退稿的时间少得多。虽说只要认真对待论文的撰写,最后发表是相对容易的,但在投稿方面仍需具备一定的知识与经验:(1)投稿渠道:去万维书刊网(比较常用)或者知网,找到学报的官方邮箱,然后用qq邮箱以发附件的方式发送对方邮箱就可以了。但由于稿件的数量过多,因此为了方便管理稿件,很多期刊已经开始采用编辑部官网的方式让作者投稿。投稿人需要在官网上进行注册,然后上传自己的稿件,并可以随时看自己论文的审阅状态。(2)审稿流程:各个期刊都有自己的审稿流程,而且笔者也未深入了解过这方面,因此只能简略谈一下各个期刊通用的原则。目前,多数期刊都采用国外学术界通行的“三审制”和“双向匿名审稿制度”。“三审制”即责任编辑初审、专家复审和主编终审的审稿制度。“双向匿名审稿制”即就是由期刊编辑部将稿件隐去作者姓名、职任、服务机构、通讯地址等个人资讯,行文中亦尽量注意避免可能透露作者身份的词语,然后送交相关专业领域的专家学者进行审稿、评价、修订。这样可以保证专家审稿的公正性、客观性。(3)投稿须知:投稿前一定要看各个期刊的投稿要求,非核心期刊要求字数5000-8000左右,核心期刊一般在10000左右。而且每个期刊的特色不一致,如写管子类的文章可以往管子特色栏目的期刊投。简言之,投其所好,可以更快速地见刊。投稿后,要勤和编辑沟通。很多人在投稿之后,便不再理会,其实这样并不好。多与编辑沟通,可以增加你用稿与见刊的速度,同时也会得到一些中肯的意见。更重要的是,通过沟通,你可以零距离接触编辑,可以更加深刻地体会到编辑喜欢什么类型的文章,审稿的流程又是怎样的。还需注意的是,受到用稿通知之后,不要直接去给编辑社邮钱,这样很容易被骗,应当打其官方电话进行核实,千万不要按照用稿通知单的电话去打而是要去万维或者知网上去查官方电话。正规的学术期刊,一般都是去邮局汇款,地址都是所投学报的编辑部,很少直接打入对方银行卡中(但也有例外,如绥化学院学报)。版面费各个期刊不同,本科学报一般在500-1000之间,超过这个数额尽量不要发了,要么期刊质量不好,要么是骗人的。来源:学术志(ID:xueshu001),作者投稿作者:老实人 编辑:学妹
一项科研工作,只有在文章发表后,才算告一段落。对于研究生及年青的科学工作者来说,在科研论文的写作及投稿过程里,与科研过程中一样,会遇到不少困难。我多年来,除了从事科研,还帮助国际主要的视觉科学杂志等审阅过许多稿件。所以本文想从一个审稿者的角度,谈谈科研文章的写作中应该注意的问题,期望能帮助到年青学者。一篇好的论文,首先是要基于好的研究工作及结果,如何达到这一点,不是本文的讨论范围,今后有机会当另写文章讲述。我一般主张好的工作要送到国外发表,这样才能与国际同行作交流,所以研究成果需要写成英文稿件。虽然对不少国内的科技人员这也是一个障碍和困难,但本文也不讨论英文的写作问题。在科学杂志中发表的文章,分好多种类,诸如:综述、纯理论性的结果、新的仪器与方法、病案报告、以及实验研究成果。所以写作的格式与方法也不完全相同,本文只限于讨论实验研究成果一类的科研论文,由于我的专业关系,本文比较适合生物、心理物理、及医学类的做基础研究的研究生及年青研究人员,对于其他专业的人员,仅供参考。当审稿人收到杂志社送来的稿件时,首先看到的是稿件的打字和排版。这就相当于你去面试时,人家先注意你的容貌和着装。所以,在写文章时,首先要了解一下想要投稿的杂志在稿件格式方面的规定和要求,千万不要别出心裁另搞一套。我曽接触到一些年青学者准备投寄的稿件,他们对于英文的打字和格式不甚熟悉,在这方面错误百出。这种“躐踏的面容”与“衣冠不整的着装”,有时会导致直接退稿。先从论文的序言(Introction)部分说起。在序言中应该包括以下四方面内容:你所研究的问题的领域和简明轭要的背景知识概述在这个领域前人的工作你在本工作中想要研究的问题你得到的主要结果作为审稿者,首先看你是否熟悉文献(前人做过的工作),其次看你是怎样从已有的工作中发现你的研究问题(researchquestion)。通常的情况是,你发现以前的文献中有相互矛盾的地方、以前的工作中有遗漏的因素、过去研究方法上的缺陷、或现在研究手段的攺进和提升等等,这些都会是合乎逻辑的说法。在序言的最后部分,应概述你在本文工作中得出的主要结果,会使人有兴趣继续读完你的文章。在这部分常发生的问题是,审稿者发现作者对于这个领域的历史进展缺乏了解,尤其对近期的文献没有全面的概念和理解,在序言中作者只挑选了几篇与他工作相一致的文献加以叙述,而忽略与其矛盾的报告。已经发表的工作与本文研究的问题没有内在联系,或者没有什么不同。这些都可以造成对这篇文章的较低的评价甚至退稿,因为我们期望看到是新的成果,是对已有的研究工作的推进。还有一点初学者往往不大注意的是,他必须对所用的术语(在第一次出现时)加以解释和定义,否则审稿者往往要求退回修改(不过,不致于导致退稿)。论文的第二部分,通常用“方法”(Methods)作标题。这一部分应包括如下方面的内容:实验设计实验对象或材料数据采集方法统计方法作者必须记住的一点是,你所报告的实验结果必须能被其他任何一个实验室重复,这样你的工作才有价值。所以在论文的这一部分你应提供详尽的资料,以便他人可以验证你报告的结果。有时候可能不是作者想隐瞒什么,而是文字表达的功力不夠。此时可以考虑借助图、表来表达清楚一个实验装置或实验流程。如果作卡通的话,尽量要请专业的绘画人员。有时候你用同一种方法或实验装置写了二、三篇文章,那么在第一篇文章中(假设已经发表)对实验方法作了详细叙述之后,在后面几篇文章中怎么処理?不少作者会一笔带过,要求读者去看他的第一篇文章。其实这是不对的。你可以写得简练一点,但是必须假定这是一篇独立的工作,读者应从这一篇文章中获得有关方法的完整信息。另外,记住审稿者往往是你这一领域最有经验的专家,你在研究方法中的任何一点瑕疵,都是有可能被他们发现出来的,所以这要求你在着手科研的时候,就要把各方面的问题都想到,不然到写文章时,便有点晚了。论文的第三部分是“结果”(Results)。如果在一篇论文的“前言” 中谈到本工作所要研究的问题时,提出过你的研究假设的话,那么在这个 “结果” 部分便可以与这些假设对应起来,告诉读者你的实验结果如何。记得这一部分是以“数据” 说话,不要搀和自已对实验结果的理解,以及这个结果的意义等等(这可以留在下一部分 “讨论” 中去表达)。为了把研究结果表达清楚,往往需要籍助表格或图形。这两者各有优势,采用哪一种,要视具体想表达的内容而定,目的是用最简洁的方法把研究结果讲清楚。这方面要注意的一点是,在文字、表格、和图形中所表达的内容不要相互重复。对于新手,往往会将同样一个结果,畫了图,还作成表格,还要写一大段文字重复图、表中的数据,这就显得多余了。对于某些照片的挿图(如解剖学的工作),注意要提供放大率,并对图中各个细节要有注解,不能想当然认为读者都认识图中之物。对于用数据作出的图形,要标明各坐标的含义、尺度、以及计量单位。作为审稿者,比较注意的是作者有否给出清晰、可信的实验结果(包括统计方法的正确使用及统计结果的正确解释),并且这个结果是新的,对这个领域的发展是有贡献的。现在国内许多研究工作,只是重复别人的工作,从实验方法到实验结果,没有对这个领域的进展起到任何贡献,这是急需改进的地方。在 “结果” 以后,便是“讨论” (Discussion)部分,有时也用 “结论” (Conclusion)作标题。在这一部分,应包括如下内容:在本工作中你得到什么结果?这些结果说明什么问题?本文的结果与前人的结果有何不同?你的工作有何不足之处及局限性?在这部分的最后一段中,应该总结性地叙述你的主要发现,并且指出进一步的研究方向。审稿者除了看你是否有新的结果,更注意的是你对于自已的工作成果的讨论,是否站在一个客观的立场?有没有将你的研究结果放到一个恰当的位置上。多数的初级人员往往会夸大自已的结果,举个例子来说,当他的实验发现某一个因变量(dependent variable)与一个自变量(independentvariable)高度相关后,他会下结论说,本工作发现了此自变量是这个因变量发生变化的原因。如果这个因变量是种疾病,他就会说他的这项工作发现了,这种疾病就是由上述的那个自变量(例如某种食物,或者某个外界环境条件等等)引起的。我看到过这样的稿件,显然是将两个量之间的相关性夸大为因果关系。在正文之后,还有一个重要的部分,就是“参考文献”。每家刋物对于如何在文章中引用参考文献及在最后如何列出这些文献的格式都有不同的规定,最好是仔细阅读它们的规定,还有一个实用的办法是找最近几期的你想投稿的刋物,看看在已经刋出的文章中是如果处理所引用的参考文献的。这里特别要注意,引用一篇论文与引用某本书,在“参考文献” 内的表达上有很大的区别的。初学者最容易犯的错误是,不去真正阅读这些文献,看见以前的作者引用了,他也照抄一遍,有时候便以讹传讹。这也是做科研工作不严谨的一种表现。作者的署名,严格地说来,只有真正对本工作有贡献的人才可以署名。这里的“贡献” 指以下几个方面:形成本工作的研究问题,设计本研究工作,创建关键的研究方法,收集、处理、分析、并最终表达实验数据及结果。审稿者一般无法判断文章署名是否合理与正确,这完全是取决于投稿者的科学道德。最后是文章的标题与摘要。在文章写完后,写摘要便比较容易,所以这里便不再多讲。文章的标题比较重要,我建议大部分情况下,是在整篇文章写就以后再确定标题。有点象小孩子生出来后,再取名字一样(当然也有人家是先取好名字再生小孩的)。确定标题的关键一点是要给读者提供关于本工作的具体特点与信息,避免空洞的内容。我在刚刚起步写科研文章时,往往会把标题取为:关于XXX的研究(A study onXXX),这种泛泛的标题显然除了你的工作属于哪个领域以外,没有告诉读者任何信息。一篇科研论文写完后,除了作者本人要再三酙酌,最好请与你相近的同事或同行帮助阅读一下并提出疑问及修改建议。这种学术上的相互帮助也体现一个科研单位的学术风气。在论文投寄到杂志以后,经过审稿,如果不是退稿(不彔用),多数情形下会收到修改的意见。这是一个好兆头,只要你根据所附的意见逐点修改你的原稿,基本上下一次便可以被彔用了。但是有时候,审稿者的问题太尖锐,太难解答或更改原稿,怎么办?此时千万不要发火或者有对抗情绪,可以用缓和的语气提出你的解释或不一样的思考,对于审稿者不能有不尊重的言辞,包括在他有明显的错误的理解时候,你一样要保持谦虚的态度。一般杂志在退稿时,也会附上审稿者提出的种种问题。此时你也不要气绥,试试看能否对稿件作些修改,甚至补充做一、二个新的实验,来充实你的研究结果,然后投寄到另一家杂志去试试。发表一篇论文,不单是总结你已经取得的成果,更是为跨出下一步,作好了准备。
核心期刊分为:统计源核心期刊,中文核心期刊,统计源核心期刊为中国科学技术信息研究所每年一评的期刊目录,中文核心期刊由北京大学图书馆3年一评选的期刊目录。很多单位或者是学校,在晋升和毕业时会要求发表核心期刊论文一篇甚至多篇,作者在明确自己所需期刊级别后,会抓紧时间完成论文,进行投稿,一部分可能1个月内会收到退稿通知,一部分会在投稿半年后还没有消息,也会有一小部分作者很幸运,会反复收到修改稿,修改数次后会有录用通知下发。核心期刊退稿原因有哪些?下面给大家介绍一下1.文章与期刊收稿方向不符合,这个是最重要的,文章是什么方向的,属于什么类型的,都要找到收录自己文章方向的期刊,如果你是神经内科的文章,你去投稿一本国际眼科杂志,肯定会被退稿的,因此,在投稿前,一定要查询所投期刊,近1年内有没有类似方向的稿件,再进行投稿。2.文章重复率过高,核心期刊要求文章重复率低于10%,为作者的原创文章,引用抄袭过多的,初审直接刷下去,杂志社在初审时,会进行重复率的检测,一般是知网检测,请投稿前务必先检测,高于10%的,一定要修改后进行投稿。3.文章的立题不新颖,核心期刊收录的文章,要求是具有创新性,前瞻性的文章,一篇文章,如果一直是研究10多年前或者近几年一直在研究的内容,也没有研究的价值了,选一个好的选题很重要。4.文章中所涉及到的论点,论据不充分,病例数太少等也会增加稿件的退稿率,病例数太少,数据统计分析也没有意义,论点,论据不充分,文章也不完整,因此,在投稿前一定要通读全文,务必做到有理有据。导致核心期刊退稿的原因还有很多,比如:文章内容啰嗦,不简洁,涉及到实验的次数太少等。这里不做一一介绍。投稿核心期刊,务必做到上面叙述到的4大点,相信初审肯定是没有任何问题,过了初审,进入到外审专家环节,专家外审审稿带有个人喜好,可以给到大家什么修改意见不好说,但是务必按照审稿专家的修改意见进行修改,一般都没有问题。
时间如此宝贵,投稿时不我待,审稿遥遥无期,毕业望尘莫及!这是很多已毕业或即将毕业的研究生投稿前最担心和最焦虑的事情。为了帮助大家在这个环节尽可能节省时间,做到心中有数,今天就给大家盘点一下那些审稿周期较短,审稿速度较快的杂志,希望对大家有帮助。之前做过一期生物医学类SCI期刊(审稿超快的SCI期刊汇总,总有你需要的!)、一期药学类SCI期刊(审稿超快的SCI期刊汇总,第二弹!)一期食品科学与技术类SCI期刊(审稿超快的SCI期刊汇总,第三弹!)以及一期SSCI期刊(审稿超快的SSCI期刊汇总,收藏备用!),今天我们做的是国内期刊专题,后续会继续分享各个专题审稿速度快的期刊,欢迎大家持续关注哦!1、技术经济《技术经济》是由中国科学技术协会主管、中国技术经济学会主办的全国一级学会的学术期刊,月刊,国内统一连续出版物号为CN 11-1444/F,国际标准连续出版物号为ISSN 1002-980X,邮发代号为80-584。 收录数据库:北大核心、CSSCI。北大核心北大核心是学术界对某类期刊的定义,一种期刊等级的划分。它的对象是,中文学术资讯网类期刊,是根据期刊影响因子等诸多因素所划分的期刊。北大核心是北京大学图书馆联合众多学术界权威专家鉴定,国内几所大学的图书馆根据期刊的引文率、转载率、文摘率等指标确定的。确认核心期刊的标准也是由某些大学图书馆制定的,而且各学校图书馆的评比、录入标准也不尽相同,受到了学术界的广泛认同。从影响力来讲,其等级属同类划分中较权威的一种。是除南大核心、中国科学引文数据库(cscd)以外学术影响力最权威的一种。CSSCI 简单来说:CSSCI就是中国版的SSCI。由南京大学与香港科技大学合作研制。1997年,南京大学提出研制开发电子版《中文社会科学引文索引》(CSSCI)的改想,并于1998年被作为重大项目在南京大学正式立项。1999年该项目被列为教育部人文社会科学研究重大项目,1998年南京大学与香港科技大学决定合作研制CSSCI,至2000年5月,《中文社会科学引文索引》(1998年)光盘正式出版发。该数据库选用了我国大陆出版的中文人文科学、社会科学期刊496种,该数据库的出版解决了长期以来我国社会科学研究、社会科学学术期刊缺乏定量、科学、客观评价方法和手段的困境,填补了国内外的一个重要的空白。CSSCI系统可提供我国各社会科学研究机构,高校、地区乃至学者个人的发表论文数量,期刊、论文、学者个人被引用情况,以及各种排序,由此可定量评价研究机构、高校、地区、学者个人的科研生产能力、学术成果、学术影响,评价社会科学学术期刊的质量和学术地位。收录范围:主要刊登技术经济及管理学科和其他相关学科的学术论文。主要栏目有:技术与创新管理、产业技术经济、区域技术经济、技术经济理论、技术经济分析、技术管理、创业管理、可持续发展、可行性研究、项目管理、价值工程等。网友评价:审稿周期快,1-3个月左右。2、水土保持研究《水土保持研究》创刊于1985年,双月刊,中文版,属地球科学类期刊,主管单位为中国科学院,由中国科学院水利部水土保持研究所主办。收录数据库:北大核心、CSCD、《中国科技论文统计源期刊》等。CSCD 简单来说:CSCD就是中国版的SCI。《中国科学引文数据库》(CSCD)由国家自然科学基金委员会和中国科学院共同资助,中国科学院文献情报中心承建开发。CSCD第一版(1996)收录期刊315种,第二版(1997)增加到582种,后又经过几次扩充,2000年收录1500种。该系统全面参照美国“Science Citation Index”(SCI)的编制体系,它按照“二八规律”(即80%的主要文献分布在20%的核心期刊中)粼选了我国4000余种自然科学期刊中具有较高水平和编辑质量的核心期刊。利用本库可以查找核心期刊中发表的论文及引文,更重要的是其评价功能,利用其引文数据可评价个人、实验室、学术机构的学术水平与学术地位,评价期刊质量等。中国科技论文统计源期刊《中国科技论文统计源期刊》是中国科技信息研究所(ISTIC)受国家科技部委托,按照美国科学情报研究所(ISI)《期刊引证报告》(JCR)的模式,在与国际接轨的同时,结合中国科技期刊发展的实际情况,确定了在中国出版的1405种科技期刊作为统计源期刊,选择了总被引频次、影响因子、平均引用率、基金资助论文比例等十几种期刊评价指标,利用中国科技论文与引文数据库十几年积累的丰富数据,编辑出版了《2001年度中国科技期刊引证报告》。这对中国广大科技工作者、期刊编辑部和科研管理部门能够快速地评价期刊,客观准确地选择和利用期刊提供了依据,也为广大科研人员和科技期刊客观了解自身的学术影响力,提供了公正、合理、客观、科学的评价依据。收录范围:水土保持相关研究,包括:土壤侵蚀、旱涝、滑坡、泥石流、风蚀等水土流失灾害的现状与发展动态;水土流失规律研究、监测预报技术研发成就与监测预报结果;水土流失治理措施与效益分析;水土流失地区生态环境建设与社会经济可持续发展研究;计算机、遥感工程、生物工程等边缘学科新技术、新理论、新方法在水土保持科研及其实践中的应用;国外水土流失现状及水土保持研究新动态等。网友评价:审稿速度快,从投稿到录用大概1-2个月。3、重庆理工大学学报(社会科学)《重庆理工大学学报(社会科学)》1987年创刊,现为《中国人文社会科学期刊评价报告(2018年)》A刊核心期刊,RCCSE中国核心学术期刊,《世界学术期刊学术影响力指数(WAJCI)年报》Q2区期刊。收录范围:智库专稿、逻辑与科学方法论、能源与环境经济、经济学、管理学、法学、马克思主义理论与实践等。网友评价:审稿1个多月,版面费2500左右。4、世界地理研究《世界地理研究》杂志是中国科学技术协会主管、中国地理学会主办的学报级学术期刊,创刊于1992年,目前是中国中文核心期刊,也是中文社会科学引文索引(CSSCI)扩展版来源期刊。收录范围:世界政治与经济地理理论及实证研究;全球经济联系和经济要素空间运动规律;世界各国区域发展、城乡建设、生产布局、产业结构变动理论与实践;世界热点地区形成的地理背景分析;世界地理教育改革和世界各国地理学发展动态等。网友评价:审稿1个月左右,版面费2000-3000元。5、西南金融《西南金融》是由中国人民银行成都分行主管,四川省金融学会主办的金融类综合性学术期刊,入选2004版、2011版和2017版“中文核心期刊要目总览”;2018年11月,被中国社会科学研究院评定为“中国人文社会科学期刊AMI综合评价”A刊扩展期刊。收录范围:政策研究、银行管理、风险管理、证券与保险、互联网金融、农村金融、金融与法律、货币政策、金融监管、区域经济等重点栏目,为广大经济金融科研工作者和金融机构实务工作人员提供论战的前沿阵地。网友评价:审稿1个月左右,不受版面费!以上是5本审稿周期较短,审稿速度较快的国内期刊。后期我们会继续推出各个领域、审稿超快的国内期刊汇总信息,希望大家持续关注哦!
SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以 SCI 最为重要。 在知乎搜索“SCI”,网友这样说:“中五百万都比不过发5篇SCI论文!”“论文发到SCI,单凭名号就可以横着走了” 进入到SCI这一刊物的论文,即为大家普遍理解的SCI论文。不得不说,SCI的发表收录,可以说是研究人员心中永不过时的富察容音。发期刊,“难者不会,会者不难”。 今天,就给你开扒一下关于SCI的那些事儿。 SCI的重要性何在?“本质上,SCI通过文献分析法,对学术期刊和科研成果进行多方位的评价研究,从而评判一个国家或地区、科研单位、个人的科研产出绩效,来反映其在国际上的学术水平。” 说到这里,就不得不说一下SCI的核心评价指标。SCI是通过收录期刊论文,统计论文在固定的时间段(通常是前两年)内被引用的频次,除以这一时期内的论文总数,即为该刊物的影响因子(Impact Factor, IF);最终通过以影响因子为核心的标准(其他因素包括及时指数,被引用的半衰期等)来评判一篇期刊论文其在学术领域内的影响力。 按照这样的标准,从论文作者的角度,其论文的影响因子越高,在SCI的引文索引数据看来,就可以反应其在学术领域内科研水平更高,其研究能力越强,以及对整体学术领域发展的作用越大。 哪些学科论文会被SCI收录?包括农业,生物学,环境科学,工程技术,应用科学,医学与生命科学,物理学,化学,经济学等自然科学各学科的核心期刊约3500种。 SCI征稿有哪些类型?一般分为正刊,特刊(具备特定主题的正刊,比如肿瘤代谢领域的研究发展,会添加special issue的字样),增刊(supplementary issue),会议集,新闻,以及编语。 发表SCI的基本要求是什么?Clarity(清楚):在概念,逻辑,层次以及表达层面的要求Completion(完整):在内容跟结构上的要求,即“有始有终”Correctness(正确):数据正确,逻辑正确,内容正确,以及语言正确Concision(简洁):表达简洁,逻辑清楚Consistency(一致):前后逻辑,表达,数据分析,结论一致审理流程以及周期如何?国际期刊是主编(Editor-in-Chief)负责制,且基本不受外部行政因素影响。一般在论文投稿后,4-6周的工作日之内,就会收到编辑回复的意见(accept/接受,modify/修改,以及reject/拒绝),一般的意见回复周期不会超过8周/两个月。审稿一般会有初选,送审,修改以及终审这几个环节。在初选后,将以主编为核心,由区域编辑/编委会等人员首先进行内部审核,在保证了论文的内容以及格式都符合基本要求的基础上,进行外部审核。如果上述的流程没有问题,终审将决定论文是否被接受,以主编或者副主编的意见为标准。 中间编辑会随时跟论文作者联系,进行论文的修改。根据经验,能够3个月确认SCI,说明文章没有大错误,仅有小部分语法及标点问题,是非常理想的状态。正常状况会有6个月及其以上的确认周期,中间需要经历跟编辑的不断沟通以及论文的修改。 是否有格式及内容的要求?Article类型Title(题目)Abstract(摘要)Introction/ Background(前言)Material and Method(材料与方法,即实验报告部分)Result(结果)Discussion(论证)Reference(引用)Acknowledgement(致谢)Review类型Title(题目)Abstract(摘要)Introction/ Background(前言)Theme Discussion(主题讨论)Reference(引用)Acknowledgement(致谢)
新智元原创 来源:reddit、twitter、ICML2019编辑:金磊【新智元导读】人工智能顶级会议ICML 2019发布了今年论文录取结果。提交的3424篇论文中,录取了774篇,录取率为22.6%,较去年有所降低。从录取论文数量来看,谷歌成为今年最大赢家,紧随其后的是MIT和伯克利。ICML 2019论文录取结果出炉,你中了吗?一时间,网友们可高兴坏了,纷纷晒帖表示“我中了!我中了!”据了解,今年ICML共提交3424篇论文,其中录取774篇,论文录取率为22.6%。录取率较去年ICML 2018的25%有所降低。目前,所有录取论文已经在官方网站公布,若有投稿的读者,可自行前往下方链接查看论文是否被录取:https://icml.cc/Conferences/2019/AcceptedPapersInitial?fbclid=suSj3J2QrrRAQ谷歌成为最大赢家,MIT、伯克利紧随其后Reddit网友发表了他和他的公司对本次ICML 2019论文录取情况的统计结果。地址:https://www.reddit.com/r/MachineLearning/comments/bn82ze/n_icml_2019_accepted_paper_stats/今年,在所有录取的论文中,谷歌无疑成为了最大赢家。录取论文总数排名(按研究所)上表显示了以研究所(包括产业界和学术界)为单位,录取论文总数的排名。这项统计中至少有一位作者隶属于某研究所,因此一篇论文可以出现多次且隶属多个研究所。排名地址:https://i.redd.it/wdbw91yheix21.png其中,蓝色代表论文总数,绿色和红色分别代表第一作者和通讯作者参与录取论文的论文数量。并且,附属机构是手动合并到研究所的,例如Google Inc.、Google AI、Google UK都将映射到Google。可以看到谷歌录取论文的数量远超其它研究所,位列第一;紧随其后的是MIT、伯克利、谷歌大脑、斯坦福、卡内基梅隆以及微软。作者还分别根据学界和产业界进行了统计Top 50排名。排名统计可视化地址:https://i.redd.it/37hxhsmfzix21.png在学界排名中,MIT、加州伯克利分校、斯坦福和卡内基梅隆夺冠前四,成为本届录取论文数的第一梯队,且与第二梯队拉开了一定差距。排名可视化地址:https://i.redd.it/wa6kjzmhzix21.png在企业研究所Top 50排名中,谷歌无疑成为最大赢家:谷歌、谷歌大脑和谷歌DeepMind分别取得第一、第二和第四的好成绩。微软、Facebook和IBM成绩也较优异,位居第三、第五和第六。而对于国内企业,腾讯(Tencent)成绩较好,位居第八名。此外,从本届ICML 2019录取论文情况来看,还可以得到如下统计:452篇论文(58.4%)纯属学术研究;60篇论文(7.8%)来自工业研究机构;262篇论文(33.9%)作者隶属于学术界和工业界。总结上述的统计,我们可以得到如下结果:77%的贡献来自学术界;23%的贡献来自产业界。伯克利两位研究人员分别被录取7篇和6篇论文!根据今年录取论文情况,还得出了基于论文作者的排名统计情况。排名地址:https://i.redd.it/r2drkqkkeix21.png上图中根据论文唯一作者(黄色)、第一作者(橙色)、通讯作者(绿色)及论文总数(蓝色)进行了统计。来自加州大学伯克利分校的Michael Jordan被ICML 2019录取了7篇论文,成绩是相当的惊人!紧随其后的是Volkan Cevher(EPFL)和Sergey Levine(加州大学伯克利分校),各被录取6篇。同样令人印象深刻的是,大量的研究人员拥有两篇或两篇以上的唯一作者或第一作者论文。这一排名中,来自谷歌的Ashok Cutkosky遥遥领先,他有一篇唯一作者论文、一篇第一作者论文和一篇普通作者论文。Simon Du (CMU)和Jayadev Archarya (Cornell)的结果也是较为瞩目的,他们分别发表了三篇第一作者论文。排名地址:https://i.redd.it/1mo7is3meix21.png根据通讯作者的排名,或许我们可以从中发现更多的资深人士。相对贡献排名最后这项排名是根据相对贡献来排名的,即一篇论文中有多少作者实际上来自某个研究所。排名地址:https://i.redd.it/o1783e2oeix21.pngICML 2019如何评审论文?新智元此前做了ICML 2019评审结果一出,便遭到了众网友讽刺的相关报道。我们先来看下ICML 2019的论文评审机制:双盲评审ICML 2019论文评议采用双盲模式; 即审稿人不知道作者的身份,作者也不知道审稿人身份。请尽可能以第三人称的方式引用自己之前的成果,请不要在提交的论文中添加致谢、以及公共github存储库链接。如果需要匿名引用,比如参考自己在其他地方正在评议中的成果,请将此成果作为补充材料上传。匿名是强制性要求,明确或隐含地揭示作者身份的论文可能会被拒稿。审稿人可以通过外部资源来推断出作者的身份,比如在网上发布的技术报告。这一点并不违反双盲审稿政策。关于补充材料本届ICML大会支持提交两种补充材料 - 补充论文和代码/数据,这些补充内容可用于提供额外证据支持。如果作者在论文中进行匿名引用,请务必上传参考文献,以便审稿人可以快速查看。请注意不要在补充材料中透露作者的身份。关于代码提交,我们希望作者能够合理地以匿名形式提交代码和所在机构。即删除作者姓名和许可信息。ICML 2019允许通过匿名github存储库提交代码。但是,这些代码必须位于在提交截止日期后不可修改的目录中。请在提交的zip文件中的独立文本文件中输入github链接。请注意,提交的论文必须完全独立。大会提倡审稿人查看作者提交的补充材料,但审稿人并没有此义务,我们也不希望给审稿人带来不必要的负担。作者不得利用辅助材料来延长论文长度。如果作者认为该材料对评估论文至关重要,则需要将其包含在论文中。补充材料可以zip文件或pdf格式提交。补充材料不公布、不存档。如果要将其包含在论文的最终版本中,则必须将材料放在网站上,并在论文的最终版本中引用该网站。审稿人匹配为了找到适合作者提交论文的合适审稿人,我们将使用多伦多论文匹配系统(Toronto Paper Matching System)来进行协助筛选。作为提交过程的一部分,作者需要允许使用“论文匹配服务”的许可,向ICML2019提交论文的作者应允许使用该服务。关于一稿多投提交与之前已发布或已接收的相同(或基本相似)的论文,或向其他会议同时提交相同论文是不合适的。此种行为违反了我们的一稿多投政策。这个规则有几个例外:允许提交已提交给期刊、但尚未在该期刊上发表的论文的精简版本。作者有责任确保相关期刊允许向本会议同时提交相关论文。下列情况下的论文允许提交:在未列入Proceeding的情况下,在会议或研讨会上提交或待提交的论文(例如ICML或NeurIPS研讨会),仅发表过摘要部分的论文。曾作为技术报告提交的论文(或在arXiv中已提交的预印本)允许向本届ICML提交。在这种情况下,我们建议作者不要引用该报告,以保持匿名性。论文作者对审稿意见的回复目前暂定3月9日到3月14日期间,作者可以查看评议意见,并发表回复内容。作者的回复的目的是改变审稿人对论文的判断,回复内容最长不超过5000个字符。论文的任何一位作者都可以输入/编辑作者回复,回复内容可以进行编辑或还原,直到截止日期为止。论文审稿是双盲的。请勿在回复中包含可识别出作者/共同作者的任何信息。请勿在回复中包含任何网址。作者在拟定回复内容时应该做好判断。没有必要对每个小问题或改进建议逐一回复。而应该将这些回复视作解决问题的好机会,比如针对审稿人对论文的某一点不确定、审稿人做出的错误假设、或者审稿人误解了论文中的某一部分等问题进行解释。我们建议在作者回复意见中保持礼貌和专业。ICML 2018:录取率25%,两篇最佳论文回顾机器学习顶会ICML 2018于7月10日~15日在瑞典首都斯德哥尔摩举办,2018年ICML共收到2473篇投稿论文,比2017年的1676篇增加了47.6%。最终入选的论文一共621篇,录取率25%。ICML 2018最佳论文奖有两篇获奖论文,第一篇的作者分别是来自 MIT 的 Anish Athalye 以及来自UC Berkely 的 Nicholas Carlini 和 David Wagner,另一篇的作者则全部来自UC Berkely。最佳论文一:Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial ExamplesAnish Athalye (MIT), Nicholas Carlini (UCB), David Wagner(UCB)论文地址:https://arxiv.org/pdf/1802.00420.pdfGitHub:github.com/anishathalye/obfuscated-gradients基于神经网络的分类器通常被用于图像分类,它们的水平通常接近人类。但是,这些相似的神经网络特别容易受到对抗样本和细微的干扰输入的影响。下图是一个典型的对抗样本,对原图增加一些肉眼看不见的扰动后,InceptionV3分类器把猫分类成了鳄梨酱。根据Szegedy等人2013年的研究显示,这种“愚蠢的图像”仅用梯度下降法就能合成,这类发现为物体检测研究敲响了警钟。在这篇论文中,作者评估了ICLR 2018接收的9篇论文,并测试了它们面对对抗样本的稳健性。实验结果证实,在8篇有关对抗样本的防御机制的论文中,有7篇的防御机制都抵挡不住论文提出的新型攻击技术,防御水平有限。最佳论文二:Delayed Impact of Fair Machine LearningLydia Liu, Sarah Dean, Esther Rolf, Max Simchowitz, Moritz Hardt (全员UCB)论文地址:https://arxiv.org/pdf/1803.04383博客:r.berkeley.e/blog/2018/05/17/delayed-impact/机器学习的基础理念之一是用训练减少误差,但这类系统通常会因为敏感特征(如种族和性别)产生歧视行为。其中的一个原因可能是数据中存在偏见,比如在贷款、招聘、刑事司法和广告等应用领域中,机器学习系统会因为学习了存在于数据中的历史偏见,对现实中的弱势群体造成伤害,因而受到批评。ICML 2019也即将在6月9日召开,对于今年的最佳论文,我们也可以抱以期待。那么,今年的ICML 2019,你的论文被录取了吗?参考链接:https://www.reddit.com/r/MachineLearning/comments/bn82ze/n_icml_2019_accepted_paper_stats/https://twitter.com/search?q=ICML2019&src=typdhttps://icml.cc/Conferences/2019/AcceptedPapersInitial?fbclid=suSj3J2QrrRAQ
学术圈迎来很多新人,这是因为学术热造成的,如今很多的人去选择做学术,各大高校也不断扩招硕士、博士,我们享受到了科研带来的改变,也更加重视科研。但是在如今的科研文献中,出现了良莠不齐的现象,有很多理工科的数据、特别是化学、物理、医学、材料学领域,很多研究数据出现了一些问题,这是因为当初实验不严谨造成的,但是后人也很少进行重复的验证实验,导致这些错误的数据被大家引用,导致新论文也出现了错误。如今很多期刊杂志意识到了这种情况,如果发现有错误的引用数据,都会直接拒稿,为什么会造成实验数据的错误呢?小易给你分析一下。第一个原因,论文的统计的前提条件没有说清楚,让读者没有全面的了解,导致出现不同程度的错误,在数据分析之后,很多认对数据不敏感,没有正确的统计样本的大小,这时候就会出现标准的误差;这就非常考验研究人员的数据分析能力,正确使用数据才能得到正确的结论。第二个原因,论文的理论性比较强,缺乏数据的支撑,没有进行严格的数据统计筛选,特别是遇到跨学科的研究,这时候数据的分析非常难,考虑的因素更多,这时候研究人员一般都是按照自己的理论进行分析,轻视了数据的作用,对数据一笔带过。第三个原因,实验数据采集不够,这是一个常见的现象,样本的数量,样本的大小,都会对实验的结论产生重大的影响,在理想状态下,足够多的样本,经过实验,筛选出有用的数据,但是实际过程中,就不好控制样本的规模,得出的结论也就不一样。第四个原因,实验的时候会设置对照组,如果对照组没有随机选取,也有很大的误差,如果对照组的样本出现特殊情况,那么这个实验就不够准确了。在论文发表的时候,往往数据分析的错误是一个大问题,得出的结论是不准确的,论文需要大改,这种情况,期刊一般就会选择拒稿。如今很多高影响因子的期刊,除了审稿人审核之外,还会请相关专家对论文内容进行评估,这样才能保证论文的高质量。再次给广大科研人员提个醒,在研究之余,还要学好文献中的分析与统计方法,才能更好的进行论文创作。你们怎么看?欢迎在下方留言评论!
今天分享一篇生信文章,这篇有一个非常牛的地方:从投稿到接收就用了20来天。这篇文章所在的期刊不是那些箩筐OA期刊,而是一本影响因子高达3.656的非OA期刊——Journal of Cancer Research and Clinical Oncology,中科院最新分区——2区,审稿周期:非常快,一般一个月以内,不在中科院发布的国际预警期刊名单上。这篇文章做的内容非常少就两张图和两个表格,作者是采用收集临床数据分析+采用TCGA数据挖掘的模式。研究内容就做了基线数据的统计、marker基因的免疫组化分析、绘制生存曲线、单因素Cox回归分析、多因素Cox回归分析。跟以往的文章作者不一样,这篇文章的作者不是国内的研究人员,而是来自意大利的研究人员。文章题目:In search for biomarkers and potential drug targets for uterine serous endometrial cancer分析内容:1、第一个表格(基线数据的统计)2、第一张图(绘制生存曲线)3、第二张图(maker基因免疫组化分析)4、第二个表格(单因素cox回归分析、多因素cox回归分析结果汇总表)