欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
《统计与管理》杂志征稿函明希

《统计与管理》杂志征稿函

《统计与管理》杂志简介《统计与管理》创刊于1986年,是由河北省统计科学研究所主管和主办的集学术性、知识性、实用性和资料性于一体的综合性刊物,成为广大读者获取社会经济的捷径、了解省情省力的窗口。办刊宗旨:面向读者、立足统计、反映经济、服务社会。读者对象:全国统计系统、经济部门、企事业单位、大专院校。《统计与管理》荣获1996年获河北省期刊“经营管理奖”、1998年获河北省期刊“设计优秀奖”。投稿要求一、《统计与管理》摘要与关键词:文章要提供100-200字的摘要,客观反映论文的主要内容;提供3-5个关键词,用分号隔开;撰写的文章字数以2500-4500字为宜。二、《统计与管理》作者简介:姓名(出生年月)、性别、工作单位、邮政编码、职称、职务、学历、主要研究方向等(研究生须注明博士研究生或硕士研究生)。三、《统计与管理》注释:注释序号(上标)用带圆圈的阿拉伯数字表示,附于文末。四、非正式出版物(如博士或硕士学位论文)、未正式发表的讲话等不能作为参考文献引用。五、参考文献的格式:1、参考专著:[序号]作者.书名.出版地:出版社,出版年。2、参考报纸、期刊:[序号]作者.文题.报刊名,出版年,卷(期、版次),其止页码(具体情况可以参照国家GB7714-87“文后参考文献著录规则”)。六、资助项目需注明资助者、项目编号。 七、体例要求:以“一”、“1”、“(1)”作为文章层次,(1)之下以小标题方式提炼主要观点。八、图表要求:表格:将表名置于表上方居中;图:将图名置于图下方居中。表、图内文字统一用楷体。九、为便于稿件的修改及联络,请作者提供联系方式:通信地址:邮编、电话、手机、电子信箱等。十、来稿一律通过电子邮件(WORD文档附件)发送,严禁抄袭,文责自负,来稿必复。来源:无忧文秘新学术 微信公众号无忧文秘新学术更多价值资讯请来,无忧文秘新学术

民之理也

打造世界级多学科统计研究平台

12月4日至6日,“2020深圳统计与数据科学国际前沿论坛”在南方科技大学举行。11位统计和数据科学大咖齐聚一堂,带来水平顶尖的学术报告。专家学者们围绕统计、数据科学等主题展开了交流和讨论,聚焦行业前沿焦点。据悉,参加此次论坛的专家阵容十分强大。除了中科院院士马志明、鄂维南、徐宗本,享有盛名的统计学界杰出学者范剑青等,还有深耕于业界的资深专家,如滴滴统计学首席科学家朱宏图教授等。主办方表示,希望此次论坛可以为来自国(境)内外统计学者提供一个自由的交流平台,就全球统计与数据科学前沿领域的发展现状和趋势,以及在相关领域科学研究、技术创新、应用推广等方面面临的机遇和挑战进行深入探讨。因为疫情的原因,论坛采取线上、线下相结合的方式进行,影响力进一步扩大。此次论坛的主办单位为南方科技大学统计与数据科学系。统计与数据科学系是南科大一个“年轻”的系,2019年4月才建立。系主任邵启满在接受记者采访时表示,虽然统计与数据科学系成立只有一年多时间,但发展迅速。到目前为止,已有12位专任教师和4位双聘教师,主要涵盖统计与数据科学基础理论、生物医学统计、金融统计、数据科学等研究领域。“我们不仅已有统计学本科专业,同时已申请数据科学本科专业。此外,也有硕士和博士授予权。”邵启满表示,统计与数据科学系已经搭建了完备的本硕博人才培养体系。邵启满表示,人工智能的时代已经到来,统计学开始渗透到各行各业之中,逐渐成为一门综合性、多科性的学科。“我们目前正处在一个人工智能迅速发展的时代,大数据、人工智能的发展与统计学息息相关。其中,《粤港澳大湾区发展规划纲要》中提出了共建粤港澳大湾区大数据中心的指示。”邵启满表示,南科大统计与数据科学系“生逢其时”。而有了统计学这个“支点”,也可以“撬动”多个学科的交叉融合。10月揭牌的南科大生物医学统计中心就是最好的例证。邵启满说:“生物医学统计中心已经与南科大医学院、生物系、化学系、深圳应用数学中心、南科大医院、深圳市儿童医院等科研机构和院系建立紧密联系,联合开展生物医学领域的研究。”邵启满表示,未来,统计与数据科学系还将继续致力于多学科交叉发展建设,打造一流的交叉学科科研平台,如金融统计中心、数据科学中心等。谈及未来的规划,邵启满表示,未来将继续致力于汇聚培育一流的师资队伍,打造世界级多学科交叉创新的统计研究平台。如:利用学校及学院的优势和特色,发展优势学科,努力打造独具特色的一流统计与数据科学学科,培养大批相关领域拔尖创新人才,早日实现建设国际一流的教育培养和研究基地的目标。“我的愿望是希望经过5至10年的努力,在中国的南方有一个可以被人记住的统计与数据科学系,会自然地想到南方科技大学。”邵启满充满期待地说。 (文章来源:深圳商报)

落山风

ACL 2020投稿破 3 千,到底有多少人在做 NLP 研究?

科学出版的世界是一片雨林:思想争夺阳光/注意力;有些人胜出并变得更高,而其他人则被遗忘。雷锋网AI科技评论按:在昨天ACL 2020公布了最新的投稿数量:3429篇。这也是所有ACL旗下会议首次接收论文数量破 3000篇。这引起了笔者的好奇,历届 ACL 都接收了多少文章呢?当前做NLP的研究人员数量在什么量级呢?目前最热的研究领域是什么呢?笔者在搜索相关资料的时候,无意间发现就在前不久已经有人做了更为详细的调查和分析,这是位匿名者。研究内容发表在medium上,账户也是新注册的。笔者顺藤摸瓜,找到了他的调查研究论文《The State of NLP Literature: A Diachronic Analysis of the ACL Anthology》,论文内容丰富多样,调查了ACL Anthology(AA)相关的所有论文,范围从1965年到2018年。在论文首页底部他也写了,匿名是因为这项工作目前还没有正式发表。且先不追究这位作者是谁,雷锋网从报告及他的博客中撷取部分内容,来了解 NLP 领域 50多年来的发展态势。共有八问——1、NLP领域每年发多少论文?2、有多少人在做 NLP 研究?3、哪个会议/期刊的论文最多?4、NLP领域,女性喜欢做什么研究?5、NLP领域,年轻人真的越来越多了吗?6、对哪种语言的研究最多?7、哪个领域最热?8、谁的影响力最大?1、NLP领域每年发多少论文?截至2019年6月,AA拥有约50,000个条目,但其中包括一些并非真正的研究出版物的条目(例如,前言、序言、目录等),将这些舍弃后,还剩44,896篇文章。上图中显示了从1965年到2018年期间,每年发表的论文数量。从图中可以看出:1)1990年之后,NLP的研究开始突飞猛进,特别是在2000年之后,AA文章数量开始破千;2)隔年出版的影响在图中可以清晰看到,特别是1998年以来,类似LREC、COLING这样的会议。2、有多少人发论文?除了隔年出版的会议影响外,我们可以看出一个明显的趋势,即从事NLP研究的人数在不断增长。一个进一步的有趣的问题是,发表论文的人到底有多活跃呢?这很难确切回答,但我们可以将一段时间里的人数累加起来看,例如在2017年和2018年(至少2年)发表了至少一篇论文的人大约为12k(精确来讲是11957);在2015年至2018年(至少4年)发表了至少一篇论文的人大约是17.5k(精确为17457)。3、哪个会议/期刊的论文最多?当然是各种 workshop 了!这张图展示的是不同会议或期刊的收录论文情况。从中可以看出,除了各种workshop论文外,LREC已经成为NLP会议论文的最大单一来源(尽管LREC是一个相对较新的会议,每两年召开一次,但它的接受率往往很高,约60%)。其次则是主会ACL/4839,COLING/3142,NAACL/1479……4、NLP领域,女性喜欢做什么研究?NLP领域和其他领域一样,并不会记录作者的个人信息,例如性别、年龄、语言等。但这并不代表我们没有办法研究性别分布——作者的名字往往会蕴含着性别信息。根据这个信息,这位匿名作者利用美国社会保障局发布的新生儿姓名和性别数据库进行匹配识别。(作者注:由于中文名字的拼音与性别识别的关联较小,因此中文作者的性别较难识别。)1)女性发表的论文占多大比例?下面这幅图是女性作为第一作者在历年论文中所占比例经过统计,女性作为第一作者发表论文数量约26637篇,大约占总论文数量的30.3%。从时间线上来看,从1980年至今,女性第一作者论文比例总体来说变化不大,但近年来却有稍微的下降趋势。尽管30%的比例,相较于计算机科学的其他子领域已经比较高了,但离男女势均力敌还比较遥远。2)女性喜欢做什么研究?作者还做了一个有意思的统计,依据关键词来看女性第一作者的分布。从图中可以看出,女性的工作在discourse、annotation、study、corpus等领域所占比例较多,而例如parsing、dependency、model等则相对较少。5、NLP领域,年轻人真的越来越多了吗?如果能去调查NLP研究人员的实际年龄分布,当然是一件有趣的事情。但很遗憾,目前没有这样的信息。于是这位匿名作者另辟蹊径,提出了:NLP学术年龄。如果一位研究人员是第一年在AA上发表,那么这个研究人员的NLP学术年龄是 1 ;如果是在2001年发表第一篇AA论文,并且在2018年发表了最新的AA论文,那么他的学术年龄是18。首先来看NLP研究人员的在每一年的平均学术年龄分布——从上图看出:1)2018年的平均学术年龄为5.41年;2)NLP研究也在逐渐走向“老龄化”;3)直到 2016、2017年,研究人员的平均学术年龄在不断增长,但随后却开始下降了,这个可以从下图中看得更加清楚一点——作者统计了每年学术年龄的中位数,1965年至1990年大部分时间的平均年龄为1岁,1991年至2006年大部分时间的平均年龄为2岁,2007年至2015年大部分时间的平均年龄为3岁,此后又回到2岁。这大概是 NLP 领域的“返老还童”吧!我们还可以从另一个角度来看,作者统计了每年首次发表论文的作者比例,在1965年-1985年期间,这个比例逐渐下降;随后到2005年基本稳定在40%-50%之间;然后2005年到2015年则下降到40%上下。这也说明了从1985年之后,NLP社区已经趋于成熟稳定。不过我们有趣的是,从2016年之后,这个比例又开始逐渐上升了。(注:这个比例明显会受到奇偶年的影响)再详细一点,我们来看 2011 - 2018年,不同学术年龄之间的比例:其中2018年首次发表论文的作者占到44.93%,而学术年龄不到5年的作者比例占到65%。事实上,该数字自1965年以来一直在稳步下降,在1990年代为60%至70%,2000年代初上升到70%至72%,然后再次下降,直到2010年达到最低值(约60%),并再次稳定上升,直到2018年(65%)。因此,如果不是去回顾历史的话,我们常常会感觉最近的会议上有大量新人涌入,虽然这是事实,但也是错觉。事实是,现在(2018年),NLP领域的平均学术年龄要比历史上许多时候都要高,年龄大的(因此也是经验丰富的)人所占的比例要更多。6、对哪种语言的研究最多?正如维特根斯坦所说:“我的语言将限制我的世界”,对于一个语言群体也是如此。能否将其所使用的自然语言融入到自动系统(例如计算机)中,以及融入程度如何,是决定使用该语言的人群在网络世界中影响力的关键因素。我们知道,当前的NLP研究主要是针对英语/英语数据集。原因很多,这里不再赘述;这种现象就会造成一个现象,即当研究课题是非英文语言时,往往会在文章标题中显示出语言的名字。作者据此观察,统计了如下的表格,共有122种语言:图中字体较小,但大致是颜色越深,标题中出现的频率越高。从中可以看出中文的研究是所有非英语中频率最高的,且远远高于其他语言(例如法语、日语等)。注意,这里英语的频率并不是第一,原因是大多针对英语的研究并不会在标题中表示。现在社区中有越来越多的人意识到这是不正确的,这对其他语言是不公平的,因此有人建议应当在所有研究的标题和数据集名称中注明所研究的语言。7、哪个领域最热?从1965年至今,NLP领域的研究热点是怎么变化的呢?这是一个有意思的问题。由于AA文章往往不要求作者提交关键词,因此要想统计文章的研究方向,最便捷的一种方式就是——从标题中提取关键词。这里作者做了假设,认为标题内容是和文章研究主题一致的。Sneha Kulkarni曾表示:“一个好的研究论文标题,应当满足三点,1)用尽可能少的词概括论文的内容;2)吸引到读者的注意力;3)将论文与同一领域的其他论文区分开。”如果按照这个理想规则,那么使用标题来提取关键词应该会具有一定的代表性。(当然实际上还会有许多要考虑的因素,这里不再赘述)。因此,作者的假设,再具体一点就是:随着时间的流逝,与该领域相关的标题词的出现频率,将在某种程度上反映出对某个研究领域的广泛兴趣。那么,在过去这些年里,哪些才是热门呢?作者统计了从1980年到2019年的论文,如下图从术语分布来看,NLP论文标题中最常用的术语是language,其次是translation。如果考虑bigram的话,如下图:最常出现的术语是machine translation,毫无疑问,机器翻译是NLP领域最受关注的研究领域之一。我们再来看不同的研究领域随着时间线的变化:(注:图中有个小错误,parsing对应于浅绿线)从这张图中可以看到一个非常有意思的现象,即,在1980年-2008年之间近三十年的时间里,language、translation、parsing在80年代炙手可热,而现在已经远不如当年受欢迎了;而另一方面,neural在80年代经历了一段高潮之后,迅速下降,但近年来却又突破重围,再次超越而出。我们可以把parsing的时间线单拎出来:真的是不复当年!另一个有意思的是,可以对比statistical machine, neural machine 和 machine translation在近40年里的变化趋势:统计机器经历过一段高潮之后,现在已经基本销声匿迹了;而神经机器则随之崛起。正所谓“沉舟侧畔千帆过,病树前头万木春”!8、谁的影响力最大?引用率并不一定能反映一篇文章的质量或重要性,但却是一个重要的参考。作者指出:“对于为什么有些论文会被大量引用,而有些不会,很难说清,论文被高引,可能是引起了该领域的想象力,也有可能是它们极具创造力,或者开辟了一个新的研究领域,在很大程度上推动了技术发展,检验了令人信服的假设,或者产生了对多数人有用的数据集等等。”作者从Google Scholar上对4万多篇论文的引用率进行提取,获得了33,051篇论文的引用信息。下面两张图,是同一个信息,但按照不同的顺序排列的——第一张,按照相关所有论文的引用总数排列,可以看做机器翻译是总引用率最高的,其次是统计机器、情感分析。但是这种方式有其弊端,即不同领域,发表的论文数量也不相同,于是作者又按照平均引用率进行排列,这就给我们展示了另外一种视角:从中可以看出,自动评估才是引用率的王者,语料库和词汇资源才是广受欢迎的宠儿。所以,要想高引,还是要做资源建设呀。作者别具一格地结合了学术年龄,来分析学术年龄对引用率的影响。从中可以看出,在论文数量和总引用率上,学术年龄为1年和(10-14)年的是NLP的主力军。在平均引用上,7年的学术年龄是最好的。倒U形的分布也很好理解,人们普遍会引用年限不是很久远、但也不是刚刚出炉的论文。对于那些学术年龄在35-50之间的,平均引用率则普遍低到可怕。针对引用率,作者也做了性别分析:显然,无论是总引用率、总论文数,还是平均引用、中位数引用,男性都要比女性高。(其中的unknown是考虑到有大量来自中国的论文作者,该研究作者不知道如何区分他们的性别)作者也做了性别相关引用在时间跨度上的分析请注意,女性第一作者在ACL的历史上一直是少数派; 但是平均而言,她们在早期(1965年至1989年)的论文被引用的次数明显多于同期的男性第一作者。从图中可以看出,这种情况在1990年代有所改变,男性第一作者的论文平均获得了明显更多的引用。引用差距在2000年代大大减少,2010-2016年期间引用差距进一步缩小。有趣的是,在2000年之后,性别未知的作者几乎弥合了与男性作者之间的差距。作为中国人,笑而不语啊!

卡迪什

日本统计研究发现:中美合著论文数量近些年激增

原标题:日本统计研究发现:中美合著论文数量近些年激增参考消息网8月12日报道 据日本《每日新闻》8月11日报道,日本文部科学省科学技术与学术政策研究所分析了2015年至2017年间多国研究人员合著论文的情况,发现美国研究人员的合著对象最多的是中国研究人员,其数量和近10年与英国、日本等国家的合著数量相比激增明显。日媒称,随着中国研究实力的崛起,美国深化了在科学研究层面与中国的合作关系。报道称,日本文部科学省按照研究人员所属机构的所在国分析了全球出版的论文,得出了三年的平均值。美国合著对象国的占比在2005年至2007年的情况为:英国12.9%,排名第一;中国8.7%,排名第四。然而,在10年后的2015年至2017年,中国占比大幅增加至24.3%,跃居首位;英国占比13.9%,降至第二。报道指出,中国的研究活动非常活跃,论文数量激增至10年前的近4倍。中国赴美在科学工程领域深造的研究生数量逐年增加,在美国从事研究的中国籍研究生2017年约有8万人。这些年轻人回国后可能会继续与美国的科学家合作研究,这或许是中美合著论文数量激增的一个原因。报道还称,2005年至2007年,日本和中国在国际合著论文数量上都是年均1.8万篇左右,但到了2015年至2017年,日本为2.59万篇,中国为8.05万篇,差距逐渐拉大。另一方面,日本国际合著论文占其论文总量的比例为32.9%,高于中国的27%。日本与中国最大的合著对象国与10年前一样,都是美国。更多资讯或合作欢迎关注中国经济网官方微信(名称:中国经济网,id:ourcecn)来源:参考消息

似趼

ACL 2018|印度统计研究所:使用CNN进行文本多选问题回答

这是读芯术解读的第132篇论文ACL 2018 Short Papers使用CNN进行文本多选问题回答CNN for Text-Based Multiple Choice Question Answering印度统计研究所Indian Statistical Institute本文是印度统计研究所发表于 ACL 2018 的工作,在本文中,我们提出了一个卷积神经网络(CNN)模型,用于基于文本的多选问题的回答,其中问题是基于一篇特定的文章。给定一篇文章和一个多选问题,模型为每个问题选项元组分配一个分数,并选择出最终选项。我们在Textbook Question Answering(TQA)和SciQ数据集上测试模型。最终证明我们的模型在两个数据集上优于几个基于LSTM的基线模型。引言根据特定文本回答问题需要不同的技能。它需要查找能力、推理能力、执行简单数学运算的能力(例如,回答以下单词出现过多少次这样的问题?),能够合并多个句子中包含的信息。这种多样化的技能使问题回答成为一项具有挑战性的任务。问答(QA)近年来出现了更具挑战性的数据集和新架构的激增。问答任务可能需要系统对一些句子、表格、Wikipedia文章、课程进行推理。随着数据集规模的增加,研究人员可以为这项任务探索不同的神经网络结构。对于基于文本的问题,模型需要关注文本的特定部分才能回答问题。因此,注意力机制的使用在这些体系结构中很常见。卷积神经网络(CNN)已被证明对情感分析、问题分类等各种自然语言处理任务有效。然而,对于回答问题的任务,基于长短期记忆(LSTM)的方法是最常见的。本文建立了一个基于CNN的多选问答模型。通过与几个基于LSTM的基线进行比较,证明了该模型的有效性。本文的主要贡献是:(i)所提出的CNN模型在两个不同的数据集上比基于LSTM的基线性能更好。(ii)我们的模型采用问题选项元组为相关选项生成分数。我们认为这是一个比单独考虑问题和选项来回答多项选择问题更好的策略。例如,考虑问题“球的颜色是”,有三个选项:红色、绿色和黄色。如果模型生成一个要与三个选项嵌入进行比较的向量,那么这可能会导致错误,因为三个选项嵌入彼此非常接近。(iii)我们设计了一个简单但有效的策略来处理问题,这些问题没有上述任何一个选项,上述两个选项,上述所有选项,包括(a)和(b)等,这在之前是没有过的。(iv)我们的模型不是关注文本中的单词,而是关注句子级别。这有助于回答查找问题的模型,因为回答这些问题所需的必要信息通常包含在一个句子中。方法根据文章提出的问题,通常需要文章的一小部分来回答相关问题。因此,将整篇文章作为神经网络的输入是没有成效的。为了选择文章中最相关的段落,我们同时考虑问题和选项,而不是仅仅考虑问题。这种方法的基本原理是,在问题本质上非常普遍的情况下,获得最相关的段落。例如,考虑到这篇文章是关于碳的主题,而问题是“以下关于碳的哪些陈述是正确的?”在这种情况下,仅仅通过查看问题就不可能选择最相关的段落。我们通过基于word2vec的查询扩展和tf-idf得分选择最相关的段落。神经网络体系结构我们使用单词嵌入来编码有问题的单词、选项和最相关的段落。因此,每个单词都被分配一个固定的d维表示。所提出的模型体系结构如下图所示。让q,oi分别表示问题和第i个选项中的单词嵌入。因此,和,其中lq和lo分别代表问题和选项中的单词数。问题选项元组(q,oi)是使用卷积神经网络(CNN)嵌入的,卷积层遵循平均池。卷积层有三种尺寸为的过滤器,输出通道尺寸为k。每种类型的过滤器j产生一个形状特征图,平均池生成一个k维向量。将三个k维向量连接起来形成3k维向量。因此,以上,nq是选项数,hi是CNN的输出,[q;oi]表示q和oi的串联,即最相关段落中的句子使用相同的CNN嵌入。让sj表示第j句中的单词嵌入,其中ls是句子中的单词数。然后,接下来,我们用hi来参与句子嵌入。正式地,为了给第i个选项打分,我们取hi和mi之间的余弦相似性,即最后,利用SoftMax对得分进行归一化,得到最终的概率分布。式中,pi表示第ith个选项的概率。处理禁止选项我们将上述选项中的任何一个、上述两个、上述所有选项(a)和(b)都称为禁止选项。在培训期间,不考虑将禁止选项作为正确选项的问题。此外,如果一个问题有一个被禁止的选项,那么这个特定的问题选项元组就不被考虑。设和|S| = k,在预测过程中,将其中一个禁用选项作为选项的问题处理如下:1. 以上/所有选项都不存在的问题。2. 有两个以上选项的问题。3. (a)和(b)类型选项的问题。4. 上述任何选项的问题。训练详情我们尝试了两种不同的CNN模型,一种是fj等于3、4、5,另一种是fj等于2、3、4,由于选项的数量因问题而异,因此我们的模型在一组可用选项上生成概率分布。类似地,最相关段落中的句子数量可能因问题而异,因此每当dj为零向量时,我们设aij = ∞。结果和讨论我们提出的TQA和SciQ数据集验证模型的准确性如以下两个表所示。GRUbl是将CNN替换为递归神经网络(GRU)以嵌入问题选项元组和句子的模型。GRU细胞的大小是100。对于SciQ数据集,我们使用与问题一起提供的相关段落。作为读者,使用GRU和注意机制对问题和段落进行建模,在SciQ测试集上获得74.1%的准确度。然而,对于一个问题,他们使用不同的语料库来提取文本段落。因此,比较这两种模型是不明智的。TQA数据集的基线:Kembhavi中提到了三个基线模型。这些基线模型分别依赖于单词级别的attention和编码问题和选项。基线模型包括随机模型、text-only模型和BIDAF模型。kembhavi中给出的基线模型的结果是在测试集上的,但是作者使用了不同于公开发布的数据分割。根据作者的建议,将验证集和测试集相结合,对CNN2,3,4模型进行了评价。与基线模型的比较如下表所示。可以看出,CNN2、3、4模型比基线模型有显著改善。我们认为,我们提出的模型优于text-only模型的原因有三个:(i)句子级attention,(i i)作为输入的问句元组,(i i i)处理禁止选项的能力。总结本文提出了一种基于CNN的多选回答模型,并与多个基于LSTM基线的模型进行了比较,验证了该模型的有效性。我们还提出了处理禁止选择的策略。利用问答选择元组作为输入,使模型具有显著的优越性。然而,未来的工作还有很大的空间。本文模型在需要复杂的演绎推理来回答的情况下不能很好地工作。例如,假设问题是“两个半衰期后,母体同位素的百分之多少仍然存在?”这是关于碳年代测定的,它包含了半衰期的定义。使用定义回答这个问题需要理解定义并将问题转换为数值问题。我们提出的模型缺乏这样的技能,对于这样的问题的表现仍然不够优秀。

意也

复旦学术之星:绩点3.89,耗时1年完成70页论文,被国际A类期刊接收

今天我们走近复旦大学管理学院的李婷同学。管理学院 李婷对未来复旦人说的话“ 我想对未来的复旦人说:努力去做自己想做的事情,多读好书,多交好朋友,珍惜在复旦的日子!”李婷是来自管理学院2016级统计系的博士生。李婷始终认为,对于统计的科学研究,基础知识的储备非常重要。在2014年9月进入到管理学院的硕博连读项目后,她努力学习专业课程,在学习中反复思考、反复讨论和反复琢磨取,这种对思考的享受和热爱让她与科研结下了不解之缘,最终也取得学位课绩点3.894的成绩。进入博士阶段,在导师朱仲义教授的指导下,李婷很快确立了自己的研究方向,主要对函数型数据、高维数据和分位数回归进行理论研究。那个时候的她对未来充满期待,希望自己能够多读好论文,努力做一流的研究,勇于去挑战难题,并能将自己的理论研究应用于实际问题。为了锻炼自己的学术思维,她将自己的本科毕业论文进行整理和完善,写成了英文文章,发表在了国内A类期刊上。这样的经历,让她对学术研究有了更深入的了解,拉开了统计研究的序幕。博一期间,通过阅读文献,李婷的第一个课题是有关广义部分函数型线性模型的估计和假设检验,这个时候她也真切地体会到读文献和自己动手做“真的是两件事情”。短短的几行公式,她可能需要一个月的时间去梳理、推导、证明其理论性质。大概有五六个月的时间,她每天做的事情只有两件:读文献,写证明。她每天都对着草稿纸和文献焦头烂额,在求证、推翻,再次求证,再被推翻的循环当中。过程枯燥且磨炼心性,但是她坚持下来了,克服了这个难题。“那一刻像哥伦布发现新大陆的欣喜,所有的愁苦和辗转反侧都是值得的。”耗时一年,完成了70页的论文,并被国际A类期刊接收。这也增添了她继续统计研究的信心。博二期间,李婷通过申请csc去到德州大学MD安德森癌症中心的生物统计系进行联合培养。在那里,研究人员尝试将统计理论研究和实际的阿兹海默症数据分析相结合,建立理论模型探究大脑区域白质和大脑认知功能之间的关系。她会因为能够将自己的理论研究应用于实际的阿兹海默症数据分析而感到兴奋,但同时也会因为自己完全不懂阿兹海默症相关知识而感到不足。于是,她一头扎进统计和医学的文献中、在读文献、写程序、理论推导和数据处理中争分夺秒地去试错、发现问题、解决问题,跟两位导师讨论,向身边的师兄师姐不断请教。耗时近两年,凝结成64页的论文,并在国际顶级期刊上二轮审稿。他们进一步地挑战难题,希望建立理论模型刻画这个数据中的一些独特的数据特性。比如在泛函空间讨论异步纵向函数型数据,这也导致理论证明难度非常大。在去年的这个时候,李婷表示自己一度处于崩溃的状态,因为她尝试了很多种证明方法都走不通,每周也跟导师讨论新的可能的解决方法,但都失败了。“觉得看不到希望,那一刻,想放弃。”但是导师说:“你再试一试,我相信你的能力。”在导师的鼓励下,她度过了那一段最艰难的时光。坚持下去,不要轻言放弃是她从科研当中学到的很重要的一课。去年暑假,李婷访问香港中文大学统计系,尝试开拓新的研究方向,将函数型数据分析和亚组分析以及聚类回归相结合,并继续用于阿兹海默症数据分析。对于学术边界由点及面的扩展,对于新方向的探索,都让她感受到了科研无穷的魅力。这一次,有了此前的积累,遇到困难时她见招拆招,完成了40页的论文,并已投稿至国际A类期刊。回首这六年在复旦的生活,学术的海洋让李婷遇到了一位又一位倾囊相授的老师和一群交心的朋友。未来她也会坚守、努力,继续攀登学术高峰。来源:复旦大学党委研究生工作部 编辑:丁辰琦、李玲

大电站

高校顶级期刊发文统计来啦!北大不是第一,这所高校力压群雄!

前言一所高校科研实力是否强大,不光要看培养出人才的多少,学科建设的评价,还有顶级期刊文章的数量。如果一所高校在顶级期刊上发表的文章比较多,自然这所高校的科研成果就比较有分量,实力也相对较强。我们熟知的全世界最顶级的期刊有两个,一个是《Nature》,另外一个便是《Science》。近日,软科统计了中国内地高校在本年所发布的顶级期刊数量,我们一起来看一下吧。内地高校顶级期刊发文量统计出炉,清华荣登榜首,北大复旦并列第三如果说世界上的顶级期刊你不太了解,但是我相信你应该会听过《Nature》与《Science》,这两种期刊是世界上最厉害的期刊,也更具有权威性,高校都以在这些期刊上发表文章而感到荣耀。下面我们来简单介绍下两种期刊。《Nature》是世界上历史悠久的、最有名望的科学杂志之一,它首次出版时间在1869年,它最大的特点便是这里面的内容发表来自很多科学领域的一手研究论文,并不一定专注于一种领域,这里面发表的文章,都是该研究领域内最前沿的研究结果。与《Nature》相似,《Science》也是全世界最权威的学术期刊之一,它是于1880年由爱迪生投资1万美元创办,是发表最好的原始研究论文、综述的期刊之一,能在这里面发表文章,足可见其科研能力非一般人可比!近日,软科统计了我国内地高校2020年在《Nature》与《Science》上发表的文章数目。至八月底,我国内地高校N&S总发文数达到了123篇,其中八月份发表文章共13篇。在这次统计中,清华大学、中国科学院大学分别以20与17的数量位居前两名,北京大学和复旦大学发表文章数量相同,并列第三。值得一提的是,在这里面双非院校表现也是不容小视,其中南方科技大学表现更为突出,排名高达第九,它为什么会这样厉害呢?双非院校实力不弱,南方科技大学“力压群雄”在这次统计中,共有57所内地高校作为通讯作者单位在N&S发表至少一篇文章,其中的双非院校就高达21所,这足以证明,双非院校并非实力不行,一部分高校科研实力更是堪比双一流。其中表现最为突出的便是南方科技大学,作为新生院校,为何实力如此强大呢?南方科技大学简称南科大,是深圳市创办的一所创新型大学,其建校历史不长,仅有八年历史而已,2012年时,教育部同意建立南方科技大学,到2018年时,南方科技大学就被获批为博士学位授予单位,可见其成长速度之快。如今的南方科技大学,实力堪比我国的“985工程“、”211工程“高校,为何建校历史不长,其实力就如此强大呢?南方科技大学位于我国深圳,地理位置已经占尽先机,为其快速发展提供了地理条件。另外南方科技大学的师资力量也非一般高校可比,校内的院士数量就高达45位,我们知道,院士的加入不光代表着人才,还有各种资源的汇入。所以南方科技大学的科研实力才会如此强大!最后大学之大,非有大楼之谓也,乃是有大师之谓也。一所高校的科研实力想要发展,没有人才支撑是不行的。而高校的科研实力又该如何评定呢?最主要的指标就是发表高质量论文的数量,所以高校想要发展,想要发表高质量论文,最主要的就是引进人才,有了人才,这些就变得顺理成章了!部分图片来源于网络,如有侵权烦请联系删除喜欢我的内容就关注下吧往期精彩九月开始复习考研晚吗?掌握这些技巧,你离双一流不远了!最新高校升学率排名来啦!北大退出前五,这所高校排名令人吃惊!恭喜!新高校联盟正式成立,长三角地区迎来大发展时期!国庆放假还能回家吗?教育部最新通知来了

鬼面人

如何成功发表SCI论文?看看4位复旦学霸的经验,值得借鉴、收藏!

发表SCI文章,尤其高影响因子的paper,是每一个复旦学子追求的目标。然而如何才能在期刊发表SCI呢?今天,复旦研究生邀请了复旦四位学霸,给大家分享一些写论文的小Tips,一起来看看吧!写SCI就像讲故事一样时文明 时文明,中共党员,公共卫生学院2016级硕士研究生,上海市优秀毕业生,国家奖学金获得者,连年获复旦大学优秀学业奖学金,复旦大学优秀学生,五四100周年复旦大学优秀团员标兵。发表文章6篇,其中SCI 2篇,并以独立一作在国际顶尖医学《柳叶刀》上发表会议摘要1篇, 2篇SCI在投。在Lancet-CAMS 2018, ISEE-ISES SEGH-2017, 中国环境科学年会等国际国内学术会议上做报告。上医90周年校庆志愿者,上医校友会志愿者,校庆“我的医学,我的梦”征文比赛校一等奖。学会阅读文献文献看的越多越好吗?这个不一定。面对海量的文献信息,如果抱着刷数量的心理会让你手足无措。文献的目的是让你把握领域的最新科研动态,从而扩充自己的知识,助推研究的进展。如何高效阅读文献呢?建议先选取课题组或本领域的代表性文献(近5年)来读,在阅读的过程中做好笔记和标记,当积累到一定阅读量时,自然会有“质变”感觉。对于研究/试验方法相同、结论不同的文献,需要批判性的阅读,探讨存在差异的原因。聆听报告,拓宽思路做科研写文章,不能封闭自己。需要多聆听领域专家教授的报告,与导师和同行多学习交流。没有人天生优秀,都是相互学习而来。建议大家多参加学术会议,学会提问,学习一些新的观点和方法,助力SCI文章的写作和发表。多写多练,勤能补拙“板凳宁坐十年冷,文章不写半句空。”SCI更是如此,需要多写多练。写SCI文章时,最重要的是逻辑,逻辑的形成来源于对研究方案,试验结果的总体分析。需要先和导师讨论出一套清晰的思路,然后按照思路,进行初稿的撰写,对于Reviewer给的审稿意见,需要认真对待,逐条回复。总而言之,写SCI就像讲故事一样,需要把故事说的有条理,讲完美。研究生要学会做“研究”陈泽昊 陈泽昊,信息科学与工程学院2016级电子工程系电路与系统专业硕士生,2018年复旦大学研究生国家奖学金获得者。曾在2018年IEEE地球科学与遥感大会及SCI等级国际期刊《Remote Sensing》(《遥感》)上发表科研成果。首先恭喜你们,无论是已经经历了四年旦复旦兮的土著,还是初来乍到的萌新,作为复旦的研究生,你们已经打败了绝大多数的同龄人。这绝不是毫无意义的打气,在你们求职的时候,相信会有更深刻的体会。所以,珍惜这个机会,是你们需要做的。那么,说具体一点,怎么做呢?我的导师经常强调于我的一件事是,你们是“研究”生,要学会如何去“研究”。如果总是上课讲什么我就学什么,老师给我哪篇文章我就看哪篇,那和本科生就没有区别了。我认为作为合格的“研究”生,在学术上应该做到以下几点:主动获取知识一是要有主动获取知识的能力,包括主动学习的态度,以及知道从何处获取想要的知识的能力。思辨的能力二是要有思辨的能力,看到新的观点或方法,第一反应不是它好在哪,而是哪些地方还不够好,还可以改进,可以怎么改进,这就是从别人的变成了你自己的。多读好文章针对大家很关心的,如何发文章的问题,其实我自己也没有多丰富的经验,而且不同学科不同方向,写文章的内容和套路也有所不同,个人建议是多读一些好文章,然后模仿其中的逻辑结构和遣词造句。不要放弃希望还有一点我很愿意分享的就是,对于投期刊的同学,只要没被直接拒,哪怕反馈了再严苛的审稿意见,都说明希望还是有的。只要认真写好每一条答复,修缮文中每一句不佳的内容,对审稿人和编辑保持谦逊尊敬的态度,或早或晚一定会有收获,毕竟人家给你修改的机会,就是想看到你写得更好,给你提了问题,就是对你的工作感兴趣。最后,祝各位研究生同学都能发表更多的文章,顺利毕业,找到理想的工作,度过人生最后的学生时代。不发表,就出局 郑宁 郑宁,历史学系2015级博士生,研究方向为明清史,第十届“学术之星”特等奖获得者。入学以来,以第一作者身份在高水平期刊发表学术论文7篇。多次获得国家奖学金、一等学业奖学金等各项荣誉,被评为2019年上海市优秀毕业生。2017至2018学年,受国家留学基金委资助,于哈佛大学东亚语言文明系完成博士联合培养。在“不发表,就出局”的今日学术环境下,年轻学生再也不能逃避发表论文的头疼事,即便是崇信“板凳要坐十年冷”的人文学科也是如此。其实我们也无需太多抱怨,在信息资源高度发达的今天,人文科学的研究条件也得到了极大地改善。特别是图书电子化、信息数据库的出现,为年轻研究生发表论文提供了更多机会。就我个人的有限经验而言,有以下三点可供诸君参考。要多想,更要多做在学校潜心学习,理应迸发科研的灵感,找到论文的选题。这样的思路自然多多益善,但更重要的是落到实处。写出来的文章越多,心里才越踏实,说话才真正越有底气。将更多的时间用于修改文章将更多的时间用于修改文章。论文写成后,常有如释重负之感,恨不能立刻投稿、见刊。这个时候不妨缓一缓,过段时间再重新阅读,往往又能发现许多问题。再过一段时间,又会发现新的问题。精心雕琢方有美玉,一篇好的论文,大多是反复修改出来的。论文质量如何,自己心里要有数到了研究生阶段,都应该具备鉴别学术水平高低的能力。可是,一些同学品评他人的文章,高下优劣一目了然,换成自己的文章,却成了白璧无瑕。这样的心态,显然是有问题的,用这样的态度向期刊投稿,也更容易受挫。对于自己的文章,应该跳出作者的身份,有勇气批评自己、否定自己。这样才能更好地修改论文,并在此基础上有的放矢地选择期刊投稿。最后,科研与投稿,可能真的是需要一些运气的。希望每一位同学都有拥有好运!做科研,就像游戏升级打怪 章迎莹 章迎莹,管理学院统计系2015级博士生,师从朱仲义教授,研究方向为概率论与数理统计,如分位数回归,面板数据等,第十届“学术之星”特等奖获得者。目前在Journal of Econometrics 和Statistica Sinica 上分别发表一篇一作论文,另有一篇论文在Statistica Sinica 修改中,并多次在国内外会议做口头报告。在校期间获得2019年上海市优秀毕业研究生,2018年博士研究生国家奖学金,2015年研究生国家奖学金,2014,2015,2018年获得复旦大学郑祖康奖学金。曾获得国家留学基金委奖学金资助,于乔治华盛顿大学联合培养博士一年。四年的博士经历让我对科研有了全新的认知。很荣幸能在这里和大家分享我的心得体会。不要眼高手低,要脚踏实地读博之初,我对自己的博士生涯没有规划,所以我起步很晚,一直在踉踉跄跄、蹉跎岁月。当时导师对我的评价是,简单的问题不愿意做,总想找一些大问题做,但是能力又不够。很感谢导师及时点醒了我,当我意识到自己的问题之后,我迅速瞄准一个小问题,着手科研。博一的经历教会我:不要眼高手低,要脚踏实地。当你真正去做的时候,才能在不断发现问题和解决问题的过程中锻炼自己的科研技能。这就好比打游戏升级,一路上打遍小怪兽,才有能力对抗终极大boss。百毒不侵,越挫越勇博士二年级,我的论文开始接受导师的轮番批判,我在这个过程中不断自我否定,自我革命。我发现每次修改完之后,老师会不断提出新的问题和评论,经过几番来回,我彻底崩溃,躲在屋子里嚎啕大哭。博二的经历教会我抗压力,论文投稿前要经过老师和同行的批判,投稿后要经历审稿人的质疑,最后发表时候已经把初稿改的面目全非了。所以我们要以一个百毒不侵,越挫越勇的内心面对科研。最后,科研期间一般没有硬性时间表强制我们去工作,希望我们都能尽早规划并执行,才不会辜负我们的青春岁月。值此庆祝新中国成立70周年之际,作为复旦学子,立足科研岗位,书写报国情怀,以实际行动为祖国庆生!来源:复旦研究生 编辑 :汪 睿

好天气

安全统计研究的分析方法

安全统计研究的分析方法包括四大方法:空间自相关方法,聚类分析法、灰色统计法、实验数据统计方法。那么,怎么理解这四大方法呢?1.空间自相关方法1)空间自相关方法是研究空间中某空间单元与其周围空间单元就某种特征值,进行空间自相关性程度的计算,以分析这些空间单元在空间分现象的特征的统计分析方法2)研究对象是两个或多个属性变量间的相互关系及关联程度,以及同一属性值在不同空间位置上的相关关系及关联程度3)优点是可同时满足独立性和大样本两个假设,可以用图形示意区域集聚事故的类型,而且还可用一些量化指标,揭示研究区域内事故发生的空间格局空间自相关方法2. 聚类分析法1)聚类分析法就是输入一组未分类的数据,通过分析数据,确定每个记录所属的类别,把相似性大的对象聚集为一个类2)主要用于安全统计数据或样本的分类3)按原理可分为层次聚类法和非层次聚类法;按照分类的目的可分为指标聚类(R型)和样品聚类(Q型)4)具有客观性、科学性等优点5)如果数据量少会影响归纳精确性;需要介入主观因素确定该分成几类;只能对指标进行单一归类聚类分析法3. 灰色统计法1)灰色统计法是一种白数的灰化处理方法,以灰数的白化函数生成为基础,将安全统计数据按某种灰数所描述的类别进行归纳整理,判断安全指标所属的灰类2)具有可操作性强,分辨率高等优点,通过建立影响事故发生的安全统计核心指标,来对事故进行安全统计分析灰色统计法4. 实验数据统计方法1)实验数据统计方法是基于完全样本的安全统计方法,用此方法处理产品寿命数据是,检验产品寿命数据属于何种类型后采用相应的安全统计方法进行数据处理,做基于特征值的可靠性统计并归一化处理2实验数据统计方法包含正太分布、三参数威布尔分布、两参数Weibull分布、极小值分布、极大值分布等等;数据处理有图解法和解析法试验数据统计方法

百分比

投稿论文被核心期刊退稿的原因有哪些?

核心期刊分为:统计源核心期刊,中文核心期刊,统计源核心期刊为中国科学技术信息研究所每年一评的期刊目录,中文核心期刊由北京大学图书馆3年一评选的期刊目录。很多单位或者是学校,在晋升和毕业时会要求发表核心期刊论文一篇甚至多篇,作者在明确自己所需期刊级别后,会抓紧时间完成论文,进行投稿,一部分可能1个月内会收到退稿通知,一部分会在投稿半年后还没有消息,也会有一小部分作者很幸运,会反复收到修改稿,修改数次后会有录用通知下发。核心期刊退稿原因有哪些?下面给大家介绍一下1.文章与期刊收稿方向不符合,这个是最重要的,文章是什么方向的,属于什么类型的,都要找到收录自己文章方向的期刊,如果你是神经内科的文章,你去投稿一本国际眼科杂志,肯定会被退稿的,因此,在投稿前,一定要查询所投期刊,近1年内有没有类似方向的稿件,再进行投稿。2.文章重复率过高,核心期刊要求文章重复率低于10%,为作者的原创文章,引用抄袭过多的,初审直接刷下去,杂志社在初审时,会进行重复率的检测,一般是知网检测,请投稿前务必先检测,高于10%的,一定要修改后进行投稿。3.文章的立题不新颖,核心期刊收录的文章,要求是具有创新性,前瞻性的文章,一篇文章,如果一直是研究10多年前或者近几年一直在研究的内容,也没有研究的价值了,选一个好的选题很重要。4.文章中所涉及到的论点,论据不充分,病例数太少等也会增加稿件的退稿率,病例数太少,数据统计分析也没有意义,论点,论据不充分,文章也不完整,因此,在投稿前一定要通读全文,务必做到有理有据。导致核心期刊退稿的原因还有很多,比如:文章内容啰嗦,不简洁,涉及到实验的次数太少等。这里不做一一介绍。投稿核心期刊,务必做到上面叙述到的4大点,相信初审肯定是没有任何问题,过了初审,进入到外审专家环节,专家外审审稿带有个人喜好,可以给到大家什么修改意见不好说,但是务必按照审稿专家的修改意见进行修改,一般都没有问题。