研究的定义【研究的定义资讯】

辩护词

世界各地的学者都在研究这一概念。有近200个定义

文化因其丰富的内涵和外延，一直是学术界争议最大、界定难度最大的概念之一。长期以来，国内外许多学者试图从不同的学科和视角对文化概念进行界定和阐释，但至今仍有不同的观点和智者见智，未能形成统一的观点。据不完全统计，学者们已经定义了数百种文化。学者美国克罗伯（A）。L。Kroeber）和Clark洪（ClydeKluckhohn）在他们的书《文化：关于概念和定义的检讨》中做了统计。从1871年到1951年，学术界共有164种文化定义。作为20世纪文化研究的重要奠基人之一，英国人类学家雷蒙德威廉姆斯（RaymondWilliams）曾经无奈地说，文化就是“英语中最复杂的两三个词语之一”[1]。因此，关于文化概念的争论成为当前学术界关于文化问题争论的焦点之一。论古代文化观念的起源中国和古代印度，古埃及，古巴比伦被称为四个文明古国，但中国也是大国唯一有5000年历史的文化文明。通过查阅相关古籍，不难发现“文化”一词在中国古代就已经存在。由于汉语具有鲜明的表意特征，我们可以从“文”和“化”的本义来分析文化的本义。根据《说文解字》的解释：“文，错画也，象交文。”“化，教行也。”根据这个解释，我们可以看到“文”的原意是指各种颜色的交错纹理，具有文章的含义；“化”的原意是变化、生成、创造，延伸到教育、培养，等等，一起使用“文”“化”这个词。见《易·贲》。书上记载：“观乎天文以察时变，观乎人文以化成天下。”这里“人文”和“化成天下”紧密相连，初步论证了文明和文教文化的含义，即用文化的规律教育人，培养受教育的人。这是对中国古代文化概念的最早解释。经过漫长的历史，现有的研究发现，最早使用“文化”作为一个词开始于西汉时期。在西汉历史学家刘写给《说苑·指武》之后，“文化”一词逐渐被接受，并在中国古代广泛使用。西晋学者和文学家在其《补亡诗·由仪》中指出：“文化内缉，武功外诛。”唐代卢照邻诗人的诗中也有“武化偃兮文化昌”句。古代的文化概念中国在很大程度上是作为动词使用的，常与“武功”“武治”“野蛮”等词结合使用，基本上属于精神文明范畴，这是一种统治社会的主张和方法。现代文化观念的起源现代所谓的文化显然不同于古代文化。据说19世纪末是从日语翻译过来的，这是一个新的概念。20世纪初以来，中国学者们对文化进行了广泛而深入的研究，形成了许多文化概念的定义。例如，胡适思想：“文化(Culture)是一种文明所形成的生活的方式。”[2]梁漱溟在他的著作《中国文化要义》：“文化，就是吾人生活所依靠之一切……文化之本义，应在经济、政治，乃至一切无所不包。”[3]中说张殿年思想，“狭义的文化指文学艺术；广义的文化包括哲学、宗教、科学、技术、文学、艺术、社会心理、风俗习惯等等”。[四]20世纪80年代以来，“文化研究热”在中国兴起。一批中国学者对文化概念提出了不同的理解，但他们基本上根据自己的需要对文化概念进行了不同意义的界定和使用，没有给出下一个文化被广泛认可的准定义。西方文化观念的内涵从词源上看，“现代文化”一词最早是由西方学者提出的。在西方文化中，现代英语通常被翻译为culture，它起源于拉丁语中cultura和colere。它最初有许多含义，如农业、生活、实践、敬神等。。法语中还扩展了气质陶冶和道德来培养之意。早在16世纪初，文化的含义就扩展到了人类发展的领域，不仅限于畜牧业领域，还扩展到了人类心灵的培养之意。从18世纪到19世纪，文化的含义扩展到指人类精神或智力发展的过程。到19世纪中叶，文化开始作为一个特殊的术语出现在学者的作品中。这一时期的文化往往被认为是人类智慧的反映，是人类生活和发展过程中形成的物质和精神要素的统一。19世纪下半叶，随着人类学、社会学、文化学等学科的逐渐兴起，文化的概念也被学者们从多学科的角度来解读。把文化定义为一个整体的学者是英国人类学家泰勒（E）。B。Tylor）。在71年和《原始文化》中，他定义文化如下：“所谓文化或文明，乃是包括知识、信仰、艺术、道德、法律、习惯以及其人类作为社会成员而获得的种种能力、习性在内的一种复合整体。”[5]这一论述被认为是文化的第一个经典定义，对后世学者对文化的研究产生了深远的影响。它至今仍被学术界普遍认可，其基本含义也一直沿用至今。20世纪以来，世界的历史已经从一个区域时代转变为一个全球化时代。不同的国家、民族、种族相互影响、相互作用，加速了文化与文明的冲突与融合。因此，学者们一直站在世界历史发展的角度，对文明更替与文化发展进行探讨和反思。例如，著名的历史哲学家汤因Bi（A）。J。Toynbee）提出了文明形态学理论。他认为人类社会主要由经济、政治和文化三种形式构成。其中，文化是文明形式中最稳定、最常发挥作用的精神因素，是文明的核心。据塞缪尔亨廷顿（SamuelP）教授说。美国哈佛大学的Huntington，“文化是指一个社会中的价值观、态度、信念、取向以及人们普遍持有的见解。”[6]如何理解文化的概念？马克思主义经典作家也十分重视文化问题，从历史唯物主义的角度阐释了文化的概念。纵观马克思恩格斯的作品，从早期的《1844年经济学哲学手稿》到后来的《人类学笔记》，“文化”一词出现了很多次。当然，他们并没有给出自己对文化的定义，而是在多个意义上使用了文化的概念，这一概念有着更广泛的内涵。更重要的是，他们通过精神生产、意识形态、文明、文学、艺术、观念、思想等概念阐释了自己的基本文化观，认为文化是人的创造行为，成果和人的实践生活是本质，文化的意义和终极目标在于人的发展，在于人的全面发展的培养。他在著名文章《新民主主义论》中坚持唯物史观的基本立场，运用社会存在与社会意识相互作用的原理，提出了经济、政治、文化的社会结构理论，阐释了对中国马克思主义文化本质的理解：“一定的文化（当作观念形态的文化）是一定社会的政治和经济的反映，又给予伟大影响和作用于一定社会的政治和经济；而经济是基础，政治是经济的集中表现。”论述了三者之间的辩证关系：政治、经济、文化等因素是相互作用的，文化是政治和经济的反映，文化对政治和经济具有负面影响。综上所述，通过对文化概念的起源及其演变的历史过程的探究，不难看出文化概念是随着社会的发展而不断变化和发展的。到目前为止，学术界对文化概念的解释还没有形成统一的共识。文化的概念仍然是一个开放的概念。特别是进入21世纪，随着经济全球化和科学技术的飞速发展，各种文化交流和交流不断向全球化、世界性的文化转变，文化的内涵和外延将进一步拓展。[1] [英文]约翰斯道雷。文化理论与大众文化（第五版）[M]常江，翻译。北京：北京大学出版社，2010:2[2] 作品选集[M]。北京：中国文化历史出版社，2013:173[3] 文化意义[M]。上海：上海人民出版社，2011:7[4] 张大年。张岱年的学术文化随笔[M]。北京：中国青年出版社，1996:136[5] [英语]泰勒。原始文化[M]连树声，trans。上海：上海文艺出版社，1992:2[6] 文化的重要作用——价值观如何影响人的进步[M]。程克雄，事务处理。北京：新华出版社，2010:9以上参考《以文化人：大学文化育人研究》，人民出版社，感兴趣的网友自行阅读。你如何理解文化的概念？我们留个口信讨论吧！

展开

坝

科学研究是什么

百科：科学研究（Scientific research），一般是指利用科研手段和装备，为了认识客观事物的内在本质和运动规律而进行的调查研究、实验、试制等一系列的活动，为创造发明新产品和新技术提供理论依据。科学研究的基本任务就是探索、认识未知。小编认为，要正确理解“科学研究”的定义，首先要知道什么是科学。那么，什么是科学呢？试问，人们为什么要在有关“科学”的杂志上投稿？显然，人们之所以要在有关“科学”杂志上投稿，根本目的就是为了让自己的观点获得人们的充分认可。试问，人们为什么要办“科学”杂志？显然，人们之所以要办“科学”杂志，就是为了获得更多的被人们充分认可的观点。试问，自然科学教科书上的观点是不是被人们充分认可的观点？答案当然是肯定的。比如，自然科学教科书上的“万有引力定律”其实就是被人们充分认可的，牛顿的观点。因为，自然科学教科书上的观点也都是“在一定时间，一定范围和一定条件下”被人们充分认可的观点。比如“万有引力定律”在量力科学范围内就不适用。由此我们就可以知道“科学”完整、正确的定义了，即：科学就是在一定时间，一定范围和一定条件下被人们充分认可的观点。由此，科学研究的定义也就昭然若揭了，即：科学研究就是人们在一定时间，一定范围和一定条件下为了获得“被人们充分认可观点”的研究。由此，科学探索的定义也就水落石出了即：科学探索就是人们在一定时间，一定范围和一定条件下为了获得“被人们充分认可”的观点的探索。

展开

法国版

这个概念全世界的学者都在研究，近200种定义，却谁也说不清楚！

文化因其丰富的内涵和外延，一直以来成为学术界最具争议、最难以被界定的概念之一。长期以来，中外众多学者试图从不同学科、不同视角对文化的概念作出界定和阐释，但迄今为止仍是仁者见仁、智者见智，未能形成统一一致的意见。据不完全统计，学者们对文化的定义多达数百种。美国学者克罗伯(A.L.Kroeber)和克拉克洪(Clyde Kluckhohn)在他们合著的《文化：关于概念和定义的检讨》一书中曾做过统计，仅从1871年至1951年这80年间，学术界关于文化的概念界定就达到164种之多。被誉为20世纪文化研究重要奠基人之一的英国人类学家雷蒙德·威廉斯(Raymond Williams)对此曾颇有些无奈地说：文化乃是“英语中最复杂的两三个词语之一”[1]因此，文化概念之争也成为当前学术界对于文化问题争论的焦点之一。中国古代文化概念溯源中国与古印度、古埃及、古巴比伦并称为四大文明古国，但中国也是唯一一个有着五千年文明历史而从未间断的文化大国。查阅古代相关典籍，不难发现，文化一词在中国古已有之。由于汉语具有鲜明的表意特征，故而关于文化的本义，我们可以从“文”和“化”二字本义上来作出分析。据《说文解字》解释：“文，错画也，象交文。”“化，教行也。”根据这一解释，我们可以看出“文”的本义，是指各色交错的纹理，有文饰、文章之义；“化”的本义则为变易、生成、造化，引申为教化、培育等。将“文”“化”二字连用，始见于《易·贲》。该书记载：“观乎天文以察时变，观乎人文以化成天下。”这里的“人文”与“化成天下”紧密相连，已初步彰显了文化的文明教化、以文教化之义，意指对人施以文治教化，培养有教养的人。这是目前为止学术界考证的中国古代关于文化概念的最早阐释。穷源溯流，现有研究发现，最早将“文化”作为一个词语使用始于西汉时期。西汉史学家刘向在其著述《说苑·指武》中写道：“凡武之兴，为不服也，文化不改，然后加诛。”此后，文化一词在中国古代渐为人们所接受并广泛使用。西晋学者、文学家束皙在其《补亡诗·由仪》中指出：“文化内缉，武功外诛。”唐代诗人卢照邻诗中也有“武化偃兮文化昌”的诗句。中国古代的文化概念，在很大程度是作为一个动词使用，往往与“武功”“武治”“野蛮”等词对举并用，基本上属于精神文明的范畴，是一种治理社会的主张和方法。现代文化概念出处现代所谓的文化，显然与中国古代文化一词有所区别。据载是19世纪末从日文转译而来的，是一个全新的概念。20世纪初以来，中国学者对文化开展了广泛深入的研究，形成了很多对于文化概念的界定。如胡适认为：“文化(Culture)是一种文明所形成的生活的方式。”[2]梁漱溟在其著作《中国文化要义》中说：“文化，就是吾人生活所依靠之一切……文化之本义，应在经济、政治，乃至一切无所不包。”[3]张岱年则认为，“狭义的文化指文学艺术；广义的文化包括哲学、宗教、科学、技术、文学、艺术、社会心理、风俗习惯等等”。[4]20世纪80年代以后，国内兴起了“文化研究热”，一批中国学者纷纷提出对文化概念的不同理解，但他们基本上是根据各自需要从不同意义上界定和使用文化这一概念的，并未能给文化下一个广受认可的准确定义。西方文化概念内涵从词源上看，现代文化一词最早是由西方学者提出来的。西方的文化，现代英语一般译为culture，源于拉丁语中cultura和colere，原本有耕种、居住、练习、敬神等诸多含义，法语中还引申有性情陶冶和道德培养之意。早在16世纪之初，文化的含义就已拓展到人类发展领域，不再仅仅局限于畜牧领域，引申出对人的心灵培育之意。18世纪至19世纪期间，文化的含义扩展到用来指人的精神或智力发展的过程。到了19世纪中叶，文化开始作为一个专门术语，广泛出现在学者的著述中。这一时期的文化往往被视为人类智慧的反映，是为满足人类生活和发展过程中形成的物质要素与精神要素的统一体。19世纪下半叶，随着人类学、社会学、文化学等学科的逐步兴起，文化概念也被学者们从多学科角度作出阐释。第一次从整体上界定文化概念的学者是英国人类学家泰勒(E.B.Tylor)，他于1871年在《原始文化》一书中对文化给出这样的界定：“所谓文化或文明，乃是包括知识、信仰、艺术、道德、法律、习惯以及其人类作为社会成员而获得的种种能力、习性在内的一种复合整体。”[5]这一阐述被认为是最早对文化进行界定的经典定义，对后世的学者们研究文化产生了深远影响，至今仍为学术界所普遍肯定，其基本要义被沿用至今。20世纪以来，世界历史呈现出由地域时代向全球化时代转化的时代特征，不同国家、不同民族和种族等地域文化相互影响、相互作用，加速了文化与文明的冲突与融合，引发学者们站在世界历史发展的视角，对文明更替和文化发展问题进行探讨和反思。如英国著名历史哲学家汤因比(A.J.Toynbee)提出文明形态理论，他认为人类社会主要包括经济、政治和文化三个文明形态，其中文化是文明形态中最稳定的经常起作用的精神因素，是文明的核心。美国哈佛大学教授塞缪尔·亨廷顿(Samuel P. Huntington)认为，“文化是指一个社会中的价值观、态度、信念、取向以及人们普遍持有的见解。”[6]如何理解文化概念？马克思主义经典作家同样对文化问题给予高度关注，并从唯物史观的视角对文化概念作出阐释。纵观马克思恩格斯的著作，从早期的《1844年经济学哲学手稿》到晚年的《人类学笔记》,文化一词多次出现。当然，他们并未对文化给出自己的概念界定，而是在多重意义上使用文化这一概念的，其内涵比较宽泛，更多的是通过精神生产、意识形态、文明、文学、艺术、观念、思想等概念来阐释他们对文化的基本观点，认为文化是人的创造性行为及成果，是人类实践活动的产物，文化的实质、意义和终极目的就在于人的发展，在于培养全面发展的人。毛泽东把马克思主义对文化概念的认识提高到一个新水平，在其名篇《新民主主义论》一文中，他坚持历史唯物主义基本立场，运用社会存在和社会意识相互作用关系的原理，提出了经济、政治和文化三者并列的社会结构理论，阐释了中国化马克思主义对文化本质的认识：“一定的文化（当作观念形态的文化）是一定社会的政治和经济的反映，又给予伟大影响和作用于一定社会的政治和经济；而经济是基础，政治是经济的集中表现。”毛泽东还论述了三者之间的辩证关系：政治、经济、文化等因素是相互作用的，文化是政治和经济的反映，文化对政治、经济具有反作用。综上所述，通过探寻文化概念的产生源头及其嬗变的历史过程，不难看出，文化的概念是随着社会发展而不断变化、动态发展的，学术界至今对于文化概念的诠释尚未形成一个统一的共识。文化的概念仍然是一个一直在路上、极为开放的概念。特别是进人21世纪以来，随着经济全球化和科学技术的迅猛发展，各种文化交流交融交锋不断，正在向全球化、世界性的文化转变，文化的内涵和外延也必将得到进一步的拓展。[1] [英]约翰·斯道雷.文化理论与大众文化导论(第5版)[M].常江，译.北京：北京大学出版社，2010:2.[2] 胡适.胡适文选[M].北京：中国文史出版社，2013:173.[3] 梁漱溟.中国文化要义[M].上海：上海人民出版社，2011:7.[4] 张岱年.张岱年学术文化随笔[M].北京：中国青年出版社，1996:136.[5] [英]泰勒.原始文化[M].连树声，译.上海：上海文艺出版社，1992:2.[6] 塞缪尔·亨廷顿，劳伦斯·哈里森.文化的重要作用——价值观如何影响人进步[M].程克雄，译.北京：新华出版社，2010:9.以上参考《以文化人：大学文化育人研究》，人民出版社，感兴趣的网友自行阅读。你对文化这个概念是怎么理解的？快来留言讨论吧！

展开

途隙守神

研究方法｜十分钟弄懂元分析（附经典案例）

01元分析1.定义：1976年学者Glass所下定义：“元分析是以综合已有的发现为目的，对单个研究结果进行综合的统计学分析方法”。也称为“典型或定量元分析”。2.优点：与传统的文献综述相比，元分析能最大限度地减少各种偏向，确保结论的科学性、客观性和真实性。具体体现在：①元分析运用各种手段从一群独立研究中组织和提取信息，并对这些研究的结果做出总的估计，是一种定量方法；②它包含某一研究课题下所有可接受的文献，全面而客观，弥补了单一研究的不足；③元分析给出的通常是一般性的结论，是系统的和可重复的；④元分析方法能发现单一因果分析或关系分析研究所不能发现的潜在规律。3.缺点：①由于不同的研究所采用的研究方法和研究实验材料可能存在不一致，因此对其结果进行整合有可能是不适合的，即“apples- and-oranges problem”；②元分析中所引入的研究有可能是低质量的，那么其结果的可靠性就无法保证，即“garbage in-garbage out problem”；③具有统计学显著意义的研究结果较无显著性意义的结果或无效的结果被报告和发表的可能性更大，即发表偏见的问题；④在计算效果量的过程中，某些研究可能会存在着多个效果量，如果这些效果量来自同一个样本，那么对这些效果量的整合就会不适合。02操作步骤1.选题：选题与方法契合，突出研究价值2.文献搜索：全面客观，报告选择标准需要搜索的文献类型有两种，包括已发表的文献和未发表的文献。3.数据编录：内容详尽，避免主观因素的影响4.数据分析03经典案例论文基本信息题目：社交媒体自我呈现与主观幸福感关系的元分析作者：毛良斌来源：《现代传播》2020年【内容提要】采用元分析方法探讨社交媒体自我呈现与主观幸福感的关系。共有43篇实证研究纳入元分析，被试总人数为24386人。结果发现，社交媒体自我呈现确实能显著提高主观幸福感，效果量微弱;社交媒体自我呈现对主观幸福感的影响效应大小取决于自我呈现的方式;积极自我呈现和真实自我呈现均能显著提高主观幸福感，消极自我呈现则显著降低主观幸福感;社交媒体自我呈现强度显著提高主观幸福感，具体到主观幸福感各维度来看，自我呈现强度能显著提高积极情感，但不能显著提高生活满意感，也不能显著降低消极情感;主观幸福感测量工具和文化背景对社交媒体自我呈现与主观幸福感关系存在调节效应，但在被试类型上，则未发现调节效应。【关键词】社交媒体;自我呈现;主观幸福感;元分析;效果量【研究问题及研究假设】RQ1:社交媒体自我呈现能显著提升主观幸福感吗?RQ2:社交媒体自我呈现对主观幸福感的影响效果有多大?H1:被试类型不同，社交媒体自我呈现对主观幸福感影响效应存在显著差异。H2:主观幸福感测量工具不同，社交媒体自我呈现对主观幸福感影响效应存在显著差异。H3:文化环境不同，社交媒体自我呈现对主观幸福感影响效应存在显著差异。【研究设计】(一)文献检索和获取研究检索时间跨度为2000年1月至2020年3月。根据PRIMA STATEMENT提出的标准，研究文献查找和获取需经过四个步骤，即文献查找、文献筛选、资格审查和研究纳入。据此，研究获得符合元分析要求的文献43篇，其中英文31篇，中文12篇，独立样本量为24386人。(二)文献编码按照元分析编码方法，对43篇文献进行编码。样本特征编码包括作者、发表年份、研究设计类型、被试特征、独立样本量、测量工具、研究的文化背景；效果量编码主要围绕自变量与因变量相关的统计描述值，包括相关系数、回归系数、p值、t值、均值与标准差以及自变量和因变量测量的信度系数α值。研究先由论文作者对所有文献进行编码，再由一位传播学专业研究生进行再次编码，结果显示，所有项目两次编码结果的百分比一致性信度均在0．98以上。纳入元分析的43篇文献基本信息见表1。(三)统计分析使用ComprehensiveMeta－Analysis(CMA)软件进行数据处理和分析。选择r作为统一效果量，若提取到的效果量为其他统计值，则将其转化成r值再进入元分析。对t值、p值以及均值和标准差，直接使用CMA软件转化为r值。由于CMA没有直接针对回归系数β的转换，研究根据Peterson等人提供的简便公式r=β+0．05λ(β≥0，λ=1;β＜0，λ=0)，先将回归系数转换为相关系数，之后直接录入CMA进行分析。在分析前，研究者首先对每个从独立样本中提取出的相关系数做信度修正，以避免因量表信度缺陷而导致相关系数的衰减偏差，校正的公式为:，其中ESr代表初始效果量，EScr代表校正效果量，rxx和ryy分别代表自变量和因变量的测量信度系数。对于使用实验操控或者单个项目测量的情况，其测量信度系数用1代替。利用CMA软件对效果量进行处理和分析，分析过程中将每个EScr转换成对应的FisherZ值，再将FisherZ值的加权平均数转换为相关系数，得到总体效果量，并估计总体效果量的95%置信区间。责编：周梦琦

展开

希崎

历史是过去的时光，你仔细研究过它的定义吗

历史是过去的时光，你仔细研究过它的定义吗？看到标题，读者们可能会想历史不就是那些过了很久的事情，它是我们人类存在的足迹，有残酷的画面，也有宏伟的成就，那么我们今天一起来细研究一下什么叫做历史，这些历史的进程又是否有规律可循。历史在汉语词典中的解释：1.已过去事物的记载2.那些曾经出现的事实3.大自然和整个人类社会的进展过程4.单纯的指一门学科。我们现在所接触的历史是指人类出现和发展的进程，从有人类存在痕迹开始考察的学科，从中与现代形成一种对比，所以古人常说，以史为鉴，可以知道自己有哪方面做的不足。我们看一下在科学技术还没有那么发达，历史记载也没有那么长久的前提下，古人是怎样看待历史的变迁呢！最著名的一句总结应该是在三国演义的开头，分久则合，合久则分。我们国家从封建王朝一路走来，不知道经历了多少的磕绊，才迎来了现在的独立民主时期。从夏朝的一统到商纣的分崩离散，再经历了周朝的短暂统一到春秋和战国的纷争，秦始皇合并分立的各国，汉朝继续统治，可是马上又有了魏晋南北朝之分立，隋唐到唐朝，有过繁盛的场面，最终还是亡国，五代十国再次把土地分成了众多的版块，宋王朝建立后又有辽金与之抗争，忽必烈赢得了天下，又被明清取代，民国之后，终于走到了现在的国家。历史上亡国的原因无外乎民不愿意再载舟，昏庸的统治者，残酷的暴政让百姓无法喘息；宫廷内部的瓦解，从小得意到外戚干政，从任用宦官到后宫祸水；其他的民族的威逼与征服，这三个原因也是历代王朝更替的原因，总之历史总是会抛弃那些不应该存在的！所谓成王败寇，比如刘邦项羽之争、朱元璋张士诚之较量，胜利的就可以统治八方，拜下的人落为刀下亡魂，就是这么直接又简单！在历代王朝颁布的条文，很多条律的制定出发点是好的，只是实行时过了头，比如秦朝的连坐，起初是为了让刚建立的王朝更稳定，却激起了民众的反抗，宋朝的单方面尚文，缺少守国大将，被外族频繁来犯，明清时代的八股文，真正的把读书人变呆，读书变得功利！从另一方面来说，在一个动荡的年代，会出现更加进步的东西，来立于一个优势的位置，推动历史向前滚动，比如百家争鸣、三教和谐共处，那个时候对人的个性出现了最大的包容！王朝的更替一直显示着地域上的差异，从政治上来说北方相对较强，崇尚武力，国度也定于北方，西方的武力要强于东方，比如秦朝统一六国、宋朝战胜了南唐、大元又灭掉了南宋等，因为地形上的差距，地势高的地区易守难攻有一定的优势，同时为了享有南方的经济的供给，让统治者进一步想征服更多的土地，所以王朝的版图一直存在着扩张之势！朝廷中皇权和君臣之间的矛盾一直也是存在的，有时君王就是绝对的权威，而有时则是大臣握有重权，多数的情况下，都是君王实力较强臣子就会柔一些，比如汉高祖在位的时候，大臣就有三位杰出人物，而到了光武帝时，就只是一些摆弄权力的小人为官了！统治一个国家一定要文武并重，太过重武，秦国风强硬蛮横，容易折断，如果一味的提倡文治，民风是和谐了，又无法抵挡外族的侵略，比如出现了众多诗人的宋朝，直抒着国破山河在，看来真的是国难当头，文人感想甚多，可惜无力抵抗强壮的外敌！另外中国的统治史上出现了一个十分有趣的规律，我们的重点军事防御设施都建在北方，比如万里长城用来抗击匈奴烦扰，加强边境防御游牧部落，同时南方相对来说气候温和，物产丰富，来犯的外族又较少，所以经济中心不知不觉中，已经偏向南方，近几年这种趋势更加明显！历史这个车轮不停的碾压着一切，终究有一天我们也会成为历史研究中的一个小分子，某某年有那样的一群人存在，他们被较为几几后，然后他们老去了，有了更新兴的一代！对于历史的发展规律你有什么想补充的，可以给小编留言！

展开

佛陀

「对科学本身研究的基础」科学的四个基本概念

【对科学本身研究的基础】对科学本身的研究也需要基础，也需要有一定的条件，没有这些条件，即使是有专门的研究也得不出结果。这一栏目是对这一问题的叙述。前提研究，由这一研究可以进入科学，以此形成对科学本身的研究。四个基本概念仍属于围绕科学的基本研究，是基于人性、事理等研究以后所作的继续。a、人的需要（科学的目的，经由行为科学研究得出的结果）b、系统（指世界、宇宙，包括社会，精神和物质等，一体概念）c、管理（对思想、行为、行政和科学本身等所有一切的管理）d、科学（指对科学本身的研究，科学学、科学性等，与母体同名）以上研究的过程人的需要、系统、管理、科学，是科学的四个基本概念，由以上可形成对科学本身的研究。这些概念是从哪里来的呢？由更为基础的研究而得来，首先是对人性、事理的研究，以此形成对人性、事理的初步认识，然后是对世界的研究，以此对社会进行观察，发现社会的一切就两点，一是人，二是事，由此确定人性、事理是科学和社会研究的基础。循环，从懵懂到清晰，一个思想和认识逐渐抬高的循环——螺旋。然后再以此寻找与人性、事理对应的研究，确认行为科学、系统科学、管理科学和科学学为科学的基础学科，当确认了以上以后，对每一学科作继续研究，经以上的系列，确认了科学以上的四个基本概念。对科学四个基本概念的确认过程以上是一个经由多学科、多要素、许多问题相互交织，相互作用，反复研究的结果，经过许多循环，由此可以使人的认识得不断的提高。以上较为抽象，这里不做详细的叙述。以上是科学的最基础内容，由此，可形成对科学本身的研究，接着继续，可形成对科学的一步步的认识。关系说明以上有几个维度的思考，在对整个科学研究以前，还需要对以上概念的关系做一个说明。人的需要、系统、管理、科学，是科学本身的概念，在以上的概念中，人的需要是科学的目的，所有科学的活动，目的都是为了人的需要，由此形成了研究的基点；系统、管理、科学，则是为完成目的对科学的要求。以上涵盖几个维度，可以认为，科学就是由以上几个概念，或由以上几个不同维度的思考形成的。经系列的研究确定，科学就是由以上几个概念，或由以上几个不同维度的思考形成的。世界是一个人的世界，人的行为，一切都是为了人的需要，包括科学以及对科学本身的研究和认识都是人的需要，所以，确认人的需要是科学研究的基点。世界是一个人的世界，人的行为及一切都是为了人的需要，所以，确认人的需要是科学研究的基点。关于人的需要人的需要有感性、理性和实际的需要三种情况，对科学本身的研究，是一种实际需要，而且没有什么比它更为重要，因此对它必须有科学和理性的认识。但是由于人往往没有理性思维，缺乏一定的条理性，所以并未能从科学的角度确定以上是人的需要，也因此才有了对这一研究的忽略。只是原因之一。关于系统、管理、科学另外三个概念，系统、管理、科学，a可视为是为完成目的对科学的要求；b科学本身的需要；c科学本来的状况；d或是人对问题的研究必须达到的一种状态。由此可形成对科学的组织，形成对所有研究的指导。系统、管理、科学：a 可视为是为完成目的对科学的要求；b 科学本身的需要；c 科学本来的状况；d 或是人对问题的研究必须达到的一种状态。由此可形成对科学的组织，形成对所有研究的指导。下面对系统、管理、科学三个概念做一个解释。对系统、管理、科学的解释a 系统。这是对科学的第一个要求。在2-4-1有一个“一体论”，该理论阐述了世界一体的状况，一切都属于世界，包括国家、社会，精神、物质，与世界都是一体的；科学是社会的组成部分，因此，科学也是世界的一个存在。以上的所有一切又都是一个个独立的系统，因此，科学也是一个系统。科学的职责是对所有一切的研究，包括物质、生命、社会、思想、文化、国家和行政等所有的一切，由此构成一个体系。对世界的研究，不但要有系统思维，不但要有整体研究，还需要有对世界一切的一个个研究，而且都必须有将它们视为是系统的系统研究。因此，人在以科学对问题的研究以前，首先应是将科学作为一个系统作系统的研究，探知科学本身的系统状况，探知它的产生、发展的规律。有点拗口。系统是科学本身的一个概念，是一种思想，由此可形成对所有研究的指导，因此，在对科学研究之前，还必须有对系统的研究，需建立系统的学科，形成学科体系，必须明确系统的内涵、概念和构造。这里指的是思想，是对思想的研究，不是对子系统、母系统，系统与系统，系统与要素等的描述。对系统的研究就是对科学的研究，这里是一个强调。这里只是一个概述，暂时作这么多叙述。b 管理。也是对科学的要求。重要性不亚于系统的概念。管理，首先指的也是思想，这个思想首先指的是对思想的梳理、整理和管理，问题的研究，从思想开始就必须有管理，包括对科学本身的研究，以及对所有一切的梳理、整理，以此弄清所有一切的来龙去脉。由此延伸到行为，继续向下，会一步步走到所有方面，进入所有的组织，走到行政，由此可形成对所有组织的管理。进入国家，可形成对政治、经济等所有一切的管理。以上是一个从思想开始，从基础一直到行政——对科学的全程要求。与系统一样，管理也是一种思想，一个理论。以上思想可用于所有的研究，用于所有研究的指导，所以在以管理思维对所有问题的研究之前，也必须有对管理本身的研究，对它的研究就是对科学本身的研究。这里是对管理也是对科学的一个强调。c 科学。科学的又一概念。这一概念与母体重名，讲的是对科学本身的研究和审视，讲的实际是“科学学”和“科学性”的问题，既是对问题研究科学性、有效性的研究，也是对科学本身的研究和审视，首先是对科学本身的研究。由此可形成一个专门的学科，以科学的科学，科学的科学的科学对科学作专门的研究。具体的方法：将科学的最基础内容——人性、人的需要、系统、管理，以及上述内容放在一起，将它们融会贯通，然后对科学的本身、本来，以及科学各方面的概念和问题作反复研究，由此形成对科学本身的系统研究和系统认识。经以上的反复，可形成以管理思维、管理理论和系统论，对科学和科学研究的科学管理，以此使科学形成一种系统的运作，接着进入应用。经过以上，可以使没有进入科学的研究进入科学，使已经进入科学的研究，变得更加科学（主要指方法和思维方式），由此，可以使所有的科学形成加速。整理以上高度抽象。对以上现在只是简介，在全部的资料中有对以上的不断解释和叙述。对科学四个基本概念的研究，最后可形成行为科学、系统科学、管理科学和科学学四个学科，以上几个学科的研究相互交织，全部属于横断研究，由此可代表科学的四个方面。科学与社会本为一体，以上四个概念，既是对科学本身的研究基础，也是社会研究的基础，因此，以上概念会随着问题的研究一直走到最后，对所有的研究都会发生作用

展开

力牧

陈先达：学术不玩弄概念

近些年来，我在评审和指导博士中发现一种倾向，就是有的人认为，离现实远点、更远点，学术性强就是一篇好的博士论文。博士论文要有学术性，这是天经地义的，在学术上一文不值，无所言说，这种论文写它干什么？但学术性是否就是在概念中翻跟斗，不知所云呢？当然不是。学术性是追求真理性。真理离不开概念，但真理并不是从概念推演中获得的。学术不是玩弄概念，不是纯逻辑推演，而是来源于实践又能指导实践的具有真理性的研究。任何能称得上是学术研究的工作，都必须具有双重特点。一是回答现实的实际问题而不是伪问题，选题中所论述的问题必须是确实的。研究上帝是否存在，研究一个针尖上能站几个天使之类的问题，不是学术问题，因而也不是科学研究的问题，而是信仰领域中的问题。它既不能证实，也不可能证伪。对信仰者它就是真的，对无神论者它是彻底的谎言。二是它必须有助于正确指导实践活动，并能在实践中得到验证。只有这种研究才称得上是学术研究，也只有这种理论才具有学术性。毛泽东在《整顿党的作风》中专门论述过什么是理论研究，什么是理论家的问题。他说：“我们所要的理论家是什么样的人呢？是要这样的理论家，他们能够依据马克思列宁主义的立场、观点和方法，正确地解释历史中和革命中所发生的实际问题，能够在中国的经济、政治、军事、文化种种问题上给予科学的解释，给予理论的说明。”既不能解释历史和现实问题，又无助于人们的实践活动，只为满足自己的思辨爱好、思辨兴趣而建构的这个体系、那个体系，貌似吓人，仿佛是庞大的建筑，实际上是一淋雨就满是漏洞的纸房子。这不叫学术工作，谈不上学术性。马克思主义是具有实践性和学术性的学说。马克思主义面对的问题是实际的，回答问题是经得起实践检验的。因此，要掌握马克思主义，必须进行严肃认真刻苦的学习，而马克思主义专业的博士论文要追求学术性，必须进行艰苦的科学研究。恩格斯在《德国农民战争》之《1870年第二版序言的补充》中说过，“社会主义自从成为科学以来，就要求人们把它当做科学来对待，就是说，要求人们去研究它”。恩格斯在讲到马克思的《资本论》研究的学术性时说，政治经济学不是供给我们牛奶的奶牛，而是需要认真热心为它工作的科学。马克思为《资本论》殚精竭虑四十年，这算不算学术工作？当然算。它远离资本主义社会的现实吗？没有。是对资本主义社会现实亦步亦趋吗？不是。它基于资本主义社会现实，又超越资本主义社会现实，因为它揭示了资本主义产生、发展和必然灭亡的规律。应该说，越具有现实性，越具有学术性，因为现实永远是为生活于现实社会之中的人所关心的。生活于当代社会之中的人们不会关心秦汉晋隋唐的社会现实，除非历史研究，而历史研究也不是为古而古，而总是与现实有关。现实性是哲学社会科学研究的重要因素。只要这种所谓“现实性”不是对现实不公正现象的辩护或论证，而是真正进行科学剖析，为人类指出前进的方向，这种学术性就永远为人们所欢迎。只有自己感兴趣或只是少数几个同行感兴趣的学术性，是走不出书房门或学术小圈子的。全部人类历史证明，这种所谓“学术性”著作能传下来的几乎没有，正如某些闺阁诗一样。凡是能流传下来的都是具有社会意义而又具有学术性的著作。王船山本欲藏之名山的著作之所以没有被埋藏在深山，就是因为它既具有现实性又具有学术性。后人不会让其藏之深山，而是传之于世。追求一个人的所谓学术性，是没有学术性的；只有追求社会意义上的学术性，才是真正的学术性。学术性的特点具有相对持久性和稳定性，因为其中包含某些真知灼见。转瞬即逝的所谓学术性，不是真正的学术性，而只是一张获得博士证书的入场券。如果博士论文的“学术性”在答辩结束后就被宣告终结，这种学术性，还是不要追求为好。（作者为中国人民大学哲学系教授）本文原载于2014年9月22日北京日报。

展开

田鸠

深度 | 迁移学习全面概述：从基本概念到相关研究

选自sebastianruder.com作者：Sebastian Ruder机器之心编译参与：马亚雄、吴攀、李亚洲将在一个场景中学习到的知识迁移到另一个场景应用中一直是人工智能研究领域的一个热门领域，本文从迁移学习的基本概念谈起，介绍了迁移学习的技术、应用和方法。本文作者为 Insight Research Centre for Data Analytics 的自然语言处理与深度学习博士生 Sebastian Ruder，他同时也是爱尔兰都柏林的文本分析创业公司 AYLIEN 的研究科学家。目录：1.什么是迁移学习？2.为什么现在需要迁移学习？3.迁移学习的定义4.迁移学习的场景5.迁移学习的应用从模拟中学习适应到新的域跨语言迁移知识6.迁移学习的方法使用预训练的 CNN 特征学习域不变的表征让表征更加相似混淆域7.相关的研究领域半监督学习更有效地使用可用的数据提高模型的泛化能力让模型更加稳健多任务学习持续学习zero-shot 学习8.总结近年来，我们越来越擅长训练深度神经网络，使其能从大量的有标签的数据中学习非常准确的输入到输出的映射，无论它们是图像、语句还是标签预测。我们的模型仍旧极度缺乏泛化到不同于训练的环境的能力。什么时候需要这种能力呢？就是你每一次将你的模型用到现实世界，而不是精心构建的数据集的时候。现实世界是混乱的，并且包含大量全新的场景，其中很多是你的模型在训练的时候未曾遇到的，因此这又使得模型不足以做出好的预测。将知识迁移到新环境中的能力通常被称为迁移学习（transfer learning），这就是本文将讨论的内容。在这篇文章中，我首先会将迁移学习与机器学习的最普遍和成功的范式——监督学习——做一下对比。然后我会概括一下迁移学习值得我们去关注的原因。随后，我会给出一个更加技术性的定义以及介绍多个不同的迁移学习的场景。然后，我会提供一些迁移学习的应用的例子，再探究一些可以被用来迁移知识的实际方法。最后，我会概述一下相关的研究方向，并展望一下未来的前景。什么是迁移学习？在机器学习的经典监督学习场景中，如果我们要针对一些任务和域 A 训练一个模型，我们会假设被提供了针对同一个域和任务的标签数据。我们可以在图 1 中清楚地看到这一点，其中我们的模型 A 在训练数据和测试数据中的域和任务都是一样的（后面我会详细地定义什么是任务（task），以及什么是域（domain））。现在，让我们假设，一个任务就是我们的模型要去执行的目标，例如，识别图片中的物体；而域就是数据的来源，例如，来自于旧金山的咖啡店的照片。图 1：机器学习领域中传统监督学习的设置现在我们可以在这个数据集上训练一个模型 A，并期望它在同一个任务和域中的未知数据上表现良好。在另一种情况下，当给定一些任务或域 B 的数据时，我们还需要可以用来训练模型 B 的有标签数据，这些数据要属于同一个任务和域，这样我们才能预期能在这个数据集上表现良好。当我们没有足够的来自于我们关心的任务或域的标签数据来训练可靠的模型时，传统的监督学习范式就支持不了了。如果我们要训练一个模型来检测在夜间拍摄的照片上的行人，我们可以用一个在相似的域中训练的模型，例如白天拍摄的图片。然而，实际上，我们经常会遭遇表现上的衰退或者崩溃，因为模型已经继承了它的训练数据中的偏差，不知道如何泛化到新的域中。如果我们要训练一个模型来执行新的任务，例如检测骑自行车的人，我们甚至不能够使用已有的模型，因为任务之间的标签都是不一样的。迁移学习允许我们通过借用已经存在的一些相关的任务或域的标签数据来处理这些场景。我们尝试着把在源域中解决源任务时获得的知识存储下来，并将其应用在我们感兴趣的目标域中的目标任务上去，如图 2 所示。图 2：迁移学习的设置在实践中，我们力求将尽可能多的知识从源环境迁移到目标任务和域中。依据数据的不同，这种知识有不同的形式：它可以涉及物体是如何组成的，以允许我们更加容易地识别新的对象；也可以是关于人们用来表达观点的普通词汇，等等。为什么现在需要迁移学习？前百度首席科学家、斯坦福的教授吴恩达（Andrew Ng）在广受流传的 2016 年 NIPS 会议的教程中曾经说过：「迁移学习将会是继监督学习之后的下一个机器学习商业成功的驱动力」。图 3：吴恩达在 2016 年 NIPS 上谈论迁移学习特别地，他在白板上画了一个图表，我尽可能忠实地将它复制在如下所示的图 4 中（抱歉坐标轴没有详细的标注）。据吴恩达说，迁移学习将成为机器学习在产业界取得成功的一个关键驱动力。图 4：吴恩达心中机器学习产业成功的驱动力不容置疑，机器学习在产业界的应用和成功主要是受监督学习的驱动。受到深度学习中的进步、更强大的计算资源以及大量的标签数据集的推动，监督学习是人们对人工智能的兴趣复苏浪潮、多轮融资以及收购的主要原因，尤其是我们近年来看到的机器学习的应用，它们已经成为了我们生活的一部分。如果我们忽视关于另一个人工智能寒冬的怀疑和传言，并且相信吴恩达的预见，这种成功很可能会持续下去。然而，不太清楚为什么已经存在了大约几十年并且至今在产业界很少被使用的迁移学习会出现吴恩达所预言的那种爆炸式增长。更有甚者，与机器学习的其他领域（如无监督学习和强化学习等）相比，迁移学习目前受到的关注更少。而且那些领域也正越来越受欢迎：无监督学习是实现通用人工智能的关键成分（如图 5 中 Yann LeCun 所说），人们对此兴趣已经复苏，尤其是在生成对抗网络（GAN）的推动下。反过来，强化学习在 Google DeepMind 的牵头下已经实现游戏 AI 的进步，AlphaGo 的成功堪称典范，并且也早已在现实世界中实现了成功，例如将 Google 数据中心的冷却费用降低了 40%。这两个领域虽然很有希望，但是在可预见的未来可能只会有着相对较小的商业影响力，并且大部分还停留在前沿研究论文的范围之内，因为它们仍然面临着许多挑战。图 5：显然迁移学习没有出现在 Yann LeCun 的蛋糕成分问题中什么使得迁移学习与众不同呢？下面我们会看一下在我看来驱使了吴恩达的预见的因素，并且总结一下现在正是重视迁移学习的时机的原因。目前产业界对机器学习的应用分为两类：一方面，在过去几年中，我们已经获得了训练越来越准确的模型的能力。我们现在所处的阶段，对很多任务而言，最先进的模型已经达到了这样的水平：它们的表现是如此的好以至于对使用者来说不再有障碍了。有多么好呢？最新的 ImageNet 上的残差网络 [1] 在进行物体识别时实现了超越人类的性能；Google 的 Smart Reply 系统 [2] 可以处理所有移动手机中的回复的 10%；语音识别的错误率在持续降低，并且比键盘输入更加准确 [3]；我们已经实现了和皮肤科医师一样好的自动皮肤癌识别；Google 的神经机器翻译系统（NMT）[4] 已被用在了超过 10 种以上的语言对的生产中；百度可以实时地生成逼真的语音；类似的还有很多很多。这种成熟度允许将这些模型大规模地部署到数百万的用户上，并且已经得到了广泛的采用。另一方面，这些成功的模型都是极其地重视数据的，依靠大量的标签数据来实现它们的性能。对一些任务和域而言，经过了多年的精心收集，这种数据是可以得到的。在少数情况下，数据是公开的，例如 ImageNet[5]，但是在很多语音或者 MT 的数据集中，大量的标签数据都是有专利的，或者是很昂贵的，因为它们在竞争中提供了前沿参考。同时，把机器学习的模型应用在自然环境中时，模型会面临大量之前未曾遇到的条件，它不知道如何去处理；每一个用户都有他们自己的偏好，也需要处理和生成不同于之前用来训练的数据；要求模型执行很多和训练相关但是不相同的任务。在所有这些情况下，尽管我们最先进的模型在它们被训练的任务和域上展示出了和人类一样甚至超越人类的性能，然而还是遭遇了明显的表现下降甚至完全失败。迁移学习可以帮助我们处理这些全新的场景，它是机器学习在没有大量标签数据的任务和域中规模化应用所必须的。到目前为止，我们已经把我们的模型应用在了能够容易获取数据的任务和域中。为了应对分布的长尾，我们必须学会把已经学到的知识迁移到新的任务和域中。为了做到这个，我们需要理解迁移学习所涉及到的概念。基于这个原因，我会在下面的内容中给出更加技术性的定义。迁移学习的定义为了这个定义，我会紧密地遵循 Pan 和 Yang(2010) 所做的杰出的综述 [6]，并以一个二元文档分类为例。迁移学习涉及到域和任务的概念。一个域 D 由一个特征空间 X 和特征空间上的边际概率分布 P(X) 组成，其中 X=x1,…, xn∈X。对于有很多词袋表征（bag-of-words representation）的文档分类，X 是所有文档表征的空间，xi 是第 i 个单词的二进制特征，X 是一个特定的文档。（注：这里的 X 有两种不同的形式，这里不太好呈现，具体请参考原文。）给定一个域 D={X,P(X)}，一个任务 T 由一个标签空间 y 以及一个条件概率分布 P（Y|X）构成，这个条件概率分布通常是从由特征—标签对 xi∈X,yi∈Y 组成的训练数据中学习得到。在我们的文档分类的例子中，Y 是所有标签的集合（即真（True）或假（False）），yi 要么为真，要么为假。给定一个源域 Ds，一个对应的源任务 Ts，还有目标域 Dt，以及目标任务 Tt，现在，迁移学习的目的就是：在 Ds≠Dt，Ts≠Tt 的情况下，让我们在具备来源于 Ds 和 Ts 的信息时，学习得到目标域 Dt 中的条件概率分布 P（Yt|Xt）。绝大多数情况下，假设可以获得的有标签的目标样本是有限的，有标签的目标样本远少于源样本。由于域 D 和任务 T 都被定义为元组（tuple），所以这些不平衡就会带来四个迁移学习的场景，我们将在下面讨论。迁移学习的场景给定源域和目标域 Ds 和 Dt，其中，D={X,P(X)}，并且给定源任务和目标任务 Ts 和 Tt，其中 T={Y,P(Y|X)}。源和目标的情况可以以四种方式变化，我们仍然以我们的文档分类的例子在下面描述：XS≠XT。源域和目标域的特征空间不同，例如，文档是用两种不同的语言写的。在自然语言处理的背景下，这通常被称为跨语言适应（cross-lingual adaptation）。P(Xs)≠P(Xt)。源域和目标域的边际概率分布不同，例如，两个文档有着不同的主题。这个情景通常被称为域适应（domain adaptation）。YS≠YT。两个任务的标签空间不同，例如，在目标任务中，文档需要被分配不同的标签。实际上，这种场景通常发生在场景 4 中，因为不同的任务拥有不同的标签空间，但是拥有相同的条件概率分布，这是极其罕见的，P（Ys|Xs）≠P（Yt|Xt）。源任务和目标任务的条件概率分布不同，例如，源和目标文档在类别上是不均衡的。这种场景在实际中是比较常见的，诸如过采样、欠采样以及 SMOTE[7] 这些方法被广泛应用。在明白了与迁移学习相关的概念和常被用到的一些场景之后，我们将要介绍一些能够说明它的潜力的应用。迁移学习的应用从模拟中学习一个非常令我兴奋并且我认为我们在将来会见到更多的迁移学习应用就是从模拟中学习。对很多依靠硬件来交互的机器学习应用而言，在现实世界中收集数据、训练模型，要么很昂贵，要么很耗时间，要么只是太危险。所以最好能以某些风险较小的其他方式来收集数据。模拟是针对这个问题的首选工具，在现实世界中它被用来实现很多先进的机器学习系统。从模拟中学习并将学到的知识应用在现实世界，这是迁移学习场景 2 中的实例，因为源域和目标域的特征空间是一样的（仅仅依靠像素），但是模拟和现实世界的边际概率分布是不一样的，即模拟和目标域中的物体看上去是不同的，尽管随着模拟的逐渐逼真，这种差距会消失。同时，模拟和现实世界的条件概率分布可能是不一样的，因为模拟不会完全复制现实世界中的所有反应，例如，一个物理引擎不会完全模仿现实世界中物体的交互。图 6：谷歌的自动驾驶车辆（来源： Google Research 博客）从模拟中学习有利于让数据收集变得更加容易，因为物体可以容易地被限制和分析，同时实现快速训练，因为学习可以在多个实例之间并行进行。因此，这是需要与现实世界进行交互的大规模机器学习项目的先决条件，例如自动驾驶汽车。谷歌无人车的技术主管 Zhaoyin Jia 说，「如果你真的想做无人驾驶车，模拟是必需的」。Udacity 已经开源了它用来进行无人驾驶汽车工程纳米学位教学的模拟器，在图 7 中可以看到，OpenAI 的 Universe 平台将可能允许用《侠盗飞车 5(GTA 5)》或者其他视频游戏来训练无人驾驶汽车。图 7：Udacity 的无人驾驶汽车模拟器另一个必需从模拟中学习的领域是机器人：在实际的机器人上训练模型是非常缓慢和昂贵的。从模拟中学习并且将知识迁移到现实世界的机器人上的方式能缓解这个问题，并且这种方面最近正得到越来越多的关注 [8]。图 8 中可以看到一个在现实世界和模拟中操作数据的一个例子。图 8：机器人和模拟图片 (Rusu et al., 2016)最后，另一个方向是通向通用人工智能的途径，其中模拟会是一个必需的组成部分。在现实世界中直接训练一个代理来实现通用人工智能的代价太高，并且不必要的复杂度还会在初始的时候阻碍训练。相反，如果基于诸如 CommAI-env [9] 的模拟环境的话，学习也许会更加成功，如图 9 所示。图 9：Facebook 人工智能研究院的 CommAI-env (Mikolov et al., 2015)适应到新的域尽管从模拟中学习是域适应的一个特例，总结一些域适应的其他例子也是有价值的。域适应在视觉中是一个常规的需求，因为标签信息易于获取的数据和我们实际关心的数据经常是不一样的，无论这涉及到如图 11 所示的识别自行车还是自然界中的其他物体。即使训练数据和测试数据看起来是一样的，训练数据也仍然可能包含人类难以察觉的偏差，而模型能够利用这种偏差在训练数据上实现过拟合 [10]。图 10：不同的视觉域 (Sun et al., 2016)另一个常见的域适应场景涉及到适应不同的文本类型：标准的自然语言处理工具（例如词性标签器或者解析器）一般都是在诸如华尔街日报这种新闻数据上进行训练，这种新闻数据在过去都是用来评价这些模型的。然而，在新闻数据上训练出的模型面临挑战，难以应对更加新颖的文本形式，例如社交媒体信息。图 11：不同的文本类型/风格即使在产品评价这样的域中，人们采用不同的词汇和短语去表达同样的观点。因此，在一种类型的评论上训练出的模型应该能够解决人们使用的通用和特定领域的意见词，以免被域的变化所混淆。图 12：不同的主题最后，尽管以上的挑战都是处理一般的文本或者图像类型，如果我们考虑涉及到单个用户或者用户组的域，问题就被放大了：以自动语音识别（ASR）为例。语音指定会成为下一个大平台，据预测，到 2020 年，我们所有搜索的 50% 将会通过语音执行。大多数自动语音识别系统都在由 500 位说话人组成的标准数据集上进行传统测试。如此一来，大多数拥有标准口音的人则是幸运的，然而，移民、非标准口音的人、语音障碍的人以及儿童则会不容易被理解。现在比以往任何时候都需要能够适应个体用户和少数群体的系统，以确保每个人的声音都能被听懂。图 13：不同的口音跨语言迁移知识最后，在我看来，迁移学习的另一个杀手级别的应用是将知识从一种语言迁移到另一种语言，我曾经在此处写过一篇关于跨语言环境的嵌入式模型的文章（博文链接：http://sebastianruder.com/cross-lingual-embeddings/index.html）。可靠的跨语言域的方法会允许我们借用大量的已有的英文标签数据并将其应用在任何一种语言中，尤其是没有足够服务且真正缺少资源的语言。已有的最先进的方法看起来仍然太过理想，但是以 zero-shot 翻译 [11] 为例的最近的进展已在这个领域取得了快速的进步。虽然到目前为止我们已经考虑过一些迁移学习的特殊应用，但是现在我们要研究一下文献中那些解决了一些挑战的实际方法和方向。迁移学习的方法在解决前文提及的四种迁移学习场景上，迁移学习拥有悠久的研究和技术的历史。深度学习的出现导致了一系列迁移学习的新方法，我们下面将会概览其中的一些。参考文献 [6] 可以看到一些早期方法的综述。使用预训练的 CNN 特征为了了解目前应用中最常见的迁移学习方式，我们必须理解在 ImageNet 上大型卷积神经网络所取得的杰出成功 [12]。理解卷积神经网络虽然这些模型工作方式的许多细节仍然是一个谜，但我们现在已经意识到，较低的卷积层捕获低级图像特征，例如边缘（见图 14），而较高的卷积层捕获越来越复杂的细节，例如身体部位、面部和其他组合性特征。图 14:AlexNet 学习得到的实例滤波器 (Krizhevsky et al., 2012)全连接层通常被认为是捕获了与解决相应任务相关的信息，例如 AlexNet 的全连接层可以指出哪些特征与在 1000 个物体类中分类一张图片相关的。然而，尽管知道一只猫有胡须、爪子、毛皮等是将一个动物识别为猫所必需的（参见图 15），但它并不能帮助我们识别新物体或解决其他共同的视觉任务（如场景识别、细粒度识别、属性检测和图像检索）。图 15：这篇博文的标志猫然而，能够帮助我们的是捕获关于一幅图像是如何组成的以及它包括什么样的边缘和形状组合的通用信息。正如我们之前所描述的，这种信息被包含在在 ImageNet 上训练出的卷积神经网络的最后卷积层或者最后一层之前的全连接层。所以，对于一个新任务，我们可以简单地使用这种由最先进的卷积神经网络在 ImageNet 上预训练出的现成特征，并在这些抽象的特征上面训练出新的模型。在实际中，我们要么保持预训练的参数固定不变，要么以一个较小的学习率来调节它们，以保证我们不会忘记之前学习到的知识。这个方法已经被证明可以在一系列的视觉任务 [13] 以及一些依靠图像作为输入的任务（例如看图说话）上实现出色的结果。在 ImageNet 上训练出的模型似乎能够捕获到关于动物以及物体的构造和组成方式的细节，这种方式通常在处理图像的时候是有价值的。因此，ImageNet 上的任务似乎对于一般的计算机视觉问题来说是一个很好的代理（proxy），因为在其中所需的相同知识也与许多其他任务相关。学习图像的隐含结构一个类似的假设被用来推动生成模型：当训练一个生成模型的时候，我们假设生成逼真图像的能力需要对图像隐含结构的理解，它反过来可以被用在很多其他任务中。这个假设本身也依赖一个前提，即所有图像都由一个低维度的流形结构决定，这就是说，可以用一个模型来抽象出图像的隐含结构。利用生成对抗网络来生成逼真图片的最新进展揭示，这种模型或许真的存在，如图 16 所示，卧室空间的点之间的逼真过渡证明了这个模型的能力。图 16：行走在卧室的图像流形中预训练的特征在视觉之外的领域有用吗？现成的卷积神经网络特征在视觉任务上有着无出其右的结果，但是问题在于，使用其它的数据，在其它领域（例如语言）能否复制这种成功？目前，对自然语言处理而言没有能够实现与图像领域一样令人惊叹结果的现成特征。为什么呢？这样的特征是否存在呢？如果不存在，那为什么视觉比语言更有利于这种形式的迁移呢？诸如词性标注或分块这类低级别任务的输出就可以被比作现成的特征，但是在没有语法学的帮助下，不能采集到更细粒度的特征。正如我们看到的，可概括的现成特征似乎存在似乎存在于众多任务中原型任务中。在视觉中，物体识别就占据了这样的地位。在语言中，最接近的类似物可能是语言建模：为了预测给定词汇序列中的下一个单词或者句子，模型需要处理语言是如何构造的知识，需要理解那些单词很可能是相关的，那些单词很可能是彼此跟随出现的，需要对长期依赖关系进行建模，等等。尽管最先进的语言模型越来越接近人类的水平 [15]，但是它们的功能使用是有限的。同时语言建模方面的进步已经为其他任务也带来了正面的结果：用语言模型的目标函数对一个模型进行预训练能够提升性能 [16]。此外，在一个大规模的无标签的语料库上用一个近似的语言模型目标函数进行预训练的单词嵌入已经变得普遍 [17]。虽然它们不如视觉中的现成特征那样有效，但仍然能够带来相当大的收益 [18]，并且它们可以被看做是从大规模的无标签的语料库向通用域知识的一种简单形式的迁移。尽管自然语言处理领域的通用代理任务（general proxy）在当前似乎是无法企及的，但是辅助任务可以采用局部代理的形式。不管是通过多任务目标 [19] 还是综合任务目标 [20,21]，它们都可以被用来为模型增加更多的相关知识。使用预训练特征是目前做迁移学习的最直接、最常用的方式。然而，到目前为止它并不是唯一的一种。学习域不变的表征在实际中，预训练特征通常被用在我们想适应的新任务的场景适应中 3。对其他场景而言，另一个由深度学习实现知识迁移的方式是学习基于域而不会改变的表征。这个方法在概念上和我们思考过的使用预训练的卷积神经网络特征非常相似：两者都只编码关于域的一般知识。然而，给非视觉任务创建基于特定域的不变表征要比为所有任务生成有用的表征要更加经济，更加可行。ImageNet 已经花费了多年、数千个小时来创建，然而为了创建域不变的表征，我们通常只需要每个域中的无标签数据。这种表征通常用大量的去噪自动解码器学习得到，而且已经在自然语言处理中取得了和视觉中一样的成功 [22,23]。让表征更加相似为了提高学到的表征从源域到目标域的可迁移性，我们希望两个域之间的表征尽可能相似，这样一来，我们就不用考虑可能阻碍迁移的特定域的特征，只需要考虑域之间的共同点。与其仅仅让我们的自动解码器学到一些表征，不如积极地激励以让两个域中的表征和彼此变得更加相似。我们可以像预处理步骤一样把这个直接应用在我们的数据表证过程中 [25,26]，然后把新的表征用来训练。我们也可以促使我们的模型中的表征变得更加相似 [27,28]。混淆域另一个最近变得流行的、用来确保两个域的表征之间相似性的方式就是在现有的模型上增加一个目标函数来鼓励两个域的混淆 [29,30]。这个域混淆的损失函数就是常规的分类损失函数，模型尝试预测输入样例的类别。然而，又和常规的损失函数有所不同，如图 17 所示，从损失函数到网络的剩余部分的流动是反向的。图 17:用一个梯度反向层（gradient reversal layer）来混淆域。梯度反向层会导致模型最大化误差，而不是学着去最小化域分类的损失函数的误差。在实际中，这意味着该模型会学习那些允许最小化原目标函数的表征，同时不允许区分两个域，这样有利于知识迁移。如图 18 所示，尽管仅仅使用常规的目标函数训练的模型可以基于它学到的表征清晰地区分两种域，但是用域方法增强的目标函数训练得到的模型却不能做到这一点。图 18：常规模型和域混淆模型的域分类得分比较 (Tzeng et al, 2015)相关的研究领域尽管这篇博文是关于迁移学习的，但是到今天为止，迁移学习并不是唯一一个试图利用有限的数据、在新的任务上使用学到的知识、并让模型在新环境上具有较好的泛化能力的机器学习领域。所以，在下面的内容中，我们会介绍一些其他的与迁移学习相关或者能够补充迁移学习目标的方向。半监督学习迁移学习力图最大效率地使用某些任务或者域中的无标签数据。这也是半监督学习所恪守的准则，半监督学习遵循经典机器学习的设定，但是它仅仅采用有限数量的标签数据来训练。如此，半监督域适应本质上就是在域变化的情况下进行半监督学习。许多来自于半监督学习的教训和思想同样地适用于迁移学习。文献 [31] 是一个很不错的关于半监督学习的综述。更有效地使用可用的数据另外一个与迁移学习和半监督学习相关的方向是让模型在有限数量的数据上运行得更好。这个可以用几种方式实现：你可以使用无监督学习或者半监督学习从无标签数据中抽取信息，以减少对有标签样本的依赖；你可以允许模型能够获取一些数据的固有属性，同时减轻正则化过程中的过拟合倾向；最后，你还可以使用至今仍然被忽视或者位于不明显的地方的一些数据。作为用户生成内容的意外结果，这种巧合的数据 [32] 可能会被创建，例如能够提升命名实体和词性标注的超链接；它也可能作为注释的副产品存在，例如注释器不一致（annotator disagreement) 可能改进标注或者解析；或者来源于用户行为的数据，例如视线追踪或者键入变化，可以影响自然语言处理的任务。虽然这些数据只是以有限的方式被利用，但是这样的例子鼓励我们在意外的地方查找数据，并研究检索数据的新方法。提高模型的泛化能力让模型更好地泛化也是与此相关的一个方向。为了实现更好的泛化能力，我们首先必须理解大规模神经网络的行为和错综复杂的结构，并且去研究它们泛化的原因和方式。最近的工作已经朝着这个目标迈出了大有希望的步伐 [33]，但是很多问题仍然等待解答。让模型更加稳健（robust)尽管提升我们的模型的泛化能力这方面已经比较成功了，在类似的例子上面我们也许泛化得很好，但是在出乎意料或者者非典型的输入情况下仍然会失败。所以，一个关键的补充目标就是让我们的模型更加稳健。在近来对抗学习的进步的推动下，这个方向越来越受关注，并且，最近的方法研究了很多让模型在最糟糕的情况下或者面对不同设置的对抗样本时变得更加稳健的方式 [34,35]。多任务学习在迁移学习中，我们主要关心在我们的目标任务和域上友好的表现。相反，多任务学习中的目标是在所有可用的任务上都要表现良好，尽管某个标签数据通常都被假定在一个任务上。虽然多任务学习的方法没有直接用在迁移学习上，但是对多任务学习有利的关于任务的思想 [19] 仍然能够指引迁移学习的决策。持续学习虽然多任务学习允许我们在许多任务中保留知识，而不会对我们的源任务造成性能损失，但只有在所有任务都处于训练时间的情况下，这才是可能的。对于每个新任务，我们通常需要重新训练我们所有任务的模型。然而，在现实世界中，我们希望一个代理能够通过使用它以往的一些经验来处理逐渐变得复杂的任务。为了达到这个目的，我们需要让一个模型在不忘记的情况下持续地学习。这个机器学习的领域被称为学会学习 [36]、元学习、终生学习，或者持续学习。持续学习在最近的强化学习 (强化学习以 Google DeepMind 对通用学习代理的探索而著称) 上已经取得了成功 [37,38,39]，也正在被用于序列到序列的模型上 [40]。zero-shot 学习最后，如果我们把迁移学习使用到极限，并且想要仅仅从很少的（一个，甚至 0 个）实例中学习，这就分别得到了 few-shot、one-shot 以及 zero-shot 学习。让模型执行 one-shot 和 zero-shot 学习，无疑属于机器学习中最艰难的问题。而另一方面，这却是我们人类天生就会的：幼年的时候，为了让我们能够认出任何狗狗，我们仅仅需要被告知一次「这是一条狗」，然而成年人可以仅通过在文中阅读就理解一个东西的本质，不需要事先见过它。one-shot 学习的新进展利用了这样的思想，即为了在测试的时候实现好的性能，模型需要显式地被训练，从而进行 one-shot 学习 [41,42]。但更加逼真、具有概括性的 zero-shot 学习设置在最近已经引起了注意，在零点学习中训练类别出现在测试的时候 [43]。总结总之，迁移学习提供了很多令人兴奋的研究方向，特别是许多应用需要能够将知识迁移到新的任务和域中的模型。希望我在这篇博客中为你们给出了关于迁移学习的概述并且激发了你们的兴趣。参考文献：因参考文献太多，超出微信字数限制，读者可点击以下原文链接查看。原文链接：http://sebastianruder.com/transfer-learning/

展开

漂疽疥臃

数的研究系列之自定义数的含义

题目：2018年重庆真题A卷第25题25、对任意一个四位数n,如果千位与十位上的数字之和为9，百位与个位上的数字之和也为9，则称n为“极数”.（1）请任意写出三个“极数”；并猜想任意一个“极数”是否是99的倍数，请说明理由；（2）如果一个正整数a是另一个正整数b的平方，则称正整数a是完全平方数，若四位数m为“极数”，记D（m）=m/33.求满足D（m）是完全平方数的所有m.问（1）根据题意写出符合要求的四位数即可：2475,1386,4653等。猜想是99的倍数，设千位上的数字是a，百位上的数字是b，相应十位上的数字是（9-a），个位上的数字是（9-b）,这个四位数可表示为：1000a+100b+10(9-a)+(9-b)整理可得：990a+99b+99=99(10a+b+1)作为一个四位数，1≤a≤9，0≤b≤9，且a，b为正整数。(10a+b+1)为整数，任意极数是99的倍数。问（2）D(m)=m/33=99(10a+b+1)/33=3(10a+b+1),则3(10a+b+1)是完全平方数。根据范围1≤a≤9，0≤b≤9，且a，b为正整数，(10a+b+1)的最小值是：当a=1,b=0，最小值是11；最大值是当a=9,b=9时，最大值是100.要使得D(m)是个完全平方数，则D(m)=3*3*x*x,其中3*x*x=(10a+b+1)，取值范围是11至100.3*1*1（舍），3*2*2=12（可取），3*3*3=27(可取)，3*4*4=48（可取），3*5*5=75（可取），3*6*6=108（超范围）综上D（m）=12*3=36,81,104,225.m=1188或2673或4752或7425

展开

庞朴

以资本的定义为例说明经济研究的历史性

经济学是否能帮助一个国家实现经济增长，帮助一个企业做大做强，帮助一个家庭实现生活富裕，经济学家们是给出肯定答案的。把经济学定义为研究财富的学问，研究发展的学问，本质上是把经济学当成生产力看待的。马克思主义认为，这是不可能的。因为实现经济增长、家庭富裕的不是依靠经济学理论，而是生产力，是工作。经济学的作用是充实头脑。马克思在他的纲领性文献《<政治经济学批判>序言》中说：“我考察资产阶级经济制度是按照以下的次序：资本、土地所有制、雇佣劳动”（见《马克思恩格斯选集》第二卷第81页）。这本身就说明资本是资产阶级经济制度的产物。马克思要研究的是资本主义生产方式带来的后果，就是对社会的改变。目的是认识。亚当.斯密的经济学是从分工开始的。精细分工作为大工业的工艺标志是资本主义生产方式的核心内容之一。斯密从分工开始研究经济学理论，可见是把资本主义生产当作起点的。而马克思是从商品和雇佣劳动开始经济学研究，可见是把生产方式的历史变革当作研究对象的。亚当.斯密的学说是资本家的。学术研究的历史贡献是历史运动规律，而不是一个对象的横向对比。历史研究方法是辩证唯物主义的研究方法，是哲学的方法。比如资本这个术语，在经济学理论的历史上，其定义是一直在变化过程中。我们研究资本，不是把资本这个经济范畴当作前提，而是当作现实的阶段结果。要研究它的历史，更要研究它的演化。这样才能研究资本的规律。资本，是人类的经济生活进入到资本主义生产方式以后被定义的。在资本主义生产方式之前，是不存在资本的现代定义的，于是在经济学理论的早期是不把土地等经济要素作为资本看待的。这种定义是不科学的。其不科学性在于，它不是从性质上去定义，而只是从现象，或者说从分类上去定义。例如约翰.斯图亚特.穆勒就是这样定义资本的：“如前所述，除去劳动与自然界的力量这两种基本的、普遍的生产要素之外，还有一种生产要素，缺少了它，任何生产活动均不可能超越其原始的并且不充分的状态，即事先积累的前期劳动的产品的存量。这种劳动产品所积累的存量就叫做资本。”（见约翰.斯图亚特.穆勒《政治经济学原理（上）》第30页）。这一现象至少说明，任何经济学理论的完善都是以经济活动的发展为基础的。在那个时候，由于资本主义生产方式刚从封建的生产方式中独立出来，还没有取得统治地位，封建主义的生产方式还没有被彻底清除，于是在理论上是无法将封建主义生产方式赖以存在的基础——土地和自然力纳入资本范畴的。而经济发展到今天，资本主义生产方式不但成为现代社会的唯一的生产方式，而且一切新的经济要素陆续产生了，比如商标、专利等等这些在封建主义生产下不存在的经济要素。于是资本所囊括的经济要素不但不再有例外，即土地，自然力等等能够进入经济活动中的所有要素都是资本，而且一些在资本主义生产方式下新产生的经济要素也都是资本，它们从出生那天就是资本。在现代社会资本可以这样定义：资本是在资本主义生产方式下经济要素的学术称谓，在现代社会，资本就是能够参与经营活动的要素所有权。这个概念可以对下列问题进行解释，即在经济领域，人是以劳动出现的，当劳动与资本形成契约关系以后，劳动所有权就归企业所有，因此现代理论把劳动称为劳动资本。对于劳动者个人来说，劳动则不是资本。

展开

学术研究的定义

首页

考研

考博

院校选择

专业选择

研究生动态

研究生题库

研究的定义