欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
值得收藏!数据分析最常用的18个概念,终于有人讲明白了化醇

值得收藏!数据分析最常用的18个概念,终于有人讲明白了

导读:大多数情况下,数据分析的过程必须包括数据探索的过程。数据探索可以有两个层面的理解:一是仅利用一些工具,对数据的特征进行查看;二是根据数据特征,感知数据价值,以决定是否需要对别的字段进行探索,或者决定如何加工这些字段以发挥数据分析的价值。字段的选取既需要技术手段的支撑,也需要数据分析者的经验和对解决问题的深入理解。01 数值类型在进行数据分析时,往往需要明确每个字段的数据类型。数据类型代表了数据的业务含义,分为3个类型:1. 区间型数据(Interval)数值型数据的取值都是数值类型,其大小代表了对象的状态。比如,年收入的取值,其大小代表了其收入状态。2. 分类型数据(Categorical)分类型数据的每一个取值都代表了一个类别,如性别,两个取值代表了两个群体。3. 序数型数据(Ordinal)和分类型数据非常相似,每个取值代表了不同的类别。但是,序数型的数据还有另外一层含义就是每个取值是有大小之分的。比如,如果将年收入划分为3个档次:高、中、低,则不同的取值既有类别之分,也有大小之分。如果不了解字段的实际业务含义,数据分析人员可能会出现数据类型判断失误。比如字段的取值为“1”“2”“3”等,并不意味着是一个数值类型,它的业务含义还可以是一个分类型的字段,“1”“2”“3”分别代表了一个类别,其大小没有任何含义。所以,充分了解字段的含义是很重要的。很多的数据分析工具会根据数据中的字段的实际取值,做出类型的自动判断:如字符型的数据,一般都认定为分类型数据;如某个字段的所有取值只有“1”“2”“3”,则判断其为分类型变量,然后经过用户的再次判断,其很可能是序数型变量。不同的数据类型,在算法进行模型训练时,处理和对待的方式是不同的。区间型数据是直接进行计算的;分类型数据是先将其转换为稀疏矩阵:每一个类别是一个新的字段,然后根据其取值“1”“0”进行计算。在很多场景下,人们习惯将分类型数据和序数型数据统称为分类型数据,即数据类型可以是两个:数值型数据(区间型数据)和分类型数据(分类型数据和序数型数据)。02 连续型数据的探索连续型数据的探索,其关注点主要是通过统计指标来反映其分布和特点。典型的统计指标有以下几个:4. 缺失值取值为空的值即为缺失值。缺失值比例是确定该字段是否可用的重要指标。一般情况下,如果缺失率超过50%,则该字段就完全不可用。在很多情况下,我们需要区别对待null和0的关系。Null为缺失值,0是有效值。这个区别很重要,要小心区别对待。例如,某客户在银行内的某账户余额为null,意味着该客户可能没有该账户。但是如果将null改为0,则是说用户有该账户,且账户余额为零。5. 均值(Mean)顾名思义,均值即平均值。其大小反映了整体的水平。一个数学平均成绩是95分的班级,肯定比平均成绩是80分的班级的数学能力要好。6. 最大值和最小值最大值和最小值即每个数据集中的最大数和最小数。7. 方差方差反映各个取值距平均值的离散程度。虽然有时两组数据的平均值大小可能是相同的,但是各个观察量的离散程度却很少能相同。方差取值越大,说明离散程度越大。比如,平均成绩是80分的班级,其方差很小,说明这个班级的数学能力比较平均:没有多少过高的成绩,也没有多少过低的成绩。8. 标准差标准差是方差的开方,其含义与方差类似。9. 中位数(Median)中位数是将排序后的数据集分为两个数据集,这两个数据集分别是取值高的数据集和取值低的数据集。比如,数据集{3,4,5,7,8}的中位数是5,在5之下和5之上分别是取值低和取值高的数据集。数据集{2,4,5,7}的中位数应当是(4 + 5)/2=4.5。10. 众数(Mode)众数是数据集中出现频率最高的数据。众数最常用的场景是分类型数据的统计,但是其也反映了数值型数据的“明显集中趋势点的数值”。均值、中位数、众数的计算方式各有不同,假设有一组数据:1,2,2,3,4,7,9均值:(1 + 2 + 2 + 3 + 4 + 7 + 9)/7=4中位数:3众数:211. 四分位数(Quartile)四分位数,即用三个序号将已经排序过的数据等分为四份,如表2-2所示。▲表2-2 四分位的例子第二四分位数(Q2)的取值和中位数的取值是相同的。12. 四分位距(Interquartile Range,IQR) 四分位距通过第三四分位数和第一四分位数的差值来计算,即IQR=Q3-Q1。针对上表,其IQR=61-34=27。四分位距是进行离群值判别的一个重要统计指标。一般情况下,极端值都在Q1-1.5×IQR之下,或者Q3 + 1.5×IQR之上。著名的箱形图就是借助四分位数和四分位距的概念来画的,如图2-1所示。▲图2-1 箱形图及IQR箱形图中的上下两条横线,有可能是离群值分界点(Q3 + 1.5×IQR或Q1-1.5×IQR),也有可能是最大值或最小值。这完全取决于最大值和最小值是否在分界点之内。13. 偏斜度(Skewness)偏斜度是关于表现数据分布的对称性的指标。如果其值是0,则代表一个对称性的分布;若其值是正值,代表分布的峰值偏左;若其值是负值,代表分布的峰值偏右。在图2-2中给出了偏斜度的示例。▲图2-2 Skewness的含义Skewness的绝对值(不论是正值还是负值)如果大于1是个很明显的信号,你的数据分布有明显的不对称性。很多数据分析的算法都是基于数据的分布是类似于正态分布的钟型分布,并且数据都是在均值的周围分布。如果Skewness的绝对值过大,则是另一个信号:你要小心地使用那些算法!不同的偏斜度下,均值、中位数、众数的取值是有很大不同的:▲图2-3 众数、均值及中位数在不同分布下的比较由图2-3可见,在数据取值范围相同的情况下,中位数是相同的。但是均值和众数却有很大的不同。所以,除了偏斜度指标可以直接反映分布特征外,还可以通过中位数和均值的差异来判断分布的偏斜情况。中位数<均值:偏左分布中位数、均值相差无几:对称分布中位数>均值:偏右分布14. 峰态(Kurtosis)标准正态分布的峰态的值是3,但是在很多数据分析工具中对峰态值减去3,使得:0代表是正态分布;正值代表数据分布有个尖尖的峰值,高于正态分布的峰值;负值代表数据有个平缓的峰值,且低于正态分布的峰值。峰态指标的主要作用是体现数值分布的尾巴厚度,尖峰对应着厚尾,即Kurtosis大于0时,意味着有一个厚尾巴。尖峰厚尾也就是说,在峰值附近取值较集中,但在非峰值附近取值较分散。图2-4所示为一个峰态的例子。▲图2-4 峰态的例子在连续型数据的探索中,需要重点关注的指标首先是缺失率,然后是均值、中位数等指标,这些指标能帮助数据分析者对数据的特征有很好的了解。偏斜度是另外一个非常重要的指标,但其绝对值接近1或大于1时,必须对其进行log转换才能使用,否则该指标的价值将大打折扣。Python Pandas中DataFrame的describe方法默认只统计连续性字段的最大值、最小值、均值、标准差、四分位数,如果想获取其他的特征值,需要调用相应的函数来获得。下面是一段示例代码,其运行结果通过表2-4来展示。List_of_series = [bank.var().rename('方差'), bank.median().rename('中位数'), bank.skew().rename('偏斜度'), bank.kurt().rename('峰态')]df = pd.DataFrame(list_of_series)mode = bank.mode(numeric_only=True).rename({0: '众数'})pd.concat([df, mode])▲表2-4 连续型变量数据探索示例代码的运行结果03 分类型数据的探索分类型数据的探索主要是从分类的分布等方面进行考察。常见的统计指标有以下几个:15. 缺失值缺失值永远是需要关心的指标,不论是连续型数据,还是分类型数据。过多的缺失值,会使得指标失去意义。16. 类别个数依据分类型数据中类别的个数,可以对指标是否可用有一个大致的判断。例如,从业务角度来看,某指标应当有6个类别,但实际样本中只出现了5个类别,则需要重新考虑样本的质量。再如,某个分类型变量只有一个类别时,对数据分析是完全不可用的。17. 类别中个体数量在大多数情况下,如果某些类别中个体数量太少,如只有1%的比例,可以认为该类别是个离群值。关于分类型变量离群值的研究比较多,但是如果脱离业务来谈分类型变量的离群值,是不妥当的。不平衡数据就是一个典型的与业务有关的例子。比如,从业务角度来看,购买黄金的客户只占银行全量客户的很小的一个部分,如果采取简单随机抽样的方式,“是否购买”列的值将只有极少的“是”的取值。但是,不能将“是”直接判断为离群值,反而“是”有极其重要的业务含义。所以,数据分析者需要灵活地认识和对待类别中个体数量的问题。18. 众数和连续型数据的含义一样,众数是数据集中出现频率最高的数据。比如,针对某个分类型取值A、B、C、D中C的出现次数最多,则C就是众数。以下是一段分类型变量数据探索示例代码,其运行结果通过表2-5来展示。bank.describe(include=[np.object])▲表2-5 分类型变量数据探索示例代码的运行结果应用Python Pandas的相关函数能够非常容易得到分类型变量的探索结果,表2-5所示就是数据探索示例代码的运行结果。来源:大数据公众号

故怠

「对科学本身研究的基础」科学的四个基本概念

【对科学本身研究的基础】对科学本身的研究也需要基础,也需要有一定的条件,没有这些条件,即使是有专门的研究也得不出结果。这一栏目是对这一问题的叙述。前提研究,由这一研究可以进入科学,以此形成对科学本身的研究。四个基本概念仍属于围绕科学的基本研究,是基于人性、事理等研究以后所作的继续。a、人的需要(科学的目的,经由行为科学研究得出的结果)b、系统(指世界、宇宙,包括社会,精神和物质等,一体概念)c、管理(对思想、行为、行政和科学本身等所有一切的管理)d、科学(指对科学本身的研究,科学学、科学性等,与母体同名)以上研究的过程人的需要、系统、管理、科学,是科学的四个基本概念,由以上可形成对科学本身的研究。这些概念是从哪里来的呢?由更为基础的研究而得来,首先是对人性、事理的研究,以此形成对人性、事理的初步认识,然后是对世界的研究,以此对社会进行观察,发现社会的一切就两点,一是人,二是事,由此确定人性、事理是科学和社会研究的基础。循环,从懵懂到清晰,一个思想和认识逐渐抬高的循环——螺旋。然后再以此寻找与人性、事理对应的研究,确认行为科学、系统科学、管理科学和科学学为科学的基础学科,当确认了以上以后,对每一学科作继续研究,经以上的系列,确认了科学以上的四个基本概念。对科学四个基本概念的确认过程以上是一个经由多学科、多要素、许多问题相互交织,相互作用,反复研究的结果,经过许多循环,由此可以使人的认识得不断的提高。以上较为抽象,这里不做详细的叙述。以上是科学的最基础内容,由此,可形成对科学本身的研究,接着继续,可形成对科学的一步步的认识。关系说明以上有几个维度的思考,在对整个科学研究以前,还需要对以上概念的关系做一个说明。人的需要、系统、管理、科学,是科学本身的概念,在以上的概念中,人的需要是科学的目的,所有科学的活动,目的都是为了人的需要,由此形成了研究的基点;系统、管理、科学,则是为完成目的对科学的要求。以上涵盖几个维度,可以认为,科学就是由以上几个概念,或由以上几个不同维度的思考形成的。经系列的研究确定,科学就是由以上几个概念,或由以上几个不同维度的思考形成的。世界是一个人的世界,人的行为,一切都是为了人的需要,包括科学以及对科学本身的研究和认识都是人的需要,所以,确认人的需要是科学研究的基点。世界是一个人的世界,人的行为及一切都是为了人的需要,所以,确认人的需要是科学研究的基点。关于人的需要人的需要有感性、理性和实际的需要三种情况,对科学本身的研究,是一种实际需要,而且没有什么比它更为重要,因此对它必须有科学和理性的认识。但是由于人往往没有理性思维,缺乏一定的条理性,所以并未能从科学的角度确定以上是人的需要,也因此才有了对这一研究的忽略。只是原因之一。关于系统、管理、科学另外三个概念,系统、管理、科学,a可视为是为完成目的对科学的要求;b科学本身的需要;c科学本来的状况;d或是人对问题的研究必须达到的一种状态。由此可形成对科学的组织,形成对所有研究的指导。系统、管理、科学:a 可视为是为完成目的对科学的要求;b 科学本身的需要;c 科学本来的状况;d 或是人对问题的研究必须达到的一种状态。由此可形成对科学的组织,形成对所有研究的指导。下面对系统、管理、科学三个概念做一个解释。对系统、管理、科学的解释a 系统。这是对科学的第一个要求。在2-4-1有一个“一体论”,该理论阐述了世界一体的状况,一切都属于世界,包括国家、社会,精神、物质,与世界都是一体的;科学是社会的组成部分,因此,科学也是世界的一个存在。以上的所有一切又都是一个个独立的系统,因此,科学也是一个系统。科学的职责是对所有一切的研究,包括物质、生命、社会、思想、文化、国家和行政等所有的一切,由此构成一个体系。对世界的研究,不但要有系统思维,不但要有整体研究,还需要有对世界一切的一个个研究,而且都必须有将它们视为是系统的系统研究。因此,人在以科学对问题的研究以前,首先应是将科学作为一个系统作系统的研究,探知科学本身的系统状况,探知它的产生、发展的规律。有点拗口。系统是科学本身的一个概念,是一种思想,由此可形成对所有研究的指导,因此,在对科学研究之前,还必须有对系统的研究,需建立系统的学科,形成学科体系,必须明确系统的内涵、概念和构造。这里指的是思想,是对思想的研究,不是对子系统、母系统,系统与系统,系统与要素等的描述。对系统的研究就是对科学的研究,这里是一个强调。这里只是一个概述,暂时作这么多叙述。b 管理。也是对科学的要求。重要性不亚于系统的概念。管理,首先指的也是思想,这个思想首先指的是对思想的梳理、整理和管理,问题的研究,从思想开始就必须有管理,包括对科学本身的研究,以及对所有一切的梳理、整理,以此弄清所有一切的来龙去脉。由此延伸到行为,继续向下,会一步步走到所有方面,进入所有的组织,走到行政,由此可形成对所有组织的管理。进入国家,可形成对政治、经济等所有一切的管理。以上是一个从思想开始,从基础一直到行政——对科学的全程要求。 与系统一样,管理也是一种思想,一个理论。以上思想可用于所有的研究,用于所有研究的指导,所以在以管理思维对所有问题的研究之前,也必须有对管理本身的研究,对它的研究就是对科学本身的研究。这里是对管理也是对科学的一个强调。c 科学。科学的又一概念。这一概念与母体重名,讲的是对科学本身的研究和审视,讲的实际是“科学学”和“科学性”的问题,既是对问题研究科学性、有效性的研究,也是对科学本身的研究和审视,首先是对科学本身的研究。由此可形成一个专门的学科,以科学的科学,科学的科学的科学对科学作专门的研究。具体的方法:将科学的最基础内容——人性、人的需要、系统、管理,以及上述内容放在一起,将它们融会贯通,然后对科学的本身、本来,以及科学各方面的概念和问题作反复研究,由此形成对科学本身的系统研究和系统认识。经以上的反复,可形成以管理思维、管理理论和系统论,对科学和科学研究的科学管理,以此使科学形成一种系统的运作,接着进入应用。经过以上,可以使没有进入科学的研究进入科学,使已经进入科学的研究,变得更加科学(主要指方法和思维方式),由此,可以使所有的科学形成加速。 整理以上高度抽象。对以上现在只是简介,在全部的资料中有对以上的不断解释和叙述。对科学四个基本概念的研究,最后可形成行为科学、系统科学、管理科学和科学学四个学科,以上几个学科的研究相互交织,全部属于横断研究,由此可代表科学的四个方面。科学与社会本为一体,以上四个概念,既是对科学本身的研究基础,也是社会研究的基础,因此,以上概念会随着问题的研究一直走到最后,对所有的研究都会发生作用

爱如果

读懂概率图模型:你需要从基本概念和参数估计开始

选自statsbot作者:Prasoon Goyal机器之心编译参与:Panda概率图模型是人工智能领域内一大主要研究方向。近日,Statsbot 团队邀请数据科学家 Prasoon Goyal 在其博客上分两部分发表了一篇有关概率图模型的基础性介绍文章。文章从基础的概念开始谈起,并加入了基础的应用示例来帮助初学者理解概率图模型的实用价值。机器之心对该文章进行了编译介绍。第一部分:基本术语和问题设定机器学习领域内很多常见问题都涉及到对彼此相互独立的孤立数据点进行分类。比如:预测给定图像中是否包含汽车或狗,或预测图像中的手写字符是 0 到 9 中的哪一个。事实证明,很多问题都不在上述范围内。比如说,给定一个句子「I like machine learning」,然后标注每个词的词性(名词、代词、动词、形容词等)。正如这个简单例子所表现出的那样:我们不能通过单独处理每个词来解决这个任务——「learning」根据上下文的情况既可以是名词,也可以是动词。这个任务对很多关于文本的更为复杂的任务非常重要,比如从一种语言到另一种语言的翻译、文本转语音等。使用标准的分类模型来处理这些问题并没有什么显而易见的方法。概率图模型(PGM/probabilistic graphical model)是一种用于学习这些带有依赖(dependency)的模型的强大框架。这篇文章是 Statsbot 团队邀请数据科学家 Prasoon Goyal 为这一框架编写的一份教程。在探讨如何将概率图模型用于机器学习问题之前,我们需要先理解 PGM 框架。概率图模型(或简称图模型)在形式上是由图结构组成的。图的每个节点(node)都关联了一个随机变量,而图的边(edge)则被用于编码这些随机变量之间的关系。根据图是有向的还是无向的,我们可以将图的模式分为两大类——贝叶斯网络( Bayesian network)和马尔可夫网络(Markov networks)。贝叶斯网络:有向图模型贝叶斯网络的一个典型案例是所谓的「学生网络(student network)」,它看起来像是这样:这个图描述了某个学生注册某个大学课程的设定。该图中有 5 个随机变量:课程的难度(Difficulty):可取两个值,0 表示低难度,1 表示高难度学生的智力水平(Intelligence):可取两个值,0 表示不聪明,1 表示聪明学生的评级(Grade):可取三个值,1 表示差,2 表示中,3 表示优学生的 SAT 成绩(SAT):可取两个值,0 表示低分,1 表示高分在完成该课程后学生从教授那里所得到的推荐信的质量(Letter):可取两个值,0 表示推荐信不好,1 表示推荐信很好该图中的边编码了这些变量之间的依赖关系。学生的 Grade 取决于课程的 Difficulty 和学生的 Intelligence;而 Grade 又反过来决定了学生能否从教授那里得到一份好的 Letter;另外,学生的 Intelligence 除了会影响他们的 Grade,还会影响他们的 SAT 分数。注意其中箭头的方向表示了因果关系——Intelligence 会影响 SAT 分数,但 SAT 不会影响 Intelligence。最后,让我们看看与每个节点关联的表格,它们的正式名称是条件概率分布(CPD/conditional probability distribution)。1. 条件概率分布Difficulty 和 Intelligence 的 CPD 非常简单,因为这些变量并不依赖于其它任何变量。基本而言,这两个表格编码了这两个变量取值为 0 和 1 的概率。你可能已经注意到,每个表格中的值的总和都必须为 1。接下来看看 SAT 的 CPD。其每一行都对应于其父节点(Intelligence)可以取的值,每一列对应于 SAT 可以取的值。每个单元格都有条件概率 p(SAT=s|Intelligence=i),也就是说:给定 Intelligence 的值为 i,则其为 SAT 的值为 s 的概率。比如,我们可以看到 p(SAT=s|Intelligence=i) 是 0.8。也就是说,如果该学生的智力水平高,那么他的 SAT 分数也很高的概率是 0.8。而 p(SAT=s|Intelligence=i) 则表示如果该学生的智力水平高,那么 SAT 分数很低的概率是 0.2。注意,每一行中的值的总和为 1。这是当然而然的,因为当 Intelligence=i 时,SAT 只能是 s 和 s 中的一个,所以两个概率之和必定为 1。类似地,Letter 的 CPD 编码了条件概率 p(Letter=l|Grade=g)。因为 Grade 可以取 3 个值,所以这个表格有 3 行。有了上面的知识,Grade 的 CPD 就很容易理解了。因为它有两个父节点,所以它的条件概率是这种形式:p(Grade=g|Difficulty=d,SAT=s),即当 Difficulty 为 d 且 SAT 为 s 时 Grade 为 g 的概率。这个表格的每一行都对应于一对 Difficulty 和 Intelligence 值。同样,每一行的值的总和为 1。贝叶斯网络的一个基本要求是图必须是有向无环图(DAG/directed acyclic graph)。马尔可夫网络:无向图模型一个马尔可夫网络的简单例子:为了简洁地说明,我们只探讨这个抽象的图,其中的节点 ABCDE 不像上面的例子有直接的真实案例对应。同样,这些边表示变量之间的相互作用。我们可以看到 A 和 B 彼此之间有直接的影响关系,而 A 和 C 之间则没有。注意马尔可夫网络不需要是无环的,这一点和贝叶斯网络不一样。1. 可能的用途正如贝叶斯网络有 CPD 一样,马尔可夫网络也有用来整合节点之间的关系的表格。但是,这些表格和 CPD 之间有两个关键差异。首先,这些值不需要总和为 1,也就是说这个表格并没有定义一个概率分布。它只是告诉我们值更高的配置有更高的可能性。其次,其中没有条件关系。它与所涉及到的所有变量的联合分布成正比,这与 CPD 中的条件分布不同。这样得到的表格被称为「因子(factor)」或「势函数(potential function)」,使用希腊字母φ 表示。比如,我们可以使用下面的势函数来描述变量 A、B 和 C 之间的关系,其中 C 是 A 和 B 的「软」异或(XOR),也就是说:如果 A 和 B 不一样,那么 C 很可能为 1;如果 A 和 B 一样,那么 C 很可能为 0:一般而言,你要为图中的每个极大团(maximal clique)定义一个势函数。图结构和表格就可以简洁地表示在这些随机变量上的联合概率分布。现在你可能会有一个问题:为什么我们需要有向图,也需要无向图?原因是有些问题使用有向图表示会更加自然,比如上面提到的学生网络,有向图可以轻松描述变量之间的因果关系——学生的智力水平会影响 SAT 分数,但 SAT 分数不会影响智力水平(尽管它也许能反映学生的智力水平)。而对于其它一些问题,比如图像,你可能需要将每个像素都表示成一个节点。我们知道相邻的像素互有影响,但像素之间并不存在因果关系;它们之间的相互作用是对称的。所以我们在这样的案例中使用无向图模型。问题设置我们已经讨论了图、随机变量和表格,你可能会想所有这些有什么意义?我们到底想做什么?这里面存在机器学习吗?数据、训练、预测都在哪里?这一节将给你答案。让我们再回到学生网络那个例子。假设我们已经有图结构了——我们可以根据我们对世界的知识进行创建(在机器学习中,这被称为领域知识(domain knowledge))。但我们没有 CPD 表,只有它们的规模。我们确实有一些数据——来自某所大学的十个不同课程,我们有这些课程的难度的测量方法。另外,我们还有每个课程的每个学生的数据——他们的智力水平、他们的 SAT 分数、他们得到的评级以及他们是否从教授那里得到了好的推荐信。根据这些数据,我们可以估计 CPD 的参数。比如说,数据可能表明有高智力水平的学生往往有很好的 SAT 分数,然后我们可能会学习到:p(SAT=s|Intelligence=i) 很高。这是学习阶段。我们后面会介绍我们可以如何在贝叶斯网络和马尔可夫网络中执行这种参数估计。现在,对于一个新数据点,你可以看到其中一些变量,但不是全部变量。比如,在下面给出的图中,你可以知道一个课程的难度和学生的 SAT 分数,你想估计学生得到好的评级的概率。(现在你已经从学习阶段得到了表格中的值。)尽管我们没有可以给我们直接提供信息的 CPD,但我们可以看到有高 SAT 分数的学生说明该学生智力水平也很可能较高;由此,如果该课程的难度很低,那么该学生得到好评级的概率也会较高,如上图中的红色箭头所示。我们可能也想同时估计多个变量的概率,比如学生同时得到好评级和好推荐信的概率?这种有已知值的变量被称为显变量(observed variable),而值未被观察到的变量被称为隐变量(hidden variable 或 latent variable)。一般来说,显变量用灰色节点表示,而隐变量则用白色节点表示,如上图所示。我们可能想要找到一些或全部显变量的值。这些问题的解答类似于机器学习的其它领域——在图模型中,这个过程被称为「推理(inference)」。尽管我们使用了贝叶斯网络来描述上述术语,但这也适用于马尔可夫网络。在我们深入用于学习和推理的算法之前,让我们先形式化我们刚刚看过的思想——给定某些节点的值,我们可以得到有关其它哪些节点的信息?条件独立我们刚才探讨过的图结构实际上带有关于这些变量的重要信息。具体来说,它们定义了这些变量之间的一组条件独立(conditional independence),也就是这种形式的陈述——「如果观察到 A,那么 B 独立于 C。」让我们看一些例子。在学生网络中,让我们假设你看到了一个有很高 SAT 分数的学生,你对她的评级怎么看呢?正如我们之前见过的那样,高 SAT 分数说明学生的智力水平很高,因此你可以预计评级为优。如果该学生的 SAT 分数很低呢?在这个案例中,你可以预计评级不会很好。现在,让我们假设你不仅知道这个学生 SAT 分数较高,也知道她的智力水平也较高。如果 SAT 分数较高,那么你可以预测她的评级为优。但如果 SAT 分数较低呢?你仍然可以预计评级为优,因为这个学生的智能水平高,而且你可以假设她在 SAT 上表现得不够好。因此,知道这个 SAT 分数并不能让我们了解有关这个学生的智力水平的任何信息。要将其用条件独立的方式陈述,可以说——「如果已观察到 Intelligence,那么 SAT 和 Grade 是独立的。」我们是根据这些节点在图中的连接方式得到这个条件独立信息的。如果这些节点的连接方式不同,那么我们也会得到不同的条件独立信息。让我们看看另一个例子。假设你知道这个学生的智力水平高。你能对这门课程的难度有什么了解呢?一无所知,对吧?现在,如果我告诉你这个学生在这门课程上得到了一个差的评级,又会怎样呢?这说明这门课程很难,因为我们知道一个聪明的学生得了一个差。因此我们可以这样写我们的条件独立陈述——「如果未观察到 Grade,那么 Intelligence 和 Difficulty 是相互独立的。」因为这些陈述都表达了在一定条件下两个节点之间的独立性,所以被称为条件独立。注意这两个例子有相反的语义——在第一个例子中,如果观察到相连的节点则独立性成立;第二个例子则是未观察到相连的节点则独立性成立。这种差异是由节点连接的方式(即箭头的方向)造成的。为了行文简洁,我们不会在这里覆盖所有可能的情况,但这些情况都很简单,凭直觉就能看出来。在马尔可夫网络中,我们可以使用类似的直觉,但因为其中没有有方向的边(箭头),所以其条件独立陈述相对简单——如果节点 A 和 B 之间没有路径能使得该路径上的所有节点都被观察到,那么 A 和 B 就是相互独立的。换种说法:如果在 A 和 B 之间至少有一条路径上的所有中间节点都未被观察到,那么 A 和 B 就不是相互独立的。我们会在本博客的第二部分查看完成参数估计和推理的细节。现在让我们看看贝叶斯网络的应用,我们可以在其中用到我们刚学习到的条件独立思想。应用:三门问题你肯定在某个电视游戏节目中看到过这个问题的某个版本:主持人会向你展示三扇关着的门,其中一扇门之后有一辆车,其它门后则有一些无价值的东西。你可以选择一扇门。然后,主持人会打开剩下的两扇门中没有车的一扇。现在,你可以选择是否更换选择的门:坚持你之前选择的那扇门,还是选择主持人剩下的那扇关闭的门。你会更换吗?直觉上看,主持人似乎并没有透露任何信息。事实证明这种直觉并不完全正确。让我们使用我们的新工具「图模型」来理解这个问题。我们首先先定义一些变量:D:背后有车的门F:你的第一个选择H:主持人打开的门I:F 是否是 D?D、F 和 H 可取值为 1、2 或 3;I 可取值 0 或 1。D 和 I 是未被观察到的,而 F 是已观察到的。在主持人打开其中一扇门之前,H 都是未被观察到的。因此,我们使用贝叶斯网络来解决我们的问题:注意箭头的方向——D 和 F 是相互独立的,I 显然依赖于 D 和 F,主持人选择的门也取决于 D 和 F。目前你对 D 还一无所知。(这与学生网络的结构类似,即知道学生的智力水平不能让你获得有关课程难度的任何信息。)现在,主持人选择了门 H 并打开了它。所以现在 H 已被观察到。观察 H 不能为我们提供任何有关 I 的信息,也就是说不能表明我们是否选择了正确的门。我们的直觉是这样认为的。但是它却向我们提供了一些有关 D 的信息!(同样,类比一下学生网络,如果你知道学生的智力水平高而评级差,你就能了解一些有关课程难度的信息。)让我们使用数字来看看。这些变量的 CPD 表格如下所示(这是没观察到任何变量的时候):D 和 F 的表格很简单——背后有车的门可能是这些门中的任何一扇且概率相等,我们选择其中一扇的概率是一样的。I 的表格是说当 D 和 F 一样时 I=1,当 D 和 F 不一样时 I=0。H 的表格是说如果 D 和 F 一样,那么主持人从另外两扇门选择一扇门的概率一样;如果 D 和 F 不一样,那么主持人就选择第三扇门。现在,让我们假设我们已经选择了一扇门。也就是说现在已经观察到 F,假设 F=1。那么给定 F 时,I 和 D 的条件概率是多少?使用这些等式,我们可以得到以下概率:这些数字是有道理的——到目前为止,我们选对了门的概率都是三分之一,汽车仍然有可能在任何一扇门之后且概率相等。现在,主持人打开了 F 之外的另一扇门,所以我们观察到了 H。假设 H=2。让我们再计算给定了 F 和 H 时 I 和 D 的条件概率。使用这些等式,我们可以得到以下概率:因此,我们对 I 没有任何额外的信息——我们第一个选择正确的概率仍然是三分之一,我们的直觉也是如此。但是,现在车在第 3 扇门后的概率不再是三分之一,而是三分之二了。所以如果我们更换选择,那么我们得到车的概率是三分之二;如果我们不换,我们得到车的概率是三分之一。我们不使用图模型也能得到同样的答案,但图模型给我们提供了一个框架,让我们可以扩展到更大型问题。结论在这个概率图模型教程中,我们了解了图模型领域的一些基本术语,包括贝叶斯网络、马尔可夫网络、条件概率分布、势函数和条件独立。我们也探讨了图模型在三门问题上的应用。在本博客的第二部分,我们将介绍一些用于参数估计和推理的算法以及另一个应用。第二部分:参数估计和推理算法在本概率图模型教程的第一部分,Statsbot 团队介绍了两种类型的图模型,即贝叶斯网络和马尔可夫网络。另外还探讨了图模型的问题设定、条件独立以及在三门问题上的应用。这一部分将介绍参数估计和推理,并还将探讨另一个应用。参数估计1. 贝叶斯网络估计贝叶斯网络的 CPD 表格中的数值很简单,就是计算训练数据中事件发生的次数。也就是说,如果要估计 p(SAT=s1|Intelligence=i1),我们只需要计算 SAT=s1 且 Intelligence = i1 的数据点在 Intelligence = i1 的数据点总量中所占的比例。尽管这种方法看起来似乎是特定于这个问题的,但事实证明这样获得的参数能够最大化被观察到的数据的可能性。2. 马尔可夫网络上述计数方法对马尔可夫网络没有统计学上的支持(因此会得到次优的参数)。所以我们需要使用更加复杂的技术。这些技术背后的基本思想是梯度下降——我们定义一些描述其概率分布的参数,然后使用梯度下降来寻找能最大化被观察数据的可能性的参数值。最后,我们有了我们模型的参数,我们想在新数据上使用它们,也就是执行推理!推理围绕推理的概率图模型的文献可谓汗牛充栋,原因有两方面:1. 推理就是我们打造这整个框架的原因——要根据我们已知的信息做出预测。2. 推理在计算上很困难!在某些特定类型的图中我们可以相当高效地执行推理,但一般而言图的计算都很难。所以我们需要使用近似算法来在准确度和效率之间进行权衡。我们可以使用推理来解答一些问题:边际推理(marginal inference):寻找一个特定变量的概率分布。比如,给定一个带有变量 A、B、C 和 D 的图,其中 A 取值 1、2 和 3,求 p(A=1)、p(A=2) 和 p(A=3)。后验推理(posterior inference):给定某些显变量 v_E(E 表示证据(evidence)),其取值为 e,求某些隐藏变量 v_H 的后验分布 p(v_H|v_E=e)。最大后验(MAP)推理(maximum-a-posteriori inference):给定某些显变量 v_E,其取值为 e,求使其它变量 v_H 有最高概率的配置。解答这些问题本身可能就很有用,也可能被用作更大规模的任务的一部分。接下来,我们将介绍一些用于解答这些问题的流行的算法,其中既有精准的算法,也有近似的算法。所有这些算法都既可用于贝叶斯网络,也可用于马尔可夫网络。变量消除(variable elimination)使用条件概率的定义,我们可以将后验分布写作:我们可以怎样计算上式中的分子和分母呢?让我们用一个简单的例子进行说明。考虑一个有三个变量的网络,其联合分布定义如下:假设我们想计算 p(A|B=1)。注意这意味着我们想计算 p(A=0|B=1) 和 p(A=1|B=1),这两个值的和应该为 1。使用上面的等式,我们可以写:分子是 A=0 且 B=1 的概率。我们不关心 C 的值。所以我们会把 C 的所有值都加起来。(这是由于基本概率 p(A=0, B=1, C=0) 和 p(A=0, B=1, C=1) 是互斥事件,所以它们的联合概率 p(A=0, B=1) 就是各个概率的总和。)所以我们将第 3 和 4 行加起来得到 p(A=0, B=1)=0.15。类似地,将第 7 和 8 行加起来得到 p(A=1, B=1)=0.40。另外,我们可以求所有包含 B=1 的行的总和来计算分母,即第 3、4、7、8 行,从而得到 p(B=1)=0.55。从而我们可以得到:p(A=0|B=1) = 0.15 / 0.55 = 0.27p(A=1|B=1) = 0.40 / 0.55 = 0.73如果你仔细看看上面的计算,你可以发现我们做了一些重复的计算——将 3 和 4 行以及 7 和 8 行加了两次。计算 p(B=1) 的更高效方法是直接将 p(A=0, B=1) 和 p(A=1, B=1) 的值加起来。这是变量消除的基本思想。一般来说,当有很多变量时,你不仅可以使用分子的值来计算分母,而且分子本身也可能会包含重复的计算。你可以使用动态编程来高效地使用之前已计算出的值。因为我们一次对一个变量进行求和,从而可以消除这个变量,所以对多个变量进行求和的过程相当于逐个消除这些变量。所以我们将这个过程称为「变量消除」。我们也可以相当简单直接地将上述过程用于求解边际推理或 MAP 推理问题。类似地,也可以容易地将上述思想推广应用于马尔可夫网络。变量消除的时间复杂度取决于图结构以及你消除这些变量的顺序。在最糟糕的情况下,时间复杂度会指数式增长。置信度传播(Belief Propagation)我们刚才看到的变量消除算法只会得到一个最终分布。假设我们想找到所有变量的边际分布。除了多次运行变量消除之外,我们还有更聪明的方法。假设你有一个图结构了。为了计算某个边际,你需要对其在其它所有变量上的联合分布进行求和,这相当于将整个图的信息聚合到一起。还有另一种聚合整个图的信息的方法——每个节点都检查其邻近节点,然后以局部的方式近似变量的分布。然后,每一对相邻节点都互相发送「消息」,这些消息中包含了其局部分布。现在,每个节点都检查其收到的消息,然后将它们聚合起来以更新变量的概率分布。在上图中,C 聚合了来自邻近节点 A 和 B 的信息,然后再发送一个消息给 D。然后 D 将这个消息与来自 E 和 F 的信息聚合起来。这种方法的优点是如果你保存了你在每个节点处发送的消息,那么将这些消息进行一次前向通过,然后再进行一次反向通过,就能让所有节点都得到所有其它节点的信息。然后这个信息可以被用于计算所有的边际,这是无法使用变量消除实现的。近似推理对于大型的图模型来说,进行精准的推理可能极其耗时,为此很多用于图模型的近似推理算法被开发了出来,其中大多数都属于下面两类:1. 基于采样的近似推理这些算法使用采样来估计希望得到的概率。举个简单的例子。考虑这个场景:给定一个硬币,你如何确定它被抛出后正面朝上的概率?最简单的做法就是抛这个硬币,比如抛 100 次,然后看其中正面朝上多少次。这是一种用于估计正面朝上的概率的基于采样的算法。对于概率图模型领域内的更复杂的算法,你也可以使用类似的流程。基于采样的算法还可以进一步分为两类。一类中的样本是相互独立的,比如上面抛硬币的例子。这些算法被称为蒙特卡洛方法。对于有很多变量的问题,生成高质量的独立样本是很困难的,因此我们就生成带有依赖关系的样本,也就是说每个新样本都是随机的,但邻近上一个样本。这种算法被称为马尔可夫链蒙特卡洛(MCMC)方法,因为这些样本会形成一个马尔可夫链(Markov chain)。一旦我们得到了样本,我们就可以将其用于解答各种推理问题。2. 变分法近似推理变分法近似推理不是使用采样,而是试图通过分析的方式来近似所需的分布。假设你写出了计算相关分布的表达式——不管这个分布是边际概率分布还是后验概率分布。通常这些表达式里面有求和或积分,要精确评估是极其消耗计算资源的。要近似这些表达式,一种好方法是求解一个替代表达式,并且通过某种方法使该替代表达式接近原来的表达式。这就是变分法背后的基本思想。当我们试图估计一个复杂的概率分布 p_complex 时,我们定义另一组更易于操作的概率分布 P_simple,然后基于 P_simple 得到最接近于 p_complex 的概率分布 p_approx。应用:图像去噪现在让我们将刚才探讨的一些思想用在真正的问题上。假设你有以下图像:现在假设这张图像受到了随机噪声的污染,变成了有噪声的图像:现在你的目标是恢复原始图像。让我们看看如何使用概率图模型来实现。首先第一步是思考哪些变量是观察得到的,哪些变量不能观察到,以及我们可以如何将它们连接起来构成一个图。让我们将有噪声图像中的每个像素都定义为一个观察到的随机变量,并将基准图像中的每个像素都定义为一个未被观察到的变量。由此,如果该图像的大小为 MxN,那么观察到的变量和未被观察到的变量都各有 MN 个。让我们将观察到的变量表示为 X_ij,未被观察到的变量定义为 Y_ij。每个变量都可取值 +1 或 -1(分别对应于黑色像素和白色像素)。给定观察到的变量,我们希望找到未观察到的变量的最有可能的值。这对应于 MAP 推理。现在让我们使用一些领域知识来构建图结构。很显然,在有噪声图像中的 (i,j) 位置观察到的变量取决于在基准图像中的 (i,j) 位置未观察到的变量。原因是大多数时候它们是相等的。我们还能得到什么信息?对于基准图像,邻近的像素通常有一样的值——在颜色变化的边界不是这样,但在每个单一颜色的区域内有这个性质。因此,如果 Y_ij 和 Y_kl 是邻近像素,那么我们将它们连接起来。由此,我们得到图结构:其中,白色节点表示未被观察到的变量 Y_ij,灰色节点表示观察到的变量 X_ij。每个 X_ij 都连接到对应的 Y_ij,每个 Y_ij 都连接到它的相邻节点。注意这是一个马尔可夫网络,因为图像的像素之间不存在因果关系,因此这里不适合使用贝叶斯网络中有方向的箭头。我们的 MAP 推理问题可以用数学的方式写出,如下:这里我们使用了最大对数似然(maximum log likelihood)计算中的一些常用的标准简化技术。我们将使用 X 和 Y(没有下标)来分别表示所有 X_ij 值和所有 Y_ij 值的集合。现在,我们需要根据我们的图结构来定义我们的联合分布 P(X,Y)。让我们假设 P(X,Y) 由两类因子组成——(X_ij, Y_ij) 和 (Y_ij,Y_kl),对应于图中的两类边。接下来,我们按如下方式定义这些因子:(X_ij, Y_ij) = exp(w_e X_ij Y_ij),其中 w_e 是一个大于 0 的参数。当 X_ij 和 Y_ij 相等时,这个因子取较大的值,当 X_ij 和 Y_ij 不同时就取较小的值。(Y_ij, Y_kl) = exp(w_s Y_ij Y_kl),其中 w_s 也是一个大于 0 的参数。当 Y_ij 和 Y_kl 取值相等时,这个因子较大。因此,我们的联合分布可由下式给出:其中第二个求积中的 (i, j) 和 (k, l) 是相邻的像素,Z 是一个归一化常数。将其插入到我们的 MAP 推理式中,可得:注意我们已经丢弃了包含 Z 的项,因为它不影响得到的解。w_e 和 w_s 的值是基于基准图像和噪声图像对,使用参数估计技术得到的。这个过程涉及到相当多的数学内容(尽管其最终只是在复杂函数上执行梯度下降),因此我们在此不再继续深入了。我们假设我们已经得到了这两个参数的值,即 w_e=8 且 w_s=10。这个例子重点关注的是推理。有了这些参数后,我们需要求解上述 MAP 推理问题。我们可以使用置信度传播的一种变体来实现,但事实上针对这种特定结构的图还有一种简单得多的算法,即迭代条件模式(ICM/iterated conditional mode)。其基本思想是:在每个步骤选择一个节点 Y_ij,然后检查 Y_ij=-1 和 Y_ij=1 时 MAP 推理表达式的值,然后选择值更高的那个。重复这个过程一定的迭代次数或直到收敛,通常就能得到相当好的结果。你可以使用这里的 Python 代码来实现:https://github.com/prasoongoyal/image-denoising-mrf。该算法返回的去噪后的图像如下:是不是相当好?当然,你也可以使用更加精巧的技术——既可以在图模型内,也可以在图模型外,从而可以得到更好的结果。但对这个例子来说,简单的马尔可夫网络加上简单的推理算法就足以得到相当好的结果了。从定量的角度看,有噪声图像中有 10% 的像素与原图像不同,而由我们的算法去噪后的图像与原图像仅有 0.6% 的像素差异。需要注意,我们使用的图是相当大的——这张图像的尺寸是 440x300,所以节点总数接近 264 000。因此,在这样的模型中进行精准的推理基本上是不可行的,我们用大多数算法(包括 ICM)所得到的结果都是局部最优的。回顾这里我们简要回顾一下我们在这篇分成两部分的文章中所谈到的核心概念:图模型:图模型是由图结构构成的,其中节点表示随机变量,边表示变量之间的依赖关系。贝叶斯网络:是有向图模型,每个节点都有一个相关的条件概率分布。马尔可夫网络:是无向图模型,每个团都有一个相关的势函数。条件独立:根据图中节点的连接方式,我们可以写出这种形式的条件独立陈述:「给定 Z,则 X 与 Y 相互独立」。参数估计:根据给定的一些数据和图结构来填充 CPD 表或计算势函数。推理:给定一个图模型,我们希望解答有关未被观察的变量的问题,这些问题通常属于以下问题范围:边际推理、后验推理和 MAP 推理。在一般图模型上的推理的计算非常困难。我们可以将推理算法分成两大类——精准推理和近似推理。无环图中的变量消除和置信度传播是精准推理算法的例子。近似推理算法对大规模图而言是必需的,而且通常属于基于采样的方法或变分法。总结在这两部分教程中,我们解读了概率图模型的一些核心思想。现在你应该能够理解:图模型为很多存在依赖关系的真实世界任务提供了可以解释的建模方式。图模型为我们提供了一种用有原则的方式解决这些任务的方法。在结束之前,需要指出这个教程并不完整——为了保证内容简洁直观,很多细节都跳过了。要知道,关于概率图模型的标准教科书可超过了一千页!这个教程旨在提供一个起点,帮助初学者对这一领域产生兴趣并在此基础上使用更深度的资源进行进一步的深入学习。这里列出了一些可以帮你更深入学习这一领域的资源:Graphical Models in a Nutshell:https://ai.stanford.e/~koller/Papers/Koller+al:SRL07.pdf图模型教科书:《Probabilistic Graphical Models: Principles and Techniques》机器之心文章:想了解概率图模型?你要先理解图论的基本定义与形式另外,在标准的机器学习教科书中应该也都会有几章有关图模型的内容。

荀况

性别研究系列之——50个关键概念【上】

50个关键概念(1~25)1. Androcentrism 男性中心主义男性中心主义(Androcentrism、希腊文:andro即男性,centre即中心)意指完全建立于男性经验为基础上的理论和实践,成为不容置疑的准则。许多学术研究都是以男性为主要观察对象,女性的经验和女性关心的问题则往往被忽视,在日常生活中的医疗、政治、宗教、家庭、职场、学校等等,不只如此,然而这发生在保守派、宗教或是传统文化上,甚至包含一些进步势力,如:社会运动、左派都有一样的问题。2. Backlash 后坐力3. Body 身体身体是每个生物的实体。身体是生物的外表,可表示该生物的健康程度,以致表示该生物是否死亡。4. Citizenship 公民身份公民身份或公民权(英文:Citizenship)是一种认同或身份的形式,使个人在政治社群中取得相关的社会权利和义务,和国籍概念不同,拥有国籍如未成年的国民可能没有行使公民权的权利及义务,在宪法学及政治学则指由法律规范及政治社群中的个人和群体的权利及义务关系。5. Class 阶级社会阶级(英语:social class),意义相近或相关的汉语词汇还有“等级”、“阶层”、“社会等级”、“等级社会”,按照马克思主义理论的划分,即对具有相同或相似的经济水平和社会身份的社会群体总称。6. Consciousness Raising 意识提升7. Cyborg 赛博电子人8. Dichotomy 两分法9. Difference 差异10.Domestic Division of Labour 家庭分工11.Double Standard 双重标准双重标准是指针对某一种特定行为,因实施的人不同,而导致评价褒贬不一的现象。例如允许某一群体或个人实施某一种行为,但禁止另外一群体或个人实施相同行为。双重标准是一种人与人之间的偏见或歧视,违反了公正、平等的原则,而实行“双重标准”的人通常不会承认这一点,甚至称自己很公平。12.Equality 平等 13.Essentialism 本质主义本质主义(Essentialism),又译为精粹主义,是一种认为任何的实体(如一只动物,一群人,一个物理对象,一个观念)都有一些必须具备的本质的观点。这种观点同时会认为无法对现象作出最终解释的理论都是无用的,因为其不能反映客观事实。14.the Family 家庭家庭是一种以婚姻、血缘、收养或同居等关系为基础而形成的共同生活单位。由婚姻组成的家庭关系,经由生育孩子、收养不具血缘关系的孩子,产生出以血缘、拟制血亲为连带的家庭成员。15.Feminisms 女性主义流派16.First Wave Fiminism 第一波女性主义第一波女性主义(英语:First-wave feminism),或者说第一次女性主义浪潮,指的是女性主义历史中从1850年到1945年的这一段时期,涉及到美国以及欧洲多个国家。17.Gender 性别社会性别(英语:gender)是一系列与男性气质和女性气质有关的特征。根据上下文,这些特征可以包括生物性别(包括男性,女性和双性人的变异状态)、以性别为基础的社会结构(即性别角色)或性别认同。大多数文化与性别二元论息息相关,只有两种性别(男性和女性),对于处在这两者性别之外的,有性别酷儿。有些社会除了男人和女人外还有其他的分类(如:南亚的海吉拉),这些统称为第三性别。社会性别是很复杂的,包含了无数外表、言语、动作等等各方面的特质。18.Gendered 性别化19.Gender Order 性别秩序20.Gender Segregation 性别区隔21.Heterosexism 异性恋主义异性恋主义(Heterosexism),亦称异性恋偏见、异性恋至上主义,是用于形容以异性恋观念为标准,看待整个主流社会,并且忽视或贬低非异性恋的性倾向者的态度,通常包含偏见和歧视的术语。它包括假定任何人都是异性恋,或者异性性倾向或性关系是唯一的规范,因此更加优越。事实上,任何性倾向的人都可能持这种态度,包括非异性恋。异性恋霸权和父权有高度的重叠性。22.Identity Politics/the Politics of Identity 身份政治23.Ideology 意识形态意识形态(英语:ideology,意为“理念或想像的学说”;也译作意识型态;周德伟译作意理;中文早期曾经译作意德沃罗基,属音译;林毓生主张音译意译合一,译为意缔牢结,意识形态有两种具有本质性区别的涵义,若将意识形态视其为一种无价值偏见的概念时,意识形态可视为是想像、期望、价值及假设的总合。若考虑政治的层面,则意识形态是“所有政治运动、利益集团、党派乃至计划草案各自固有的愿景的”总和。卡尔·马克思所理解的意识形态是一种不平等的权力关系,是统治阶级为了欺骗和使权力关系具有合法性的产物,目的是为了让大家扭曲对于现实的认识,马克思也称其为上层建筑。通常是某些社会的道德价值观形塑了意识形态的基础。现代社会的政治意识形态撕裂主要体现在左派与右派。24.Lesbian Continuum 女同连续体25.Masculinity/Masculinities 男性气质/男性气质群男性气质(Masculinity,Manliness或Manhood),也称作男子气概、男性化或男人味,是指通常与男孩或者男子相关的一组特质、行为和角色。男性气质包括生理决定的因素和社会决定的因素,故男性气质与解剖学上的男性不同,男性和女性都可能表现出男性化特质和行为。既有男性气质又有女性气质的人称为双性性格。资料来源:#维基百科##bing#

词与物

世界各地的学者都在研究这一概念。有近200个定义

文化因其丰富的内涵和外延,一直是学术界争议最大、界定难度最大的概念之一。长期以来,国内外许多学者试图从不同的学科和视角对文化概念进行界定和阐释,但至今仍有不同的观点和智者见智,未能形成统一的观点。据不完全统计,学者们已经定义了数百种文化。学者美国克罗伯(A)。L。Kroeber)和Clark洪(ClydeKluckhohn)在他们的书《文化:关于概念和定义的检讨》中做了统计。从1871年到1951年,学术界共有164种文化定义。作为20世纪文化研究的重要奠基人之一,英国人类学家雷蒙德威廉姆斯(RaymondWilliams)曾经无奈地说,文化就是“英语中最复杂的两三个词语之一”[1]。因此,关于文化概念的争论成为当前学术界关于文化问题争论的焦点之一。论古代文化观念的起源中国和古代印度,古埃及,古巴比伦被称为四个文明古国,但中国也是大国唯一有5000年历史的文化文明。通过查阅相关古籍,不难发现“文化”一词在中国古代就已经存在。由于汉语具有鲜明的表意特征,我们可以从“文”和“化”的本义来分析文化的本义。根据《说文解字》的解释:“文,错画也,象交文。”“化,教行也。”根据这个解释,我们可以看到“文”的原意是指各种颜色的交错纹理,具有文章的含义;“化”的原意是变化、生成、创造,延伸到教育、培养,等等,一起使用“文”“化”这个词。见《易·贲》。书上记载:“观乎天文以察时变,观乎人文以化成天下。”这里“人文”和“化成天下”紧密相连,初步论证了文明和文教文化的含义,即用文化的规律教育人,培养受教育的人。这是对中国古代文化概念的最早解释。经过漫长的历史,现有的研究发现,最早使用“文化”作为一个词开始于西汉时期。在西汉历史学家刘写给《说苑·指武》之后,“文化”一词逐渐被接受,并在中国古代广泛使用。西晋学者和文学家在其《补亡诗·由仪》中指出:“文化内缉,武功外诛。”唐代卢照邻诗人的诗中也有“武化偃兮文化昌”句。古代的文化概念中国在很大程度上是作为动词使用的,常与“武功”“武治”“野蛮”等词结合使用,基本上属于精神文明范畴,这是一种统治社会的主张和方法。现代文化观念的起源现代所谓的文化显然不同于古代文化。据说19世纪末是从日语翻译过来的,这是一个新的概念。20世纪初以来,中国学者们对文化进行了广泛而深入的研究,形成了许多文化概念的定义。例如,胡适思想:“文化(Culture)是一种文明所形成的生活的方式。”[2]梁漱溟在他的著作《中国文化要义》:“文化,就是吾人生活所依靠之一切……文化之本义,应在经济、政治,乃至一切无所不包。”[3]中说张殿年思想,“狭义的文化指文学艺术;广义的文化包括哲学、宗教、科学、技术、文学、艺术、社会心理、风俗习惯等等”。[四]20世纪80年代以来,“文化研究热”在中国兴起。一批中国学者对文化概念提出了不同的理解,但他们基本上根据自己的需要对文化概念进行了不同意义的界定和使用,没有给出下一个文化被广泛认可的准定义。西方文化观念的内涵从词源上看,“现代文化”一词最早是由西方学者提出的。在西方文化中,现代英语通常被翻译为culture,它起源于拉丁语中cultura和colere。它最初有许多含义,如农业、生活、实践、敬神等。。法语中还扩展了气质陶冶和道德来培养之意。早在16世纪初,文化的含义就扩展到了人类发展的领域,不仅限于畜牧业领域,还扩展到了人类心灵的培养之意。从18世纪到19世纪,文化的含义扩展到指人类精神或智力发展的过程。到19世纪中叶,文化开始作为一个特殊的术语出现在学者的作品中。这一时期的文化往往被认为是人类智慧的反映,是人类生活和发展过程中形成的物质和精神要素的统一。19世纪下半叶,随着人类学、社会学、文化学等学科的逐渐兴起,文化的概念也被学者们从多学科的角度来解读。把文化定义为一个整体的学者是英国人类学家泰勒(E)。B。Tylor)。在71年和《原始文化》中,他定义文化如下:“所谓文化或文明,乃是包括知识、信仰、艺术、道德、法律、习惯以及其人类作为社会成员而获得的种种能力、习性在内的一种复合整体。”[5]这一论述被认为是文化的第一个经典定义,对后世学者对文化的研究产生了深远的影响。它至今仍被学术界普遍认可,其基本含义也一直沿用至今。20世纪以来,世界的历史已经从一个区域时代转变为一个全球化时代。不同的国家、民族、种族相互影响、相互作用,加速了文化与文明的冲突与融合。因此,学者们一直站在世界历史发展的角度,对文明更替与文化发展进行探讨和反思。例如,著名的历史哲学家汤因Bi(A)。J。Toynbee)提出了文明形态学理论。他认为人类社会主要由经济、政治和文化三种形式构成。其中,文化是文明形式中最稳定、最常发挥作用的精神因素,是文明的核心。据塞缪尔亨廷顿(SamuelP)教授说。美国哈佛大学的Huntington,“文化是指一个社会中的价值观、态度、信念、取向以及人们普遍持有的见解。”[6]如何理解文化的概念?马克思主义经典作家也十分重视文化问题,从历史唯物主义的角度阐释了文化的概念。纵观马克思恩格斯的作品,从早期的《1844年经济学哲学手稿》到后来的《人类学笔记》,“文化”一词出现了很多次。当然,他们并没有给出自己对文化的定义,而是在多个意义上使用了文化的概念,这一概念有着更广泛的内涵。更重要的是,他们通过精神生产、意识形态、文明、文学、艺术、观念、思想等概念阐释了自己的基本文化观,认为文化是人的创造行为,成果和人的实践生活是本质,文化的意义和终极目标在于人的发展,在于人的全面发展的培养。他在著名文章《新民主主义论》中坚持唯物史观的基本立场,运用社会存在与社会意识相互作用的原理,提出了经济、政治、文化的社会结构理论,阐释了对中国马克思主义文化本质的理解:“一定的文化(当作观念形态的文化)是一定社会的政治和经济的反映,又给予伟大影响和作用于一定社会的政治和经济;而经济是基础,政治是经济的集中表现。”论述了三者之间的辩证关系:政治、经济、文化等因素是相互作用的,文化是政治和经济的反映,文化对政治和经济具有负面影响。综上所述,通过对文化概念的起源及其演变的历史过程的探究,不难看出文化概念是随着社会的发展而不断变化和发展的。到目前为止,学术界对文化概念的解释还没有形成统一的共识。文化的概念仍然是一个开放的概念。特别是进入21世纪,随着经济全球化和科学技术的飞速发展,各种文化交流和交流不断向全球化、世界性的文化转变,文化的内涵和外延将进一步拓展。[1] [英文]约翰斯道雷。文化理论与大众文化(第五版)[M]常江,翻译。北京:北京大学出版社,2010:2[2] 作品选集[M]。北京:中国文化历史出版社,2013:173[3] 文化意义[M]。上海:上海人民出版社,2011:7[4] 张大年。张岱年的学术文化随笔[M]。北京:中国青年出版社,1996:136[5] [英语]泰勒。原始文化[M]连树声,trans。上海:上海文艺出版社,1992:2[6] 文化的重要作用——价值观如何影响人的进步[M]。程克雄,事务处理。北京:新华出版社,2010:9以上参考《以文化人:大学文化育人研究》,人民出版社,感兴趣的网友自行阅读。你如何理解文化的概念?我们留个口信讨论吧!

零忍

物理学中5个关键概念及其基本的解释

本文参加#科学了不起#系列征文赛。想要学习物理学的基础知识吗?今天,我将和你们分享10个基本物理概念的一个非常简单的解释。重力重力(引力)是宇宙中自然存在的四种力之一。它是两个有质量的物体之间的引力。任何两个有质量的物体都会相互吸引。引力与物体的质量和物体之间距离的平方成正比,从而得到:产生的重力等于重力常数(由大写字母G表示)乘以物体1的质量,再乘以物体2的质量,再除以两个物体之间距离的平方。这就得到了两个力之间的引力,单位是牛顿。这就是为什么像地球这样巨大的物体能够容纳它上面的一切,比如我们人类,水和大气,因为我们的质量被地球的质量所吸引。你以后会学到施加一个力给一个物体是如何使它向那个力的方向加速的,这就解释了为什么当你在重力场中下落一个物体时,它会向大质量物体加速。质量越大,施加在其他质量上的力越大,它们就会越快地向它们加速。然而,另一个有趣的想法是,因为我们有质量,所以我们必须稍微吸引一些物体。这是一个微不足道的力,但是每一个有质量的物体,无限远的物体,都对你有一个轻微的吸引力,但是这个力小到无法形容,看看引力公式就知道了。光子和波粒二象性直到19世纪末,人们还认为光是一种波。这是因为它对那些不研究量子物理的人来说更有意义。光子没有质量,每秒有无数的光子从太阳中释放出来,在各种物体上反弹,进入你的眼睛,让你看到它们。令人困惑的是,它们既是粒子又是波。这很让人困惑,但它们显示了两者的特性,这就是所谓的波粒二象性。它是一种波,因为它可以通过一个小的间隙或一个透镜来分解;由于光电效应,它又是粒子。光电效应是指光照射在一层金属上,光子与金属原子碰撞,传递其能量,使电子从金属中释放出来,其速度与初始光子的运动速度(动能)成正比。这是太阳能电池板工作原理的基础。照相机就是运用这种物理原理的完美例子。这种透镜利用光波特性对光进行聚焦,并利用光的粒子特性在光子撞击探测器芯片时释放电子。每个光子的能量由一个非常简单的方程给出:E= hv,有时也写作E=hf这意味着能量(以焦耳为单位)等于普朗克常数(6.63×10-34 j)乘以光/波的频率。频率是每秒通过的完整波周期的数量,以赫兹为单位。由于普朗克常数是常数,光子的能量只与它的频率成正比。夸克夸克是粒子的组成部分。为了让它更清楚,希望你知道所有的原子都是由电子,质子和中子组成的。夸克是组成质子、中子和其他粒子的较小粒子。电子是基本粒子,这意味着它们(像夸克)是不可分割的,它们不是由更小的粒子组成的。粒子物理学是一门庞大的学科。所以这只是最基本的。你需要了解的三种夸克被称为“上”“下”和“奇异”。夸克是原子的基本单位,但不能单独存在。不存在单独的夸克。质子的结构是uud(两个上夸克和一个下夸克组成)。中子的结构是udd。还有很多其他的2到3夸克的粒子它们包含了上夸克,下夸克和奇异夸克的粒子,但是它们也包含夸克的反粒子,这需要很长的时间来解释,所以如果你对此感兴趣,请仔细阅读粒子物理学。牛顿运动定律定律1:如果没有外力作用,物体将保持静止或保持匀速直线运动。这就是为什么如果太空中的火箭关闭它的引擎,它将永远继续前进。定律2:如果一个物体受到一个力的作用,它就会以与作用的力和它的质量成比例的速度加速。这就产生了著名的等式F=ma。这解释了为什么当你把一个网球直接扔向地面时,第一定律不适用,当它上升时,对地球的引力使它向下加速。定律三:每个作用力都有一个大小相等、方向相反的反作用力。这些定律首次出现于1687年,一直流传至今,并被现代物理学家频繁地使用,并被用来设计你周围的每一个运动物体。牛顿对物理学的影响如此之大,力的单位以牛顿的名字命名。要正确地理解一牛顿有多大,想象一下,如果我把一个100克的苹果从1米高的地方扔到你手里,所受到的力是1牛顿。热力学定律温度只是粒子的运动的宏观表达。如果一个粒子快速振动,表现为高温,如果一个粒子缓慢移动,表现为低温。当例子停止运动,就达到了绝对零度。当一个高能粒子与一个低能粒子碰撞时,它们可以交换能量,直到达到所谓的“热平衡”。热力学是物理学的重要组成部分,有一些规则需要遵守。第零定律——这个定律是在第一定律被发现之后被发现的,因此它被称为第零定律。它简单地解释了处于热平衡状态(温度相同)的两个物体的热能不会发生净变化。显然粒子会碰撞,能量会被交换,但总的来说不会有能量/热量的净移动。第一定律——你可能还记得在学校里学过,能量总是守恒的,从未被创造或毁灭,只是从一种形式转移到另一种形式。要加热你的晚餐,你必须以电的形式为微波炉提供能量,或者为炉子提供煤气。如果你举起一支笔,你是在对它做功,增加它的重力势能,当你把它放下,它就变成动能(运动),当它落到地板上,动能就转化成热能,也许还有一些声音。第二定律,这个稍微复杂一点。它指出任何自发的过程都会增加宇宙的熵(无序性)。一个很好的类比是,当你吃一个汉堡时,它会分解成更小的元素(更无序),而且永远不会自发地再次变成汉堡。宇宙自然地使自己变得更加无序的想法听起来并不理想,但正是它使大多数化学反应得以发生。幸运的是,你可以通过减少一个区域的熵来增加另一个区域的熵,但是总有净熵损失,它总是会变得更无序。第三定律——首先你必须了解绝对零度。科学家们通常不用摄氏或华氏来测量温度,他们用开尔文(或K)来表示温度,因为这是人们认为的最冷的温度(大约是-273.15摄氏度或-459.67华氏度)。当一个粒子的温度下降,它的能量也下降,如果你把一个粒子降低到绝对零度,它会失去所有的能量,完全不运动,时间会冻结!酷吧?抱歉让你们失望了,但是第三定律说这是不可能的。由于粒子的量子性质,它们的能量自然波动,因此它们永远不可能达到绝对零度。物理是一个非常广泛和有趣的话题,我强烈建议你多读一些。物理学的其他一些有趣的领域包括力学、声音、广义/狭义相对论(不要指望永远能理解它,如果你认为你能理解,那你肯定没有理解)、电磁学、量子、天体物理学、薛定谔方程、核物理等等,不胜枚举。物理学就在我们身边,在我看来,它是最酷的科学。有无数的书你可以读,从非常初级的,简单的阅读难以置信的复杂的期刊和大学教科书,每个人都能理解物理学。艾萨克·牛顿在17世纪晚期剑桥因淋巴腺鼠疫而关闭的时候创立了他的万有引力理论,所以谁知道你在隔离期间对物理学有了基本的了解之后会得出什么结论呢?

松树

作战概念研发应注重“四性”

随着人工智能、云计算、大数据等技术在军事领域的广泛运用,战争形态、作战样式等正在加速演变,能否准确把握战争发展趋势,推出既能支撑备战打仗,又能牵引部队建设发展的新型作战概念,已成为军事研究的关键领域。做好作战概念研发工作,具体来讲,应注重“四性”。预测性——搞清打什么仗、怎么打仗、用什么打仗这个根本问题。作战概念的核心是对未来作战的整体设计和抽象概括,其最大的军事价值体现在对未来战争形态、作战对手、作战样式、武器装备、技术发展等方面的科学预测。只有定准靶标,才能有的放矢。科学准确的军事预测是作战概念研发的前提、基础和重要内容,更是直接决定作战概念是否成立、能否顺利“落地”的关键。研发作战概念的质量,很大程度上取决于预测水平的高低。越南战争后,美军预测其主要战场将转向欧洲,主要作战对象将是数量规模庞大、装备精良的苏联和华约部队,作战样式、制胜机理等各方面将发生重大变化,于是提出“空地一体战”作战概念。这一概念在后来的海湾战争和伊拉克战争中通过了实战检验。相反,错误的预测也将带来灾难性的后果。冷战初期,美军曾做出“未来战争是核战争,常规战争不复存在”的错误预测,认为“核战争”将是未来战争的基本作战样式,耗费巨资建设了规模庞大的核武库,影响了常规力量的建设,某种程度上导致越南战场上的惨败。迭代性——掌握理技融合、循环论证、叠加发展的新型研发模式。作战概念研发本身是一个从想象到具象、从感性认识到理性认识、从理论研究到指导实践的过程,是科学性和艺术性、理论性和实践性、技术性和工程性的有机结合,决定了这项工作不可能一步到位,必将经历多次迭代、不断完善。事实上,作战概念的迭代过程伴随作战概念的整个生命周期,具有叠加更新的鲜明特点。从外军作战概念研发的实践来看,普遍采取科学化、标准化、工程化的研发模式。比如美军多域作战概念,先后经历了“空地一体战”“多域战”“多域作战”等不断迭代的过程,现在又向“全域作战”概念更新。对于我军而言,应采用凸显特色、适应自身体制机制的理技融合、循环论证、叠加发展的研发模式。理技融合就是要统筹理论创新和技术研发两条线。以准确、严密的理论推导提出作战能力需求,从而牵引技术发展;以技术体系提升和关键技术突破带动作战方式转变,支撑理论研究跃升。循环论证就是要打造从“提出初始概念、展开逻辑推理、综合研讨分析、开展试验论证、完善补充概念”的研发流程。通过研发流程的精准控制,以整体与各环节的双重循环,不断完善作战概念。叠加发展就是借鉴软件版本更新的开发方式,在保持原有作战概念整体稳定下,引入新的内容、更新相应组件、修改部分不足,以叠加优化的方式推动作战概念做大、做全、做优。系统性——形成要素齐全、层次清晰、体系完善的全维解决方案。现代作战是高度复杂的系统工程,作战胜负主要取决于交战双方体系与体系的对抗,某一要素的缺失、功能的短板带来的“木桶效应”愈发凸显。作战概念作为指导作战、引领建设的顶层设计,主要任务就是给出基于特定时空条件下,针对众多不同作战问题的一揽子解决方案,系统性是其必然要求。要素齐全,是作战概念开发的基本要求,也是作战概念清晰表达、持续开发的重要保证。作战概念要素大致可分为三类,即作战问题描述类要素,包括相关战略背景及作战目标、威胁、对手、时间、空间、环境、条件、能力等;作战问题类要素,包括作战指导、原则、样式、方法、内容等;作战能力类要素,包括作战能力需求、建设措施、生成途径等。层次清晰,从作战概念本身角度讲,要准确定位概念层级,区分到底是战争层面、战役层面还是战术层次作战概念,是顶层概念、联合概念还是军种概念。从作战概念的内容上讲,应遵循“准确描述问题、创新解决方案、提出能力需求”的层次结构,以获得标准化、清晰化的作战概念成果。体系完善,就是通过区分层级,以上统下、明确指导、渐进实现,以下承上、逐级集成、提供支撑的方法,同步研发,将不同层次的作战概念有机融合,形成完善的作战概念体系,为应对多重威胁、部队建设、装备研发等提供有力指导和牵引。引领性——提供指导作战、牵引建设、推进转型的全面发展蓝图。作战概念的精髓是基于对历史、现实和未来的战略局势、技术发展、作战对手、战场环境等作战条件的分析和判断,做出对未来作战的前瞻性设计,牵引出对作战能力的需求,实现现在与未来、现状与趋势、实力与潜力的无缝对接。比如,21世纪初,围绕新的战争威胁和部队建设发展需要,提出“体系破击战”作战概念,对引领军队作战和建设发展、转型、重塑发挥了重要作用。新时代,战争形态正在加速向信息化智能化演进,带来作战力量、作战空间、作战行动的全面转变,致使作战样式和制胜机理也发生着深刻变化,从而推动战争朝着新的方向、新的面貌不断发展。为适应国家安全和发展需求,应对现实和潜在威胁,必须在作战概念研发中突出引领性,紧盯军事科技发展前沿,面向未来战场设计未来作战,加快构建作战概念体系,为备战打仗和转型建设勾勒出发展蓝图,引领军队实现跨越式发展。(姚小锴 单敏 詹静)

臣无所见

机器学习常见基本概念

机器学习是什么 人工智能的一个重要学科分支多领域交叉学科。 数据驱动,在数据上通过算法总结规律模式,应用在新数据上。 机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,并重新组织已有的知识结构使之不断改善自身。 就是计算机从数据中学习出规律和模式,以应用在新数据上做预测的任务。 互联网时代巨大的数据量和超高的数据维度。机器学习问题类型机器学习的目标机器学习的评估方法留出法将数据集D划分为两个互斥的集合,一个作为训练集S,一个作为测试集T,满足D=S∪T且S∩T=,常见的划分为:大约2/3-4/5的样本用作训练,剩下的用作测试。需要注意的是:训练/测试集的划分要尽可能保持数据分布的一致性,以避免由于分布的差异引入额外的偏差,常见的做法是采取分层抽样。同时,由于划分的随机性,单次的留出法结果往往不够稳定,一般要采用若干次随机划分,重复实验取平均值的做法。交叉验证法将数据集D划分为k个大小相同的互斥子集,满足D=D1∪D2∪...∪Dk,Di∩Dj=(i≠j),同样地尽可能保持数据分布的一致性,即采用分层抽样的方法获得这些子集。交叉验证法的思想是:每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集,这样就有K种训练集/测试集划分的情况,从而可进行k次训练和测试,最终返回k次测试结果的均值。交叉验证法也称“k折交叉验证”,k最常用的取值是10。与留出法类似,将数据集D划分为K个子集的过程具有随机性,因此K折交叉验证通常也要重复p次,称为p次k折交叉验证,常见的是10次10折交叉验证,即进行了100次训练/测试。特殊地当划分的k个子集的每个子集中只有一个样本时,称为“留一法”,显然,留一法的评估结果比较准确,但对计算机的消耗也是巨大的。自助法我们希望评估的是用整个D训练出的模型。但在留出法和交叉验证法中,由于保留了一部分样本用于测试,因此实际评估的模型所使用的训练集比D小,这必然会引入一些因训练样本规模不同而导致的估计偏差。留一法受训练样本规模变化的影响较小,但计算复杂度又太高了。“自助法”正是解决了这样的问题。自助法的基本思想是:给定包含m个样本的数据集D,每次随机从D 中挑选一个样本,将其拷贝放入D',然后再将该样本放回初始数据集D 中,使得该样本在下次采样时仍有可能被采到。重复执行m 次,就可以得到了包含m个样本的数据集D'。可以得知在m次采样中,样本始终不被采到的概率取极限为:这样,通过自助采样,初始样本集D中大约有36.8%的样本没有出现在D'中,于是可以将D'作为训练集,D-D'作为测试集。自助法在数据集较小,难以有效划分训练集/测试集时很有用,但由于自助法产生的数据集(随机抽样)改变了初始数据集的分布,因此引入了估计偏差。在初始数据集足够时,留出法和交叉验证法更加常用。机器学习的评估度量标准性能度量性能度量(performance measure)是衡量模型泛化能力的评价标准,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果。关于模型的好坏判断,不仅取决于算法和数据,还取决于当前任务的需求。比如:回归任务常用均方误差。分类问题的常见性能度量错误率和精度查准率/查全率/F1初次接触时,FN与FP很难正确的理解,按照惯性思维容易把FN理解成:False->Negtive,即将错的预测为错的,这样FN和TN就反了。ROC与AUC回归问题的常用性能度量

回答我

性别研究系列之——50个关键概念【下】

50个关键概念(26~50)26.Men’s Movement/Men's Studies 男性运动/男性研究27.(the) Other 他者他者,是由自我意识建立的意向,用于区分他人,有类似“非我族类”意味的概念。这个概念在哲学、政治学及社会学中,有着广泛的讨论。28.Patriarchy 父权制父权(英语:patriarchy)指以成年男性为中心的权力。父权关于权力,强调的是以男性为中心的权力运作形式。父权思想则是顺由权力运作模式所产生、以男性为中心的思想。父权体制则指涉父权这种权力运作发展出完善的政经社文制度以持续父权的运作与优越地位。29.Pornography 色情30.Post-colonial Theory 后殖民理论31.Post-feminism 后女权主义32.Postmodernism 后现代主义后现代主义(英语:Postmodernism),是一个从理论上难以精准下定论的一种概念,因为后现代主要理论家,均反对以各种约定俗成的形式,来界定或者规范其主义。对于此学说的持续时间有不同说法,其中有一说是指从1960年代到1990年代。目前,在建筑学、文学批评、心理分析学、法律学、教育学、社会学、人类学、政治学等诸多领域,均就当下的后现代境况,提出了自成体系的论述。他们各自都反对以特定方式来继承固有或者既定的理念。33.Post-structuralism 后结构主义后结构主义是指跟随在结构主义觉醒之后出现的一套思想,它试图去了解这个分割成数个体系的世界。34.Power 权力权力是一种广泛存在的社会现象,是政治学、国际关系与国际政治学的核心概念。权力是影响、甚至控制别人行为的能力。35.Psychoanalytical Feminism 心理分析女性主义36.Public/Private 公领域/私领域37.Queer Theory 酷儿理论酷儿理论(英语:Queer theory)是一种1980年代初在美国形成的文化理论。它批判性地研究生理的性别决定系统(生理性别为男性的人,天生具有理性、强壮、主动等特性,即“阳刚气质”(masculinity);生理性别为女性的人,天生具有感性、脆弱、被动等特性,即“阴柔气质”)、社会的性别角色和性取向。酷儿理论认为性别认同和性取向不是“天然”的,而是通过社会和文化过程形成的。酷儿理论使用解构主义、后结构主义、话语分析和性别研究等手段来分析和解构性别认同、权力形式和常规。米歇尔·福柯、朱迪斯·巴特勒、伊芙·科索夫斯基·赛菊寇和迈克尔·华纳等是酷儿理论的重要理论家和先驱。把酷儿理论应用到各种学科的研究被称为酷儿研究。米歇尔福柯朱迪斯巴特勒38.Race/Ethnicity 人种/族群种族(Race),是在体质形态或遗传特征上具有某些共同特色的人群,划分时可以根据外在特征(如肤色、发色、面部骨骼结构等)、基因、以及自我认同为标准。人种这一概念以及种族的具体划分都是具有相当争议性的课题,其在不同的时代和不同的文化中都有差异,种族的概念也牵涉到诸如社会认同感以及民族主义等其他范畴。人种不属于生物分类学,在智人以下没有所谓人种的生物分类。39.Representation 再现40.Reproctive Technologies 生育科技41.Second Wave Feminism 第二波女性主义第二波女性主义(英语:Second-wave feminism)是女性主义者的一场社会运动,最早开始于1960年代初的美国,最终波及至整个西方世界和其他地区。尽管社会运动持续到1980年代初,但是该波思潮后来在世界持续造成种种影响,影响包括土耳其、以色列等国家。内容包括争取性别平等、生育权、堕胎、避孕、离婚、女性的工作权利等,也让社会开始关注家庭暴力及婚内强奸等社会议题。第二波女性主义的代表人物有Camille Paglia,Germaine Greer。42.Separatism 分离主义分离主义(Separatism),又称分裂主义,意味着将自身从原本相连的其他部分抽离。通常其目标是从现存的主权国家中分离出一部分领土建立自己独立的国家。分离主义的核心推动力一般是来自该国内的某少数族群,并且该族群有自己的集体认同和自己宣称的家国领土。43.Sexual Contract 性契约44.Sexuality 性存在45.Socialisation 社会化社会化(英语:Socialization)是一个广泛应用于社会学、社会心理学、人类学、政治学与教育学范畴的名词,意指人类学习、继承各种社会规范、传统、意识形态等周遭的社会文化元素,并逐渐适应于其中的过程。对个人来说,社会化是学习同时扮演社会上不同的角色的过程。个人的社会化常受到地区文化的影响,且因个人的成长背景,社会化的过程、内容也会随之改变。46.Standpoint 立场47.Stereotype 刻板印象刻板印象(亦称印刻作用,英语:stereotype),是一个社会学术语,专指人类对于某些特定类型人、事或物的一种概括的看法,看法可能是来自于同一类型的人事物之中的某一个个体给旁人的观感。通常,刻板印象是大多数是负面而先入为主的,并不能够代表每个属于这个类型的人事物都拥有这样的特质;不过另一方面,虽然有一个对49个文化进行的研究显示,民族性这种族群刻板印象,并不反映该社会成员的平均人格特质,但刻板印象有可能是准确的,一项研究显示,一些种类的刻板印象有着中至高度的准确性,而且一些研究和后续的研究,可能会一再证实某些刻板印象的准确性。48.Third Wave Feminism 第三波女性主义第三波女性主义(英语:Third-wave feminism)被视为等同数个不同派系的女性主义运动,和自1980末期开始的研究。其运动的主力认为第二波女性主义已经失败了,而且过时了。第三波女性主义者不仅批评男权与父权,也批评第二波女权主义者,这让他们和第二波女性主义者分别开来。有些参兴第三波女性主义运动的人,会以处在社会阶级和其他社会分类的中心点来界定自己,而且还有他们反对一切种类压迫的工作的承担。第三波女性主义尝试挑战,或避免对女性主义的本质化解释。因为支持者认为,这种解释跟第二波女性主义一样,过度着重中产白人妇女的经验。第三波女性主义通常加入了酷儿理论,批判性理论,生态女性主义,和新女性主义理论。与前人不同的是,第三波女性主义通常着重于“微观政治”,道出关于性别压迫和比较含蓄的政治表征。他们也挑战第二波女性主义对对女性好或坏的定义,或者找出在第二波女性主义的范畴外找出权力或反抗的征兆。一个对性别或性欲的后结构主义阐释是第三波女性主义的中心,也帮助解释了它对在所有性别名词和类别遗传了的,散漫而不确定的权力的强调。49.Violence 暴力暴力指基于故意侵犯或伤害他人的心理,而使用激烈且富有强制性力量之行为,包括有形物理或无形心理。50.Women's Studies 女性研究妇女研究又称作女性研究、女性学,是一门研究女性相关主题的跨领域学科,它一般包括了女性主义理论、立场论(英语:standpoint theory)、多元交织性(英语:intersectionality)、多元文化主义、跨国女权主义(英语:Transnational feminism)、社会正义、妇女史、妇女健康、妇女文化以及其他包括社会学、人类学、政治学、新闻学等社会科学,以及艺术、哲学等人文学科中与女性相关的研究课题。资料来源:#维基百科##bing#写在后面当然,性别研究领域涵盖的理念和内容范围远不止50个概念,但是这50个概念可以帮助我们去了解国内性别研究已经涉及的理论和学术地带。总之,性别研究这条路任重而道远!

隆撒

这些基本知识,你知道几个?

3月3日“全国爱耳日”,爱的分贝邀请到原北京大学人民医院资深耳科医生、人工耳蜗专家耿军力老师来到我们的直播间,与大家在线交流了一些爱耳护耳常识以及关于人工耳蜗的常见问题。直播过程中有不少网友与我们互动,积极提问;还有不少人表示直播“时间太短了”,“看得还不过瘾”。条件允许的话,以后我们会再组织类似直播或网络授课。耿老师在直播中首先,我们对耿老师的直播中讲到重要“知识点”进行一次梳理。1 人是用大脑听声音的关键词:听到 & 听懂耳朵是人的听觉器官,由外耳(耳郭、外耳道)、中耳(鼓膜、鼓室、听小骨)和内耳(半规管、前庭、耳蜗)三个部分组成。听觉是由耳朵、听神经和听觉中枢的共同活动来完成的。声波通过外耳道、鼓膜和听小骨传到内耳,使内耳的感音器官发生兴奋,将声能转变为神经冲动,再经过听神经传入位于大脑皮层的听觉中枢,从而产生听觉。由此我们就不难理解,耳朵负责声音的传输,完成“听到”声音的任务;大脑负责对声音信息进行加工、分析,感觉声音的音色、音调、音强、判断方位,完成“听懂”声音的任务。2 什么是人工耳蜗?关键词:结构 & 原理人工耳蜗是一种电子装置,分为植入体和体外机两部分。植入体由信号接收及解码模块、刺激电极阵列组成;体外机又叫做言语处理器,由麦克风、语音处理器以及用于向植入部分发送指令的信号发射器组成,用电池提供能源。人工耳蜗的工作原理就是通过体外机的麦克风完成外界声音信息的接收,经过语音处理器将接收到的声音信息转换为一定编码形式的电信号,通过植入体内的电极系统模拟毛细胞的功能,完成电信号解码和转化,再由耳蜗神经传递给大脑听觉中枢。3 助听器与人工耳蜗的区别关键词:工作原理 & 适应症助听器和人工耳蜗都是辅助人听力的一种助听设备。二者主要的区别区域工作原理和适应人群。助听器的本质是一个声音放大器,通过声音刺激来工作;使用助听器的前提是使用者必须要有残余听力,残余听力越多使用效果越好。人工耳蜗的工作原理我们上面讲了,重度听力损失和全聋患者可以通过植入人工耳蜗来恢复听力。4 哪些人群适合人工耳蜗关键词:听损程度 & 年龄人工耳蜗适用于重度感音神经性耳聋(一般指听力损失达90分贝以上)和全聋的患者。各种先天性耳聋、药物性耳聋、病毒感染所致耳聋、突发性耳聋、噪音性耳聋以及老年性耳聋等均适合接受人工耳蜗治疗。这里我们要提到2个概念:语前聋和语后聋。通俗的说,语前聋是学会说话之前产生的听力障碍,语后聋是学会说话之后产生的听力障碍。对语前聋患者来说,植入人工耳蜗时间越早,听力恢复以及语言掌握能力越好。经过良好的康复训练,通常可以和正常人群一样工作生活。各个年龄段的语后聋患者都可以植入人工耳蜗,并且能够很快恢复听说能力,基本不影响正常生活。5 如何选择人工耳蜗关键词:品牌 & 考虑因素 & 特殊个体耿老师很风趣地把选耳蜗比作选汽车,一下子就让大家更好理解如何去选择耳蜗。无论哪个品牌的人工耳蜗,只要是通过正规渠道在国内出售,质量都是有保证的,也都能实现恢复听力的基本诉求。在选择耳蜗的之前,我们通常也要去查一下这个品牌耳蜗的口碑、服务,然后根据自己的喜好选择外观形状,当然最后还要根据自身家庭的承受能力进行选择,不能盲目追求高价格、高配置。还有一些特殊情况,比如听障患者有耳蜗畸形、耳廓畸形,这个时候就需要根据自身条件以及医生和专家的建议,进行最佳选择。6人工耳蜗手术并发症及注意事项关键词:正确认识 & 消除误解经过科学和医疗技术的不断发展,同时我国进行耳蜗手术的人群越来越多,医生在这个过程中积累了大量的临床经验,如今进行人工耳蜗手术发生危险以及出现严重并发症的情况已经微乎其微。但任何一种手术,也不可能百分之百安全。比如面神经损伤这种比较严重的并发症,在目前国内的人工耳蜗手术案例中,非常罕见;面神经刺激、皮瓣问题、电极植入问题、术后过敏、耳鸣眩晕等都属于常见的轻微并发症,经过医生妥善处理就能够解决。因此,我们对对人工耳蜗手术的认知不要走入误区,片面夸大或者刻意掩盖人工耳蜗手术的风险都是不正确的。7 影响人工耳蜗效果的因素关键词:手术 & 产品 & 个体人工耳蜗的唯一功能是恢复耳蜗的功能,也就是听的功能。影响到人工耳蜗听力恢复层面效果的主要有两个原因,一是手术原因,一是产品原因。只要我们选择正规医院,合格产品,基本上就能杜绝这两种情况。除此之外,像耳蜗发育、神经发育、植入年龄、学习能力、智力发育、心理状况等个体因素,也会影响到植入耳蜗后个人听说、认知、交流沟通等能力的掌握。8 日常生活中注意事项关键词:怕潮不怕水 & 怕撞不怕动 & 怕磁电不怕射线 & 怕丢不怕坏人工耳蜗其实并没有我们想象中那么“脆弱”,它能适应绝大多数日常生活场景。但是在人工耳蜗的日常使用中,还是有一些问题需要注意,耿老师总结了4个“秘诀”:1、怕潮不怕水:人工耳蜗一般都有防水功能,比如游泳、淋雨等情况都不需要专门摘下耳蜗,如果为了延长耳蜗使用使用,也可以购买专用防水套。但是使用耳蜗一定要注意防潮,注意日常的清理、干燥,睡觉时可以摘下放入专用的干燥盒中。2、怕撞不怕动:像打篮球、足球、跑步等一些运动,不会影响耳蜗使用,但是必须要防止耳蜗收到剧烈撞击。3、怕磁、电不怕射线:X光、CT、心电图、脑电图等医疗检查对耳蜗无影响;但是如果需要做核磁共振,就要看核磁强度、耳蜗型号,需要提前征求医生或耳蜗公司意见;再比如电磁炉、微波炉这种日常生活用具,也会对耳蜗产生一定影响,但只要不是刻意用耳朵去贴近,影响也不会很大。4、怕丢不怕坏:因为人工耳蜗价格相对较高,所以在日常使用中一定要注意保管,防止丢失;而一些使用中的零件损坏,则不需过于担心,耳蜗厂家也会对正常的零件损坏负责维修、更换。9 常见故障及排除方法关键词:链接 & 供电 & 硬件 & 软件耿老师结合自身经验,整理了人工耳蜗日常使用中出现故障时一些排查方法。当你发现使用人工耳蜗不能听见声音时,可以进行以下排查:1、检查体外机的接口、导线,是否出现链接问题;2、检查电池及电池仓,是否出现供电问题;当你听见的声音出现变化时,可以进行以下排查:1、检查麦克风,是否麦克风出现故障;2、检查处理器、线圈问题,是否出现软件故障;当你自身无法确认具体故障,请及时与医院或耳蜗厂家进行联系。10 什么情况外机需要更换或升级关键词:使用寿命 & 故障 & 个人需求人工耳蜗植入体所用材料与人体组织具有良好的相容性,从理论上讲可终生使用,不需要更换。耳蜗体外机具有一定的使用年限,达到使用年限后就可以考虑更换。当体外机出现处理器故障、听觉效果降低无法解决等情况,也可能需要更换新的体外机。此外,因为耳蜗技术也在一直进步,如果个人对耳蜗的功能、美观等因素有需要,条件允许的情况下,也可以进行体外机升级。直播中,爱的分贝工作人员挑选了一些网友问题请耿老师在线作了解答。但由于直播时间的限制,还有部分网友的问题没有办法在直播中给予一一解答。直播结束后,我们将网友提问进行了筛选,选出了一些具有代表性和普遍性的问题,请耿老师进行了解答。下面,我们把这些得到耿老师解答的问题在这里进行分享,希望能够帮助到您。Q1:2只耳朵能做不同牌子的耳蜗么?同时使用不同牌子的耳蜗会不会有不良影响?2个耳朵可以做不同牌子的耳蜗。相互之间不会影响拍、排斥、Q2:双侧人工耳蜗植入有哪些优势?就像正常人要长两只耳朵一样,双耳听力能让我们听的更多更好。虽然单侧的正常听力在安静环境下就可以正常交流,但双耳聆听可以在噪声环境下比单侧听得更好,还有声音的立体感,更有利于声音的定向定位。还有研究表明,对于学语期的儿童,双侧植入比单侧植入的言语康复时间会更短。Q3:单侧植入人工耳蜗后,另一侧植入时间怎么选择?单侧植入人工耳蜗的一侧,在获得声音及言语信号后,即成为“优势听觉侧”。由于大脑对感觉系统提供的信号存在偏重处理及废用皮层的功能转化,在形成优势听觉侧的同时,未植入人工耳蜗的一侧耳可能会出现听觉功能剥夺。听觉功能剥夺通常在一侧听觉得到良好重建后出现,在3-5年后形成不可逆的功能剥夺。针对人工耳蜗手术,两侧植入的间隔时间应控制在3-6月内,后植入侧尚无听觉功能剥夺的报道。如不具备3-6月内植入第二侧的条件,应在未植入的一侧耳佩戴助听器,以此延缓听觉功能剥夺的发生;对于先天性感音神经性耳聋的儿童,两次植入时间间隔不应超过2-3年。Q4:做了耳蜗之后,之前说的不清楚的,是否有改善?植入人工耳蜗后,通常对言语掌握能力都会有改善的。如果是在最佳年龄段植入人工耳蜗,辅以良好的康复训练,是能够让听障孩子像正常孩子一样的。Q5:植入人工耳蜗后多久可以开口说话?总体来说,如果术前有言语基础,那么术后的效果会比没有言语基础的孩子更好。如果都是语前聋,那么植入者一岁时植入的术后效果肯定要好于同等条件下六岁才植入的儿童。Q6:听障孩子最佳植入耳蜗年龄是多少?耳聋发生时间不同,对年龄的要求也是不同的。人的听觉中枢发育需要听力和语言的刺激,一般来说到6岁听觉中枢发育就结束了,7岁以后听觉中枢的发育非常缓慢,甚至是停止的。所以,对语前聋患者来说,最佳的植入时间一般是12个月到6岁,时间越早越好。6岁以上的语前聋患者要植入人工耳蜗,一般来说必须要有助听器佩戴史,有一定的听力语言训练过程,需要有一定的言语分辨力,才考虑人工耳蜗植入。对语后聋来说,植入人工耳蜗没有年龄的限制,各个年龄段都可以。Q7:植入耳蜗后听到的声音和正常人是一样的吗?听觉系统对声音的感觉除了与内耳对声音的接受有关以外,还与个人对声音的理解以及以往建立起来的听觉经验有关。人工耳蜗的言语处理器处理范围主要适合语言频率区域,与正常人耳的感受范围有所不同,自然界有些声音不一定在人工耳蜗处理范围之内,因此通过人工耳蜗听到的声音与正常耳蜗会有不同。实际上,影响人工耳蜗植入者声音感受的因素有许多,每一位使用者所听声音的描述都会有所不同。Q8:人工耳蜗植入后必须要去康复机构吗?人工耳蜗植入的目的不仅仅是使患者重新听到声音,更重要的是使患者能听懂和理解声音,学会或恢复语言交流,因此必须重视术后听力语言康复。专业的康复机构老师可以帮助植入者学习如何感知、识别、理解、表达声音,在条件许可的情况下,去言语康复中心进行康复学习对植入者来说是最好的。当然家庭永远都是言语康复中不可缺少的一环,就算去了康复中心,也不可把一切都扔给康复老师,家人的陪伴才是最重要的,往往可以让康复得到事半功倍的效果。保护听力,不是一时一日之功,需要全社会和每个人持之以恒的关注与坚持。同样,关爱听障人群,推动听障救助行业,也需要全社会各行各业有生力量支持与推动。只要人人都献出一点“爱”,每一天都是“爱耳日”!分贝新媒体爱的分贝入驻平台搜索“爱的分贝”即可查到搜索“爱的分贝”关注因听障群体而结缘的一群人的美好生活。接收投稿编辑部向大家征集稿件啦~我们的愿景:帮助听障人群融入社会,推动听障行业全面发展。此愿景下,你可以讲:与听障有关的影视、书籍;你参与志愿者的经历、感想;给大家科普听障的小知识;你对于公益的思考......或者其他【有助于实现愿景】的选题。题材不限,视频亦可,记得告诉我们你的署名哦。投稿须知:邮箱:info@i-db.com.cn主题:投稿+文章名称+署名+微信号