欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
沪深股市网络舆情相关性研究分析鬼附身

沪深股市网络舆情相关性研究分析

在上周文章《上证指数、深证指数相关性研究》中,我们看到上证指数和深证指数之间存在非常强的正相关关系。那么在社交网络中,沪深股市的网络舆情又是什么情况?两者是否也存在类似的关系?为回答这些问题,我们使用企业舆情监测系统识微商情进行进一步的分析。本报告只用于企业舆情研究,不作为投资参考。沪深股市网络舆情分布下图为今年2月中旬到5下旬的沪深股市网络舆情趋势情况。从图上看,两者存在类似之处,但具体相关程度还不好判断。为便于分析,我们将两条曲线放到一个图表中,如下。我们以每日舆情增减变化情况为对象进行统计,得到如下的变化率曲线图。可以发现,沪深股市舆情在增减变化上非常相似。下面我们对相关性进行度量。相关性度量我们继续使用相关图和相关系数来进行相关性的度量。相关图是发现变量之间相关程度和相关形态的有效工具,它为测定相关关系奠定有效基础。相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量。比如下图就是几种简单的相关关系。 我们将今年2月中旬到5下旬三个月的沪深股市网络舆情变化率形成相关图。从相关图来看,沪深股市网络舆情之间也存在正相关关系。一般沪市舆情变热时,深市舆情也会增加,反之类似。我们使用相关系数进行度量,得到两者的相关系数值:0.89288。根据与下图对照,我们可以认为沪深股市网络舆情之间存在比较强的正相关关系。使用线性回归策略,可以得到最佳拟合直线和回归系数。为便于对比,我们把上证指数和深证指数的相关图一起附上。通过以上分析,我们可以了解:沪深股市不但在指数变化上存在非常强的正相关关系。两者在社交网络中,相关舆情也存在密切联系。无论是我们的实例分析,还是国内外的相关学术研究,都可以证明社交网络舆情与股市之间存在非常紧密的关系,感兴趣的读者可以通过企业舆情监测系统识微商情对上市企业进行网络舆情分析,为股市预判提供更多参考。报告声明由于案例抽取、数据收集、评价模型等限制原因,本报告结论仅供参考。更多详细数据请关注识微商情监测系统,专注企业舆情监测/正负面新闻监测/竞争对手监测/品牌口碑监测/行业监测,可免费试用系统

果恶乎在

数据分析基础相关性分析,SPSS实操

一、相关性分析定义相关性分析用于描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。一般根据研究的目的不同、或变量的类型不同,采用不同的相关分析方法。 常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析等。样本相关系数r:在说明变量之间线性相关程度时,根据经验可将相关程度分为以下几种情况: 若r≥0.8 时,视为高度相关; 若0.5≤r<0.8 时,视为中度相关; 当0.3≤r<0.5 时,视为低度相关; 当 r<0.3 时,说明变量之间的相关程度极弱,可视为不相关。在一般情况下,总体相关系数p是未知的,我们往往是用样本相关系数 r作为总体相关系数p的估计值。但由于存在样本抽样的随机性。样本相关系数并不能直接反映总体的相关程度。为了判断r对ρ 的代表性大小,需要对相关系数进行假设检验。(1)首先假设总体相关性为零,即H0为两总体无显著的线性相关关系。(2)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平,则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。相关性分析1、二元定距变量的相关分析定义: 二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行分析。定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。Pearson简单相关系数用来衡量定距变量间的线性关系。pearson简单相关系数二元定距变量的相关分析---pearson简单相关系数---t统计量服从n-2个自由度的t分布。2、二元定序变量的相关分析定义:定序变量又称为有序(ordinal)变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(先后、等级、方位或大小等),也是基于“质” 因素的变量。Spearman和Kendall's tua-b等级相关系数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。二元定序变量的相关分析检验3、偏相关分析定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。偏相关分析4、距离相关分析距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。距离相关分析根据统计量不同,分为以下两种。 不相似性测量:通过计算样本之间或变量之间的距离来表示。 相似性测量:通过计算Pearson相关系数或Cosine相关来表示。距离相关分析根据分析对象不同,分为以下两种。 样本间分析:样本和样本之间的距离相关分析。 变量间分析:变量和变量之间的距离相关分析。二、SPSS相关性分析操作spss相关性分析操作流程三、总结相关分析即是用适当的统计指标来衡量事物之间,以及变量之间线性相关程度的强弱。相关分析的方法很多,包括简单相关分析、偏相关分析和距离相关分析。简单相关分析包括定距变量的相关分析和定序变量的相关分析。前者通过计算定距变量间的相关系数来判断两个或两个以上定距变量之间的相关程度。后者则采用非参数检验的方法利用等级相关系数来衡量定序变量之间的相关程度;偏相关分析是指在排除了第三者影响的前提下,衡量两个变量之间的相关程度,当然第三者与这两个变量之间要有一定的联系;距离相关分析是对观测变量之间差异度或相似程度进行的测量。附:方差分析SPSS方差分析方法与实例演练spss描述性分析基本数据统计分析--spssSPSS主界面操作:spss操作界面与数据分析基础介绍

都会夜

从相关性分析到有监督学习,浅谈数据挖掘分析

相关性分析是我们做数据分析时最常用的一种方法。我们在对业务进行分析时,都会思考哪几个环节是相互影响的,通过层层推理,找到工作中的关键问题,从而改进业务,提高工作效率。业务环节相互影响,在数据上的体现就是具有相关性。我们按照数据的类型来说下,在做数据分析时会碰到哪些相关性分析。首先,是连续型变量(数值)之间的相关性,这也是最常碰到的。我们会用相关系数来分析,最常用的当然是皮尔逊(Pearson)相关系数,取值-1到1之间,绝对值越接近于1表示相关性越强,正负表示正相关和负相关。另外还有Spearman相关系数和Kendall相关系数,应用的条件不同,在此不深入介绍了。实际上我们一般分析都是线性相关性,连续型变量的相关性除了用相关系数来分析外,还可以用散点图来分析。如果存在线性相关性,在散点图上会趋近一条直线。另外,就是连续型变量和分类型(字符型)变量之间的相关性了,这就计算不了相关系数了,在这里可以用方差分析来判断他们之间的相关性,方差分析实际上在检验几组样本的均值是否相等,就像做对照实验一样,把连续型变量按照分类型变量的取值进行分组,再比较每组的均值是否相等,相等说明分组对连续型变量的取值没有影响,说明他们之间没有相关性,反之,他们是有相关性的。最后,就是分类型变量之间的相关性,可以使用列联表来分析,进行卡方检验,可以得到是否相关的结论。大致说了相关性分析之后,我们再来看有监督学习。有监督学习是机器学习里的概念,是指从有标记的训练数据中推导出预测函数,具体来说就分类和回归问题。其实,我们也可以从相关性分析的角度来理解有监督学习,这里的有标记的数据,实际上就是我们要分析的数据字段,相关性分析时我们往往只是在分析两个字段,1对1 的,而有监督学习,我们要分析的是多个字段了,是多对1了,分析多个字段综合起来与一个字段的相关性,这个1就是训练数据中的标记字段,如果这个标记字段是分类型的,就是分类问题,如果这个标记字段是连续型的,就是回归问题,可以说有监督学习的本质还是在做相关性分析,只是更加复杂了,不是一个相关系数能描述的规律了,往往我们得到的复杂的预测函数。这个函数描述了标记字段和多个影响因素之间的相关性,例如最好理解的2种模型:性回归方程和决策树。在大数据时代,我们收集到的数据越来越多,我们分析的手段也要越来越深入了,从简单的数据可视化展现,慢慢的要过渡到更深层次的数据规律探索了,相关性分析是个很好的起点。更多干货,下次再分享哦。

大巧若拙

使用Seaborn和Pandas进行相关性分析和可视化

数据集可以讲述很多故事。要想了解这些故事的展开,最好的方法就是从检查变量之间的相关性开始。在研究数据集时,我首先执行的任务之一是查看哪些变量具有相关性。这让我更好地理解我正在使用的数据。这也是培养对数据的兴趣和建立一些初始问题来尝试回答的好方法。简单地说,相关性是非常重要的。Python的最大好处就库多,有很多库已经为我们提供了快速有效地查看相关性所需的工具。让我们简要地看看什么是相关性,以及如何使用热图在数据集中找到强相关性。什么是相关性?相关性是一种确定数据集中的两个变量是否以任何方式关联的方法。 关联具有许多实际应用。 我们可以查看使用某些搜索词是否与youtube上的观看次数相关。 或者查看广告是否与销售相关。 建立机器学习模型时,相关性是确定特征的重要因素。 这不仅可以帮助我们查看哪些要素是线性相关的,而且如果要素之间的相关性很强,我们可以将其删除以防止信息重复。您如何衡量相关性?在数据科学中,我们可以使用r值,也称为Pearson的相关系数。 这可测量两个数字序列(即列,列表,序列等)之间的相关程度。r值是介于-1和1之间的数字。它告诉我们两列是正相关,不相关还是负相关。 越接近1,则正相关越强。 接近-1时,负相关性越强(即,列越“相反”)。 越接近0,相关性越弱。r值公式让我们通过一个简单的数据集进行相关性的可视化它具有以下列,重量,年龄(以月为单位),乳牙数量和眼睛颜色。眼睛颜色列已分类为1 =蓝色,2 =绿色和3 = 棕色。让我们使用以上数据绘制3个散点图。 我们将研究以下3种关系:年龄和体重,年龄和乳牙以及年龄和眼睛的颜色。年龄和体重当我们观察年龄和体重之间的相关性时,图上的点开始形成一个正斜率。当我们计算r值时,得到0.954491。随着r值如此接近1,我们可以得出年龄和体重有很强的正相关关系的结论。一般情况下,这应该是正确的。在成长中的孩子中,随着年龄的增长,他们的体重开始增加。年龄和乳牙相反,年龄和乳牙散点图上的点开始形成一个负斜率。该相关性的r值为-0.958188。这表明了很强的负相关关系。直观上,这也是有道理的。随着孩子年龄的增长,他们乳牙会被替换掉。年龄和眼睛颜色在上一个散点图中,我们看到一些点没有明显的斜率。该相关性的r值为-0.126163。年龄和眼睛颜色之间没有显著的相关性。这也应该说得通,因为眼睛的颜色不应该随着孩子长大而改变。如果这种关系显示出很强的相关性,我们会想要检查数据来找出原因。使用Python查找相关性让我们看看一个更大的数据集,并且使用Python的库查找相关性。我们将使用来自于一个Kaggle上关于流媒体平台上的电影数据集。这个数据集包含哪些电影来自于哪个平台,它还包括关于每部电影的一些不同的列,如名称、IMDB分数等。导入数据和简单的清洗我们将首先导入数据集,然后使用PANDAS将其转换为DataFrame。import pandas as pdmovies = pd.read_csv("MoviesOnStreamingPlatforms_updated.csv")Rotten Tomatoes列(烂番茄,国外著名的电影评分网站)是一个字符串,让我们将数据类型改为浮点数。movies['Rotten Tomatoes'] = movies['Rotten Tomatoes'].str.replace("%" , "").astype(float)Type列似乎没有正确输入,让我们删除它。movies.drop("Type", inplace=True, axis=1)好了,现在可以进行我们的工作了!使用core()方法使用Pandas correlation方法,我们可以看到DataFrame中所有数字列的相关性。因为这是一个方法,我们所要做的就是在DataFrame上调用它。返回值将是一个新的DataFrame,显示每个相关性。corr()方法有一个参数,允许您选择查找相关系数的方法。默认方法是Pearson方法,但您也可以选择Kendall或Spearman方法。correlations = movies.corr()print(correlations)ID Year IMDb Rotten Tomatoes Netflix ID 1.000000 -0.254391 -0.399953 -0.201452 -0.708680 Year -0.254391 1.000000 -0.021181 -0.057137 0.258533 IMDb -0.399953 -0.021181 1.000000 0.616320 0.135105 Rotten Tomatoes -0.201452 -0.057137 0.616320 1.000000 0.017842 Netflix -0.708680 0.258533 0.135105 0.017842 1.000000 Hulu -0.219737 0.098009 0.042191 0.020373 -0.107911 Prime Video 0.554120 -0.253377 -0.163447 -0.049916 -0.757215 Disney+ 0.287011 -0.046819 0.075895 -0.011805 -0.088927 Runtime -0.206003 0.081984 0.088987 0.003791 0.099526Hulu Prime Video Disney+ Runtime ID -0.219737 0.554120 0.287011 -0.206003 Year 0.098009 -0.253377 -0.046819 0.081984 IMDb 0.042191 -0.163447 0.075895 0.088987 Rotten Tomatoes 0.020373 -0.049916 -0.011805 0.003791 Netflix -0.107911 -0.757215 -0.088927 0.099526 Hulu 1.000000 -0.255641 -0.034317 0.033985 Prime Video -0.255641 1.000000 -0.298900 -0.067378 Disney+ -0.034317 -0.298900 1.000000 -0.019976 Runtime 0.033985 -0.067378 -0.019976 1.000000输出的列太多,使其难以读取。这只是9个变量的相关性,结果是一个9x9的网格。你能想象看到20或30个吗?这将是非常困难的。输出如果我们不调用打印,只是让Jupyter格式返回。movies.corr()我们还可以通过使用列名进行切片来单独检查每个变量。print(correlations["Year"])//ID -0.254391Year 1.000000IMDb -0.021181Rotten Tomatoes -0.057137Netflix 0.258533Hulu 0.098009Prime Video -0.253377Disney+ -0.046819Runtime 0.081984如果仅查看1个变量的相关性,则它较易读且足够。 但是,必须有一种更简单的方法来查看整个数据集。使用Seaborn进行可视化我们可以通过seaborn快速生成热图。为什么使用seaborn?因为seaborn是基于matplotlib开发的并且提供了更多的扩展功能,最主要是的,它比matplotlib漂亮。#always remember your magic function if using Jupyter%matplotlib inlineimport seaborn as snsimport matplotlib.pyplot as pltsns.heatmap(correlations)plt.show()我们的发现现在我们可以快速看到一些相关性。IMDb和烂番茄之间有很强的正相关性。 以及主要视频和ID之间的强正相关性。Netflix与Year之间存在轻微的正相关。Netflix与ID,Netflix和Prime Video之间的强烈负相关Year和Prime Video,Disney Plus和Prime Video,Hulu和Prime Video以及Netflix和ID之间存在轻微的负相关。runtime 与任何流平台之间都没有关联Netflix与年份之间没有关联有了这些信息,我们可以进行一些观察。由于ID与所显示的两个平台之间的正相关和负相关性很强,因此先按顺序添加数据,然后依次添加Netflix和Prime Video。 如果我们要用这些数据来构建模型,则最好在将其拆分为测试和训练数据之前将其打乱。看起来Netflix有较新的电影。 这可能是要探索的假设。与其他流媒体平台相比,Netflix和亚马逊似乎拥有最多的独特电影。 要探索的另一个假设。不同的平台似乎不会根据评论者的得分来选择电影。 我们可以探索另一个很酷的假设。在几秒钟内,我们就能看到如何输入数据,并至少可以探索3个想法。结论通过使用seaborn的热图,我们可以轻松地看到最相关的位置。这对于了解一个新的数据集是非常有帮助的作者:Jeremiah Lutesdeephub翻译组

二合一

常用的心理学研究方法有哪些?掌握这5种就够了!

在学习A-level/GCSE心理学时,心理学研究方法是小伙伴们必须掌握的知识点。以AQA考试局GCSE心理学课程大纲来看,心理学研究方法(Research methods)是主要学习内容之一,这部分知识内容主要包括可检验假设的形式、变量类型、采样方式、设计研究、相关性、研究程序、规划和进行研究、道德考量(Ethical considerations)。各部分内容还包含具体Topic要求小伙伴们掌握:(AQA考试局GCSE心理学研究方法课程大纲)心理学有几种不同的研究方法,主要分为两种类型,即定量研究(Quantitative methods,取决于数学或统计数据的使用)和定性研究法(Qualitative methods)。这两种类别的研究方法包含许多种研究,比如说相关性研究、描述性研究和实验性研究等。具体使用哪种类型的研究取决于具体的心理学研究目标。学姐在这里给大家介绍几种不同的心理学研究方法。1.个案研究(Case Study)案例研究是定性研究方法。它涉及在一段时间内观察一个人或一组人。研究人员采访对象或观察行为并记录信息。通常使用这种类型的心理学研究来说明如何在实践中应用心理学原理或理论。案例研究方法广泛用于专业培训中。2.实验法(Experiment)在科学科学中,实验是最常使用的研究方法。实验法的第一个原则是设置对照组。对照组可能是一个或一组未经操纵的个人或群体。第二个原则是控制变量。也就是说,实验应尽可能避免多余数据。该因素使心理学家能够重复该实验,这是可靠研究的要求。第三个原则是测量的一致性。如果允许使用不同标准将导致实验无法复制,实验结果不可靠。第四个原则是显示因果关系。也就是说,在实验中执行的操作导致了最终结果,而没有涉及其他因素。实验可以是在实验室控制的,例如睡眠研究,允许心理学家操纵受试者但不能操纵其环境的现场实验,或者不允许进行控制且主要是观察性的自然实验。3.观察研究(Observational Study)这种类型的定性研究可以是既自然进行的,也可以在人为控制的情况下进行。这种研究方法是系统的且需要仔细记录的。观察研究的目的是识别和描述一个变量甚至一组变量。4.调查研究(Survey)这种调查研究方法取决于报告的数据,结果可能是高度主观的。因此,调查通常涉及许多主题。这是一种随机抽样的定量研究方法。这不是实验法,而是“精心选择”了样本的方法。5.内容分析(Content Analysis)这种研究方法涉及查看诸如印刷品、电视、广播等媒体,以重复特定单词或短语甚至想法。这是一种定量方法,利用有关单词或概念的数学或数据来研究诸如定型观念或某些文化方面(例如性行为)的事物。这类研究在广告中特别有应用价值,但也可用于预测特定人群的行为。心理学中使用的研究方法取决于要研究的数据种类以及研究的目的和广度。

梦千年

如此瞎胡闹,为利益,竟把蔗糖与疾病相关性研究封杀50年

四处打探,搜罗资讯,发现和健康相关的最新信息,或试译或综述或解读,争取以最快速度传递给您。今天的《健康快报》要呈上可将人雷到外焦里嫩的消息,让我们去看看周末新鲜出炉的大件事。说到科学研究,我们想到的就是毫不利己专门利人的有情操的学者,万万想不到,事关人类健康的研究,竟会被商业集团操纵。研究人员发现,曾在动物研究中发现证据,表明蔗糖可能与心脏病及膀胱癌有关。谁成想,研究报告被封杀了,而且,一封竟是50年。揭发这件事的论文,发表在PLOS Biology。咱先插一下,聊几句杂志的事儿。PLOS,the Public Library of Science,您英文好,看出来了,美国科学公共图书馆的简称。这是由几个生物医学科学家在2000年10月创立的,目的是向研究人员服务,让全球范围的科技和医学领域的文献成为可以免费获取的公共资源。旗下现在有7种期刊,属国际顶级水准。近期杂志发表的论文,由美国加利福尼亚大学旧金山分校提交,几名研究人员在审查制糖业的内部文件时,发现国际糖业研究基金ISRF,曾资助过蔗糖对健康影响的研究。但发现研究中有证据表明蔗糖可能与心脏病及膀胱癌有关时,基金会封杀了结论,终止了研究。还有更糟糕的事儿,研究人员还发现,ISRF还资助过一篇评论文章的发表,把疾病与蔗糖消费关系的研究给怼了回去,那篇文章声称,饲喂糖的试验鼠比喂淀粉的鼠的胆固醇水平高,这个可以用肠道微生物来解释。硬生生地把糖长老从疾病关系中给摘了出来,额滴神,说好的节操呢?!令人呆若木鸡的是,这事儿发生在公元1967年,这一瞒竟是整整半个世纪!有意思的是,就在去年,ISRF还在批评小鼠中发现的糖与肿瘤生长及转移关系的研究,并声称摄入糖和癌症之间没有可靠的联系。但此次加州大学的开撕式研究结论说明,糖与淀粉对健康的相对影响的争论,源于近60年的商业利益集团的操纵,并认为这与烟草健康影响研究的情况是类似的。这是冰山的一角,还是事件的整体,回应和争论的情况,我们会及时地跟踪。毕竟相对于药物等研究而言,糖与每个人的健康关联更加紧密。爱谁,就把健康传给谁。你的健康,我的关注。专业人员制作,以科学与人文视角多维度观察生命健康,包括医事、史话、日常、展望、心理、房内等系列,内容为作者魏宏岭及团队原创作品。拒绝未经许可的一切形式的盗用、盗链及转载,否则将依据相关法律予以追究。

野马

回归分析的基础概念之2:相关性与相关关系,相关系数与判定系数

大家好,欢迎来到许栩原创专栏《从入门到高手:线性回归分析详解》(本专栏总目录见上图),这是专栏的第二篇文章,确定关系与相关关系,相关系数与判定系数。本专栏第一篇文章,我讲解了回归分析第一个基础概念,变量。这一章,将讲解回归分析另一个最重要的基础概念,相关性。本章的主要内容如下。1、什么是相关性?2、函数关系、相关关系与因果关系。3、相关系数及其计算方法。4、相关关系强弱的评定标准。5、判定系数及其计算方法。6、相关系数与判定系数在回归分析中的作用。一、什么是相关性?在回归分析中,相关性是指变量与变量之间的相互影响程度或相互关联程度。这个定义非常明了,不用我多做说明。我就强调一点:相关性是指变量之间相互的关联程度,是共变关系,即你变我也变,是互相影响互相关联的关系。当然,变的方向和变的程度可以不同。相关性一般分为三种,即正相关、负相关和不相关。1、当一个变量变化时,另一个变量和它相同方向变化,这两个变量就是正相关。也就是说,当一个变量增加时另一个变量也增加,当一个变量减少时另一个变量同时减少。比如当气温上升时,空调耗电量就增加,气温下降时,空调耗电量也会下降,气温和空调耗电量就是正相关。2、负相关则相反,指的当一个变量增加时另一个变量减少,或一个变量减少时另一个变量增加。比如,当气温上升时,吃麻辣火锅的人就会减少,当气温下降时,吃麻辣火锅的人就会增加,气温和吃麻辣火锅的人数就是负相关。3、不相关,顾名思义,就是指两个变量之间没有关系,即一个变量的变化对另一变量没有明显影响。二、函数关系、相关关系与因果关系。客观事物之间的关系,一般来说可以归纳为两大类,函数关系和相关关系(不相关也是相关关系的一种)。函数关系,就是确定关系,是可以用精确的数学表达式表示的关系。确定关系的特征是,当自变量确定后,因变量为唯一值,也就是确定值。比如正方形面积的计算,S=a*b,当长与宽确定时,面积也是确定的,长宽和面积是确定关系。相关关系,是一种非确定性的关系。两个变量之间有一定的关系,但当一个变量确定后,另一个变量并不是唯一的,另一个变量可以有若干种可能的取值。比如上文所讲到的,气温和空调耗电量之间,当气温变化时,我们无法用一个标准的数学表达式来计算空调耗电的数量,即空调耗电的数量是不确定的,气温与空调耗电量是相关关系。因果关系是界于函数关系与相关关系之间的关系,因果关系,顾名思义,就是第一件事是第二件事的原因,而第二件事是第一件事的结果。比如因为缺料,造成订单无法交付,缺料与订单无法交付是因果关系,缺料是因,订单交付不了是果。因果关系有一定的确定性,但不如函数关系完全确定。因果关系也不等同于相关关系,相关是偶然的,因果是必然的,相关是不确定的,因果是部分确定的。很多理论将回归分析归于因果分析的一类,我并不认同。两个变量存在相关关系并不意味着一定具有因果关系,比如去年的气温与今年的气温有很强的相关性,但不能说今年气温变化的原因是因为去年的天气温度。回归分析,主要分析的是相关关系。三、相关系数及其计算方法。相关系数,是衡量两个变量之间相关方向和相关程度的相对指标。相关方向,是指两者之间是正相关还是负相关。相关程度,是指两者之间相关的紧密度。相关系数是一个统计指标,用字母R表示,最早由英国统计学家卡尔·皮尔逊设计并提出。相关系数R取值在±1之间。当R为0时,表示两个变量绝对不相关。当R大于0时,两个变量正相关,即你增加我也增加,你减少我也减少。当R小于0时,两个变量负相关,即你增加我减少,你减少我增加。当R等于1或-1时,表示两个变量绝对相关。相关系数的计算公式如下图。这个公式是不是看起来特别复杂和繁琐?不是是看着头晕?或者直接说看不懂。看不懂没关系,我也不准备讲解,因为,计算相关系数,我们有简单易学的算法。在各种计算工具越来越先进并且越来越简单的今天,我们对复杂的算法只需要有个脸熟就可以。用Excel函数CORREL可轻松计算相关系数。CORREL函数有两个参数,即两个变量的数组区域,详见下面两个图(CORREL函数介绍和CORREL函数实例)。四、相关关系强弱的评定标准。

行露

祝贺我院慢阻肺基因相关性研究创新团队获得自治区“创新先锋号”荣誉称号、朱华主任和马玉珍主任获得自治区“创新先锋岗”荣誉称号

祝贺我院慢阻肺基因相关性研究创新团队获得自治区“创新先锋号”荣誉称号、朱华主任和马玉珍主任获得自治区“创新先锋岗”荣誉称号发布时间:2020-12-31 作者:科研处 浏览次数:11次 字号:[ ]近日,内蒙古科协公布了关于命名全区“创新先锋号”、“创新先锋岗”的通告。为了让全区科技工作者积极投身“科技兴蒙”行动和“科创中国”实践,推动科技经济融合发展,内蒙古科协组织开展了“创新先锋号”“创新先锋岗”争创活动,活动中涌现出一大批立足科研、爱岗敬业、争创一流的先进集体和个人。为选树典型、激励先进,进一步把“创新先锋号”“创新先锋岗”活动引向深入,激励更多的单位和个人投身创建活动,经综合考察以及专家评定,我院的慢阻肺基因相关性研究创新团队获得自治区“创新先锋号”称号、朱华主任和马玉珍主任分别获得自治区“创新先锋岗”荣誉称号。以上荣誉的取得,是对载誉团队和专家们始终爱岗敬业、专注科技创新精神的肯定,希望今后医院有更多的医务工作者积极投身医学科技创新的事业,为建设科技强院而共同努力。【来源:内蒙古自治区人民医院】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn

未必贱也

Environmental Microbiology:趋磁细菌生物与矿物多样性鉴定及其相关性研究

刘沛余等-EM:趋磁细菌生物与矿物多样性鉴定及其相关性研究摘要:微生物是地球上出现最早、种类和数目最多、功能最全的一种生命形式。通过矿化作用,微生物直接参与地球上至少六十余种矿物的形成和转化。研究自然界中能够矿化的微生物及微生物形成的矿物对认识现今和地质历史时期的微生物参与及微化石记录的地球与生命演化过程具有重要指示意义。然而,自然环境中的微生物一般多杂居混生,且超过99.99%的微生物还不能在实验室实现纯培养。如何开展环境中未培养微生物的种类鉴定和深入研究,是当前地质微生物学领域研究的热点和难点。近日,中国科学院地质与地球物理研究所地磁场与生物圈演化学科组研究团队联合国内外多个单位科研人员,利用“荧光-电子显微镜联用”新技术(FISH-SEM和FISH-TEM),对自然环境中一类“既能利用地磁场定向游泳,又能在细胞内矿化合成纳米级磁铁矿(Fe3O4)磁小体”的原核微生物——趋磁细菌,进行了迄今为止最大规模的生物和矿物多样性鉴定,从单细胞水平上鉴定了20种新型的趋磁球菌。系统发育分析表明,这些趋磁球菌属于变形菌门(Proteobacteria)一个新的纲—η-变形菌纲;透射电镜分析表明,这些趋磁球菌合成的磁小体形貌和结构多样,但具有菌种或菌株特异性。研究表明,磁小体的生物矿化过程受到趋磁细菌基因水平上的严格调控,磁小体的形貌和结构特征与趋磁细菌的种类存在一定程度的对应关系,因此沉积物或岩石中磁小体有望成为古趋磁细菌研究的化石材料。1974-1975年,美国微生物学者理查德·布莱克莫(Richard P. Blakemore)在研究海洋淤泥中螺旋菌时,意外发现一类球形细菌,能识别地磁场或外加磁场,顺着磁力线方向游泳而聚集在水滴边缘,这些球菌还能在细胞内合成链状排列的纳米四氧化铁(Fe3O4)颗粒。在随后发表的Science文章中,他将这类细菌命名为趋磁细菌(magnetotactic bacteria),将这些细胞内纳米磁性颗粒命名为磁小体(magnetosome),将趋磁细菌这种沿磁力线游泳行为称为趋磁性(magnetotaxis)。布莱克莫的这一发现,重新唤起了人们对意大利学者Bellini在1950-1960年代从淡水环境发现的一类磁敏感细菌的重视,同时也迅速吸引了微生物学、物理学和地球科学等多领域科学家极大的兴趣,从此拉开了趋磁细菌研究的序幕。40多年来,来自英、德、日、巴西和中国等来自生命、地球、海洋、物理和材料科学等不同领域的科学家陆续加入到趋磁细菌的研究行列,重点在趋磁细菌的生态分布和种类多样性、磁小体生物矿化过程及其分子机制、磁小体化石识别及古地磁学应用、以及磁小体生物仿生和纳米医学应用等方面开展了大量研究。这些研究表明,磁细菌具有全球分布,其细胞种类(系统发育)和磁小体晶型均具有丰富的多样性,表明其生物矿化机制也可能多样。针对未培养趋磁细菌,前人多采用不依赖纯培养的分子生态学(16S rDNA序列测定)研究其系统发育,采用透射电镜技术研究磁小体的形貌、尺寸、结构、成分和细胞内的组装结构等性质,从而认识趋磁细菌的生物矿化过程和机理。然而,磁小体晶形观测难以与系统发育直接建立联系,除了少数几种趋磁细菌外,大量的未培养趋磁细菌的种类与磁小体晶型在细胞水平上的一一对应关系并未建立,制约了全面认识趋磁细菌的生物矿化机制。特别指出的是,尽管趋磁球菌是最早被发现的趋磁细菌,也是自然环境中分布范围最广、数目最多的趋磁细菌,但对这类细菌的认识相对是最不清楚的。主要表现在:(1)由于其培养条件十分苛刻,目前纯培养的趋磁球菌只有三株,分别是Magnetococcus marinus strain MC-1, strain MO-1和 Magnetofaba australis strain IT-1,均为海洋单链趋磁球菌。(2)尽管前人的研究中获得了大量的趋磁球菌16S rDNA序列,但是由于不同种类的趋磁球菌形貌极其相似,用传统的荧光原位杂交技术难以将它们的系统发育信息和细胞、磁小体形貌结构等特征对应起来,从而限制了对这类细菌生物矿化机制的深入认识。(3)由于纯培养和成功鉴定的趋磁球菌种类相对较少,对这类细菌的系统发育分类存在争议。自2015年起,中科院地质地球物理所李金华研究员与潘永信院士团队,联合中科院物理所、山东大学、法国巴黎第六大学、澳大利亚国立大学等国内外多个单位的科研人员针对环境中未培养的趋磁细菌,开展生物地磁学和地球生物学多学科交叉研究。他们首先建立了一种“荧光-电子显微镜联用”新技术(FISH-SEM和FISH-TEM),将趋磁细菌种类鉴定的荧光显微镜观测信号与磁小体结构观测的电子显微镜观测信号结合起来,首次在单细胞水平实现了未培养趋磁细菌的种类鉴定和生物矿化研究(图1)。在此基础上,该研究团队对来自北京密云水库、西安未央湖、天津于桥水库、秦皇岛石河入海口以及大连夏家河等淡水、海水以及半咸水环境的沉积物中的趋磁球菌进行首次大规模的生物和矿物多样性鉴定,在单细胞水平上鉴定了20种新型的趋磁球菌(图2)。其中,有12株是前人从未报道过的新序列(16S rDNA与所有前人报道过的序列相似度均低于97%),另外8株与前人报道过的序列有较高(≥97%)相似度,但磁小体的形貌和结构未被鉴定(Zhang et al., 2017;Liu et al., 2020)。图1 荧光-电子显微联用技术鉴定环境样品中未培养趋磁球菌。(A-D)BHC-1(来自北京北海)。(E-H)LLTC-1(来自秦皇岛老龙头海域)。(I-L)DMHC-2(来自山东济南大明湖)。(M-P)MYC-3(来自北京密云水库)。该技术基于趋磁细菌的16S rRNA基因序列,设计特异性的寡核甘酸探针,通过改进传统的荧光原位杂交(FISH)技术的制样和观察环节,实现了荧光显微镜下对经寡核苷酸探针特异性杂交的趋磁细菌进行单细胞水平的观察和识别,然后通过扫描电镜和透射电镜对同一微区或同一个细胞进行纳米尺度的形貌和结构分析,从而实现对同一个趋磁细菌细胞在单细胞水平上的种类鉴定(系统发育)和在纳米尺度上的生物矿化研究(细胞和矿物形貌结构等)(Li et al., 2017)图2 20种趋磁球菌的生物(系统发育)和磁小体形貌多样性。(A)基于16S rDNA序列的趋磁球菌系统发育进化树。(B-U)20株趋磁球菌的透射电子显微镜照片。图A每个细菌后的编号与透射电镜中显示的细菌是一一对应的在成功鉴定了这20株未培养趋磁细球菌的基础上,该研究团队综合微生物分子生态学和透射电子显微学,对这些趋磁细菌进行了深入研究。系统发育分析结果显示,所有的趋磁球菌的16S rDNA序列都聚类在变形菌门一个独立的分支上。这支持了前人认为趋磁球菌应独立为变形菌门当中一个新的纲——η-变形菌纲的观点(图3)。图3 趋磁球菌属于变形菌门的一个新纲——η-变形菌纲。本图共总结了29种趋磁球菌,其中前人共鉴定了了9种,其余20种为本研究团队所鉴定 电子显微学分析结果表明,趋磁球菌均为直径在~1.0微米到~2.5微米之间的球型或卵球型细胞。此外,趋磁球菌的磁小体链结构分为四类,分别为单链、双链、四链和非直链排列。磁小体的形貌有八面体、立方八面体和拉长的棱柱形。大多数趋磁球菌能合成10个左右的磁小体,但部分菌株,如DMHC-6和WYHC-2,几十个到上百个左右的磁小体。磁小体的平均长度在60 nm到114 nm之间,平均宽度在36 nm到86 nm之间(图4-图7)。图4 6种趋磁细菌合成单链磁小体。(A-F)磁小体链的透射电镜照片。(G-I)磁小体长、宽和宽/长比的平均值图5 5种趋磁球菌合成双链磁小体。(A-E)磁小体链的透射电镜照片。(F-H)磁小体长、宽和宽/长比的平均值图6 三种趋磁球菌合成两条双链磁小体。(A-C)磁小体链的透射电镜照片。(D-F)磁小体长、宽和宽/长比的平均值图7 6种趋磁球菌不合成直链排列的磁小体。(A-F)磁小体链的透射电镜照片。(G-I)磁小体长、宽和宽/长比的平均值为了进一步研究趋磁球菌种类和磁小体形貌之间的关系,该研究团队基于磁小体链结构、数目、宽度和宽长比数据,进行了非度量多维尺度分析(nonmetric multidimensional scaling, nMDS)。结果显示,代表同种趋磁球菌的磁小体形态学数据的点聚在一起,代表不同种趋磁细菌磁小体数据的点彼此远离。这说明趋磁球菌的生物学种类和磁小体形貌结构特征是一一对应的,即矿化产生的磁小体具有一定程度的菌种或菌株特异性(图8)。图8 趋磁球菌种类与磁小体形貌结构之间相关性的nMDS分析结果。趋磁球菌可以按照磁小体链结构聚类并分开,且每种趋磁球菌也可聚类并相互之间分开本研究完善并发展了研究团队前期建立的“荧光-电子显微镜联用”新技术,并将该方法应用到“自然界分布最广、数量最多,但相对最难识别、认识程度最低”的一类趋磁球菌的种类鉴定和生物矿化研究中,首次在单细胞水平上大规模鉴定了20种新型趋磁球菌。结合前人总共鉴定的9种趋磁球菌数据,系统发育分析证实趋磁球菌应该从α-变形菌纲中剥离出来,成为一个新纲——η-变形菌纲。透射电镜分析表明,趋磁球菌磁小体具有丰富的链组装模式、形貌和结构多样性,尤其是6种非直链磁小体结构的趋磁球菌的鉴定和发现,表明磁小体的直链排列并不是趋磁细菌组装磁小体的必要模式,因此这类非直链组装磁小体的生物矿化和磁学性质值得进一步深入研究。趋磁细菌生物种类与其磁小体形貌结构特征的综合分析表明,磁小体生物矿化过程和机制在一定程度上具有菌种或菌株特异性,这为未来通过沉积物或岩石中磁小体来追溯古趋磁细菌的生物学信息提供了理论依据。研究成果发表于Environmental Microbiology。(Liu P, Liu Y, Zhao X, et al. Diverse phylogenyand morphology of magnetite biomineralized by magnetotactic cocci[J].Environmental Microbiology, 2020.DOI:10.1111/1462-2920.15254.)本研究受中国国家自然科学基金重点国际(地区)合作研究项(41920104009)、国家自然科学基金重大项目课题(41890843)和国家自然科学基金创新研究群体项目(41621004)资助。校对:张崧

虽虫能天

饮食和生活方式与胶质瘤发病率的相关性研究

波兰比亚韦斯托克医科大学饮食学系的Joanna Bielecka等研究饮食和生活方式对胶质瘤发病率的影响,结果发表于2020年6月的《Nutrients》在线。——摘自文章章节【Ref: Bielecka J & Markiewicz-ukowska R. Nutrients. 2020 Jun 17;12(6):1812. doi: 10.3390/nu12061812.】研究背景合理饮食和生活方式可以预防30%-50%的癌症,但对胶质瘤的影响尚不明确。有人认为,饮食中的蔬菜和抗氧化剂(如维生素C和维生素A)对机体具有预防肿瘤的保护作用,而其它因素与胶质瘤的发病率无相关性。食用鱼类、咖啡和茶能否预防胶质瘤有待研究。保持适当体重和进行足够的日常体力活动也很重要;体重指数(BMI)过高会增加胶质瘤的发病率。波兰比亚韦斯托克医科大学饮食学系的Joanna Bielecka等研究饮食和生活方式对胶质瘤发病率的影响,结果发表于2020年6月的《Nutrients》在线。研究结果研究结果显示:① 饮酒是肿瘤发生的重要危险因素,提高某些类型肿瘤的发病率。有荟萃分析研究发现,饮酒与总体死亡率呈正相关(RR=1.08;95%CI,1.02-1.16)。然而,饮酒对胶质瘤发病率的影响仍不明确。② 咖啡富含多种促进健康的化合物,具有抗氧化、抗纤维化、抗突变和抗癌活性,但在烘焙时易产生有害物质,如丙烯酰胺。总体而言,咖啡可降低18%肿瘤发病率。荟萃分析研究发现,咖啡摄入与胶质瘤发病率无相关(RR=0.96;95% CI,0.81-1.13);咖啡摄入量与胶质瘤发病率也无相关性(RR=1.01;95% CI,0.83-1.22)。③ 茶,绿茶中的活性成分没食子儿茶素没食子酸脂(EGCG)可用作TMZ、放疗或顺铂治疗胶质瘤的佐剂。细胞实验发现,EGCG可抑制胶质瘤细胞增殖和侵袭,促进细胞凋亡。有研究结果显示,饮茶可降低胶质瘤发病(RR=0.86;95% CI,0.78-0.94),然而饮茶量与胶质瘤发病率无相关性(RR=0.88;95% CI,0.69-1.12)。④ 水果和蔬菜含有多种抗肿瘤成分,如维生素、类黄酮和异硫氰酸盐等发挥保护DNA和修复DNA损伤、调控DNA甲基化、诱导II相解毒酶和促进细胞凋亡等作用。荟萃分析发现,充足的蔬菜摄入可能是预防胶质瘤的一种措施,尤其在亚洲人群中;然而蔬菜如何起保护作用尚未证实。水果摄入对胶质瘤发病率的影响也缺少充分研究,但是摄入适量水果可降低多种其它类型肿瘤的发病率。⑤ 食用鱼富含EPA和DHA,二者对脑组织具有保护作用,因此认为食用鱼可降低胶质瘤的发病率。但文献报道食用鱼与胶质瘤发病率无明显相关性(RR=0.81;95% CI,0.64-1.03)。然而食用鱼对其它类型脑肿瘤具有预防作用,具体机制尚待研究。⑥ 红肉和加工红肉中的N-亚硝基化合物(NOC)以及血红素铁是最重要的致癌物。与结直肠癌、胰腺癌和前列腺癌的发生相关。现有文献报道称,铁摄入(包括血红素和非血红素)对胶质瘤发病率无影响。也有荟萃分析结果表明,食用加工红肉与胶质瘤发病率有相关性,但尚存争议。⑦ 抗氧化剂,美国的大多数研究发现,维生素A和维生素C可降低胶质瘤发病率。因此,合理饮食在预防胶质瘤中可发挥作用,特别是食用能够提供足量抗氧化剂的食物。⑧ 人体测量指标,超体重是多种癌症的危险因素,也是影响癌症患者生存和预后不良的危险因素。肥胖提高患胶质瘤的风险。相比体重正常者,18岁肥胖的成年人胶质瘤发病率增加近4倍(RR=3.74;95% CI,2.03-6.90)。研究发现,超重发生的时间非常重要,18岁之前超重或肥胖可能增加患胶质母细胞瘤的风险,而成年后超重似乎影响不大。⑨ 体力活动,向18-64岁的成年人推荐保持健康的体力活动,标准为每周至少进行150分钟中等强度的有氧活动或75分钟高强度的有氧活动。研究发现,体力活动可降低发生结肠癌、乳腺癌和子宫内膜癌的风险。体力活动影响代谢、免疫和激素水平,如IGF-1;而血清IGF-1水平与胶质瘤发病率呈正相关。在青春期进行体力活动对预防胶质瘤尤为重要,参加体力活动可降低36%患胶质瘤的风险。结论最后作者指出,饮食和生活方式对胶质瘤发病率的影响非常复杂,结论尚不明确,需要进行多地区、大规模、前瞻性对照研究。摄入咖啡、茶、足量的蔬菜和抗氧化剂(如维生素C和维生素A)对胶质瘤具有预防作用。而饮酒、红肉、加工红肉、铁摄入量与胶质瘤的发病率无相关性。食用鱼、咖啡和茶没有增加胶质瘤的发病率,但是否可预防胶质瘤有待研究。保持适当体重和进行足够的体力活动很重要,特别是在青春期。较高的体重指数会增加胶质瘤发病率,身高与胶质瘤的发病率呈正相关。声明:脑医汇旗下神外资讯、神介资讯、脑医咨询所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。