近5日机构合计调研13家公司,中航光电、TCL科技、阿尔特等被多家机构扎堆调研。 近5个交易日(4月7日至4月13日)两市约13家公司被机构调研,调研机构类型显示,证券公司共对11家公司进行调研,即84.62%的上市公司调研活动有证券公司参与;基金公司调研10家,位列其后;阳光私募机构调研9家,排名第三。 机构调研榜单中,共有6家公司获10家以上机构扎堆调研。中航光电最受关注,参与调研的机构达到172家;TCL科技被64家机构调研,榜单中排名第二;阿尔特、国药一致等分别被29家、28家机构调研。 机构调研次数来看,坚朗五金机构调研最为密集,共获机构3次调研。 市场表现上,机构扎堆调研股中,近5日上涨的有2只,涨幅居前的有中航光电、阿尔特等,涨幅为11.23%、9.55%;下跌的有4只,跌幅居前的有TCL科技、仙鹤股份、乔治白等,跌幅为10.17%、8.59%、3.85%。 机构扎堆股中,有6股已经公布了年报,净利润同比增幅最高的是TCL科技、仙鹤股份,净利润分别增长67.63%、63.02%。 近5日机构调研股一览 注:本文系新闻报道,不构成投资建议,股市有风险,投资需谨慎。〖 数据宝 〗本文不构成投资建议,股市有风险,投资需谨慎。
2020年中国市场规模达280亿元,未来五年复合增长率达41%,保持高速增长细分市场:数据存储113亿,决策应用54,以大中型企业需求为主,政府、金融行业是主市场重点区域:一二线城市占市场规模的八成以上,北京、上海、浙江、广东处于全国第一梯队用户规模:48万高需求用户,1.4万家数据资产化需求用户,实际客户开发率低,未来有34倍成长空间在中国经济迈入增速换挡期的当下,中国市场的数字化建设需求呈现急剧增长的态势。伴随数字化建设程度的不断提高,将会有更多的企业、政府机构等积累产生大量数据资源,越来越多的企业/机构开始意识到这些数据的价值,并希望对这些数据要素进行整合与管理,以便于为企业/机构管理者提供决策辅助支撑。最终用户的数据资源以数字类最高,其次是文本类、图像类和视频类,相对而言,语音类和符号类占比较低。从数据资源的量级来看,平均单个最终用户的数据量级达到3.2PB,从具体分布来看,有55%的最终用户数据资源累积超过100TB。从数据资源的来源渠道来看,客户/用户数据与企业运营数据是主要来源渠道,其次是经管数据和互联网公开数据。
近5日机构合计调研79家公司,海康威视、奇安信、京东方A等被多家机构扎堆调研。 近5个交易日(4月13日至4月19日)两市约79家公司被机构调研,调研机构类型显示,证券公司共对69家公司进行调研,即87.34%的上市公司调研活动有证券公司参与;基金公司调研61家,位列其后;阳光私募机构调研42家,排名第三。 机构调研榜单中,共有34家公司获20家以上机构扎堆调研。海康威视最受关注,参与调研的机构达到459家;奇安信被198家机构调研,榜单中排名第二;京东方A、兆易创新等分别被195家、175家机构调研。 机构调研次数来看,有2家公司被机构调研3次,分别是金字火腿、中颖电子等,机构调研最为密集。 20家以上机构扎堆调研股中,近5日资金净流入的有13只,京东方A近5日净流入资金12.25亿元,主力资金净流入最多;净流入资金较多的还有海康威视、拓邦股份等,净流入资金分别为3.35亿元、1.89亿元。 市场表现上,机构扎堆调研股中,近5日上涨的有27只,涨幅居前的有拓邦股份、海康威视、易华录等,涨幅为19.93%、14.07%、13.31%;下跌的有5只,跌幅居前的有蒙娜丽莎、兆易创新、华菱钢铁等,跌幅为15.24%、7.23%、4.20%。 机构扎堆股中,有30股已经公布了年报,净利润同比增幅最高的是京东方A、鱼跃医疗,净利润分别增长162.46%、133.74%。有2股已经公布了年报业绩快报,净利润增幅较高的有中粮科技,增幅为0.05%。 近5日机构调研股一览 注:本文系新闻报道,不构成投资建议,股市有风险,投资需谨慎。〖 数据宝 〗本文不构成投资建议,股市有风险,投资需谨慎。
大部分的互联网从业者,每天醒来,睁开眼睛,都几乎立即浸泡在压力之中。无论他们过去有多么成功,新的一天开始,新的挑战也随之开始。在这新的一天,我们不仅仅花费金钱,我们同样投入智力和精力,并且花费大量的时间,只是确保我们的互联网生意最终能够收获能让自己欣慰的结果。数据,几乎是互联网一切产品和营销的出发点,又是二者的归宿。数据,帮助我们洞悉互联网产品和营销的奥秘,甚至助我们在山穷水尽之后又柳暗花明,在“绝地”之后又重获新生。数据,看似唾手可得却又如此变化莫测,看似新鲜可口却又常常味同嚼蜡。我们想要更好的互联网生意,就应该更好的掌握和利用数据。没有捷径,但有窍门。我想提醒立志于在这个领域大干一场的朋友们,一定要注意在认知上的一些常见的“坑”——那些看起来很华美,但可能有“毒”的东西。警惕“伪数据源”第一个坑,在于我们在意识中并没有真正形成数据从何而来的正确思想。我们可能会认为,数据是唾手可得的,或者只要愿意付出金钱,就能获得数据。而一些黑科技、灰科技、工具和数据平台们,也不断鼓吹:有了我们,数据唾手可得!但事实并非如此!钱和技术,并不是获取真正有价值数据的充分条件。许多年后,我也才意识到“无运营,不数据”的真正含义。这并不是说,运营都需要数据(虽然你也可以这么理解),而是反过来,真正有价值的数据,只有通过两手沾满泥、脚踏实地的运营才能真正获得。想要打通不同消费者平台上的数据(微信、网站、app、小程序、CRM、电商)?没有技术可以帮你直接解决。你只能通过运营手段为实现技术性的打通创造条件——最起码的,你得让更多的消费者愿意注册登录,这不是光靠钱和技术就能解决的。想要搞清楚细分流量的来源?无论web端还是app端还是小程序端都有成熟的技术解决方案,但问题是,还是需要通过运营人员手工做好标记,交给技术工具才能让技术工具按照你的标记进行数据抓取。这虽然跟技术有关,但是必须靠人动手去做。想要获得用户细致入微的行为?依靠无埋点或者全埋点的方法?存在风险,手动在每一个真正监测价值的用户交互点上做好事件监测才能获得准确可靠的数据,这又是既需要研究业务需求,还需要耐心仔细才能做好的工作。关于事件监测和埋点,在2.6.4小节会有详细的介绍。还有,人群画像,机器自动就帮我们画好了?不靠细致的数据埋点(事件监测),不靠费心费力建立起标签,不靠基于业务实际情况而建立的细致规则,是不可能获得一个真正的用户画像的。这样的画像数据其实无法真正对运营起到效果。这不是在一个工具上用一个漂亮的图生成一个美妙的数据可视化这样性感的工作——虽然很多人认为这就是数据工作的样子。数据工作常常毫不起眼,仅仅只是收集数据获取,就需要大量的时间、专业的精神、以及很多的技巧与智慧。要注意数据和数据是不同的很多时候,那些看似被你拥有的数据,有可能害惨了你。数据有真有假,而即使是真实的数据,也是千差万别,即使是你自己所拥有的数据,也是如此。数据之间最主要的差异,是质量的好坏、口径的不同,以及背后业务含义的区别。要让这些形态性状各异的数据能够真正为你所用,必须经过数据清洗。数据清洗,一个几乎没有什么服务商会主动提及并且愿意收费提供的服务,因为这是一个极为耗费时间、人力,而又充满“风险”的工作。关键是,客户数据背后的口径,以及这些数据背后的业务含义,也不是一个外部的服务商能够短时间内搞清楚的。曾经经历过的数据清洗项目仍然记忆犹新,仅仅只是清理同一个事物的不同名的重复数据,就得忙上好几天,不是数据本身清洗有多难,而是沟通不同名字背后究竟是怎么一回事就得要了老命;再加上看似同样的指标,可能含义不同,于是又得几乎排查一遍。还有,各种数据记录的随意性和不一致性,各种系统之间同名字段定义的不一致性,你看到之后真的要跺脚骂娘!其工作的复杂、繁琐、无奈,以及“脱发指数”都在各类工作中名列前茅。于是,我们看到太多太多的数据系统架构和数据整合,是在没有做有效数据清洗的情况下完成的!这时的数据本身,泥沙俱下,藏污纳垢,可靠性令人发指!这样的系统,不过是表面上把外包装搭好了,而根本不管这包装里面装的是何种洪水猛兽!这样的数据和系统,质量不佳用不上反而是最好的结果,要是真的拿着这些数据做决策,那比没有数据凭着经验还要糟糕。在理解数据孤岛这个事情的时候,我意识到,数据孤岛的存在有它的理由。这并不意味着我认为数据孤岛是好的,但若不经过真正可靠的数据清洗,那些看似在各个系统中你拥有的数据,真的把它们弄出来揉在一起后,你就会发现,要么根本用不了,要么根本用不上,甚至还不如过去的数据孤岛好使!这就是令人心痛的现实。这也是为什么,我总是建议,不要一口吃个大胖子,能够在局部数据和应用上做出改善,已经非常非常不容易了。因为,少有中国的企业,存在“数据治理(data governance)”一说,只有“痛过之后”,才会幡然顿悟,代价则是又增加了一个耗资巨大的烂尾工程。本文没有专门介绍数据治理,但我提醒所有的读者,数据治理非常重要,在互联网上有很多数据治理的资料值得阅读。概念并不是最重要的,更要小心伪概念“伪数据主义者”的另一个特征,是迷恋性感的概念,而忽视朴实无华的规律与实实在在的分析。他们制作了大量充斥着“性感”概念的鸡汤,摆在你面前,然后说,干了这碗汤,一切就都成了!要真是这么简单就好了!不像别的科技,数据本身和数据应用的方法,实在没有太多华丽的转身,也不该有太多花俏概念的装点。可因为数据本身透露着神秘,便更容易被添油加醋地包装。一个很有趣的例子——把核心指标用一个更诗意魔幻的名词“北极星指标”表达,确实增添了很多遐想,似乎就跟着光芒万丈了起来,但仔细一想,它究竟和关键指标或者核心指标有多么巨大的差别呢?例如,我们可以着迷于“北极星指标”这样的性感称谓,但它究竟应该是什么指标,以及如何发现它,并没有看到任何可以作为规律的方法论——包装一个概念不难,撕开包装切实落地的方法论则很难。显然,一个关键性的指标只能在业务中产生,甚至它并非一个数字世界中的指标。业务是变化的,流动的,因此关键性的指标也在随着业务的变化而改变,这是我们要适应的必然的商业演进逻辑。至少现在,工具都没有办法能够直接揭示更深层次的商业逻辑,尤其是运营角度的逻辑。不,我不是在否定“北极星指标”本身,而是要小心别以为它就是我们运营工作所追求的数据核心。增长是否要追求如同“黑客”般犀利的效果,我很难评判,其中的思维方式强调不断尝试、流量和产品共同优化,以及更加合理的用户运营方式等,这些是非常可取的。但增长不太可能通过简单的一些灵光乍现的调整即可获得,也不可能像真正的电脑黑客那样纯靠技术完成。我是“老旧保守派”,始终坚持认为,唯有商业模型和产品本身靠谱,以及在实际的运营中两手沾满泥,才能创造实实在在的可维持的增长。而且,随着流量红利的枯竭,产品本身比过去任何时候都更加重要了——或者换句话说,今天留给迷恋性感概念和称谓的空间越来越小,“能打”才是唯一的评判指标。我想,当“数据主义者”们创造了这么多抬高期望的高大上的东西之后,这些期望万一被拍在地下摔得粉碎,会不会让数据消费者们连同对数据的希望也一起粉碎了,那就真的是得不偿失。然后,在数据源层面,数据也被用成了更加高大上的皇帝的新衣。比如,言之凿凿地跟你说:“我们能拿到(或是拥有)BAT[ 从业者们都很熟悉BAT这种说法,代表着百度、阿里和腾讯,但今天,BAT的队伍可能要扩展,也应该加上字节跳动、京东、美团等。不过,具体包含谁不重要,关键是它指代了今天的极为强势的寡头]的数据。”嗯,能拿到BAT数据不假,但几乎每一个做与BAT相关的投放的广告主都能拿到很多的BAT数据吧,比如自己的广告展现点击呀,阿里的数据银行里面的数据或者各DMP给你生成的营销效果报告之类。此数据非彼数据,数据的概念和种类太多了,到底拿到的是BAT的具体什么数据?难不成真是淘宝用户device ID[ 这里谈到的device ID是指用户终端设备比如手机的硬件ID,用来标识每一个用户个体。在2.4.1中,会具体介绍它。]和他们的行为和交易数据?什么,这些数据都能拿到?不过数据是以“包状物”呈现的?多大的包?几亿呀,这么多?!而且可以用于广告投放?还可以拿着阿里的数据到腾讯投放?这些话语都属于模棱两可的话语,你既可以说它有道理,也可以说它不可能,但当你真的购买这些数据的时候,可能会发现根本就用不上它们。尤其是在今天媒体普遍围墙花园化和个人信息保护日趋严格的情况下。今天的数据生态跟过去完全不同了,并且用户的数据太有保质期,拥有外部数据和拥有鲜活的数据是两个概念。今天的主旋律是企业一方面向内看,保持自有用户/客户的实时数据的捕获,另一方面则通过应用外部数据或与外部数据连接扩展自己的数据能力。成本问题无论是对数据,还是对运营,该花的钱要花,节约没有错,但是不能过度。你不可能用一套SaaS的钱来搞一个私有部署,也不可能用一个标准套件的钱来做定制化开发。所有承诺给你愿意这么做的都是别有用心,毕竟,所有你希望占到的便宜,都在暗中标好了价格,甚至不是价格,而是代价,而且来的总是特别迅速。并且,也不要妄想让供应商帮你做完所有工作,就算你出了高价钱,你也必须了解,有大量的工作就是需要自己做的。毕竟,数据是你自己的数据,数据背后的业务是你自己的业务,如同我前面所讲的,那些运营上的细节、需求的分析、数据的清洗,没有哪一条是供应商能帮你完成的。不是他们不帮你,是压根在你给定的成本下,他们无论无何都帮不起。更何况,最了解情况的永远都是你自己。所有想要在前期偷懒省事的,都会在后面给你不断暴雷。如果成本有限,就从小处开始吧,获得一点进步,实现一些落地,一个混凝土的小楼房绝对比用纸壳建的宫殿靠谱。坚持正确的数据理念尽管大部分企业都认可数据是最有价值的资产之一,但也请你注意,数据本身并无意义,除非我们能够善用它。何为善用?机械地套用数据和模型,不是善用;鼓吹概念,却故意忽略或矮化那些“不够性感”却真实可靠的工具和方法,不是善用;强调技术和工具才能解决问题,尤其是强调机器智能的强大却忽视人在其中作用的,不是善用;唯数据是瞻,不与业务和场景相结合的解读数据,不是善用。请大家注意到“数据自身也是有原罪的”,因为数据既不是答案,也不是结果,并且很多时候,也不代表真相。它可以被操纵、被捏造、被误读、被曲解、被粉饰,我们怀着美好的意愿跟它打交道,却很有可能得到与我们意愿相反的结果。所以,我们不可以无条件信任它,如同核能的开发,你首先要相信它是“魔鬼”,才能让它转化为“天使”。数据是我们的工具(而且完全不是唯一的工具)、我们的手段、我们要经历的过程,但绝对不是结果,也绝对不是答案本身。数据不会让事情变得更简单,除非我们能真正懂得如何与之相处,否则甚至比没有数据造成的情况更糟。我们也要警惕数据成为不断堆积的垃圾、纸上谈兵的口号、隐瞒现实的遮羞布。要警惕一个倾向,即在缺乏真正业务理解和业务场景情形下让数据穿凿附会,还为此建立一系列的指标、工具和模型。举一个例子,任何一个企业在某一个时段所应该采用何种KPI指导自己的业务方向,绝无一个定式,它绝对不是由某一个工具利用某种具备“慧眼”的算法所能做出的,也不是仅仅由数据本身的增长或减少就能判定的,而一定是从业务需求出发,通过对业务和效能之间的对应关系做出不断的拆解才能达成。这个过程,数据不是主角,数据本身也不产生洞察,最终形成的KPI,不是数据推演的结果,而是业务推演的结果。数据总是倾向于让我们变得更加机械,并压缩我们的眼界,也正因此,我们必须非常小心,而且必须要付出更多的努力,在真正的商业环境和场景中去挖掘数据真正的价值,以契合不断变化的业务。企业数据化成熟度模型任何企业的数据化营销与运营的背后,都是数据能力在支撑,而数据运营能力,实际上又是由三个层次共同作用、共同驱动的结果。这三个层分别是:组织层(企业组织与文化角度上的数据能力的构建)、治理层(企业从资源管理和资产管理的角度的数据能力的构建)、应用层(企业从数据实际落地应用的角度对于数据能力的构建)。这三个层次,组织层最为基础,治理层最为关键,应用层最具价值。企业数据化能力三层结构下表是每一个维度及它对应的7个层级的数据能力特征的表现。现在你阅读这个表可能不能完全看懂,里面有不少的专有名词,并且其中的表述可能对你也是陌生的。但没关系,读完这本书之后,你在回过头来看这张表,一定能够理解其中的含义。企业数据化营销与运营成熟度等级企业的数据化运营能力的构建是从内部数据的简单整合开始起步的,例如,广告投放的效果衡量需求,必然要求广告端和效果端的数据打通。在初步整合之后,随之而来的是企业内部数据能力很快遭遇瓶颈。例如,为运营提供关键支持的更深层次的数据需求变得迫切,这些数据需求包括消费者行为的分析、用户画像、转化优化等方面的数据。大多数企业难以单靠自己的力量获取这些数据,而必须嵌入外部的技术解决方案和工具。因此,嵌入外部能力作为层级4,标志着企业开始进入更高层级的数据成熟状态。在嵌入外部能力获得更多可供驱使的数据的同时,新的需求也将产生:企业需要以消费者(个体或者群体)为维度打通企业的内外数据资源,从而为更细致深入的运营提供支持。企业因此需要进入更高的数据成熟度阶段,即全面的内部整合,以及与外部的数据能力实现协同(层级5、6)。最终,当企业拥有足够多高质量的结构化数据,以及具备了非结构化数据的处理和应用能力,企业会到达目前最具象征性的智能化阶段(层级7)。当然,企业的互联网营销数据成熟度模型并不意味着所有企业都要沿着这个“科技树”向上攀登。取决于不同的业态和企业的目标,任何企业都可能停留在自己足以保证业务高效开展的层级上。例如,仅依赖于单一数字渠道或数字触点的市场部门是存在的,他们可能处于这个模型中的层级3或略高于层级3的状态便已经足够“舒适”。同样,受众范围极为广泛的快消品(例如普通饮料)行业,他们中的一些企业如果没有“进取心”而愿意保持在层级2也肯定不会在短期内“拖累”生意。事实上,尽管我们认为DMP和CDP是攀登到这个“科技树”更高位置的标志,但绝对不是所有的企业都有必要采用它。关于DMP和CDP,后面的章节就要为朋友们介绍。纷析智库所做的调研显示了一个有趣的事实:今天中国的大多数品牌企业(或被称为品牌广告主)正处于层级3和层级4向层级5过渡的阶段。考虑到当前的互联网营销大环境的变化,这样的变迁耐人寻味,它体现了企业们在数字世界中强烈的危机感和求生欲。帮助这些企业更好地像更高的成熟度前进,也是这本书期望实现的一个目标。本文节选自宋星老师的新书《数据赋能》,有部分删改。BAT名企都在学的新常态下的企业数字化营销实战指南,讲透数字化营销与运营的本质,真正讲述用数据赋能企业增长。更多干货,还在《数据赋能》全书中展现。
来源:同花顺金融研究中心 同花顺(300033)金融研究中心4月20日讯,有投资者向创意信息(300366)提问, 公司计划今年上半年进入国产数据库的第一梯队,国产数据库第一梯队的营收标准是多少起步?公司有多大信心完成这一目标?公司去年数据库收入有多少?公司5g相关产品今年的计划达成什么样的目标? 公司回答表示,您好,感谢您的关注。公司2020年年度报告报中,实现数据库收入2,211.78万元,同比增长744.64%。2021年5G的目标是:5G技术和产品本着成熟一代,研发一代,预研一代的总体思路,始终保持技术和产品的领先性。通过掌握核心技术并以开源开放的方式,推出领先的5G核心技术解决方案,赋能5G设备友商,建立5G技术生态,为5G技术市场的持续发展奠定基石;同时,通过积累和掌握5G关键核心技术,进而打造差异化、定制化的核心能力,加强产品的竞争力,奠定5G行业应用市场的领先地位,进而实现打造公司在5G技术市场龙头地位的目标。
数据分析的重要性不言而喻,然而近些年,有一些人群对数据分析的作用进行大肆鼓吹,似乎学会了数据分析就必然能迎来职业的春天,升职加薪不在话下。但“上帝欲使其灭亡,必先使其疯狂”,当一件事物被过度吹捧的时候,往往值得我们警惕。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。让数据分析成为企业决策的坚实后盾,是企业适应大数据时代的基础,进而实现智慧化运转。企业的数据主要产生在企业内部以及企业的外部环境,从现实的角度来说,对企业最有价值的数据首先是来源于企业内部的数据,其次才是企业外部环境的数据。单就企业内部的数据来说,数据分散在各应用系统和部门之中,散落且格式不统一;更何况外部数据。提到数据分析,认为是财务部或者IT部门的事情。其实,数据分析的价值一方面是数据本身,另一方面是对数据进行分析的人数多少。如果企业内部人人都是分析师,只是各自权限不同而已。当前企业所需单个报表,一般是要求相关部门提供;而各种报表加工成一个报告,一般都会递交到IT部门。这种流程一个是及时性,另一个因为IT部门对业务和管理的理解能力所限,效果不一定好。显然,单纯陈述现状,单纯的摆一堆数据,对解决问题是没有帮助的。甚至在大的方向没确定的时候,摆的细节数据越多,越会把人引入歧途。所以数据分析想要真的帮企业摆脱发展的困局,就得先有能力解读出:到底企业现在的发展疼点在哪里?从真实的场景出发,思考对策。数据分析,需要更多地要去深入到业务的需求中去,帮助产品、运营或者老板思考,通过更多的思考来帮助需求方设计更好的分析思路。企业对数据能力的需求增加,但不一定需要独立的的数据分析师:越来越多的的公司和部门需要数据分析人才,尤其是互联网公司的运营、市场甚至创意设计部门都开始强调数据驱动。但数据分析更多的是作为一种能力存在,企业倾向于拥有更多具备一定数据能力的运营或市场人员,而非雇佣大量的专门分析师。所以需要对现在混乱的数据分析行业来破局,我们可以选择“向外走”,不把自己局限于一个分析师,主动参与业务的策略制定和运营过程,不局限于回答业务的问题,而是提出解决方案,产生真正的业务影响力;也可以选择成为专业的数据分析专家,提升技术能力,靠更深入的数理分析能力立足于行业。因为我们进行数据分析是基于手上的数据,分析某种业务现象所导致的原因、探寻与某种业务现象相关的因素,最终的目的是为了答疑解惑、解决问题、促成业绩提升。
1665年,英国科学家罗伯特·胡克用自制的光学显微镜首次观察到了形似小隔间的细胞。多年以来,人体由细胞组成的事实已经是一个基本的,易于理解的概念。然而令人惊讶的是,科学家们仍在尝试确定组成我们的器官并有助于我们健康的各种细胞。一种称为单细胞测序的相对较新的技术使研究人员能够根据特征(例如它们表达的基因)来识别和分类细胞类型。但是,这类研究会产生大量数据,其中包含数十万到数百万个细胞的数据集。来自密歇根大学计算医学和生物信息学系的Joshua Welch博士开发了一种新算法。其团队使用在线学习,大大加快了这一过程,并为全世界的研究人员提供了一种使用常规笔记本电脑上发现的内存量来分析大型数据集的方法。该研究发表在《自然生物技术》杂志上。Welch说:“我们的技术可以使任何拥有计算机的人都可以对整个生物体进行分析。” “这是这个领域未来的方向。”Welch解释说,通常,对于像这样的项目,必须按到达的顺序使用先前的数据集对提交的每个单单元格数据集进行重新分析。他们的新方法允许将新数据集添加到现有数据集中,而无需重新处理旧数据集。它还使研究人员能够将数据集分解为所谓的迷你批处理,以减少处理数据集所需的内存量。这一技术对于越来越多地生成数百万个细胞的集合至关重要。光是今年就已经有五到六篇论文用到了两百万个或以上的细胞数据,而仅用于存储原始数据所需的内存量就已经大大超过了任何一台计算机的容量。他将在线技术比作Facebook和Twitter之类的社交媒体平台进行的连续数据处理,后者必须处理用户连续生成的数据,并持续更新每个人的信息流。“与大家在社交平台上发布推文类似的是,世界各地的实验室同样进行着实验,并发布数据。”这一发现可以显著提升其他细胞数据分析量较大的项目的效率,例如人体细胞图谱项目等。Welch说:“了解人体细胞的正常功能是了解它们在疾病中如何出错的第一步。”参考资料:https://www.eurekalert.org/pub_releases/2021-04/mm-u-nau041921.php立足学术前沿,远瞻产业发展。更多数据请参考前瞻产业研究院《2021-2026年中国干细胞治疗技术行业市场前瞻与投资潜力分析报告》,同时前瞻产业研究院提供产业大数据、产业规划、产业申报、产业园区规划、产业招商引资、IPO募投可研等解决方案。
在《爱就投大数据研究:江苏产业发展整体现状分析》一篇报道中,爱就投大数据研究中心重点剖析了江苏省的整体产业格局,以及在长三角所处的重要地位。本文将从“散装”江苏各个城市之间的企业经营发展情况,来分析江苏的产业布局,从细节出探索江苏的发展现状。一、GDP与在营企业数之间的关系江苏自古以来就是商业繁盛,经济富庶之地,“苏”的繁体字“蘇”很形象的诠释了江苏的含义,“蘇”由草、水、鱼、禾四字组成,象征着江苏自古就是鱼米之乡。江苏共有13个大型地级市,其中包括江苏省会苏A南京、太湖明珠苏B无锡、“九朝帝王徐州籍”的苏C徐州、历史文化名城苏D常州、被称为“人间天堂”的苏E苏州、“中国近代第一城”苏F南通、花果山所在地苏G连云港、“中国运河之都”苏H淮安、丹顶鹤麋鹿之乡苏J盐城、“天下之盛扬为首"的苏K扬州、鱼米之乡苏L镇江、苏中门户泰州、“第一江山春好处”的苏N宿迁,号称“十三太保”。江苏省的每一座城市,都充满着历史人文底蕴,这十三座城市可以称得上风景秀美,各具特色,人文荟萃,商业鼎盛。在《爱就投大数据研究:江苏产业发展的整体现状分析》一文中,我们详细分析了江苏各市的GDP完成情况,将这13个城市的GDP与在营企业数量作比对,不难发现,企业数量与GDP的发展情况有着非常密切的关系。江苏省GDP排名前三的城市,苏州、南京、无锡的在营企业数量也位居前三,其中苏州有超过92万家在营企业,南京有89万家,无锡有48万家,而排名比较靠后的城市,淮安、连云港、宿迁的在营企业数量分别是19.2万、19.1万、18万,在营企业数量上的差距,直接决定着一个地方的经济发展情况和产业发展情况。二、经济“巨无霸”,苏南三大龙头城市产业分布江苏省是中国的第二强省,仅次于华南地区的广东省,但是人均来看的话却是中国第一省。从习惯上来说,江苏省被分为三大区域,苏南(蓝色),苏中(红色)和苏北(绿色)。苏南地区包括苏州、无锡、常州、镇江、南京,苏南地区以苏州、南京、无锡为龙头,经济呈现快速腾飞状态。“上有天堂,下有苏杭”说的就是苏州,苏州自古被称为人间天堂,一直有这里不仅经济发达,环境更是优美。爱就投大数据研究中心的大数据显示,苏州的在营企业数量超过了92万家,其中:作为江苏省会,“六朝古都”南京底蕴雄厚,在营企业数量超过了89.5万家,仅次于苏州,其中:无锡,被称为“太湖明珠”,有布码头、钱码头、窑码头、丝都、米市之称。无锡是中国民族工业和乡镇工业的摇篮,是苏南模式的发祥地。无锡的在营企业数量超过了48.9万家,其中:三、被割裂的洼地,常州与镇江的产业发展情况苏南地区,常州相比镇江,更加靠近苏州和上海,无论是在营企业数量,还是GDP发展情况,都有很大啊潜力可以挖掘,而靠近南京的镇江,似乎处于被开发的洼地地区,其发展潜力仍待被挖掘。常州,是一座有3200多年历史的历史文化名城,曾有过延陵、毗陵、晋陵、南兰陵、武进等名称。通过爱就投大数据分析显示,常州的在营企业数量超过了31.7万家,其中:镇江是著名的江南鱼米之乡,农业相对比较发达一些,在营企业超过19万家,其中:四、细化研究江苏苏南地区各市的产业分布江苏苏南地区的经济发展,与本土的产业经营情况密切相关,其中,苏州的几大优势行业分别是贸易、商务、零售业、研发、软件信息、制造业等,这与苏州的制造业地位密切相关。苏州作为实体加工、制造业生产基地,其制造生产的产品需要销售,从而催生了批发零售业的壮大。比如盛虹控股、澳洋集团、波司登、中利控股、东山精密等制造业大户都落户在这里。与苏州相比,南京的软件开发、科研产业更加发达,催生了南京的电子商务服务业的繁荣。苏宁集团、苏交科、润和软件、中设集团、焦点科技、三六五网、天泽信息等互联网科技企业就分布在这里。无锡的制造业相对其他行业而言,发展比较突出,这也同样催生了批发零售行业企业的繁荣,海澜集团、江阴澄星实业、新长江实业、扬子江船业等实体制造业企业就落户在这里。除此之外,无锡的研究和试验发展非常繁荣,在营企业数量就超过了6.6万家,稳居江苏第一。华庄实用技术研究所、金城电子材料研究所、国家专用集成电路系统工程技术研究中心中试基地等研究所都在无锡设立。因为靠近苏州和无锡,处于上海辐射圈的范围之内,常州的制造业发展也非常乐观,由此催生的批发零售,为推动当地经济稳固发展起到了非常好的作用,软件和科技行业,虽然发展情况尚可,但仍是常州比较薄弱的环节。镇江处于南京都市圈的辐射范围,其相对传统的农业、建筑业相对比较突出,制造业与信息软件业均处于有所发展,但后劲不足的阶段,批发零售仍是其重要支柱产业。整体而言,苏南经济发展以上海为中心,呈现出逐步递减的效果,上海的辐射效应逐步减弱,处于南京都市圈的镇江,仍然处于传统行业与制造业、信息科技产业交替阶段,发展潜力尚未得到挖掘。南京的信息技术与苏州的制造业形成了苏南地区两大产业增长点,但整体而言,尽管是经济如此发达的苏南地区,仍然存在着发展不平衡,先进制造业、先进技术匮乏的问题。苏南地区,如何能够拧成一股绳,串联起各个城市之间的产业优势,进行优势互补,再上一层楼,达到形散而神不散,竞争与合作并行的良性发展,仍然需要进一步探讨。欢迎关注我们,“落户长三角,就找爱就投”,下一期,爱就投将着重分析苏中地区的产业分析情况。
“数据没有分析是一种资源的浪费,分析没有数据是一场无用功。”这是Gartner研究总监孙鑫(Julian Sun)分享的观点——没有分析,数据就仅是磁盘中的二进制。一言以蔽之,价值是在使用中淬炼出来的。图丨Gartner研究总监孙鑫(Julian Sun)近几年,“数据分析”已经成为了国民经济和社会发展的重要风向标:在“十四五”规划中,“大数据”这个词出现了14次,而“数据”这个词出现了60余次。不止如此,Gartner在CEO层中做的问卷显示,82%的CEO认为,毋庸置疑,应该追加自己在数字化举措上的投资,因为在疫情危机下,越来越多的业务不得不被搬到线上。与此同时,数据分析应用的增长速度也一路高歌猛进:2018年,仅有57%的企业认为数据分析嵌入了业务平台,而2020年,这个数字已经增长到了70%。可以说,数据分析越来越多地嵌入到业务系统当中,并让更多业务用户和数字化平台用户感受到了益处。那么,数据分析具体如何影响企业业务?在当下,如何利用新一代数据分析技术,让企业可以加快变革速度,并且在更广阔的地方部署数据分析系统?全球最具权威的IT研究与顾问咨询公司Gartner从甲方市场和乙方市场两个角度,对市场上与数据分析相关的科技进行评估——从甲方市场出发,得到CIO、CDO甚至是CEO的反馈,再从乙方市场的角度,也就是得到技术供应商对未来市场的见解,从而总结了十大数据和分析趋势。Gartner杰出研究副总裁Rita Sallam表示:“这些数据和分析趋势可以帮助企业机构应对未来三年的颠覆性变革,从巨大的不确定性中抓住其中的机遇。数据分析的领导者必须主动研究如何顺势而为,根据这些趋势加强应对能力,并对关键任务进行投资。”图丨Gartner杰出研究副总裁Rita SallamGartner总结的十大趋势中,最有代表性、同时也最为贴近我国国情、最能解决我国企业数字化转型中燃眉之急的,无外乎以下三大趋势:组装式的数据分析成为大势所趋;数据隐私保护成为时代命题,而随着大数据时代向小数据时代泅渡,AI技术将会变得更智能、更负责、更可拓展。组装式的数据分析成为大势所趋:复用能力是关键说到组装式的数据分析,就不得不提到近几年我国互联网圈炙手可热的一个概念:中台。中台最早出自战争术语,近几年才被作为管理战略被引入国内:2015年,阿里巴巴拜访了号称全世界最成功的游戏公司Supercell。Supercell以最多不超过7个员工的小团队模式战斗在一线,而小团队背后,有一个强大的技术平台,来支持众多小团队进行游戏研发。如此一来,基础技术由中台赋能,小团队不用从最基础却重要的技术问题做起,而是直接研发新产品中差异化的部分,节省了大量成本和时间。这种模式让Supercell公司成为了年税前利润15亿美元的游戏公司。在此次拜访的半年后,阿里巴巴启动了中台战略。归根结底,中台的底层逻辑就是,基于公司的资源和能力,打造一个强有力的中台,当全新的场景萌芽时,充足的资源与能力就能快速注入前台,快速打造出满足用户需求的产品。为什么能快速注入?因为一个公司的旧产品和新产品之间,有很多东西都是可以重复使用的。拿阿里巴巴来说,淘宝有完善的订单创建流程,而一切订单创建流程,都涉及会员信息验证、库存修改支付记录生成。如果在推出聚划算的时候,直接把这种共通部分复制过来用,则大大减少了新产品的研发时间。不难发现,中台实现数据分析的方式就是组装式的:中台有一个很重要的理念,就是可以在数字化业务中体现出可复用的能力。可复用的能力和可组装性是息息相关的,因为数字只有在被复用的前提下,才可以像搭积木一样把很多能力组合起来,最终交付给业务部门,让它能够起到快速响应突发事件的作用。“事实上,一旦我们把数据分析和应用开发结合在一起,就可以把重复的工作去掉。一个好的中台不止是一个简单的技术平台,它更像是一个组装式的平台,能让用户在组装过程当中体验到哪些能力是可以通过容器和微服务架构完成优化的。”Gartner研究总监孙鑫如是说。因此,组装式数据和分析不仅是一项数据分析业务,更是一种把企业的洞察力与行动力关联起来的决策工具:可以说,近几年,组装式数据分析成为了大势所趋。Gartner预测,到2023年,60%的企业将会利用三个或者是更多的分析解决方案,来组成一些组件,以建立一种注入了分析的、决策导向型应用。具体来说,未来企业在做应急响应或数据分析的交付时,不再需要从零开始搭建,只需要把各种各样的能力组合起来。比如,连接并收集客户作为一个能力、综合外部客户的数据作为一个能力、管理客户生命周期又是一个能力......最终以组装的形式合并在一起。不止如此,确定客户的特点,从客户画像监控客户流失指标并发出警报,预测客户流失率等等,都可以作为一些能力即取即用。也因此,Gartner做的另一个预测是,到2025年,70%的新应用将是由低代码、无代码技术完成开发的。更有意思的一点是,新应用将会由真正使用它的人去做组装——也就是说,在未来,用户自己将会开发出各种各样的应用。这也意味着数据时代的全面来临。与此同时,一个绕不开的问题浮出水面:如何解决企业数据需求和用户个人隐私之间的矛盾?换句话说,在对数据安全性的监管越来越强的时代,该如何平衡好数据提取与隐私保护的关系,进而发挥数据分析的最大作用?数据隐私保护成为时代命题:AI更智能、更负责、更可拓展事实上,数据隐私保护的加强亟需提上日程。拿最近的新闻来说,据外媒报道,美国知名社交媒体平台脸书(Facebook)有5.33亿用户数据遭泄露,其中包含一些知名人士的信息。据悉,一个低级别的黑客论坛3日曝光了5.33亿脸书用户的个人数据,这些用户涉及106个国家和地区,泄露的信息包括用户在脸书的账户名、位置、生日以及电子邮件地址等。脸书公司在一份声明中称,上述数据来自2019年发生的信息泄露事件,当年8月已经进行了修复。2018年3月,脸书曾被曝出与咨询公司剑桥分析公司违规分享8700万用户数据,被判赔付50亿美元罚金。也因此,互联网行业专家表示,现如今的互联网成就很大,但是带来的隐私问题相当严重。与此同时,随着隐私保护不断加强,广告商收集数据也越来越困难了。Gartner预测,到2023年,在拥有20名以上数据科学家的组织当中,将有60%的组织被要求制定关于数据和AI使用中,有关伦理道德的规定。这意味着数据分析将“带着镣铐跳舞”。然而,数据是分析的基础,当数据的使用性有限时,AI现有的优势就很难被利用。如何解决这一问题?事实上,Gartner认为,无论将来是否加强隐私保护,我们都需要更智能、更负责任、更可拓展的AI,以支持一些更复杂和数据更为稀缺的用例,因为现有数据密集型的分析方法是非常消耗算力的,在面对变化时会显得非常脆弱。更广泛的用例要求我们用创造性的AI创新来拓展AI工具箱。因此,Gartner建议企业,通过使用新型技术,如合成数据、主动学习、自适应学习等技术,去拓展AI的用例,使AI可以变得更智能、更强大,从而在历史数据稀缺等情况下仍然可以顺利运行。拿合成数据方法举例,合成数据就是通过AI工具生成一些新数据,来满足特定时期的需求和条件。目前,国外已经有了这样的厂商,当企业数据不足的时候,可以利用合成数据工具去生成一些应急数据。Gartner认为,当隐私的保护需求限制了数据的可用性时,我们也可以利用合成数据来解决训练模型中数据不足的问题。再比如迁移学习方法,可以使AI的解决方案从三段任务中学习到足够多的数据,并利用这种学习到的数据来帮助企业克服一些棘手问题:比如说,一家医院想去开发一个治疗疾病的模型,但是数据有限,于是就在自己的本地数据上训练模型,再把这个模型转移给下一家医院,下一家医院继续在自己的本地数据上训练模型......依此类推,不断结合模型进行一些改进。由于不需要集中共享本地数据,这种方法增加了数据的隐私性,更方便保密。也因此,数据平台更负责、更智能、更可拓展是大势所趋:不仅可以增强数据科学家的生产力,也可以利用自动化AI,让一些非专家的使用者也可以拥有专业分析能力。这也引出了下一个大趋势:随着数据隐私保护的不断加强、AI技术的不断革新,数据时代的脉搏正在由大数据向小数据过渡。隐私时代的让渡:由大数据到小数据或宽数据隐私保护成为时代命题的背景下,Gartner提出了一个“小数据”(或“宽数据”)的概念:随着企业逐渐认识到大数据的局限性,被称为小数据和宽数据的方法正在慢慢涌现。什么是小数据?具体说来,小数据抛开了对于大型单体数据的依赖,仍能提供有见解的分析技术:应用相对较少的数据,实现对于小型、大型、结构化、非结构化等数据源的分析和协同。方法论上,不同于大数据用一刀切的方式、使用数据要求较高的深度学习技术,小数据会有针对性地使用数据要求比较低的模型——比如一些时间序列分析的技术。Gartner预测,到2025年,70%的企业将不得不把关注点从原先的大数据转向现在的小数据。事实上,AI对数据的需求将进一步减少:到2025年,超过85%的技术供应商(乙方市场)将在AI解决方案当中加入让数据变得更丰富的方法和模型训练技术,以提高模型的弹性和敏捷性,虽然在2020年,这么做的供应商还不到5%。为什么我们需要小数据?第一,大数据时代,虽然实现了存储、管理更多数据的目的,但并没有真正让某个组织从中获得更多的价值。举个例子,企业可能花了很多钱组建了一个基于Hadoop的大数据平台,但很多数据没有被企业真正放到生产环境当中。相对而言,小而广的数据方法可以减少组织对大数据的依赖,让其摆脱重负后完成更强大的分析,从而实现更丰富、更完整的态势感知。第二,疫情让之前的很多数据都过时了,企业需要通过更少的数据去建立AI和分析的技术,并收集足够多的历史数据和标签数据用于分析和AI。第三,未来数据的来源、质量、数据偏见和隐私保护等问题都会被提上议程,并变成非常大的挑战。如果还是使用过往的大型数据解决方案,企业的成本就会变得非常高,因此,企业必须学会用小数据进行深度分析。当然,小数据目前还没有广为人知。Gartner曾提出“技术成熟度曲线”:一项新技术诞生伊始,总会先处于不成熟的技术萌芽期,再进入历资本疯狂涌入的“泡沫巅峰期”,随后,这项技术暴露出各种问题,进入“泡沫破裂低谷期”。低谷期后,技术进入触底反弹的“稳步爬升期”,最后,技术才进入“规模应用期”:在此阶段,新技术的价值与增长潜力被市场实际接受,落地模式也逐渐成熟。按照Gartner的技术成熟度曲线,小数据目前还在一个“技术萌芽期”的阶段,可能还需要5-10年才可以真正达到大众耳熟能详的程度。然而,虽然小数据目前的市场渗透率不到1%,但它对AI以及更广义的数据分析的影响是显而易见、且历久弥深的。“如果你拷问数据到一定程度,它会坦白一切。”诺贝尔经济学奖得主Ronald H. Coase曾下次论断。虽然数据分析不断进化、更迭并进行自我完善,可以预见的是,数据终将重塑一切。文:威化化 /数据猿原文标题:Gartner 2021预测:组装式数据分析将是大势所趋http://www.datayuan.cn/article/17833.htm
近日,广东欧比特人工智能研究院与澳门科技大学、广东城智科技有限公司宣布,联合成立空间大数据人工智能技术研究院。在联合发起仪式上,澳科大月球与行星科学国家重点实验室主任张可可、广东欧比特人工智能研究院院长颜军、广东城智科技有限公司总经理周海平代表签署三方战略合作协议。澳科大副校长唐嘉乐在仪式上表示,空间大数据人工智能技术研究院的成立,有利于联合引入高层次人才,培养高水准的工程技术人员,满足智慧城市建设及“数字政府”业务需求,解决空间大数据人工智能处理及分析领域技术问题,创造更大的科研和商业价值,并祝愿三方合作早日开花结果。空间大数据人工智能技术研究院主要在多源卫星数据人工智能处理及分析、月球与行星空间科学以及智慧城市空间大数据智能处理关键技术等领域集合三方优势,合作开展技术攻关和科学研究工作。研究院也将为澳科大研究生提供更多研究课题和实习机会。出席是本次仪式的嘉宾还有广东欧比特人工智能研究院常务副院长范海生、顾问岳乃正、战略发展部副总徐红,澳科大资讯科技学院院长张渡、人力资源处处长郭美芝、资讯科技学院教授田小林,澳门航天科技有限公司副总王祝金以及广东城智科技有限公司部门经理张国平。