有一个不怎么拿得出手但对实操很有帮助的逻辑,中国大数据行业的发展业态会跟随美国的步伐
有一个不怎么拿得出手但对实操很有帮助的逻辑,中国大数据行业的发展业态会跟随美国的步伐
我主要是想通过中美大数据行业头部公司差距的调查,来看下我大祖国的发展势头如何,其中美国大数据头部公司的筛选主要通过如下表格以及 Gartner 魔力象限
1:整体的观察的结果是,国内大数据行业距离美国有较大差距。按估值来算差距在 10 倍左右。
2:对标美国对应环节的大数据公司基本进入了 B+轮次的融资,新入场的创业者已经没太大机会
这个处理环节成型的公司主要是做数据采集和标注,这里的预处理主要是针对非结构化数据而言,具体应用在 AI 领域比较多,例如图像识别,视频识别,语音语意类项目
这类公司提供的其实是基础性服务,对大数据产业整体体量差距有很大的代表性意义。
全闪存无疑是企业存储领域的发展潮流,也是整个企业 IT 圈公认的技术发展方向。Gartner 预测,2020 年,有一半的传统存储将被 SSA (Solid-State Arrays) 固态阵列代替。
巨大的市场商机自然带动了全闪存市场的快速发展,我们看到,EMC、NetApp、IBM、Dell 等这样的传统存储巨头全都搞起了全闪存阵列。另外,以 Pure Storage、voilin 为代表的初创企业也纷纷进入市场,带来了全新架构的全闪存阵列,不断推进着技术的发展革新。但无论是传统大厂还是初创企业,或是 IDC、Gartner 等分析机构,它们对于存储技术的趋势都是一致的:未来的数据中心是闪存的。下面我找了一张 Gartner 的全闪存阵列的魔力象限图,我大华为上榜,其他的好像没有看到国内的企业。
不知道为啥,基本没找到国内对于存储这个环节大力发力的公司。如有老司机路过请帮忙补充。
Hadoop 已经被国内抄的很火热,几乎已经成为了大数据的代名词,由于是开源的,国内的大公司基本都有自己的 hadoop 平台作为其体系的一部分。其中单独成立做的有星环,星环曾经还晋级 Gatner 魔力象限中,为此上了央视,为此津津乐道。
下表是 Gartner 的这批公司的魔力象限图,可以看到老牌公司像 IBM, SAP, Oracle 这样子的都在这个领域有大的动作。
国内的公司在 2018 年中 Q2 Q3 已经先后进入了 B 轮左右的融资。
这里的非结构化数据的大分类,主要是偏向人工智能方向而言的,包括语音语意,图像,自动驾驶等。DATA SCIENCE PLATEFORM 最终做的是大佬公司像是 AWS,Azure,阿里,华为那样的大公司,这里就不多说,整体上,AWS,Azure,Google 的平台的水平,要高出阿里,华为,腾讯不少
最直接的表现形式就是 BI 咯,给我具体的从业感受是,结构化数据是一个很好的业务切入口,可以用 BI 作为一个很好的抓手,纵深去给客户提供很好的服务,像 tableau 估值这么高,肯定不是做可视化可以撑起来的,其背后有一套完善的数据务器体系。
这个部分网上能找到的太过了,因为非结构化数据主要是炒的比较火的人脸识别,安防,自动驾驶,生物医疗等项目,相关的文档已经生产了很多,百度一查都是,这里就不赘述。
现在大家可能觉得用电自己家里搞个发电机、用水家里搞个抽水机+水塔,这样的方式很傻,但是在发电技术发明之初,在自来水技术没有创造之前大家都是这么干的,并且就觉得应该是这样,所有的都不靠谱,自己弄才是王道。今天的云计算就是昨天的水电煤!若干年后,要是有人上新的项目还自己买机器,自己搭各种运行环境,或许我们也会觉得很傻。
客户听了水电煤这个观点,整体感觉应该大差不差,但发现应用上云了以后根本没有什么卵用。因为算力这个东西和和水电还不大一样,水电是一个直接可以使用的产品,人人都会使用,但算力这个东西不是人人都会用的。你让企业自己去建个机器学习模型试试? 自己去做 ETL 试试?自己去搞模型产线落地试试?各大云长发现大多数客户其实自己搞不懂怎么用云。能搞的定的客户现阶段也不需要云。
所以就自然产生了 ISSA,PSSA,SAAS 理论,哦,原来除了提供底层的服务器资源,还需要在云生态里面预设生态产品生态公司,让客户可以把云用起来。于是乎我们看到各大云长都开始搞生态,囤积自己的生态合作伙伴。
B:从动态来讲,云天生就可以调取最先进的 IT 技术。IT 技术发展实在太快,全闪存,spark,hadoop,流计算,虚机,AI 芯片等各个方面的都在不断演进,作为个体很难去保证算力资源的先进性,用云是大势所趋。
公司地址:北京市朝阳区酒仙桥路4号751 D·Park正东集团院内 C8座105室 极客公园




