数字经济大咖面对面之三| 柏睿数据刘睿民:解决“卡脖子”问题关键在于以创新来超越
如果去跟随一个技术,通常掌握该技术优势的厂商拥有长期的技术积累和研发投入,是很难赶上的。技术的发展是有周期的,新的技术一定会替换旧的技术,后来者应该抓住技术更新换代的机会实现超越。甲骨文在打造了被IT技术人员认为是理想产品的第二代数据库一体机Exadata后,走到了巅峰,但很快就遇到瓶颈。
——柏睿数据董事长兼首席科学家 刘睿民
这一段时间,柏睿数据董事长兼首席科学家刘睿民的心情无疑是愉快的,因为柏睿数据这个成立于2014年的大数据实时分析处理基础软件公司,基于自有核心技术产品的不断创新应用,经过7年的飞速发展,已经进入规模性市场扩张阶段,新订单不断,运营步入了健康发展的稳定轨道。这很好地验证了他坚持流数据库这一全新的技术方向是正确的,这也为我国数据库技术在下一个技术周期赢得优势,同时也走出了我国基础软件创新超越的新路径。
技术周期就是机会
时间回到2009年,在完成对SUN等公司的一系列收购并进行整合后,作为传统关系型数据库的龙头老大,甲骨文推出了更加完美的新一代数据库一体机Oracle Exadata X2,将传统关系型数据库的性能做到了极致。本来行业地位就不可撼动的甲骨文更是如日中天。
“那产品简直就是我们搞技术的人的理想。”刘睿回忆说,当时已经在数据库领域摸爬滚打了20来年的他还在硅谷,每天都在咖啡馆与同行谈论这个“神机”,担心数据库领域其他厂商已经没有机会了。
在不断的交谈中,刘睿民突然意识到,新的技术或者产业机会就在眼前:甲骨文的发展已经到了巅峰,接下来马上就面临转折。这时互联网的发展日新月异,由此产生的海量数据的存储、计算成为IT业界面临的全新挑战和机会,大容量、高并发的应用场景所占比重越来越大。
“在传统数据库领域,甲骨文拥有长期的技术积累和研发投入,很难超越。”刘睿民认为,技术的更新换代,就是机会,“技术的发展是有周期的。一种技术发展到极致,就需要有新的技术来替代它。同样这样认为的,还有一直受制于甲骨文数据库的SAP。2011年,SAP推出了全新的内存数据库HANA。
在刘睿民看来,HANA也是对新一代数据库技术的一种探索。HANA有两个特点,一是HANA是一款全内存数据库,处理效率高;二是HANA合并架构层,从而为OLAP(联机分析处理)和OLTP(联机事务处理)构建单一环境。刘睿民分析说,就特点二而言,在数据量上升到一定程度时,性能就可能受限。
也是在这个时候,刘睿民开始关注流数据库和内存数据库技术。所谓流数据库,是指面对流动的数据,是以时间轴来定义数据表。而不通过传统的静态定义的数据表来操作数据。这样可以对流动的数据进行分析及访问,不同流的创建不用再通过连接器。
在2014年,带着希望这种技术创新能够发生在国内的美好愿望,刘睿民回国创办了柏睿数据。
标准制定与产品研发齐头并进
在敏锐地发现流数据的前景后,刘睿民很快又意识到应该站到标准的制高点上,掌握行业话语权和主动权。于是,他开始提出并主导流数据库ISO标准的起草制定工作。2015年,他向ISO提交了流数据库国际标准提案,2017年,提案正式获得国际专家及组织评审通过……直到2019年,柏睿数据还是推动流数据库国际标准制定的唯一一家企业。刘睿民也成为中国唯一一个大数据领域的国际标准主笔人。
到了2020年,美国开始加入进来,希望抢夺流数据库的国际话语权。在各方的共同协商下,包括谷歌、微软、亚马逊等在内的美国软件巨头也参与到了ISO流数据库国际标准制定中来。
尽管这些巨头实力雄厚,但是柏睿数据毕竟走在了前头。除了流数据库以外,柏睿数据还将技术重心放在内存数据库上。目前,柏睿拥有完全自主研发的分布式内存数据库及流数据库核心技术,并基于这两种技术提供分析型数据库的数据智能解决方案。
从成立以来,柏睿数据以每年一款的速度不断推出新产品:
2014年和2015年,推出两款全内存分布式数据库;
2016年,首次推出数据库内人工智能产品ParallelAI;
2017年,推出自有数据库储存引擎,实现了数据库SQL解析层、优化层、执行层到存储层等数据库内核技术的全部自主研发;
2018年,与申威芯片共同研发了国内首款数据库加速芯片——数据库加速&安全芯片;
2019年,新增自动化人工智能AIworkflow、数据编织Data Fabric,帮助用户提升数据价值发现效率;
2020年,发布数据库“神器”——数据管控存算一体机,该产品通过软硬件结合的方式实现了海量数据存储,实时精准计算相融合的功能。
截至目前,柏睿数据已经全面升级基于内存计算的大数据实时分析技术,建立了完备的产品体系,其中包括全内存分布式数据库RapidsDB、全内存分布式流数据库Rapids StreamDB、库内人工智能Rapids ParallelAI、跨源异构联邦连接器Rapids Federation等。
刘睿民介绍,柏睿数据数据库产品的分析性能是传统数据库与数据仓库的数百倍,流式数据处理能力高达80万条/每核/每秒,可实现日增量20TB;支持大于300/s的超高并发,可以满足大数据实时分析场景中对流式数据处理、智能实时分析等技术需求。基于此,柏睿建立的大数据实时分析平台,能够为企业提供便捷的一站式大数据系统构建服务。
关注数字经济中的底层技术创新
当前,数字经济的发展如火如荼。加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,成为我国经济高质量发展的重要抓手。
谈到柏睿数据在数字经济中的定位,刘睿民说,柏睿数据关注底层技术创新,只有将诸如数据库这样的核心技术掌握在自己手中,才能做到真正意义的创新,数字经济发展中的安全性才能得到有效保障。而且大数据正在改变各国综合国力,重塑未来国际战略格局,大数据关乎国家战略安全。
刘睿民所关注的底层创新也好,技术标准也好,一直以来都是软件业界最难啃的骨头,需要长期的技术积累、资金投入和人才储备。刘睿民为何还要知难而上呢?
“我想这是一种情怀吧。”刘睿民回答说,他希望这一轮新技术创新,能够发生在中国。和他有着同样情怀的,是柏睿数据的投资人。正是有投资人的长期投入,柏睿数据才能坚持下来。
他补充说,随着我国经济的不断发展,经济体量也变得越来越大,有能力支撑原创技术的研发。他认为,过去我国基础软件的发展难有突破,很大一个原因是我国能够为软件买单的大中型企业数量有限。
幸运的是,刘睿民和投资人的情怀和坚持已经有了回报:柏睿数据已经拥有超过数百家用户,覆盖政府、工业、运营商、金融、制造业、能源、交通、教育等数十个行业,完成了对多个国外产品的迁移和替代。
在柏睿数据自身取得较好发展的同时,作为北京软件和信息服务业协会的副会长,刘睿民非常关注协会牵头的产业互联网北京方案。根据他在数字经济领域积累的多年经验,他建议在产业互联网北京方案建设中,应该先建立相关的标准,因为“大家都是在摸索‘,其中有很多共性的东西应该通过标准进行分享,才能加快产业互联网落地。他还表示,作为ISO流数据库标准的主笔人,他期望在产业互联网北京方案的标准制定中贡献自己的力量。
关于柏睿数据
柏睿数据是一家以完全自研数据库为核心的“Data+AI”数据智能基础软件公司。柏睿数据从底层开始完全自主开发,专注于大数据实时智能处理核心技术突破和产品创新,提供基于高速计算的海量数据处理智能分析平台和数据存算软硬一体机,以硬核核心技术支撑,实时、迅捷的为客户深度挖掘数据价值,助力实现客户实时+智能的数字化赋能,为政府智能及国民产业数字化转型升级。