More is Different: 为什么三体和人类都需要高性能计算
人类对世界本质的探索,越来越依靠先进计算工具的辅助。即使牛顿的运动学定律已经建立了数百年,人类至今仍然无法预测“仅仅”三个天体相互影响下的运动轨迹。这也是为什么诺贝尔奖得主PW Anderson 会感慨:More is different。即使基本的物理“原理”已经知晓,我们如何有效“应用”这些物理原理解决实际问题仍是巨大的挑战,其难度并不亚于其原理本身的建立。如何建立“原理”到“应用”之间的桥梁,系统性产生原始创新,正是先进算法和高性能算力所承载的使命;也是人类文明进入下一阶段的必经之路。
《三体》是中国科幻作家刘慈欣的代表作,一经出版就成为了中国科幻史最流行的作品之一,并于2015年获得全球科幻界最高奖项——雨果奖。《三体》所描绘的世界是一个地球人完全无法想象的生存环境极端严酷的世界。三体世界有三个质量相差不大的「太阳」,而三体人所在的行星被这三个「太阳」的引力交互作用,导致该行星的轨道高度混沌。由于三个「太阳」运行无规律,当行星过于靠近「太阳」时,会因为温度过高而表面熔化;过于远离太阳时温度又会过低;更可怕的是,当行星同时靠近几个「太阳」时,会因为引力的撕扯导致星体分裂。以上几种原因使三体文明毁灭了数百次。但尤为恐怖的是,因为相对「太阳」来说,行星的质量太小,最终会因为轨道的混乱而被「太阳」引力捕获吞噬,使三体人和三体文明永远消失。
因此,对于三体人来说,能否突破 “三体太阳轨迹不可预测”的诅咒,是关乎文明存续与否的头等大事。在小说中,即使已经三体文明已经能将天体运动的基本规律总结出来,却仍无法使用这些规律进行预测,最终不得不从母星逃亡。现实中的人类文明也受到同样的限制。我们每天吐槽的天气预报,其基本方法早在1920年就已经被Lewis Fry Richardson建立,然而有现实意义的预测工作直到1990年代才大规模开展。类似的情形比比皆是。诺奖得主PW Anderson 曾发出著名的感慨:即使基本的物理“原理”已经知晓,我们如何有效“应用”这些物理原理解决实际问题仍是巨大的挑战。文明的发展,不仅需要能将复杂的自然现象简化“还原”成简洁的数学物理模型;也需要能使用数学物理模型进行“推演”,针对具体的场景提供指导。
人类认识世界的两种范式:
《生活大爆炸》和《红楼梦》
对于我们绝大多数人,从小学习的物理和科学,其背后暗含着这样的逻辑,即:我们所处的世界中,千奇百怪的事物和现象归根结底都是由一些“基本单元”组成的,这些基本单元在一组“基本规律”的约束下,构成了各种纷繁复杂的自然。只要我们不断追本溯源,找到组成世界的基本单元和约束它们的基本规律,便可以建立起描述世界运行规律的体系,达到包罗万象的“终极理论”(theory of everything)。这种追求把复杂未知的自然简化还原为若干基本定理的范式,即“还原论”。
在物理学建立的过程中,还原论取得了辉煌的成就。人类将物质分解成分子,再分解成原子,再逐步分解成各自微观粒子,并建立了粒子间运动的定律,这便是成功的“还原”。在宇宙层面,开普勒从大量数据中归纳出星体运动的数值规律,又和牛顿的三大力学完美契合,可以说是在浩瀚无垠的宇宙中建立了秩序。

无怪乎三体游戏中的牛顿会醉心于利用“还原论”解决三体问题,而三体问题也的确遵从牛顿的三定律。类似的,在另一部著名的“科学文艺作品”《生活大爆炸》中,理论物理学家 Sheldon Cooper 略带调情的说“量子力学理论让我真欢喜,看到这些理论就好像看到了宇宙女神的**”。

然而,正如《生活大爆炸》中的 Sheldon 在量子物理中原地打转了半生而没有突破;三体游戏中牛顿的力学定律也不足以解决悬在三体文明头上的达克摩斯之剑——三体问题。究其原因,即使我们知道了天体运行的规律,若要对其运动进行预测,仍需要应用这些规律进行“推演”,才能知道从某一时刻开始,若干时长之后这些天体的位置和运动情况。而这个“推演”的过程,需要求解复杂微分方程。在人类目前的技术水平下,只能对这些方程进行近似求解,且求解需要消耗巨大的计算力。(参考:https://hackernoon.com/there-is-gulf-between-science-and-technology-but-ai-could-bridge-the-gap)

其实在我们的生产生活中,每天都在遇到同一类的挑战——例如气象预测。气象预期和三体运动类似,都是需要求解复杂的微分方程。气象预测通常需要数十亿成本的国家超算中心满载运转,即使如此,我们仍然经常对天气预报的准确性产生不满。

(图片来源:https://aktishydraulics.com/capabilities/atmospheric_modelling/)
再举一个“不很恰当”的例子,文字是语言的“基本要素”,虽然人人都会写字,但能用一个一个基本的字排列组合,“排列”出《红楼梦》的,古今也只有曹雪芹一人。理论上以永恒时间为尺度的《沙之书》中“包含”红楼梦,但如何从无限的乱码中检索出其中的红楼梦篇章,也仍是当今最强大的计算机也无法完成的“推演”任务。而诸如GPT等大型生成模型的不断完善,正是人类文明“推演”能力的巨大进步,其所依靠的也正是底层算力和算法的跨越式发展。

三体中的
人型阵列CPU的算力如何
在三体游戏中,为解决牛顿定律无法计算的问题,冯诺依曼(即现实中计算机的开山祖师)提出由3000万人组成人型CPU阵列,其中每个人组成一个门,简单的几个人就能完成逻辑计算,由数千万人组成的阵列就能完成复杂的数值计算。我们不得不折服于大刘非凡的想象力,3000万人组成的CPU进行计算,那会是多么壮观的场景,非荷马史诗不能描写。而在折服之余,我们也不禁好奇这样宏大的人力工程,到底能有多少算力呢?

(素材来源:B站UP主飞鱼唤龙吟)
简单来说,计算机的基本结构需要包括运算单元,以及信号传递机制(另外还包括记录和控制,先按下不表)。在三体游戏中,信号的传递是由目视完成,而每个运算单元则由三个人员形成小组。每次运算除了受限于人的反应速度,也受限于人举旗子的肌肉速度。以常识判断,人应该很难每秒举手10次,因此人型阵列的时钟速度大概会低于10Hz。相比之下,iPhone 搭载的 A15芯片的时钟速度为 3.24*10^9 Hz。仅以时钟速度(clock rate)粗估,一部iPhone 也至少相当于3亿个人型阵列。而事实上,考虑到数据的传输和存储,计算保真度和系统设计水平等,这个差距还要高得多。我们每天习以为常的事物,竟是一国之君举全国之力都遥不可及的“神器”,不得不让人感恩科学技术的伟大传承和人类的不竭潜力。
现实人类文明中
高性能计算的发展历程
科学“演生论”的发展伴随着人类所能驾驭的计算力的突飞猛进。更强大的算力、更高效的算力利用,意味着人们能“推演”精度更高、时空维度更大、体系更复杂的模型。先进的科研组使用高性能计算 (High Performance Computing, HPC),在短时间内执行海量计算任务,从容应对这些规模庞大而又极其复杂的模型挑战。
高性能计算系统建设成本昂贵,更新周期长,且大部分科研场景对计算的需求有波峰波谷,因此,全球科研人员已开始逐渐转向云上的高性能计算解决方案。根据海外机构发表的 State of Computational Engineering Report 2022,53%的被访机构(欧美日韩地区)已将科学计算任务迁移至云上。国内先进科研组和企业也已经大规模的在云计算平台上执行 CAE, CFD, EDA, 分子动力学模拟, 气象等典型科学计算和工业设计任务。
广告时间:
深势高性能云计算平台Bohrium®
对,你没有看错,我们有广告!好东西就是要分享。
深势科技的微尺度科学计算云平台Bohrium®是在对微观世界理性探险中的重要实践成果,Bohrium®将在“AI for Science”的时代,助力科学家们推开微观世界的下一扇大门,陪伴探险者们继续实现科学进阶,求解自然之梦,共同推动微观计算模拟的下个百年征程。
首先是在环境配置上,和传统服务器需要用户自己从头安装软件不同。Bohrium®采用了容器镜像的技术,助教和老师只需要将教学所需的服务器环境配置好并一键制作镜像,学生就可以直接使用,避免了非常繁琐的环境配置操作。
其次在计算资源上,Bohrium®允许弹性调度计算资源,且按量付费。这样在不需要服务器的时候,完全没有任何开销;而在大量需要服务器计算资源的时候,Bohrium®又可以按照需要保质保量的提供(CPU、GPU资源),非常适合教学中对服务器使用时间分布不均匀的情况。

(图片来源:https://hyperionresearch.com/wp-content/uploads/2022/11/Hyperion-Research-SC22-HPC-Market_Combined-1.pdf)
“十四五”和新基建驱动我国高性能计算中心建设进入高速增长期,多地地方政府和企事业单位都在积极建设和筹建高性能计算中心。2021 年 3 月,我国“十四五规划”中明确提出,要“加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群。2022 年 2 月,国家发改委批复同意在 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。“东数西算”工程正式全面启动。而事实上,“高性能计算面的挑战,不仅仅在计算机本身,应用和软件是更大的考验”。
包括生物医药,新能源,新材料等在内的诸多前沿科学研究及其工业层面的应用落地,对“高性能计算”的综合实力提出了更高的要求和期望。事实上,根据国际高性能计算分析师 Hyperion Research 的报告,全球HPC市场越发多样化,传统计算机群和存储所占比例从过去~100% 持续降低至 ~60% (2021),同时期 HPC软件生态和云计算所占比例快速上升。


