高性能计算技术产业发展趋势研究

2022-09-11

一、相关背景

高性能计算是信息领域的前沿高新技术, 是衡量一个国家综合实力的重要标志之一。自“十二五”以来, 我国高性能计算国际级重大项目成效初显, 核心技术能力取得明显进步, 硬件系统性能被国际公认位于全球前列, 已初步具备与国际相较量的竞争实力。

当前, 高性能计算成为变革性的科学方法, 对信息产业有极大的促进作用。徐光宪院士表示“进入21世纪以来, 计算方法与分子模拟、虚拟实验, 已成为继实验方法、理论方法之后的第三个重要的科学方法, 对未来科学与技术的发展起着越来越重要的作用。”根据已有理论在超级计算机上进行虚拟实验, 已经在更大程度上辅助甚至替代现实实验, 比如核试验、气候模拟等。超级计算机的发展带来一系列计算机核心技术的突破, 例如计算机系统结构、高性能处理器设计、高密度硬件设计和组装技术、冷却技术、互连网络、系统软件、应用支撑软件等, 这些技术的突破往往会产生显著的辐射作用, 带动系列化国产计算机服务器产品的发展, 提高我国计算机产业的技术水平与市场竞争力。

二、高性能计算产业发展现状

全球超算主要分布在美国、中国、德国、日本、法国、英国等国家。2016年, 美国和中国超算中心均为171个, 并列第一, 第三名是德国, 共32个超算中心;日本排名第四, 共27个超算中心。

我国高性能计算以点带面, 全面突破。2017年年底SC17发布的TOP500最新榜单表明, 在超级计算机领域, 中国的超级计算机入围总量达到202台, 已经全面压倒美国, 成为世界第一。

我国高性能计算硬件性能已进入国际领先行列。天河一号和天河二号曾先后问鼎世界超级计算机排行榜。采用国产处理器构建的“神威太湖之光”在峰值性能、持续性能、绿色指标和组装密度上全面领先, 成为排行榜上全球最快的超级计算机。

我国启动E级计算机建造计划, 与发达国家发展同步。当前高性能计算领域的“军备竞赛”白热化, 美、日、欧将E级计算机研发上升至国家战略高度, 纷纷发布E级计算机建设计划并投入大量资源保障研发进度。美国和日本将于2020年前后建成E级计算机, 我国的E级计算机研制也将同期完成, 与发达国家处于相同发展水平。

我国高性能计算应用创新取得标志性突破。基于“神威太湖之光”的应用成果“千万核可扩展全球大气动力学全隐式模拟”首次荣获高性能计算应用领域最高奖“戈登·贝尔”奖, 成为我国高性能计算应用发展新的里程碑。

三、高性能计算关键技术及趋势

高性能计算处于体系架构和计算原理更迭的交叉点。自从1946年第一台计算机Eniac发布以来, 高性能计算共经历了器件变革, 体系结构变革两个阶段, 在实现E级系统之后, 需要通过计算原理的变革来进一步提升性能。高性能计算体系架构主要经历了并行向量处理机PVP、对称多处理机SMP、分布共享存储器多处理机DSM、大规模并行处理机MPP、工作站集群Cluster五种。

系统的可扩展性和成本是推动体系结构进步的动力。早期HPC采用的向量机PVP, SMP以及DSM体系结构因其成本和可扩展性的限制, 已经逐渐被淘汰。并行向量处理机PVP优点是一条指令可以处理整个向量, 缺点是向量化编程难度较大, 且全定制处理器成本极高。对称多处理机SMP优点是基于通用微处理器, 降低了处理器的成本, 缺点是集中式共享机制使得其扩展性受到了限制。分布共享存储器多处理机DSM优点是延续了SMP架构的编程模型, 缺点是因其远程访存的方式带来一定延迟, 导致其难以大规模扩展。

异构计算体系是实现E级计算的必由之路。由于功耗的限制, 处理器的主频不能无限制地提升, 要进一步提高计算能力, 异构计算体系是当下最为理想的解决方案, 目前Top500中已经有近20%采用了异构体系。2008年左右, 能耗问题制约了处理器主频的大幅提升。若继续采用当时的主流机群技术, 实现千万亿次系统需要64000个节点, 占地近14000m2, 功耗约38MW, 相当于一个中等县城的用电量。异构计算模式可以突破系统规模, 计算密度, 系统能耗的制约。异构计算模式是采用处理器和加速器协同计算的模式, 加速器不需要执行复杂的控制流, 专注于浮点计算, 可以实现大量浮点计算部件的堆叠, 峰值计算性能超过通用处理器数倍或数十倍, 对于一些特定计算可以提升上百倍的性能。

超越E级计算能力需突破原有的计算原理。E级系统之后, 仅借助当前的异构计算模式难以再实现大幅度性能提升, 人们寄希望于计算原理的突破来开启高性能计算机的下一个大发展阶段。目前业界有三个趋势:一是量子计算、二是光计算、三是DNA计算。量子计算是指利用量子的重叠与牵连原理, 通过提高量子计算机中的量子位 (qubit) 数量, 使计算能力呈指数级提高。量子信息单元的状态可以处于多种可能性的叠加状态, 从而导致量子信息处理从效率上相比于经典信息处理具有更大潜力。光计算是采用光学方法来取代电学脉冲, 实现运算处理和数据传输。光计算具有二维并行处理、高速度、大容量、空间传输和抗电磁干扰等优点。DNA计算是基于大量DNA分子自然的并行操作及生化处理技术, 通过产生类似于某种数学过程的一种组合结果并对其进行抽取和检测来完成问题求解的过程。DNA计算具有强大的并行计算能力和很高的能量效率以及存贮容量。2013年Google, NASA以及大学空间研究联合会购买了D-Wave公司的量子计算机D-Wave Two, 成为了量子计算机产业化的标志;然而量子计算机中仍然存在大量的结构和算法问题, 短期之内难以大面积产业化。

四、高性能计算应用展望

人工智能对高性能计算提出更高的要求。人工智能需要以高性能计算为依托, 更为复杂的功能需要更强大的计算能力。1997年, IBM深蓝国际象棋比赛, 其CPU计算能力达到11.38GFLOPS。2016年Google Alpha Go围棋则使用48个CPU和8个GPU, 速度至少达到深蓝2.5万倍。

高性能计算机在人工智能应用方面逐渐专用化。Nvidia推出人工智能专用超算DGX-1, 深度学习的底层由一些非常复杂的神经网络驱动, 需要巨大的计算能力, DGX-1将这样的计算能力进行集成, 做出专门用于满足人工智能需求的超算, 设备包含了8张Tesla P100显卡, 每张显卡各有16GB显存, 支持NVLink混合立方网格技术, 另外还配有7TB存储容量, 用于储存神经网络训练的大量原始数据。

五、我国高性能计算产业发展建议

目前, 我国高性能计算产业进入由研转用的生态建设重要时期, 后续发展要着重突破核心芯片、配套系统等关键环节。抓住人工智能对高性能计算带来的发展机遇, 依托我国人工智能产业初具国际竞争潜力的优势, 积极布局、加大投入、重点突破, 体系化发展, 着力打造自主技术生态。

一是配套核心元器件自主能力。围绕处理器芯片, 提升配套核心元器件自主能力, 特别是对于国内缺失或被封锁的互连、存储等关键领域。

二是补足软件和应用短板, 完善产业生态。针对国产处理器, 加强高性能计算软件和应用配套技术研发。提升高性能计算软件开发与优化的投资比例, 重点支持关乎国计民生的行业应用及科研应用的研发与优化, 拓展应用领域, 提升资源利用水平。

三是抓住人工智能等新兴领域应用机遇, 助力产业应用发展。优化国产处理芯片在人工智能等新兴领域的转化能力, 推动深度学习算法与底层硬件芯片的深度融合。加速推进高性能计算集群与自主人工智能基础框架整合, 优化集群计算架构与调度机制。构建人工智能开放服务平台, 形成聚集效应。

四是加强学科建设, 引入高端人才。建立健全高性能计算人才培养体系, 提高优秀人才吸引能力。在“千人计划”中进一步加大引进高性能计算领域复合型人才的支持力度, 并研究出台相关政策保障机制。

摘要:自“十二五”以来, 我国高性能计算国际级重大项目成效初显, 核心技术能力取得明显进步, 硬件系统性能被国际公认位于全球前列, 已初步具备与国际相较量的竞争实力, 系统分析我国高性能计算产业的发展现状、关键技术及趋势对于国家高性能计算产业的后续发展具有重要意义。本文首先对高性能计算的产业技术现状及趋势进行研究, 而后对高性能计算的应用进行展望, 最后给出我国高性能计算发展的建议。

关键词:高性能计算,超级计算机,E级计算

上一篇:中日美术教育对比与启示下一篇:购买理财产品所得利息归公是否构成挪用公款罪