7月2日,中国绿色算力大会在内蒙古呼和浩特举行,中国工程院院士郑纬民发表题为《算力的互联与互通》的主旨演讲,从HPC算力、AI算力和数据中心算力三个类别出发,深入浅出地阐释了当前我国算力发展现状。数据显示,2021年,中国总算力规模占全球份额33%,排名全球第二;但我国算力发展呈良好趋势,算力增长速度居全球首位。郑纬民表示,算力应用场景非常多,无论是国民经济还是人民生活水平的提高,都能发挥很大的作用。随着各地算力基础设施逐渐发展完善,算力联网形成统一调度是大势所趋。
(相关资料图)
超算基础软件是提升HPC算力应用效率的关键
高性能计算(HPC)算力又称超级计算系统算力(简称超算算力),用于应对最富有挑战性的计算问题,作为国际科技竞争战略制高点,是名副其实的“国之重器”。当下,我国算力指数已经进入了E级,这意味着中国已经有能力制造出每秒能做100亿亿次数值运算的超级计算机。郑纬民表示,近十年,我国在顶尖超算系统研制和超算系统部署数量都处于国际领先行列:从质量上,我国在过去十年内曾经制造出三台世界范围内最快的计算机;从数量上,在全世界一共500台最快的计算机统计中,我国计算机占其中的162台,数量超过美国,居世界领先地位。“目前,我国有13个国家超算中心,在超算算力的提供方面发挥了重要作用。”郑纬民介绍道。
然而,在响应速度上限不断拓展的同时,我们仍然面临着实际应用层面的挑战。郑纬民表示,将领先算力高效转化为解决尖端科学与工程难题的能力是世界范围内的难题,且随选择异构架构路线更加剧了该鸿沟。“在实机运行软件时,我们计算机的实际运行速度只能达到理想反射速度的10%-20%。因此,提高这个比例就是我们要努力的方向。”
谈到目前的解决方向,郑纬民强调,超算基础软件是提升转化能力的关键之一,是实现并行应用开发、优化、部署、运行高效的基础和核心。当下,国产超算系统已部署部分基础软件,而更多的完善方向,则仍然亟待研究人员去探索。
我国AI计算中心蓬勃发展
2020年4月,国家发改委明确将人工智能纳入新基建范围,人工智能成为了新兴热门产业之一,受到社会各界的重视。根据不同的使用场景,郑纬民将人工智能归结成三大类应用:一是以卷积网络为核心应用方向的图像检测类;二是以AlphaGo为代表的、以强化学习为核心的博弈决策类;三是以ChatGPT为代表、以Transformer为核心的自然语言处理类。据了解,Transformer模型是一种基于自注意力机制的神经网络模型,它的核心思想是利用自注意力机制来捕捉输入序列中的上下文信息,从而实现更加准确的语言建模和翻译。郑纬民表示,在这几个应用类别中,只有自然语言类人工智能需要大机器的硬件支撑。
参数是大模型发展的一项重要指标,参数越多,意味着计算机的算力就越大。当前,人工智能正快速向更大的模型发展,参数呈指数级上升;人们耳熟能详的GPT-3的参数高达1700亿,是GPT-2的113倍。
在我国,人工智能产业快速发展,包括西安、武汉、成都、沈阳等在内的20多个城市陆续启动人工智能计算中心建设,应用场景遍布公安、金融、政府、运营商等各大领域。郑纬民表示,预计到2025年,中国人工智能产业规模将超过4500亿元,带动产业规模超1.6万亿。
互联互通是数据中心算力发展的必由之路
演讲中,郑纬民重点强调了算力互联的概念。他表示,算力的互联互通是实现“东数西算”的一项基本条件,更是数据中心算力发展的必由之路。郑纬民表示,在当前的应用场景中,带宽不足导致的低延迟是算力互联无从避免的局限性。他提出,要对现状做出改善,一方面要提高算力输送效率,通过并网实现高带宽、低延迟的算力互联;另一方面,可以屏蔽异构基础设施,通过统一编程框架和编译的资源管理与调度软件实现算力的互通。
最后,郑纬民表示,目前还没有类似的研究机构来解决算力的互联互通问题。他建议,应成立东数西算研究院,团结领域内各大企业,实现算力的统一调度,稳步推进“东数西算”的发展与预后工作。