集微网报道(文/杜莎)国产智能驾驶芯片赛道,再添有竞争力的新产品。5月10日,后摩智能正式发布首款存算一体智驾芯片——鸿途™H30,采用12nm工艺,最高物理算力256TOPS,典型功耗35W,成为国内率先落地存算一体大算力AI芯片的公司,也随之开启存算一体规模化应用新篇章。


【资料图】

基于底层架构创新,重构智能驾驶芯片

这两年,产业界对智能驾驶市场的需求逐渐清晰,未来3-5年L2、L2+、L2++高阶辅助驾驶将作为智能车辆标配持续占领市场。而在人工智能技术飞速发展的今天,作为智能驾驶普及应用的重要基石,智能驾驶芯片的需求必将持续激增。

在这一黄金赛道,竞争自然也十分激烈,全球的智驾芯片玩家都在奋力狂奔。就市场格局来看,除特斯拉自研自用FSD芯片外,大部分量产辅助/自动驾驶系统的国内外车企原来都依赖Mobileye、英伟达等公司的芯片。但这两年以来,这一格局在悄然改变,新一轮的智能电动汽车浪潮,叠加中国车企的崛起,为中国厂商创造了快速发展的机遇,且部分企业已崭露头角,并逐渐加入到与国外智驾芯片公司的角逐中。

后摩智能创始人兼CEO吴强

不做跟随者,坚定走差异化创新之路,这是后摩智能创立之初就秉持的信念,因此当时,后摩智能另辟蹊径,选择从还不是主流趋势的存算一体架构切入。对此,后摩智能创始人兼CEO吴强谈到:“2年前,后摩智能成立,我们坚定地选择以存算一体的底层架构创新,来实现AI计算效率的极致突破。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。随着GPT等大模型的出现,存算一体芯片越来越受到行业关注,我们很高兴看到更多创业公司加入进来,与我们一起推动硬科技的创新与应用。”

如今,存算一体爆火出圈,也充分说明后摩智能当初选择的正确性和前瞻性。对于一项技术,落地应用才算是“靴子落地”。对于后摩智能,他们选择将目前已相当内卷的智能驾驶作为存算一体芯片落地的首选场景。吴强认为,智能驾驶的市场空间很大,目前还处于发展期,留给不同玩家的机会还很多,且存算一体和智能驾驶的终局天然吻合,所以他相信存算一体一定能重构智能驾驶芯片,让智能驾驶做得更好。

后摩智能走的这一条路,将与当下智驾芯片形成有力的“互补”,为此也备受汽车产业界关注。发布会上,一汽、广汽、东软睿驰等都以视频的方式表达了他们对这款存算一体芯片的期待。在现场,中国电动汽车百人会副理事长兼秘书长张永伟还指出,“智能驾驶市场规模庞大,仍处于加速渗透的阶段,为新技术和新企业提供了创新发展的巨大机遇。存算一体作为一种创新技术,对工艺制程依赖度低,具有极高的竞争力,为智能驾驶芯片提供了更具前瞻性的技术路径选择。采用多种技术路径实现芯片国产化布局,将有利于解决汽车芯片供应链中存在的同质化竞争问题,助力提升产业链的韧性和供应链的安全性”。

存算一体,解决智能驾驶计算核心痛点

那么,存算一体创新架构的智驾芯片鸿途™H30,究竟能解决智能驾驶领域哪些痛点问题,相信这也是业界最为关注的话题。

一直以来,智能驾驶计算面临一些核心矛盾,包括大算力与高成本,与高功耗等。后摩智能提出,颠覆传统的冯·诺依曼架构,存算一体这一创新的计算架构是解锁算力和功耗难题的“金钥匙”。

存算一体有诸多优势,可以把算力做得更大,同时把能效比做一个数量级上的延伸,避免大数据的搬运,且提升延时。还有一个最重要的点,在如今的国际大环境下,国内面临着技术封锁,而存算一体对工艺的依赖比较弱,它可以用更传统的28nm工艺做出别人7nm甚至5nm的性能或者能效比,这也是它天生的优势。

正是得益于存算一体的架构优势,鸿途™H30基于12nm工艺制程,在Int8数据精度下可实现高达256TOPS的物理算力,所需功耗不超过35W,整个SoC能效比达到7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。

后摩智能联合创始人兼研发副总裁陈亮

对于鸿途™H30的创新突破,后摩智能联合创始人兼研发副总裁陈亮表示,“鸿途™H30以存算一体创新架构实现了六大技术突破,即大算力、全精度、低功耗、车规级、可量产、通用性”。

鸿途™H30基于SRAM存储介质,采用数字存算一体架构,拥有极低的访存功耗和超高的计算密度,在Int8数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上。为了更好地实现车规级,后摩智能基于鸿途™H30自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

尤为值得一提的是,为了充分发挥存算一体带来的高计算效率,后摩智能面向智能驾驶场景打造了专用IPU(处理器架构)——天枢架构,采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的完美均衡,AI计算可以在核内完成端到端处理,保证通用性。据陈亮介绍,“天枢架构的设计理念源自于庭院式的中国传统住宅,以大布局设计保障计算资源利用效率的同时,再进一步结合现代住宅多层/高层的设计优势,以多核/多硬件线程的方式灵活扩展算力。得益于灵活、高效的硬件架构设计,鸿途™H30 实现了性能 2 倍提升的同时,还降低了50%功耗”。

据陈亮透露,天枢架构是后摩智能自主研发的第一代IPU(处理器架构),第二代天璇架构已经在研发中,将采用Mesh互联结构,可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、大模型等场景。第三代天玑架构已经开始规划,将为万物智能打造。

架构、硬件、软件同步创新,鸿途™H30赋能智能驾驶

从技术步入场景应用,鸿途™H30正在有序推进中。后摩智能联合创始人兼产品副总裁信晓旭表示,目前基于鸿途™H30已成功运行常用的经典CV网络和多种自动驾驶先进网络,包括当前业内最受关注的BEV网络模型以及广泛应用于高阶辅助驾驶领域的Pointpillar网络模型,以鸿途™H30打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署,这是业界第一次基于存算一体架构的芯片成功运行端到端的智能驾驶技术栈。

后摩智能联合创始人兼产品副总裁信晓旭

对于智驾AI芯片的创新,架构、硬件、软件是三位一体,缺一不可。本次发布会上,后摩智能同步推出了基于鸿途™H30芯片打造的智能驾驶硬件平台——力驭®,和软件开发工具链——后摩大道™。

得益于鸿途™H30极高的计算效率和计算密度,力驭®平台CPU算力高达200 Kdmips,AI算力高256Tops,支持多传感器输入,能够为智能驾驶提供更充沛的算力支持,进一步提升了系统的可靠性。力驭®平台功耗仅为85W,可采用更加灵活的散热方式,实现更低成本的便捷部署,有利于推动大算力智能驾驶场景的普及应用。

后摩大道™能让客户拥有更好的产品使用体验,该工具链支持 PyTorch、TensorFlow、ONNX等主流开源框架,编程兼容CUDA前端语法,同时支持SIMD和SIMT两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途™H30的高效、易用。

据信晓旭透露,鸿途™H30将于今年6月份开始给Alpha客户送测。同时,后摩智能的第二代产品鸿途™H50已经在全力研发中,将于2024年推出,支持客户2025年的量产车型。

写在最后

鸿途向未来。吴强表示:“鸿途™H30的发布,开启了存算一体大算力芯片商用落地的新阶段。下一阶段,我们希望用两年左右时间把技术和产品做得更加扎实,在乘用车和商用车智驾领域深耕深挖,用‘人无我有’的差异化的产品去赋能客户,解决客户痛点,在成就客户的同时实现智驾芯片大规模的商用,也成长为这一领域的国内头部企业。”

未来,后摩智能希望把创新的技术和高效率的芯片延展到其他的有类似场景的需求当中,比如人形机器人、服务机器人,以及对算力和能效有更高要求的场景,比如时下火热的ChatGPT、云端推理。为了这些目标,后摩智能将坚定不移地专注于底层技术创新,打造极致效率的计算芯片,与生态链上的合作伙伴密切合作,共同推进万物智能的实现。

(校对/朱秩磊)

推荐内容