当前位置: 首页>AI

生成式AI就绪 英特尔发布第五代至强可扩展处理器

来源:创氪网 2023-12-22 15:41:24

实用化 AI 算力又升上了一个新台阶。

随着AI大模型加速迭代,智能算力已成为稀缺资源。算力是AI发展的底层土壤,大语言模型的训练和推理都需要消耗大量的计算资源。传统的通用算力往往难以满足大模型对算力的高需求,因此,强大可靠的AI算力底座显得尤为重要。

一些让人始料未及的趋势在人工智能的应用领域出现了:很多传统企业开始选择在CPU平台上落地和优化AI应用。

例如制造领域在高度精细且较为耗时的瑕疵检测环节,就导入了CPU及其他产品组合,来构建横跨“云-边-端”的AI 缺陷检测方案,代替传统的人工瑕疵检测方式。

再比如亚信科技就在自家OCR-AIRPA方案中采用了CPU作为硬件平台,实现了从FP32到INT8/BF16的量化,从而在可接受的精度损失下,增加吞吐量并加速推理。将人工成本降至原来的1/5到1/9,效率还提升了约5-10倍。

在处理AI制药领域最重要的算法——AlphaFold2这类大型模型上,CPU同样也“加入群聊”。从去年开始,CPU便使AlphaFold2端到端的通量提升到了原来的23.11倍;而现如今,CPU让这个数值再次提升3.02倍。

上述这些CPU,都有个共同的名字——至强,即英特尔®️ 至强®️ 可扩展处理器。

为什么这些AI任务的推理能用CPU,而不是只考虑由GPU或AI加速器来处理?

这里历来存在很多争论。

很多人认为,真正落地的AI应用往往与企业的核心业务紧密关联,在要求推理性能的同时,也需要关联到它的核心数据,因此对数据安全和隐私的要求也很高,因此也更偏向本地化部署。

而结合这个需求,再考虑到真正用AI的传统行业更熟悉、更了解也更容易获取和使用CPU,那么使用服务器CPU混合精度实现的推理吞吐量,就是他们能够更快和以更低成本解决自身需求的方法了。

面对越来越多传统AI应用和大模型在CPU上的落地优化,“用CPU加速AI”这条道路被不断验证。这就是在数据中心中,有70%的推理运行在英特尔® 至强® 可扩展处理器上的原因。1

最近,英特尔的服务器CPU完成了又一次进化。12月15日,第五代英特尔® 至强® 可扩展处理器正式发布。英特尔表示,一款为AI加速而生,而且表现更强的处理器诞生了。

人工智能正在推动人类与技术交互方式的根本性转变,这场转变的中心就是算力。

英特尔CEO帕特·基辛格(Pat Gelsinger)在2023英特尔ON技术创新大会表示:“在这个人工智能技术与产业数字化转型飞速发展的时代,英特尔保持高度的责任心,助力开发者,让AI技术无处不在,让AI更易触达、更可见、透明并且值得信任。”

第五代至强 为AI加速

第五代英特尔® 至强® 可扩展处理器的核心数量增加至64个,配备了高达320MB的L3缓存和128MB的L2缓存。不论单核性能还是核心数量,它相比以往的至强都有了明显提升。在最终性能指标上,与上代产品相比,在相同功耗下平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近3倍。

更为重要的是,第五代至强® 可扩展处理器的每个内核均具备AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其训练性能提升多达29%,推理能力提升高达42%。

在重要的AI负载处理能力上,第五代英特尔® 至强® 可扩展处理器也交出了令人满意的答卷。

首先要让CPU学会高效处理AI负载的方法:在第四代至强® 可扩展处理器上,英特尔面向深度学习任务带来了矩阵化的算力支持。

英特尔®️ AMX就是至强CPU上的专用矩阵计算单元,可被视为CPU上的Tensor Core,从第四代至强® 可扩展处理器开始成为内置于CPU的AI加速引擎。

第五代至强®️ 可扩展处理器利用英特尔®️ AMX与英特尔®️ AVX-512指令集,配合更快的内核,以及速度更快的内存,可以让生成式AI更快地在其上运行,无需独立的AI加速器就能执行更多工作负载。

借助在自然语言处理 (NLP) 推理方面实现的性能飞跃,这款全新的至强® 可支持响应更迅速的智能助手、聊天机器人、预测性文本、语言翻译等工作负载,可以在运行参数量200亿的大语言模型时,做到时延不超过100毫秒。

据了解,11.11期间,京东云便通过基于第五代英特尔® 至强® 可扩展处理器的新一代服务器,成功应对了业务量激增。与上一代服务器相比,新一代京东云服务器实现了23%的整机性能提升,AI计算机视觉推理性能提升了38%,Llama v2推理性能也提高了51%,轻松hold住用户访问峰值同比提高170%、智能客服咨询量超14亿次的大促压力。

除此之外,第五代英特尔® 至强® 可扩展处理器也在能效、运营效率、安全及质量等方面实现了全面提升,提供了向前代产品的软件和引脚兼容性支持,以及硬件级安全功能和可信服务。

国内云服务大厂阿里云也在发布会上披露了其实测体验数据,基于第五代英特尔® 至强® 可扩展处理器及英特尔® AMX、英特尔® TDX加速引擎,阿里云打造了 “生成式AI模型及数据保护”的创新实践,使第八代ECS实例在实现了全场景加速和全能力提升情况下,更加固了安全性能,且保持实例价格不变,普惠客户。

数据显示,其在数据全流程保护的基础上,AI推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。

英特尔表示,第五代至强® 可扩展处理器可为AI、数据库、网络和科学计算工作负载带来更强大的性能和更低的TCO,将目标工作负载的每瓦性能提升高达10倍。

对先进AI模型实现原生加速

为让CPU能够高效处理AI任务,英特尔把AI加速的能力提升到了「开箱即用」的程度。

英特尔®️ AMX除了可以加速深度学习的推理、训练以外,现在已经支持了流行的深度学习框架。在深度学习开发者常用的TensorFlow、PyTorch上,英特尔® oneAPI深度神经网络库 (oneDNN) 提供了指令集层面的支持,使开发人员能够在不同硬件架构和供应商之间自由迁移代码,可以更轻松地利用芯片内置的AI加速能力。

在保证了AI加速直接可用之后,英特尔利用高性能开源深度学习框架OpenVINO™ 工具套件,帮助开发者实现了一次开发、多平台部署。它可以转换和优化使用热门框架训练好的模型,在多种英特尔硬件的环境中快速实现,帮用户最大程度地利用已有资源。

OpenVINO™ 工具套件最新的版本也加入了对大型语言模型 (LLM) 性能的改进,可以支持生成式AI工作负载,包括聊天机器人、智能助手、代码生成模型等。

OpenVINO™ 工具套件2

通过这一系列技术,英特尔让开发者们能够在几分钟内调优深度学习模型,或完成对中小型深度学习模型的训练,在不增加硬件和系统复杂性的前提下获得媲美独立AI加速器的性能。

比如在先进的预训练大语言模型上,英特尔的技术就可以帮助用户完成快速部署。

用户可以从最热门的机器学习代码库Hugging Face中下载预训练模型LLaMA2,然后使用英特尔®️ PyTorch、英特尔®️ Neural Compressor等将模型转换为BF16或INT8精度版本以降低延迟,再使用PyTorch进行部署。

英特尔表示,为了能够紧跟AI领域的潮流,有数百名软件开发人员正在不断改进常用的模型加速能力,让用户能够在跟上最新软件版本的同时,获得对于先进AI模型的支持。

第五代至强® 可扩展处理器的实力,目前已在部分大厂进行了验证。火山引擎与英特尔合作升级了第三代弹性计算实例。

目前,火山引擎已通过独有的潮汐资源并池能力,构建百万核弹性资源池,能够以近似包月的成本提供按量使用体验,降低上云成本。基于第五代英特尔® 至强® 可扩展处理器,火山引擎第三代弹性计算实例整机算力再次提升了39%,应用性能最高提升了43%。

这只是个开始。可以预见,很快会有更多科技公司的应用能够从第五代至强®️ 可扩展处理器的性能中获益。

下一代至强已经现身

未来,人们对于生成式AI的需求还将不断扩大,更多的智能化应用将会改变我们的生活。以计算能力为基础,万物感知、万物互联、万物智能的时代正在加速到来。

面对这样的趋势,英特尔正在加紧打造再下一代的至强CPU,它们面向AI的「专业化」程度还会更高。

在最近披露的英特尔数据中心路线图上,下一代至强® 处理器将对不同工作负载、场景配备不同的核心,其中主打计算密集型与AI任务的型号会使用侧重性能输出的核「P-core」,面向高密度与横向扩展负载的型号则会使用有更高能效的核「E-core」,这两种不同的核心架构并存的设计,既满足部分用户对极致性能的追求,也能兼顾到可持续发展绿色节能的需求。

未来,英特尔还将如何实现晶体管和芯片性能的飞跃,在AI算力上还能有什么样的跃升?

让我们拭目以待。

 

相关阅读
生成式AI就绪 英特尔发布第五代至强可扩展处理器
LG智能电视三剑客,双十二选哪款升级家庭娱乐体验?
AI 爆发、万物互联,英特尔 FPGA 迎来新机
协同合作打通产业链,行业大咖共商算力网络发展
为创新成长提速—「阿里云创业者计划」云栖大会专场
双十一最值得入手的LG OLED电视,让家居生活从电视
AI大模型赋能未来智能化人力管理,云生集团发布多款
来酷科技半年报数字的背后 降本增效提速显著 经营质效
腾讯区块链助力文物数字资产共享 推动文化传承与创新
计算机软件国家工程研究中心成立三十周年,新一届技
全新门派“万灵山庄”首曝 《剑网3》十四周年发布会
全新门派“万灵山庄”首曝 《剑网3》十四周年发布会
罗格朗模块化数据中心解决方案,让机房空间大有可为
乘“风”而来!山特风电专用 UPS,为风电行业保驾护
在光影世界中坚守,山特助力医疗行业数字化转型升级
伊顿电气重磅发布新一代融合电力模块——Eaton Powe
2023长春马拉松鸣枪开跑,红旗新能源携“新锐选手E0
还原真实自然的声音,如何打造出媲美影院水准的电视
形色随心崭新江湖 《剑网3》全新资料片“群侠万变”
打破界限,开启轻薄新时代,LG gramSuperSlim商务本
伊顿与蓝厅达成战略合作伙伴关系,共建 AI 算力中心
构建不间断供电保障,山特助未来智慧药厂建设
三座城市 三场会议 | 聚焦各行业数字化转型,多地上演
山特冠军挑战赛三亚完美收官,以拼搏诠释山特精神
山特以数字之能,助力抗疫前线
无惧石油石化行业严苛考验,山特不间断时刻“守护”
山特守护用电安全,助力机场凭“云数”腾飞
助力运营商边缘数据中心建设,且看山特更优解
山特赋能智慧交通引擎加速,织出市民稳稳的幸福感
全场景守护,山特助力医疗行业捍卫“生命线”
“绿”化在行动 | 山特助力中小型数据中心“破茧成蝶
探索技术背后的故事:云边协同让VR彻底融入智慧医疗
洒拖派高速擦窗机器人革新来袭,打造满分擦窗方案
掌上生活9.0的「零点猜想」:二十载磨砺一张卡
北汽蓝谷发布三季报 极狐发力高端市场
集度ROBO-01探月限定版追加1000名额 刘慈欣获004号车
闪耀第十一届数据中心高峰论坛 | 罗格朗宣贯末端配电
百望云入选“2022北京民营企业科技创新百强”
年度资料片“横刀断浪”首曝《剑网3》十三周年发布
年度资料片“横刀断浪”首曝《剑网3》十三周年发布
预定爆款!智慧先锋科技+领潮先锋造型,打造瑞虎7 P
线与线的不同!罗格朗带您了解数据中心综合布线
积极投身数字党校建设,罗格朗共拓绿色高效园区
硬核知识 | 罗格朗如何提高数据中心配电效率?
山特 ARRAY® 3A3 PT 系列UPS 硬核集结,各显“特”长
聚焦数字新基建,看数据中心如何绿色高质量发展
山特灵霄系列 PT3000 UPS 斩获 2022 iF 国际设计大奖
伊顿宣布购入江苏辉能电气有限公司断路器业务 50%
安谋中国主要股东宣布公司的治理问题已经得到解决
智汇山特,助力城市地铁安全出行
伊顿 E-Cube 3.0 微模块重磅升级,构建数据中心崭新蓝图
看山特“处方”如何“治愈”医疗信息化建设中的“顽
“毫秒”来电 | 看克莱沃ATS电源自动切换器,如何玩
微盛·企微管家再获3亿元融资,继续领跑企业微信SCR
末端配电新航道!罗格朗携数字配电助金融行业乘风破
只为突破而来,山特城堡 UPS 3C3 HD 20-80kVA 重磅登陆
如何为高精密检测仪器找“标配”?来看武汉理工大学
罗格朗助力德赛西威,安全运营智慧工业园区
为电而生,向蜀前行——克莱沃MPDU助力四川电力
教育新基建按下加速键,山特赋能未来教育正当时
助攻中大型数据中心转型,看山特如何与“大象”共舞
山特助攻数据中心,闯关发改委红线下的“大考”
微盛参加腾讯数字大会,再次获奖并进行主题演讲
小熊电器2021年前三季度实现营收23.65亿元
上海银行实现营收414.56亿元 富安娜营收约为19.89亿元
2021年前三季度珀莱雅营收30.12亿元 太阳纸业营收2
2021年前三季度中顺洁柔营收62.75亿元 尚品宅配营
2021年前三季度欧派家居营收约为144.02亿元 广州浪奇
大亚圣象2021年第三季度实现营业收入约为25.73亿元
红豆股份2021年前三季度实现营业收入16.19亿元
可口可乐2021年第三季度净营收100.42亿美元
坚朗五金2021年前三季度实现营收约为59.66亿元
2021年前三季度喜临门营收约50.43亿元 欧派家居营
今年前三季度宁德时代净利润为77.51亿元 顾家家居营
今年前三季度吉祥航空营业净收入约91.29亿元 丽
今年前三季度宜华健康营收约10.19亿元 百奥泰营
今年前三季度温氏股份营收约为465.69亿元 常宝股份
今年前三季度国际医学营收约20.49亿元 口子窖实现
前三季度青岛食品实现营收为3.12亿元 有友食品实现
前三季度老白干酒实现营收27.69亿元 星辉娱乐营收
前三季度千禾味业实现营业收入13.56亿元 安正时尚
2021年前三季度中国平安科技业务总收入732.27亿元
前三季度东鹏饮料实现营收约55.6亿元 水星家纺营收
山特研发中心实验室获得国家CNAS 权威认证
保利威:成为职教细分赛道引领者,润德教育、优路教
头部职业教育机构共同选择,保利威直播打造全新OMO
云计算漫谈 | 面向计算优化的计算云
以融合之势,突破困局 | 极道Achelous统一计算系统,
租用高防服务器应该选择几G才算好呢?
科普传授知识,画笔承载梦想,康师傅点燃青少年航天
庆贺天和核心舱发射成功,康师傅航天科普展武汉再出
庆贺天和核心舱发射成功,康师傅航天科普展武汉再出
山特全国技术培训中心落户武汉,让未来有“技”可施
*ST宏图2021一季度经营持平,转型初见成效
游戏盾的防护原理是什么?
蛋糕都吃了,挨骂的却只有元气森林?
大火的“元气森林”到底动了谁的蛋糕?
打破笔记本充电功率僵局 倍思全新100W QC5氮化镓充电
Mine Capital正式成立首期数千万美元区块链专项天使
关注消费者智能用车需求提升,东风风光扩大自主品牌

关键词:

大家还在看