英特尔面向中国市场发布全新Gaudi2处理器,携手合作伙伴加速大规模深度学习训练与推理
7月11日,英特英特尔AI产品战略暨Gaudi2新品发布会在京举行 。尔面会上,向中新G学习训练英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana® Gaudi®2。国市规模作为英特尔从云到端产品组合的场发处理重要组成,Gaudi2致力于以领先的布全伴加性价比优势,加速AI训练及推理,器携为中国用户提供更高的手合速大深度深度学习性能和效率 ,从而成为大规模部署AI的作伙更优解 。

英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示,推理英特尔致力于通过为客户提供广泛的英特硬件选择 ,并支持开放的免费模板尔面软件环境 ,加速人工智能技术的向中新G学习训练发展。凭借包括至强可扩展处理器和Gaudi2深度学习加速器在内的国市规模产品组合 ,英特尔正在降低人工智能的场发处理准入门槛 ,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力 ,从而帮助构建中国人工智能的未来 。
为深度学习而生的全新Gaudi2训练加速器
该Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B ,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。亿华云该加速器具备:
● 24个可编程Tensor处理器核心(TPCs)
● 21个100Gbps(RoCEv2)以太网接口
● 96GB HBM2E内存容量
● 2.4TB/秒的总内存带宽
● 48MB片上SRAM
● 集成多媒体处理引擎

Habana® Gaudi®2深度学习加速器
Gaudi2加速器的出色性能在6月公布的MLCommons®MLPerf®基准测试1中得到了充分认证,其在GPT-3模型 、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果 。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,云计算降低运营成本 。
此外 ,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能 。在最近的Hugging Face评估中 ,其在大规模推理方面的表现,包括在运行Stable Diffusion2(另一个用于从文本生成图像的最先进生成式AI模型之一) 、70亿以及1760亿参数BLOOMz3模型时,在行业内保持领先 。
满足大语言和多模态模型的需求
Gaudi2深度学习加速器的架构旨在高效扩展,香港云服务器以满足大规模语言模型及生成式AI模型的需求。其每张芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA)以太网接口,从而实现低延迟服务器内扩展。
在Stable Diffusion训练上 ,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性 。此外,MLCommons刚刚公布的MLPerf训练3.0结果4 ,亦验证了Gaudi2处理器在1750亿参数的GPT-3模型上,从256个加速器到384个加速器可实现令人印象深刻的接近线性的95%扩展效果。模板下载
具备成熟的软件支持,Gaudi2产品在中国市场正式上市
伴随日益增长的生成式AI及大语言模型需求 ,英特尔亦致力于打造领先、成熟的软件支持,充分释放Gaudi2深度学习加速器性能。
为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi2服务器 ,并帮助保护软件开发投入,SynapseAI®软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起 ,帮助简化模型的服务器租用开发和迁移 。SynapseAI集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型 ,能够满足深度学习开发者的多样化需求。
目前,英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B ,还包含双路第四代英特尔至强可扩展处理器 。

基于Gaudi2加速器的浪潮NF5698G7服务器
携手中国产业生态 ,共启人工智能新篇
多年来 ,借助强大的AI软硬件基础 ,英特尔一直致力于为AI领域的各类工作负载提供业界领先的卓越性能 ,并通过开放的生态 、丰富多样的产品选择不断降低AI部署的门槛 ,并为中国的AI发展提供坚定支持。
本次发布会上,百度与浪潮信息等生态伙伴分别分享了其基于英特尔软硬件产品组合的多样化智能业务进展。百度智能云服务器高级经理何永占表示 ,集成英特尔®AMX加速引擎的第四代英特尔®至强®可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化,百度将持续构建领先的AI全栈能力和全面的开放生态 ,并期待与英特尔在未来的AI领域展开更为广泛 、深入的合作 。
浪潮信息高级产品经理王磊强调,NF5698G7是专为面向生成式AI市场创新开发的新一代AI服务器,支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展 、高能效和开放生态等优点 ,将为AI客户提供强大的大模型训练和推理能力 。未来,浪潮信息将继续携手英特尔 ,为行业打造创新、领先的产品方案 。
此外,多家本土生态伙伴亦表明了与英特尔在当下及未来产品合作上的坚定立场与长远展望。新华三集团计算存储产品线副总裁刘宏程指出,新华三智慧计算秉持内生智能的技术理念 ,基于硬件使能、前瞻技术、绿色低碳等全方位能力 ,助力AI产业的高速发展 。基于英特尔Gaudi2 AI加速器,新华三正与英特尔紧密合作,开发适合大模型训练和推理的高性能AI服务器,推动智能算力的普惠创新。
与此同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明表示 ,非常荣幸见证英特尔Gaudi2的发布 。作为英特尔的长期战略合作伙伴 ,超聚变将一如既往地携手英特尔,共同推出基于Gaudi2的全新产品与解决方案,助力企业的AI场景成熟商用和规模落地。
未来,英特尔将持续引领产品技术发展 ,进一步加速大规模深度学习部署 ,助力中国本地AI市场发展。
相关文章
译者|陈峻审校|孙淑娟多年以来,我们最为熟悉的身份验证方式,莫过于用户名和密码这对组合了。但是,即使您已经养成了非常良好的密码设置与使用习惯,密码也始终是一种安全隐患。道理其实很简单,首先,我们人类本2025-12-07
随着去中心化金融DeFi)和区块链技术的不断发展,智能合约安全的重要性愈发凸显。在此背景下,开放网络应用安全项目OWASP)发布了备受期待的《2025年智能合约十大漏洞》报告。这份最新报告反映了不断演2025-12-07
Tor是一种流行的隐私工具和暗网浏览器,通过将用户的互联网流量在全球多个计算机节点即"中继")之间反复转发,使得外界难以追踪到流量的来源。十年前得益于斯诺登的大力推荐,Tor迅速成为活动人士、记者等职2025-12-07
一、漏洞管理的新挑战现代漏洞管理已从简单的勾选框任务演变为需要实时可视化、风险优先级排序和自动化处理的系统工程。当前IT环境具有高度动态性,攻击者的进化速度与防御措施同步提升。若仍依赖传统工具和策略,2025-12-07
inforisktoday网站消息,德国警方表示,在历时2年的调查后,他们逮捕了该国最大的网络犯罪地下市场之一的幕后操纵者,并查封了其网站域名。上周,杜塞尔多夫的执法部门宣布,他们已经成功关闭了Cri2025-12-07
Google AI 安全框架 SAIF详解:六大核心要素与风险地图一览
随着人工智能技术的快速发展与安全威胁的持续演变,大规模保护人工智能系统、应用及用户所面临的挑战,不仅要求开发者掌握已有的安全编码最佳实践,还需深入理解人工智能特有的隐私与安全风险。在此背景下,Goog2025-12-07

最新评论