全场景AI部署更高效,英特尔锐炫多卡方案亮相2025湾芯展

作者 葛政涵;郜小平 2025-10-17 17:32

2025湾区半导体产业生态博览会(即2025湾芯展)在深圳举办期间。10月16日,AI芯片与智算产业发展高峰论坛在展会举行,英特尔中国区显卡和AI高级产品总监徐金平通过主旨演讲重点介绍了英特尔锐炫多卡方案。

在AI时代,企业机遇与挑战并存。一方面大模型规模化商用进展突飞猛进,蕴藏的机遇近在咫尺。另一方面无论是海量图像、文本、音视频数据的处理,还是复杂精细化AI模型的部署等等,都给传统算力架构的性能和能耗带来了挑战。

如何将AI潜力有效地转化为实际生产力?英特尔锐炫多卡方案希望凭借灵活的扩展能力,不仅高效承接多模态数据的密集型计算需求,又能降低企业AI部署的成本与复杂度,为AI的大规模、普惠化落地筑牢支撑。

作为方案的核心硬件,英特尔锐炫Pro B60 GPU凭借24GB的大显存和456GB/s的高内存带宽,满足了AI推理对显存容量的迫切需求,让大参数模型流畅运行,让海量数据高效吞吐,197 TOPS的峰值算力则为各类复杂AI推理任务提供动力。

徐金平介绍,B60主要用于推理工作站,英特尔对其做了一些AI的性能测试,例如Windows PC上单卡场景中就测了10个模型。“我们对比的产品是RTX2000和5060Ti,在相对小的14B-int4模型上,B60比RTX2000有比较明显的提升,稍微落后于5060Ti,这是与SPEC相符的。后面的9个模型我们都是领先的。”

英特尔锐炫Pro B60 GPU的另一亮点是支持多显卡协同工作,考虑到边缘端和服务器等更广泛应用场景的需求,通过多卡互联方案Battlematrix(战斗阵列)推理工作站平台,最多可搭载8张英特尔锐炫Pro B60 GPU,显存最高可达192GB;若采用特殊的“一卡双芯”方案,则最多可支持16颗GPU芯片,显存总量可达384GB,其支持100B+参数模型,可顺畅处理大规模数据集与复杂模型等任务,契合企业对“高算力+大显存+成本效益”的多重诉求。

据介绍,在实际应用中,英特尔工程师团队借助该方案,将原本需数天完成的代码修复全流程缩短至数小时,充分验证了多卡互联方案在复杂任务处理中的高效与可靠。

以英特尔锐炫Pro B60和锐炫多卡解决方案为核心,英特尔也为个人和边缘侧轻量级AI推理、通用工作站及服务器、专用AI服务器等不同场景的AI部署,提供了灵活的产品形态选择,从个人电脑、边缘设备,到通用工作站/服务器乃至专用AI服务器,都能找到与之匹配的高效且具备成本优势的部署方案。徐金平表示,B60产品可以支持多种形态整机的产品形态,也能支持全场景广泛的模型规模,是企业架构下的“甜点”GPU。

今年,英特尔已经推出了英特尔锐炫多卡AI算力一体机方案,而基于英特尔锐炫Pro B系列的多卡方案的到来,进一步丰富了英特尔支持AI大模型部署的硬件形态。在AI快速迭代的当下,英特尔强调的是软硬结合的综合价值,将通过底层硬件创新与开放软件生态,让AI部署更普惠、更便捷。

南方+记者 葛政涵 郜小平

编辑 刘静

订阅后可查看全文(剩余80%)

手机扫码打开本网页
扫码下载南方+客户端