全场景AI部署更高效，英特尔锐炫多卡方案亮相2025湾芯展_南方+

2025湾区半导体产业生态博览会（即2025湾芯展）在深圳举办期间。10月16日，AI芯片与智算产业发展高峰论坛在展会举行，英特尔中国区显卡和AI高级产品总监徐金平通过主旨演讲重点介绍了英特尔锐炫多卡方案。

在AI时代，企业机遇与挑战并存。一方面大模型规模化商用进展突飞猛进，蕴藏的机遇近在咫尺。另一方面无论是海量图像、文本、音视频数据的处理，还是复杂精细化AI模型的部署等等，都给传统算力架构的性能和能耗带来了挑战。

如何将AI潜力有效地转化为实际生产力？英特尔锐炫多卡方案希望凭借灵活的扩展能力，不仅高效承接多模态数据的密集型计算需求，又能降低企业AI部署的成本与复杂度，为AI的大规模、普惠化落地筑牢支撑。

作为方案的核心硬件，英特尔锐炫Pro B60 GPU凭借24GB的大显存和456GB/s的高内存带宽，满足了AI推理对显存容量的迫切需求，让大参数模型流畅运行，让海量数据高效吞吐，197 TOPS的峰值算力则为各类复杂AI推理任务提供动力。

徐金平介绍，B60主要用于推理工作站，英特尔对其做了一些AI的性能测试，例如Windows PC上单卡场景中就测了10个模型。“我们对比的产品是RTX2000和5060Ti，在相对小的14B-int4模型上，B60比RTX2000有比较明显的提升，稍微落后于5060Ti，这是与SPEC相符的。后面的9个模型我们都是领先的。”

英特尔锐炫Pro B60 GPU的另一亮点是支持多显卡协同工作，考虑到边缘端和服务器等更广泛应用场景的需求，通过多卡互联方案Battlematrix（战斗阵列）推理工作站平台，最多可搭载8张英特尔锐炫Pro B60 GPU，显存最高可达192GB；若采用特殊的“一卡双芯”方案，则最多可支持16颗GPU芯片，显存总量可达384GB，其支持100B+参数模型，可顺畅处理大规模数据集与复杂模型等任务，契合企业对“高算力+大显存+成本效益”的多重诉求。

据介绍，在实际应用中，英特尔工程师团队借助该方案，将原本需数天完成的代码修复全流程缩短至数小时，充分验证了多卡互联方案在复杂任务处理中的高效与可靠。

以英特尔锐炫Pro B60和锐炫多卡解决方案为核心，英特尔也为个人和边缘侧轻量级AI推理、通用工作站及服务器、专用AI服务器等不同场景的AI部署，提供了灵活的产品形态选择，从个人电脑、边缘设备，到通用工作站/服务器乃至专用AI服务器，都能找到与之匹配的高效且具备成本优势的部署方案。徐金平表示，B60产品可以支持多种形态整机的产品形态，也能支持全场景广泛的模型规模，是企业架构下的“甜点”GPU。

今年，英特尔已经推出了英特尔锐炫多卡AI算力一体机方案，而基于英特尔锐炫Pro B系列的多卡方案的到来，进一步丰富了英特尔支持AI大模型部署的硬件形态。在AI快速迭代的当下，英特尔强调的是软硬结合的综合价值，将通过底层硬件创新与开放软件生态，让AI部署更普惠、更便捷。

南方+记者葛政涵郜小平

南方日报、南方+客户端原创，未经授权不得转载

编辑　刘静

订阅后可查看全文(剩余80%)