英特尔发布Project Battlematrix推理工作站软件更新

休闲 2025-08-28 05:08:31 624787

英特尔发布Project Battlematrix（战斗阵列）推理工作站软件更新，英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。

今年5月，工作英特尔发布了代号为Project Battlematrix（战斗阵列）的站软推理工作站。推理工作站具有广阔的英特发展前景，主要表现在：一是推理安全部署，数据可在本地进行处理；二是工作易于设置，将所有软件置于容器中，站软提供一站式解决方案；三是英特易扩展，可灵活配置不同数量的推理显卡；四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU，工作提供高达192GB的站软VRAM，运行高达1500亿参数的英特中等规模且精度高的AI模型。

英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部，工作对大语言模型进行了大量的优化，包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈，Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署，加速英特尔GPU和AI战略的落实。

全新的软件栈在设计时充分考虑了易用性和行业标准，是专为Linux环境构建的容器化解决方案。经过优化，该方案能够借助多GPU扩展和PCIe P2P数据传输，带来卓越的推理性能。与此同时，该方案还具备企业级的可靠性和可管理性，如ECC、SRIOV、遥测和远程固件更新等。

LLM Scaler容器1.0版本对于前期客户支持至关重要，英特尔进行了以下更新：

vLLM：

·针对长输入长度（>4K）的TPOP性能优化：在32B KPI模型上，40K序列长度的性能提升高达1.8倍；在70B KPI模型上，40K序列长度的性能提升高达4.2倍

·与上一版本相比，8B-32B KPI模型的输出吞吐量性能优化约10%

·逐层在线量化，减少所需的GPU内存

·支持vLLM中的PP（流水线并行）（实验性）

·支持torch.compile（实验性）

·推测解码（实验性）

·支持嵌入和重排序模型

·增强的多模态模型支持

·最大长度自动检测

·数据并行支持

OneCCL基准测试工具支持

XPU Manager：

·GPU功耗

·GPU固件更新

·GPU诊断

·GPU内存带宽

英特尔表示此版本将按照5月初发布时公开的时间表顺利交付，并计划在第三季度末发布功能更全面的强化版LLM Scaler，同时积极争取在第四季度发布完整版本。

本文地址：http://m.ujsvaever.xyz/html/04f299966.html

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

上一篇阳光肺康一生肺癌复发险在哪里买？附阳光肺康一生最新保费标准

下一篇快讯：在线教育盘初快速拉升高乐股份大涨6%

评论列表

天下國際週報：疫情結束後，通膨就來了？｜天下雜誌回复

一場疫情重創全球經濟，也可能因此終結長達多年的低通膨時代。摩根史坦利分析師和部份經濟學家提出警告，疫後全球將面臨通膨上漲的壓力。這些經濟學家的預言，真的有可能發生嗎？您的閱讀篇數已達上限立刻訂閱全閱讀
2025-08-28 04:17

长三角四地跨区域抽查旅游业回复

ze: 14px; line-height: 28px;">安徽日报讯记者张敬波）记者10月16日从宣城市市场监管局获悉，为进一步加强跨区域、跨部门信用监管，维护公平有序的市场环境，切实减少执法频次
2025-08-28 03:11

第四批高值医用耗材国家集采开标回复

ze: 14px; line-height: 28px;">据新华社天津11月30日电记者彭韵佳张建新）第四批国家组织高值医用耗材集采30日在天津开标，并产生拟中选结果。此次集采覆盖人工晶体、运动
2025-08-28 02:37

全国累计创建1766个节水型社会建设达标县（区）回复

ze: 14px; line-height: 28px;">《人民日报》 2023年10月17日第 15 版）本报北京10月16日电记者王浩）近日，水利部公布第六批节水型社会建设达标县区）名单
2025-08-28 02:37

留言评论取消回复