面向企业私有化大模型部署需求,国产 AI 芯片厂商发布新一代推理服务器方案,支持文本生成、知识库问答和视觉理解等任务。
该方案在混合精度计算、显存利用率和节点扩展方面进行优化,可帮助企业在保障数据安全的前提下降低算力成本。
多家行业集成商表示,推理基础设施的成熟将进一步促进大模型在政企场景中的落地。
面向企业私有化大模型部署需求,国产 AI 芯片厂商发布新一代推理服务器方案,支持文本生成、知识库问答和视觉理解等任务。
该方案在混合精度计算、显存利用率和节点扩展方面进行优化,可帮助企业在保障数据安全的前提下降低算力成本。
多家行业集成商表示,推理基础设施的成熟将进一步促进大模型在政企场景中的落地。