【2025年7月28日,上海】在2025全国东谈主工智能大会(WAIC)“智算云启,共绘生态”论坛上,上海仪电(集团)有限公司(以下简称“上海仪电”)伙同上海曦智科技有限公司(以下简称“曦智科技”)、上海壁仞科技股份有限公司(以下简称“壁仞科技”)、中兴通讯股份有限公司(以下简称“中兴通讯”),庄重发布国内首个光互连光交换GPU超节点——光跃LightSphere X。该超节点基于曦智科技公共创举的隔离式光交换技巧,罗致硅光技巧的光互连光交换芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连,并搭载中兴通讯高性能AI国产就业器及仪电智算云平台软件,构建起高带宽、低蔓延、活泼可膨胀的自主可控智算集群新范式,行将于上海仪电智算中心落地。
光跃LightSphere X发布庆典现场
窜改技巧直击算力与收集核肉痛点
万亿参数大模子与多模态查验的崛起,正股东算力集群迈入“万卡协同”期间。超节点架构通过深度整合GPU资源,在超节点内构建起低蔓延、高带宽的调治算力实体,已成为撑握这一演进的要津技巧旅途。
现时业界一种常见决策是通过提高单机柜功耗来部署更多GPU,但受限于数据中心单机柜的功耗天花板,单机柜GPU密度提高存在瓶颈。对此,光跃LightSphere X罗致光互连技巧,通过加多机柜数目构建超节点,冲破传统互连神色下超节点的物理扬弃。比拟铜缆,光缆的远距离传输上风可完毕委用与机柜解耦,其中枢价值在于:冲破单机柜功耗料理,支握万卡级弹性膨胀,兼容现存机房门径缩小部署老本,并可按算力需求动态治疗超节点规模,完毕分阶段竖立。
同期,光跃LightSphere X公共创举的隔离式光交换(dOCS,distributed Optical Circuit Switch)技巧则进一步提高了超节点的活泼度和系统可膨胀性,从而达到提高系统性价比的想法。不同于传统的麇集式交换,其通过在每个GPU上集成光交换功能,活泼切换GPU间互连拓扑结构。这不仅可完毕故障场景下的拓扑及时重构,提盛大模子训推性能,缩小GPU冗余老本,还能按模子算力需求动态治疗超节点规模,切换拓扑收集。此外,隔离式盘算推算支握GPU高带宽通讯域弹性膨胀。光跃LightSphere X将完毕2千卡规模部署。
收成于多猜测芯粒(Chiplet)与CoWoS 2.5D封装协同盘算推算的GPU模组,光跃LightSphere X领有矫捷算力。该模组基于自主原创架构大算力(单卡1P级)通用GPU液冷模组,极地面增强了集群训推性能。通过自主研发智算云平台软件活泼成就超节点收集拓扑,支握密集通讯和更大TP&EP,高效得当多样大模子需求,大幅提高节点的可膨胀性。OCS UBB罗致创举的纠正载板盘算推算,超低损板材多层架构,互联拓扑丰富活泼。该训推一体架构可动态分拨猜测资源,既闲散千亿参数大模子查验的高模糊需求,又保险推理任务的低时延反应。
光跃LightSphere X的表层软件平台雷同值得平和。其智算集群调治措置平台通过深度交融转换引擎与训推框架,完毕了对超节点全生命周期的智能管控。智算平台简略依据不同模子特征,进行超节点拓扑智能成就,权贵提高查验性能;基于全局资源可不雅测体系,完毕故障节点秒级替换与分钟级断点续训,保险模子长稳启动。此外,通过软硬协同的系统级工程优化,进一步开释了超节点在性能和后果等方面的详尽潜能。
盛开、自主可控生态打造中国智算基础门径新基座
除了单点技巧窜改,光跃LightSphere X还进一步聚焦构建全栈自主的智算生态,为中国算力基础门径筑牢根基,为中国东谈主工智能发展提供强劲能源。
硬件层盛开兼容:光交换技巧不依赖于特定的数据传输合同,可无缝兼容不同厂商使用的互连合同,搁置生态锁闭风险;
冲破中枢器件与供应链瓶颈:隔离式光交换芯片基于硅光技巧,其盘算推算与制造不依赖于先进半导体工艺节点;
全栈软件自主:自研调治措置平台完毕从转换、容灾到优化的全链路管控。
这套“盛开合同+自主技巧+自研软件”的协同体系,真的完毕了从技巧到生态的自主可控闭环。
上海仪电示意,光跃LightSphere X依托上海仪电算力底座,麇集国内智算领域头部企业,共建了“光芯片—GPU—就业器—算力集群—智算云平台”闭环,打造了盛开分享的光电交融算力生态体系。将来,光跃LightSphere X将算作新一代智算集群中枢架构,撑握全栈自主可控的国产算力池竖立,助力中国AI算力基础门径完毕跨代发展。