伊朗发动“真实承诺4”第93波攻势科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文_蜘蛛资讯网
过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模 A800 集群从 20% 提升到 90%,解决了智能体长上下文在国产芯片训练慢的难题。在智能体强化学习训练场景,星火 X2-Flash 通过上述的算法创新 + 工程创新,大幅提升了采样推理效率,相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破,一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL 当前文章:http://3o7hxc.qetanshu.cn/4saw/1wz.html 发布时间:06:37:11 |

