2026年6月24日,日本东京,富士通公司正式发布新型PHOTON(自上而下网络并行分层计算)架构。该架构针对多查询场景优化,最高实现主流Transformer模型475倍性能提升。PHOTON通过语义层级划分替代词元级处理,降低计算复杂度与KV Cache占用,提升GPU利用率及迭代吞吐量。其多数表决或最优选择机制使最终决策仅需一次推理。测试覆盖600M至1.2B参数模型,兼顾效率与可控质量下降。此举旨在降低智能体系统等多I/O任务的硬件成本。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信