24
03月 2025
Meta AI与加州大学伯克利分校合作推出SWEET-RL强化学习框架
Meta AI与加州大学伯克利分校近日联合推出了一款名为SWEET-RL的强化学习框架,并发布了CollaborativeAgentBench(ColBench)基准测试。这一创新旨在提升大语言模型(LLMs)在多轮人机协作任务中的表现,特别是在后端编程和前端设计领域。SWEET-RL通过逐轮优化决策,显著提高了模型的任务完成率。其采用非对...

扫一扫关注微信