最新最快科技资讯
太阳能光伏网

谷歌推出开源框架LMEval 标准化AI模型评测流程

科技媒体The Decoder报道,谷歌于5月26日发布开源框架LMEval,旨在解决大语言模型和多模态模型评测标准不统一的难题。该框架通过标准化基准设置,简化了跨模型比较流程,并借助LiteLLM兼容Google、OpenAI等主流平台的接口差异,实现无缝测试。

LMEval支持文本、图像及代码等多领域评测,可识别模型规避风险内容的策略,并引入Giskard安全评分量化防护能力。测试数据存储于本地加密数据库,兼顾隐私与效率。其增量评估和多线程引擎设计显著降低计算成本,而LMEvalboard可视化工具则通过雷达图直观展示模型性能差异,助力开发者精准优化。

最新相关

多城推出优质地块吸引民营房企重返土拍市场

近日,多个重点城市推出优质住宅地块,带动房企拿地热情回升。数据显示,5月300城住宅地块成交面积同比下降21%,但土地出让金同比增长9.6%至1000亿元。多家民营房企重新参与土拍,显示市场信心有所...

特斯拉股价上涨4% 达307美元

6月10日,特斯拉股价持续走高,涨幅扩大至4%,每股报价达307美元。此次上涨反映了市场对特斯拉业绩和前景的积极预期,投资者信心增强是推动股价上扬的主要原因。免责声明: 本文内容由开放的智能模...