随着人工智能技术在编程领域的深入应用,JetBrains近日宣布推出业内首个开放式基准测试平台DPAI Arena。该平台采用多语言、多框架架构,能对代码修补、错误修复、PR审查等各类工作流进行标准化评估。
针对当前AI编码工具测试数据集过时、技术覆盖狭窄的现状,DPAI Arena通过灵活的路径架构实现公平可重现的测试比较。平台首项基准Spring Benchmark已确立数据集创建准则和评估标准,支持开发者采用自有数据集进行定制化测试。
据悉,JetBrains计划将该项目捐赠给Linux基金会,通过建立多元技术指导委员会推动平台持续发展。这一举措将有助于建立行业统一标准,客观衡量AI工具对开发效率的实际提升。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信