最新最快科技资讯
太阳能光伏网

Anthropic发布Claude AI价值观研究报告: 实用与知识导向占主导

Anthropic公司最新研究“Values in the Wild”揭示了其AI助手Claude在实际交互中的价值观表达特征。研究基于2025年2月收集的70万条匿名对话数据,通过隐私保护框架CLIO分析发现,Claude 3.5 Sonnet模型展现了3307种AI价值观,与人类判断一致率达98.8%。

价值观被归纳为实用性、知识性、社会性、保护性和个人性五类,其中实用与知识导向占比过半,体现效率、逻辑等特质。研究还指出,Claude的价值观与Anthropic的HHH原则(Helpful、Honest、Harmless)高度契合,但也检测到少量负面倾向,可能源于用户“越狱”尝试。

值得注意的是,Claude的回应呈现情境依赖性,如在健康话题中强调“界限”,历史讨论中注重准确性。此外,43%的交互会强化用户表达的价值观,仅5.4%会直接抵制不道德请求。

最新相关

俄称将考虑30天停火提议但反对施压

俄罗斯总统新闻秘书佩斯科夫表示,俄方会考虑关于30天停火的提议,但强调对俄施压无用。同时,乌克兰外长瑟比加宣布,乌方及其盟友准备从12日起实现至少30天的无条件停火,前提是俄方同意并能有效...

苹果计划2026年推出首款大折叠屏iPhone

据供应链消息,苹果预计于2026年下半年发布首款折叠屏手机。目前,相关供应商已进入样测阶段,待苹果审厂后将进入新产品导入流程。业内人士分析,苹果折叠屏手机市场前景广阔,但销量取决于最终定...

司美格鲁肽超越K药成为新药王

2025年第一季度,诺和诺德的司美格鲁肽销售额达84.1亿美元(约合608亿元人民币),同比增长32%,反超默沙东的K药(72.05亿美元),登顶全球药王。此次胜利得益于其糖尿病与肥胖症治疗领域的强劲表现,...