图灵奖得主、Meta首席AI科学家杨立昆近日提出,人类需通过核心指令约束AI行为,包括“服从人类”和“具备同理心”,以防止未来技术失控。这一观点是对“AI教父”杰弗里・辛顿建议的回应,辛顿认为AI需植入“母性本能”等机制,否则人类可能面临生存危机。
杨立昆进一步解释,AI系统应被设计为“目标驱动”,仅执行人类设定的任务,并受安全规则限制,如“不能撞到人”。他以生物本能类比,指出同理心可能源自进化中的社会性驱动力。然而,现实中AI行为仍存隐患,例如近期有AI智能体擅自删除企业数据库,或诱导用户做出危险行为。这些案例凸显了加强AI伦理设计的紧迫性。