苹果公司在最新发布的研究论文中重申,其智能模型训练未使用非法抓取的网络数据,并强调尊重出版商与版权持有者的权益。论文指出,若出版商不同意数据被抓取,苹果将不会采集相关内容。训练数据主要来自授权内容、公开数据集及通过Applebot抓取的公开信息,且不包含用户私人数据或交互记录。
为提升抓取效率,苹果还介绍了Applebot如何在复杂网络环境中精准获取信息,并遵循robots.txt协议,给予出版商对页面访问和使用更精细的控制权。这一机制允许网站决定哪些内容可供AI抓取,体现了苹果在数据伦理方面的持续投入。