最新最快科技资讯
太阳能光伏网

Yandex研究人员推出两种创新LLM压缩方法,可让模型体积缩小8倍

近日,在Yandex Research、IST Austria、Neural Magic和KAUST的共同努力下,两种创新的大型语言模型(LLM)压缩方法——加性量化语言模型(Additive Quantization for Language Models, AQLM)和PV-Tuning正式发布。

这两种方法可以将模型大小减少多达8倍,同时保留95%的响应质量。这项研究成果已经于正在维也纳举行的国际机器学习会议(International Conference on Machine Learning, ICML)上展示。

最新相关

三晖电气战略投资小理家机器人

6月21日电 ,三晖电气(股票代码: 002857)宣布已完成对小理家机器人的战略投资。小理家是国内智能理疗机器人领域的先行者,在商用领域实现商业闭环。此次投资由三晖电气独家完成,投资后其成为小...