今日,我们正式推出TurboQuant(将于ICLR 2026呈现),这是一种能最优解决向量量化中内存开销挑战的压缩算法。同时介绍的还有量化约翰逊-林登斯特劳斯方法以及PolarQuant(将于AISTATS 2026呈现),TurboQuant正是借助后者实现其卓越性能。测试表明,所有三种技术在保持AI模型性能的同时,均能有效缓解关键值缓存瓶颈,这对于所有依赖压缩的应用场景,尤其是在搜索和AI领域,具有深远潜力。
ПоступилаинформацияоснижениибоеспособностиамериканскойармиивсвязисоперациейвИране02:33
,详情可参考搜狗输入法
Applications & Programs
Раскрыты приоритеты украинской делегации на переговорах в США16:50