涨粉点赞播放量 · 直播间人气

支持:抖音,快手,小红书,视频号,微博,B站,西瓜,头条,公众号,淘宝,闲鱼,百家号等各类自媒体平台。

进入网红商城

快手AI平台算法负责人团队近期开源了哪些AI算法项目?

更新时间:2026-06-04 03:50:43点击:

在人工智能技术日新月异的今天,快手AI平台算法负责人团队凭借其深厚的技术积累和前瞻性的战略眼光,近期开源了一系列具有里程碑意义的AI算法项目,不仅为学术界提供了宝贵的研究资源,更为工业界带来了前所未有的创新动力。本文将深入剖析快手AI团队近期开源的三大核心项目:SRPO强化学习算法、KAT自动思考模型以及Keye-VL-1.5多模态大模型,探讨它们如何共同推动AI技术的边界。

SRPO:高效强化学习的新篇章

在强化学习领域,训练成本高、效率低一直是制约技术发展的瓶颈。快手Kwaipilot团队提出的SRPO(历史重采样策略优化)方法,以其创新的两阶段训练范式,成功打破了这一僵局。SRPO方法通过历史重采样策略,有效降低了训练过程中的方差,使得模型在保持高性能的同时,训练成本大幅降低。实验数据显示,SRPO仅需GRPO的十分之一训练成本,便能在数学与代码双领域基准测试中取得显著突破,特别是在AIME2024和LiveCodeBench测试中,分别取得了50和41.6的高分,超越了DeepSeek-R1-Zero-32B的表现。

SRPO的成功,不仅在于其高效的训练策略,更在于其对数学与编程响应长度冲突问题的巧妙解决。通过纯强化学习训练,SRPO模型在处理不同任务时,能够始终提供详细的思考过程,并在训练中后期展现出强大的自我反思能力,实现自我纠错,展现出更广泛的问题解决能力。这一创新技术的开源,无疑为强化学习领域的研究者提供了新的思路和工具。

KAT:让AI学会自动思考

在AI领域,如何让模型在面对复杂问题时,能够像人类一样进行深度思考,一直是研究者们追求的目标。快手AI团队推出的KAT(Kwaipilot-AutoThink)自动思考模型,正是这一目标的生动实践。KAT模型通过学会判断何时生成显式推理链与何时直接回答,有效缓解了过度思考问题,实现了推理与直接回答的智能切换。

KAT模型的发展遵循简洁的两阶段训练流程:预训练阶段通过注入知识并分离“推理”与“直接回答”能力,使基础模型具备强大的事实和推理技能;后训练阶段则通过冷启动自动思考和Step-SRPO技术,使模型能够根据任务需求智能选择思考模式,减少不必要的推理过程,提高推理效率。KAT模型在专为防止数据泄露设计的挑战性基准测试LiveCodeBench Pro中位列所有开源模型榜首,甚至超越了Seed和o3-mini等强大的专有系统,充分证明了其卓越的性能和实用性。

Keye-VL-1.5:多模态理解的新标杆

随着短视频和直播的兴起,多模态理解技术的重要性日益凸显。快手开源的Keye-VL-1.5多模态大模型,以其80亿参数和128k tokens扩展上下文的能力,在视频理解、图像理解和推理方面展现出了非凡的实力。在Video-MME、Video-MMMU、TempCompass等一系列权威的公共视频基准测试中,Keye-VL-1.5在同等规模模型中取得了SOTA(最佳表现),赶超了阿里Qwen2.5-VL 8B、小米MiMo-VL 7B-RL等优秀模型。

Keye-VL-1.5的核心优势在于其对视频内容的准确理解。通过慢-快视频编码策略,该模型有效解决了时空权衡问题,能够捕捉视频中的细节与时间逻辑,实现对长视频与复杂语义的深度理解。这一能力使得Keye-VL-1.5在视频推荐、创作、互动以及内容审核和商业化全链条中展现出巨大的应用潜力。无论是自动生成吸睛标题、智能剪辑精彩片段,还是实时互动解说,Keye-VL-1.5都能游刃有余地应对,为短视频生态注入了前所未有的可能性。

结语

快手AI平台算法负责人团队近期开源的SRPO、KAT和Keye-VL-1.5三大项目,不仅展示了快手在AI技术领域的深厚积累和创新能力,更为整个AI社区带来了宝贵的资源和灵感。随着这些技术的不断演进和应用,我们有理由相信,快手将继续在AI领域发挥引领作用,推动人工智能技术的边界不断拓展,为人类社会带来更多惊喜和改变。

推荐文章