快手AI平台算法负责人团队近期开源了哪些AI算法项目？

更新时间：2026-06-04 03:50:43点击：

在人工智能技术日新月异的今天，快手AI平台算法负责人团队凭借其深厚的技术积累和前瞻性的战略眼光，近期开源了一系列具有里程碑意义的AI算法项目，不仅为学术界提供了宝贵的研究资源，更为工业界带来了前所未有的创新动力。本文将深入剖析快手AI团队近期开源的三大核心项目：SRPO强化学习算法、KAT自动思考模型以及Keye-VL-1.5多模态大模型，探讨它们如何共同推动AI技术的边界。

SRPO：高效强化学习的新篇章

在强化学习领域，训练成本高、效率低一直是制约技术发展的瓶颈。快手Kwaipilot团队提出的SRPO（历史重采样策略优化）方法，以其创新的两阶段训练范式，成功打破了这一僵局。SRPO方法通过历史重采样策略，有效降低了训练过程中的方差，使得模型在保持高性能的同时，训练成本大幅降低。实验数据显示，SRPO仅需GRPO的十分之一训练成本，便能在数学与代码双领域基准测试中取得显著突破，特别是在AIME2024和LiveCodeBench测试中，分别取得了50和41.6的高分，超越了DeepSeek-R1-Zero-32B的表现。

SRPO的成功，不仅在于其高效的训练策略，更在于其对数学与编程响应长度冲突问题的巧妙解决。通过纯强化学习训练，SRPO模型在处理不同任务时，能够始终提供详细的思考过程，并在训练中后期展现出强大的自我反思能力，实现自我纠错，展现出更广泛的问题解决能力。这一创新技术的开源，无疑为强化学习领域的研究者提供了新的思路和工具。

KAT：让AI学会自动思考

在AI领域，如何让模型在面对复杂问题时，能够像人类一样进行深度思考，一直是研究者们追求的目标。快手AI团队推出的KAT（Kwaipilot-AutoThink）自动思考模型，正是这一目标的生动实践。KAT模型通过学会判断何时生成显式推理链与何时直接回答，有效缓解了过度思考问题，实现了推理与直接回答的智能切换。

KAT模型的发展遵循简洁的两阶段训练流程：预训练阶段通过注入知识并分离“推理”与“直接回答”能力，使基础模型具备强大的事实和推理技能；后训练阶段则通过冷启动自动思考和Step-SRPO技术，使模型能够根据任务需求智能选择思考模式，减少不必要的推理过程，提高推理效率。KAT模型在专为防止数据泄露设计的挑战性基准测试LiveCodeBench Pro中位列所有开源模型榜首，甚至超越了Seed和o3-mini等强大的专有系统，充分证明了其卓越的性能和实用性。

Keye-VL-1.5：多模态理解的新标杆

随着短视频和直播的兴起，多模态理解技术的重要性日益凸显。快手开源的Keye-VL-1.5多模态大模型，以其80亿参数和128k tokens扩展上下文的能力，在视频理解、图像理解和推理方面展现出了非凡的实力。在Video-MME、Video-MMMU、TempCompass等一系列权威的公共视频基准测试中，Keye-VL-1.5在同等规模模型中取得了SOTA（最佳表现），赶超了阿里Qwen2.5-VL 8B、小米MiMo-VL 7B-RL等优秀模型。

Keye-VL-1.5的核心优势在于其对视频内容的准确理解。通过慢-快视频编码策略，该模型有效解决了时空权衡问题，能够捕捉视频中的细节与时间逻辑，实现对长视频与复杂语义的深度理解。这一能力使得Keye-VL-1.5在视频推荐、创作、互动以及内容审核和商业化全链条中展现出巨大的应用潜力。无论是自动生成吸睛标题、智能剪辑精彩片段，还是实时互动解说，Keye-VL-1.5都能游刃有余地应对，为短视频生态注入了前所未有的可能性。

结语

快手AI平台算法负责人团队近期开源的SRPO、KAT和Keye-VL-1.5三大项目，不仅展示了快手在AI技术领域的深厚积累和创新能力，更为整个AI社区带来了宝贵的资源和灵感。随着这些技术的不断演进和应用，我们有理由相信，快手将继续在AI领域发挥引领作用，推动人工智能技术的边界不断拓展，为人类社会带来更多惊喜和改变。

上一篇 : 抖音快手剪辑电视剧被封怎么办？规避版权雷区的5种安全剪辑法下一篇 : 快手中控台短视频添加字幕功能在哪？AI语音转文字实测体验

涨粉点赞播放量 · 直播间人气

快手AI平台算法负责人团队近期开源了哪些AI算法项目？

相关阅读

推荐文章

热门文章