KuaiMod – 快手推出的自动化短视频质量判别框架-爱论文

KuaiMod是什么

KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架，能高效识别和过滤有害及低质量内容。框架借鉴普通法（Common Law）体系，基于案例驱动的方式动态更新审核策略，快速适应短视频平台上内容的快速变化。KuaiMod 结合视觉语言模型（VLM）和链式推理（Chain-of-Thought,中 CoT）技术，基于用户反馈进行强化学习，实现精准的内容判别。KuaiMod 离线测试准确率高达92.4%，在实际部署显著降低用户举报率，提升用户体验，为短视频平台的健康生态提供有力支持。

KuaiMod的主要功能

自动审核有害内容：识别过滤暴力、**、谣言等违规视频。细粒度内容分类：将视频精准分类到不同违规类别，便于管理。动态策略更新：根据用户反馈实时调整审核策略，适应内容变化。降低用户举报率：减少用户对不良内容的曝光，提升用户体验。助力个性化推荐：优化推荐系统，推送符合用户兴趣的优质视频。

KuaiMod的技术原理

多模态大模型（VLM）：基于视觉编码器和语言模型，将视频的视觉信息（如视频帧、封面）和文本信息（如标题、评论、OCR/ASR 文本）进行融合，生成综合的视频表示。基于大规模预训练，VLM 能理解视频的语义内容，识别其中的有害信息。链式推理（Chain-of-Thought, CoT）：基于 CoT 技术，生成详细的推理过程，解释为什么某个视频被判定为有害或非有害。将视频审核过程分解为多个状态（如内容提取、内容分析、用户反馈分析等），逐步推理最终给出审核结果。离线适配与训练：用大规模标注数据，对 VLM 进行监督微调，适应视频审核任务。基于生成正负样本对，优化模型的偏好，提高审核的准确性和一致性。在线更新与强化学习：基于用户反馈的强化学习（RLUF）：基于用户举报、点赞、评论等反馈，构建新的训练数据，用强化学习动态更新审核策略。模型根据实时反馈进行优化，确保快速适应平台内容的变化。动态分类体系：根据平台内容的变化，动态扩展和调整分类标签体系，确保覆盖新出现的有害内容类型。