琅琅配音是一款智能文本转语音工具,提供语音合成服务。支持中文、英语、德语、法语等30多种语言,以及高兴、悲伤、兴奋等10多种情感风格。平台功能丰富,操作简单,支持SSML标签,实现多音字、多人配音等高级功能。琅琅配音提供真正的免费版本,晓晓、晓辰、麦克阿瑟、云希、云扬等众多知名AI主播,助您轻松完成视频解说、小说推文或广告宣传,满足不同用户的配音需求。
Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和RAG应用中的搜索结果准确性。Bocha Semantic Reranker模型基于文本语义,对初步排序的搜索结果进行二次优化,用评估查询语句与文档内容的深层语义匹配,给出排序得分,改善用户搜索体验。
AI教程资讯
2025-01-23
Ruyi是图森未来科技有限公司推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、运动幅度控制和镜头控制等特性。Ruyi基于DiT架构,由Casual VAE模块和Diffusion Transformer组成,用在视频数据压缩和生成。
AI教程资讯
2025-01-23
Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)的文本生成能力。LAMs能理解用户意图,在物理和数字环境中自动执行复杂任务。
AI教程资讯
2025-01-23
Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物图像生成框架,基于在注意力机制中引入流场学习,精确控制人物的外观和姿势。Leffa基于正则化损失函数,指导模型在训练时让目标查询聚焦于参考图像中的正确区域,减少细节失真,提升图像质量。
AI教程资讯
2025-01-23