LongCite是什么
LongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。模型能理解长文本内容并提供准确的问答服务,同时附上直接查阅的文本引用,增强信息的透明度和可靠性。

来源:爱论文 时间:2025-04-30 11:14:50
LongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。模型能理解长文本内容并提供准确的问答服务,同时附上直接查阅的文本引用,增强信息的透明度和可靠性。
ongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。
AI教程资讯
2023-04-14
CSGO(Content-Style Composition in Text-to-Image Generation)是由南京理工大学、小红书等机构合作开发的图像风格迁移和文本到图像生成的研究项目。CSGO的目标是为用户提供更加丰富和多样化的图像创作工具。
AI教程资讯
2023-04-14
GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型,专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能,包括生成游戏角色、动态环境、复杂动作等,支持交互控制,支持用户通过文本、操作信号和视频提示来控制游戏内容。
AI教程资讯
2023-04-14
GPT-4 1 是 OpenAI 最新推出的新一代语言模型,包含 GPT-4 1、GPT-4 1 mini 和 GPT-4 1 nano 三个版本。系列模型在编码能力、指令遵循和长文本处理等方面有显著提升,支持高达 100 万个 token 的上下文窗口。
AI教程资讯
2023-04-14