UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成离散文本标记和连续图像标记。框架基于预训练的 Gemma 模型,用配对的图像-文本数据训练,让生成和理解任务相互促进。UniFluid 基于标准的 SentencePiece 作为文本标记器,用连续变分自编码器(VAE)作为图像生成的标记器,结合 SigLIP 图像编码器用在理解任务。
OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能(AGI),在ARC-AGI基准测试中得分高达87 5%,远超人类平均水平。它在数学和编程任务中表现出色,在2024年美国数学邀请赛(AIME)中得分96 7%,在Codeforces评级中达到2727分。o3能够自我事实核查,通过“私人思维链”进行推理,提高答案的准确性。
近日,面向儿童的对话式AI英语学习平台Buddy ai宣布,完成BITKRAFTVentures领投的1100万美元种子轮融资,并得到了欧洲最大的教育科技基金Educapital和其他投资方的支持。Buddy ai是一款面向3-8岁孩子的英语学
06-14