当前位置: 网站首页 >AI教程资讯 >正文

EAFormer – 复旦推出的AI文本分割框架

来源:爱论文 时间:2025-05-04 19:32:11

EAFormer是什么

EAFormer是复旦推出的AI文本分割框架。擅长在照片中找到文字,并且能很精确地把文字从背景中分离出来。即使文字的边缘很模糊或者背景很复杂,EAFormer也能做得很好。对于想要从图片中去除文字或者编辑文字的人来说非常有用。EAFormer是一个能让我们轻松处理图片中文字的智能助手。

EAFormer的主要功能

找文本:在照片或图片里,EAFormer能快速找到所有的文字。描边角:不仅能找到文字,还能特别准确地描绘出文字的边缘,哪怕是弯弯曲曲的地方。改背景:如果你想把图片里的文字去掉,换上新的背景,EAFormer让文字看起来像是从未有过一样。学新招:如果EAFormer碰到了新的或不同语言的文字,能很快学会并提高识别能力。

EAFormer的技术原理

文本边缘提取器:利用Canny算法检测图像中的边缘,并结合轻量级文本检测模型来过滤非文本区域的边缘,只保留文本区域的边缘信息。边缘引导编码器:基于SegFormer框架构建,通过对称交叉注意力层在编码过程中融入边缘信息,增强模型对文本边缘的感知能力。MLP解码器:采用多层感知机(MLP)层来融合特征并预测最终的文本mask,实现文本区域的精确分割。损失函数设计:使用文本检测损失和文本分割损失两种交叉熵损失进行优化,通过超参数平衡两者权重,简化了超参数选择的复杂性。数据集重新标注:针对COCO_TS和MLT_S等数据集的标注质量问题,进行了重新标注,确保评估结果的可靠性和模型训练的准确性。特征融合策略:在边缘引导编码器中,通过设计的对称交叉注意机制仅在第一层融合边缘信息,避免了在所有层中融合边缘信息可能带来的性能下降。轻量级文本检测器:在文本边缘提取器中使用,包括基于ResNet的骨干网络和MLP解码器,用于提取文本区域特征并辅助边缘过滤。

EAFormer的项目地址

GitHub仓库:https://hyangyu.github.io/EAFormer/
上一篇:WiseFlow – 开源的AI信息挖掘工具
相关资讯 更多+
  • EAFormer – 复旦推出的AI文本分割框架
    EAFormer – 复旦推出的AI文本分割框架

    EAFormer是复旦推出的AI文本分割框架。擅长在照片中找到文字,并且能很精确地把文字从背景中分离出来。即使文字的边缘很模糊或者背景很复杂,EAFormer也能做得很好。对于想要从图片中去除文字或者编辑文字的人来说非常有用。EAFormer是一个能让我们轻松处理图片中文字的智能助手。

    AI教程资讯 2023-04-14

  • WiseFlow – 开源的AI信息挖掘工具
    WiseFlow – 开源的AI信息挖掘工具

    WiseFlow是开源的AI信息挖掘工具,能从网站、微信公众号、社交平台等多源信息中智能提取并分类数据。结合了统计学习和大型语言模型(LLM),支持多种新闻页面,优化了微信公众号文章的解析。WiseFlow轻量化设计,无需GPU即可运行,适用于任何硬件环境,是信息过载时代的理想助手。

    AI教程资讯 2023-04-14

  • Agents – AIWaves公司推出的AI Agent开发工具
    Agents – AIWaves公司推出的AI Agent开发工具

    Agents是AIWaves公司推出的AI Agent开发工具,支持用户对AI模型进行详细调整和优化,构建更加智能和个性化的AI Agent。通过Agents平台,用户可以自定义AI模型的行为和响应,实现高级的自动化任务和交互体验。

    AI教程资讯 2023-04-14

  • MiniCPM-V – 面壁智能推出的开源多模态大模型
    MiniCPM-V – 面壁智能推出的开源多模态大模型

    MiniCPM-V是面壁智能推出的开源多模态大模型,拥有80亿参数,擅长图像和视频理解。MiniCPM-V在单图像理解上超越了GPT-4V等模型,并首次支持在iPad等设备上实时视频理解。模型以高效推理和低内存占用著称,具备强大的OCR能力和多语言支持。

    AI教程资讯 2023-04-14

最新录入 更多+
确定