Umi-OCR是一款批量图片转文字软件,就是通过OCR文字识别技术将图片里的文字给提取出来,用户只需要导入图片文件即可,使用非常简单。软件是基于PaddleOCR的离线OCR模块制作而成的,可以训练模型,支持修改PaddleOCR参数,添加不同的语言模型,软件可识别多国语言,当然想要使用后面所说的这些功能的前提是要会开发。
软件介绍
这款「Umi-OCR」和其它的 OCR 软件不一样的是它主要采用批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
批量识别图片导出文本对于一些场景用途来说比你一张一张去识别效率要高不少,使用也很简单,批量拖入你需要识别的图片。
接下来点击设置,可以设置勾选识别内容写入到本地文件,可以选择 txt 文本或者 Markdown 格式,选择输出目录。
如果你识别的图片里面有一些内容你不需要的,例如水印,可以点击添加区域功能,然后选择你不需要识别的区域。
忽略区域功能说明:
忽略区域1 :正常情况下,处于忽略区域1内的文字 不会 输出。
识别区域 :当识别区域内存在文本时,忽略区域1失效 ;即处于忽略区域1内的文字也 会 被输出。
忽略区域2 :当 忽略区域1失效时,忽略区域2才生效;即处于区域1内的文字 会 输出、区域2内的文字不会输出。
接着点击开始任务即可进行批量图片识别文字,从列表中可以看到内容基本上都被识别出来了。
导出的文本对比图片里面的内容,中文内容基本上没错误,不过个别英文内容可能是图片比较模糊的原因,识别出来有个别错误,所以识别的图片尽量选择清晰点的大图。
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
EV录屏软件是一款功能全面的屏幕录制工具,支持高清、流畅的录制体验。EV录屏软件简单易用,用户只需几步操作即可开始录制。软件支持多种录制模式,满足不同场景的需求,如全屏录制、窗口录制等...
EV投屏是一款功能强大的投屏软件,支持电脑与手机、电视之间的屏幕共享,只需在同一局域网内,即可实现设备间的快速连接和屏幕共享。无论是办公远程操作、手机PPT投屏,还是娱乐时的手机投屏到...
api-ms-win-core-com-l1-1-0.dll文件是电脑系统中非常重要的组件之一。当该dll文件被删除、被移动到错误的位置,被电脑上的恶意软件更改,或者Windows注册表已损坏等,用户电脑就会出现api-ms-w...
Windows Terminal是微软自行开发的一款命令行终端工具,该工具功能强大,支持多标签页支持、富文本、多语言支持、窗口分割、可配置、主题和样式等,支持x86、x64和arm64,最低要求Windows 10 Bu...
弹弹play是将视频与弹幕相结合的影音播放工具,可以支持分析你的视频文件,将它与网络上的弹幕进行匹配,不管你看的是渣360p,还是高清1080p,它都能够帮你找到同一份弹幕,和所有观看此动画的...
腾讯文档是一款功能强大、易于使用的云端协同办公软件,它能够帮助用户快速高效地进行团队协作、文件管理、在线文档编辑等多种工作,提高团队协作效率和工作效率。同时有工作日报、会议纪要...
发表评论
共0条
评论就这些咯,让大家也知道你的独特见解
立即评论以上留言仅代表用户个人观点,不代表系统之家立场