Pix2Text - 开源多功能图像内容识别工具

软件功能:

图像内容识别

软件平台:

#Web #Windows #macOS #Linux

软件介绍:

一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。

它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。

P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。

网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。

项目地址:

https://github.com/breezedeus/Pix2Text

在线体验:

https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

网站版本:

https://p2t.breezedeus.com/

资源加速:

国内访问GitHub资源缓慢看这篇《GitHub国内访问加速操作指南

胖氪笔记公众号


Pix2Text - 开源多功能图像内容识别工具
https://pknote.top/38.html
作者
胖氪不胖
发布于
2024年6月2日
许可协议