kaze channel
14:43 · 2024年6月29日 · 周六
工具名:gptpdf
功能:使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。
通过只有293行代码几乎可以完美地解析PDF排版、数学公式、表格、图片、图表等。每页平均价格约为0.013 美元
处理流程:
1. 使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记;
2. 使用视觉大模型(如 GPT-4o)进行解析,得到 markdown 文件。
GitHub地址
关注频道
@ZaiHuaPd
频道爆料
@ZaiHuabot
Home
Powered by
BroadcastChannel
&
Sepia