PDF Reader MCP — 給 AI agent 的 PDF 智慧解析層
2026 年 7 月 1 日
共 618 字
AI
MCP
PDF
Agent
OCR
GitHub
來源:GitHub SylphxAI/pdf-reader-mcp
https://github.com/SylphxAI/pdf-reader-mcp
一句話
給 AI agent 用的 PDF 智慧解析 MCP server:證據導向抽取、OCR 溯源、視覺裁切、信任報告,把 PDF 變成可引用、可驗證的文件表示。
解決什麼
PDF 有版面、像素、表格、隱藏文字、權限、閱讀順序模糊等,純文字抽取會漏。這個 server 把它轉成有來源背書、可驗證的表示,讓 agent 能信任並引用。
重點功能
Agent Document Twin:帶證據連結的抽取
證據層:頁碼、bounding box、區域裁切、原始 render
掃描頁自動 OCR,附 word box 與溯源
表格還原(可選取文字+OCR 資料)
信任報告:揪出隱藏文字、視覺偽裝、不安全連結
無障礙路由:tag 覆蓋率與頁面評級
多格式輸出:Markdown / JSON / HTML / AST
benchmark 閘門釋出,確定性品質證明
技術
TypeScript、Node.js ≥22.13、可選 Docker
安裝
claude mcp add pdf-reader -- npx @sylphx/pdf-reader-mcp
連結
Repo https://github.com/SylphxAI/pdf-reader-mcp
文件 https://sylphxai.github.io/pdf-reader-mcp/