PDF Reader MCP — 給 AI agent 的 PDF 智慧解析層

2026 年 7 月 1 日共 618 字

AI MCP PDF Agent OCR GitHub

來源：GitHub SylphxAI/pdf-reader-mcp
https://github.com/SylphxAI/pdf-reader-mcp

一句話
給 AI agent 用的 PDF 智慧解析 MCP server：證據導向抽取、OCR 溯源、視覺裁切、信任報告，把 PDF 變成可引用、可驗證的文件表示。

解決什麼
PDF 有版面、像素、表格、隱藏文字、權限、閱讀順序模糊等，純文字抽取會漏。這個 server 把它轉成有來源背書、可驗證的表示，讓 agent 能信任並引用。

重點功能
Agent Document Twin：帶證據連結的抽取
證據層：頁碼、bounding box、區域裁切、原始 render
掃描頁自動 OCR，附 word box 與溯源
表格還原（可選取文字＋OCR 資料）
信任報告：揪出隱藏文字、視覺偽裝、不安全連結
無障礙路由：tag 覆蓋率與頁面評級
多格式輸出：Markdown / JSON / HTML / AST
benchmark 閘門釋出，確定性品質證明

技術
TypeScript、Node.js ≥22.13、可選 Docker

安裝
claude mcp add pdf-reader -- npx @sylphx/pdf-reader-mcp

連結
Repo https://github.com/SylphxAI/pdf-reader-mcp
文件 https://sylphxai.github.io/pdf-reader-mcp/