WORK IN PROGRESS - USE WITH CAUTION - Windows:
Сервер для манипуляции PDF: объединение файлов, извлечение страниц, поиск и объединение по regex.
Описание
MCP-сервер на Python для инструментов работы с PDF, интегрируемый с LLM через Model Context Protocol. Ключевые особенности: слияние нескольких PDF в один (с указанным порядком), извлечение конкретных страниц, поиск по файловой системе, поиск и слияние связанных PDF на основе извлечения текста и regex. Идеален для автоматизации задач с PDF в чатботах и AI-приложениях, таких как обработка документов. Установка через uv, совместим с Claude Desktop.
Возможности
Объединение PDF
Слияние нескольких PDF файлов в один.
Объединение с порядком
Слияние PDF в указанном пользователем порядке.
Извлечение страниц
Выбор и извлечение конкретных страниц из PDF.
Поиск по PDF
Поиск PDF в файловой системе (рекомендуется использовать Everything для лучшей производительности).
Поиск связанных PDF
Нахождение и слияние связанных PDF на основе извлечения текста и regex-совпадений.
Установка
- Клонируйте репозиторий.
- Перейдите в директорию: cd mcp-pdf-tools
- Создайте и активируйте виртуальное окружение (Windows): uv venv && .venv\Scripts\activate
- Установите пакет: uv pip install -e .
Для использования с Claude Desktop добавьте в claude_desktop_config.json:
{
"mcpServers": {
"pdf-tools": {
"command": "uv",
"args": [
"--directory",
"PATH_TO\\mcp-pdf-tools",
"run",
"pdf-tools"
]
}
}
}