Перейти к содержимому

WORK IN PROGRESS - USE WITH CAUTION - Windows:

Сервер для манипуляции PDF: объединение файлов, извлечение страниц, поиск и объединение по regex.

Python
63 stars

Описание

MCP-сервер на Python для инструментов работы с PDF, интегрируемый с LLM через Model Context Protocol. Ключевые особенности: слияние нескольких PDF в один (с указанным порядком), извлечение конкретных страниц, поиск по файловой системе, поиск и слияние связанных PDF на основе извлечения текста и regex. Идеален для автоматизации задач с PDF в чатботах и AI-приложениях, таких как обработка документов. Установка через uv, совместим с Claude Desktop.

Возможности

Объединение PDF

Слияние нескольких PDF файлов в один.

Объединение с порядком

Слияние PDF в указанном пользователем порядке.

Извлечение страниц

Выбор и извлечение конкретных страниц из PDF.

Поиск по PDF

Поиск PDF в файловой системе (рекомендуется использовать Everything для лучшей производительности).

Поиск связанных PDF

Нахождение и слияние связанных PDF на основе извлечения текста и regex-совпадений.

Установка

  1. Клонируйте репозиторий.
  2. Перейдите в директорию: cd mcp-pdf-tools
  3. Создайте и активируйте виртуальное окружение (Windows): uv venv && .venv\Scripts\activate
  4. Установите пакет: uv pip install -e .

Для использования с Claude Desktop добавьте в claude_desktop_config.json:

{
    "mcpServers": {
        "pdf-tools": {
            "command": "uv",
            "args": [
                "--directory",
                "PATH_TO\\mcp-pdf-tools",
                "run",
                "pdf-tools"
            ]
        }
    }
}

Информация

Язык
Python
Лицензия
The Unlicense
GitHub Stars
63

Ссылки