Перейти к содержимому

MCP Mistral OCR

Сервер для OCR-распознавания текста в изображениях и PDF через API Mistral AI

Python
31 stars

Описание

Это MCP-сервер, интегрирующий API Mistral AI для оптического распознавания текста (OCR). Поддерживает обработку локальных файлов (изображения: JPG, PNG и PDF) и файлов по URL с указанием типа. Результаты сохраняются в JSON с временными метками. Использует Docker для контейнеризации и UV для управления пакетами. Идеально для автоматизации извлечения текста из документов, анализа изображений в приложениях ИИ.

Возможности

Обработка локальных файлов

Распознавание текста в изображениях (JPG, PNG, GIF, WebP) и PDF из указанной директории с помощью process_local_file.

Обработка файлов по URL

OCR для файлов по ссылке с обязательным указанием типа (image или pdf) через process_url_file.

Сохранение результатов

Вывод в JSON-файлы с временными метками в формате YYYYMMDD_HHMMSS в директории output.

Поддержка форматов и лимитов

Работа с файлами до 50MB и 1000 страниц; контейнеризация через Docker для легкого развертывания.

Установка

{ “mcpServers”: { “mistral-ocr”: { “command”: “docker”, “args”: [ “run”, “-i”, “–rm”, “-e”, “MISTRAL_API_KEY”, “-e”, “OCR_DIR”, “-v”, “C:/path/to/your/files:/data/ocr”, “mcp-mistral-ocr:latest” ], “env”: { “MISTRAL_API_KEY”: “<YOUR_MISTRAL_API_KEY>”, “OCR_DIR”: “C:/path/to/your/files” } } } }

Информация

Язык
Python
GitHub Stars
31

Ссылки