MCP Image Recognition Server
Распознаёт изображения и генерирует их описания с помощью API Anthropic и OpenAI.
Описание
Это MCP-сервер для распознавания изображений, использующий Anthropic Claude Vision или OpenAI GPT-4 Vision. Поддерживает форматы JPEG, PNG, GIF, WebP; ввод через Base64 или файлы. Конфигурируемые провайдеры с fallback, опциональное извлечение текста via Tesseract OCR. Идеально для автоматизации анализа изображений в приложениях, чатботах или обработке визуальных данных. Технологии: Python 3.8+, API Anthropic/OpenAI, Docker для контейнеризации.
Возможности
Описание изображений
Генерация детальных текстовых описаний с помощью Anthropic или OpenAI Vision API.
Поддержка форматов
Работа с JPEG, PNG, GIF, WebP через Base64 или файлы.
Конфигурация провайдеров
Выбор основного и fallback-провайдера (Anthropic/OpenAI), интеграция с OpenRouter.
Извлечение текста (OCR)
Опциональное использование Tesseract для извлечения текста из изображений.
Docker-поддержка
Сборка и запуск в контейнере для удобного развертывания.
Установка
- Клонируйте репозиторий: git clone https://github.com/mario-andreschak/mcp-image-recognition.git && cd mcp-image-recognition
- Создайте .env: cp .env.example .env (отредактируйте API-ключи).
- Соберите проект: build.bat Опционально: Установите Tesseract OCR (sudo apt-get install tesseract-ocr на Linux). Запуск: python -m image_recognition_server.server или run.bat server.