Описание

Это MCP-сервер для распознавания изображений, использующий Anthropic Claude Vision или OpenAI GPT-4 Vision. Поддерживает форматы JPEG, PNG, GIF, WebP; ввод через Base64 или файлы. Конфигурируемые провайдеры с fallback, опциональное извлечение текста via Tesseract OCR. Идеально для автоматизации анализа изображений в приложениях, чатботах или обработке визуальных данных. Технологии: Python 3.8+, API Anthropic/OpenAI, Docker для контейнеризации.

Возможности

✓

Описание изображений

Генерация детальных текстовых описаний с помощью Anthropic или OpenAI Vision API.

✓

Поддержка форматов

Работа с JPEG, PNG, GIF, WebP через Base64 или файлы.

✓

Конфигурация провайдеров

Выбор основного и fallback-провайдера (Anthropic/OpenAI), интеграция с OpenRouter.

✓

Извлечение текста (OCR)

Опциональное использование Tesseract для извлечения текста из изображений.

✓

Docker-поддержка

Сборка и запуск в контейнере для удобного развертывания.

Установка

Клонируйте репозиторий: git clone https://github.com/mario-andreschak/mcp-image-recognition.git && cd mcp-image-recognition
Создайте .env: cp .env.example .env (отредактируйте API-ключи).
Соберите проект: build.bat Опционально: Установите Tesseract OCR (sudo apt-get install tesseract-ocr на Linux). Запуск: python -m image_recognition_server.server или run.bat server.

MCP Image Recognition Server