Перейти к содержимому

MCP Image Recognition Server

Распознаёт изображения и генерирует их описания с помощью API Anthropic и OpenAI.

Python
27 stars

Описание

Это MCP-сервер для распознавания изображений, использующий Anthropic Claude Vision или OpenAI GPT-4 Vision. Поддерживает форматы JPEG, PNG, GIF, WebP; ввод через Base64 или файлы. Конфигурируемые провайдеры с fallback, опциональное извлечение текста via Tesseract OCR. Идеально для автоматизации анализа изображений в приложениях, чатботах или обработке визуальных данных. Технологии: Python 3.8+, API Anthropic/OpenAI, Docker для контейнеризации.

Возможности

Описание изображений

Генерация детальных текстовых описаний с помощью Anthropic или OpenAI Vision API.

Поддержка форматов

Работа с JPEG, PNG, GIF, WebP через Base64 или файлы.

Конфигурация провайдеров

Выбор основного и fallback-провайдера (Anthropic/OpenAI), интеграция с OpenRouter.

Извлечение текста (OCR)

Опциональное использование Tesseract для извлечения текста из изображений.

Docker-поддержка

Сборка и запуск в контейнере для удобного развертывания.

Установка

  1. Клонируйте репозиторий: git clone https://github.com/mario-andreschak/mcp-image-recognition.git && cd mcp-image-recognition
  2. Создайте .env: cp .env.example .env (отредактируйте API-ключи).
  3. Соберите проект: build.bat Опционально: Установите Tesseract OCR (sudo apt-get install tesseract-ocr на Linux). Запуск: python -m image_recognition_server.server или run.bat server.

Информация

Язык
Python
Лицензия
MIT License
GitHub Stars
27

Ссылки