Перейти к содержимому

ScreenPilot

Сервер для полного контроля LLM над устройством через автоматизацию экрана, мыши и клавиатуры.

Python
40 stars

Описание

ScreenPilot — это MCP-сервер на Python, позволяющий большим языковым моделям (LLM) управлять графическим интерфейсом устройства. Ключевые особенности: захват экрана, контроль мыши (клики, перемещения), ввод с клавиатуры (текст, горячие клавиши), прокрутка, обнаружение элементов и последовательные действия. Технологии: Python 3.12 с библиотеками для автоматизации (pyautogui и т.д.). Применения: автоматизация задач, образовательные цели, развлечения и тестирование GUI.

Возможности

Захват экрана

Съемка скриншотов и анализ содержимого экрана для получения информации.

Контроль мыши

Перемещение курсора и выполнение кликов в указанных позициях.

Действия с клавиатурой

Ввод текста, нажатия клавиш и комбинации горячих клавиш.

Прокрутка

Прокрутка контента в различных направлениях и на конкретные позиции.

Обнаружение элементов

Проверка наличия элементов на экране и ожидание их появления.

Последовательные действия

Выполнение цепочек нескольких действий в автоматизированной последовательности.

Установка

  1. Установите Python 3.12.
  2. Клонируйте репозиторий: git clone https://github.com/Mtehabsim/ScreenPilot.git.
  3. Создайте виртуальное окружение: python -m venv venv.
  4. Активируйте: venv\Scripts\activate (на Windows).
  5. Установите зависимости: pip install -r requirements.txt.
  6. Откройте Claude AI Desktop, перейдите в File → Settings → Developer → Edit config.
  7. Вставьте в config.json:
{
    "mcpServers": {
        "device-controll": {
            "command": "pathToEnv\\venv\\Scripts\\python.exe",
            "args": [
                "pathToProject\\ScreenPilot\\main.py"
            ]
        }
    }
}
  1. Замените пути на реальные.
  2. Сохраните, выйдите из Claude AI и перезапустите.

Информация

Язык
Python
GitHub Stars
40

Ссылки