Перейти к содержимому

Fetcher

получает содержимое веб-страниц с помощью headless-браузера Playwright, включая динамический JS-контент.

TypeScript
862 stars

Описание

Fetcher MCP — сервер для извлечения веб-контента с использованием Playwright. Поддерживает выполнение JavaScript, интеллектуальное извлечение основного контента (алгоритм Readability), вывод в HTML или Markdown. Обеспечивает параллельную обработку URL, блокировку ненужных ресурсов, обработку ошибок и настройку таймаутов. Идеально для веб-скрейпинга, анализа динамических сайтов, интеграции с AI-моделями для обработки данных из интернета.

Возможности

fetch_url

Извлечение контента с одной веб-страницы: парсинг JS, извлечение основного контента, поддержка параметров таймаута, формата вывода и отключения медиа.

fetch_urls

Параллельное получение контента с нескольких URL: многотабовая обработка для повышения эффективности, комбинированные результаты.

Интеллектуальное извлечение

Автоматическое удаление рекламы и навигации с помощью Readability, вывод в Markdown или HTML.

Обработка динамического контента

Выполнение JavaScript для сайтов с динамической загрузкой, ожидание навигации и верификации.

Режим отладки

Визуальный браузер для ручного логина и отладки, с возможностью активации по запросу.

Установка

{ “mcpServers”: { “fetcher”: { “command”: “npx”, “args”: ["-y", “fetcher-mcp”] } } }

Информация

Язык
TypeScript
Лицензия
MIT License
GitHub Stars
862

Ссылки