Agent skill
telegram-channel-parser
Парсинг публичных Telegram-каналов через веб-превью t.me/s/. Посты, метрики, аналитика, дайджесты, конкурентный анализ. Cache-first подход для гигиены контекстного окна. Triggers: telegram канал, telegram channel, парсинг телеграм, дайджест каналов, telegram digest, анализ канала, шер-парад, telegram analytics, мониторинг каналов.
Install this agent skill to your Project
npx add-skill https://github.com/artwist-polyakov/polyakov-claude-skills/tree/main/plugins/telegram-channel-parser/skills/telegram-channel-parser
SKILL.md
telegram-channel-parser
Парсинг публичных Telegram-каналов через веб-превью (t.me/s/). Без API-ключей, без MTProto, zero config.
Config
Никаких токенов не требуется. Для дайджестов — скопировать .env.example:
cp config/.env.example config/.env
Без .env: скилл работает, но каналы нужно передавать явно через --channel / --channels.
С .env: дайджест AI-каналов готов из коробки. Пользователь может добавить свои категории.
Структура .env (категории дайджестов):
TG_CATEGORIES=ai,crypto # реестр доступных категорий
TG_DEFAULT_CATEGORY=ai # дефолтная при запросе "дайджест"
TG_CHANNELS_AI_LABEL=AI и технологии
TG_CHANNELS_AI=countwithsasha,evilfreelancer,...
TG_CHANNELS_CRYPTO_LABEL=Криптовалюты
TG_CHANNELS_CRYPTO=channel1,channel2
Алгоритм агента при запросе дайджеста:
- Прочитать
config/.env(если есть) - Распарсить
TG_CATEGORIES— получить список доступных категорий - Для каждой категории:
TG_CHANNELS_<ID>= каналы,TG_CHANNELS_<ID>_LABEL= название - Определить нужную категорию:
- Пользователь назвал тему → сопоставить с
_LABEL - Не уточнил → использовать
TG_DEFAULT_CATEGORY - Несколько категорий подходят → предложить выбор
- Пользователь назвал тему → сопоставить с
- Передать каналы нужной категории через
--channels
Если .env нет → спросить какие каналы парсить, предложить cp config/.env.example config/.env.
Приоритет: --channels явно > категория из .env > агент спрашивает.
Подробности: config/README.md.
Philosophy
- Always fresh — данные запрашиваются в реальном времени при каждом вызове. Никогда не пропустишь свежий пост.
- Context window hygiene — stdout ограничен 30 строками. Полные данные в TSV/CSV. LLM работает с компактным форматом, а не с сырым HTML.
- Rate limit — между запросами к t.me пауза 1.5с. Не жадничаем.
- Чистый POSIX sh — никаких зависимостей кроме curl, sed, awk, grep.
Workflow
Парсинг одного канала
-
Получи посты:
bashbash scripts/fetch_posts.sh --channel countwithsasha --limit 50Выведет последние 50 постов в TSV (id, date, views, reactions, fwd_from, fwd_link, text, media_url).
-
Инфо о канале:
bashbash scripts/channel_info.sh --channel countwithsasha -
Поиск по постам:
bashbash scripts/search_posts.sh --channel countwithsasha --query "скилл" -
Топ постов (шер-парад):
bashbash scripts/top_posts.sh --channel countwithsasha --limit 50 --sort reactions -
Расписание публикаций:
bashbash scripts/posting_schedule.sh --channel countwithsasha --limit 100 -
Экспорт:
bashbash scripts/export_csv.sh --channel countwithsasha --limit 100 --csv cache/export.csv
Дайджест по нескольким каналам
# Явный список каналов
bash scripts/digest.sh --channels "countwithsasha,evilfreelancer,aostrikov_ai_agents" --period today
# Дефолтный набор (без --channels)
bash scripts/digest.sh --period today
Периоды: today, yesterday, week, N (последние N дней).
Сравнение каналов
bash scripts/compare_channels.sh --channels "channel1,channel2,channel3" --limit 30
Таблица: подписчики, средние просмотры, частота публикаций, engagement.
React-артифакт для дайджеста
При запросе дайджеста — отображай результаты как React-артифакт (лента карточек).
Алгоритм (4 шага):
- Запусти
digest_json.sh— он пишет JSON в файл (не stdout!) и возвращает путь:bashbash scripts/digest_json.sh --period today # → prints: cache/digest_today.json - Прочитай JSON-файл по выведенному пути
- Прочитай шаблон
assets/digest-feed.tsx - Замени
__DIGEST_DATA__в шаблоне на содержимое JSON, отрендери как React-артифакт
Важно: скрипт пишет в файл, а не в stdout, чтобы обойти лимит буфера sandbox (~200KB). Для 30-дневного дайджеста 15 каналов JSON может быть 500KB+.
Посты автоматически сортируются по дате (новые сверху), перемешаны между каналами. Пользователь фильтрует по периоду и каналу через UI.
Scripts
Общий паттерн вызова:
bash scripts/<script>.sh --channel <username> [--limit N] [--before <post_id>] [--csv path]
| Script | Description | Special params |
|---|---|---|
fetch_posts.sh |
Посты канала → TSV | --limit, --before, --after-date YYYY-MM-DD |
channel_info.sh |
Название, описание, подписчики | — |
search_posts.sh |
Полнотекстовый поиск | --query "text" |
top_posts.sh |
Ранжирование постов | --sort views|reactions, --limit |
posting_schedule.sh |
Анализ времени публикаций | --limit |
export_csv.sh |
Экспорт в CSV | --csv path |
digest.sh |
Дайджест нескольких каналов | --channels "a,b,c", --period today|yesterday|week|N |
digest_json.sh |
Дайджест → JSON файл (для React-артифакта) | --channels "a,b,c", --period today|yesterday|week|N |
compare_channels.sh |
Сравнительная таблица | --channels "a,b,c" |
Общие параметры
| Param | Required | Default | Description |
|---|---|---|---|
--channel |
да* | — | Username канала (без @) |
--channels |
нет | из .env | Несколько каналов через запятую |
--limit |
нет | 20 | Сколько постов загрузить |
--before |
нет | — | ID поста для пагинации |
--after-date |
нет | — | Не загружать посты старше даты (YYYY-MM-DD) |
--csv |
нет | — | Путь для экспорта |
*--channel для одного канала, --channels для мультиканальных команд.
Ввод канала
Скилл принимает канал в любом формате:
countwithsasha— просто username@countwithsasha— с собакойhttps://t.me/countwithsasha— прямая ссылкаhttps://t.me/s/countwithsasha— ссылка на веб-превьюt.me/countwithsasha?before=500— с параметрами
Всё автоматически нормализуется до голого username.
Ограничения
- Только публичные каналы (у которых есть t.me/s/ превью)
- Счётчик пересылок (shares) недоступен — t.me/s/ его не отдаёт, только MTProto API
- Зато парсится откуда переслан пост (fwd_from + ссылка на оригинал)
- Реакции парсятся суммарно (общее количество по всем эмодзи)
- Пагинация: ~20 постов на страницу, для 100 постов = 5 запросов
- Rate limit: 1.5с между запросами к t.me
Recommended Agent Skills
Expand your agent's capabilities with these related and highly-rated skills.
genome-analizer
scrapedo-web-scraper
docx-contracts
telegraph-publisher
Publish pages to Telegraph with images, YouTube embeds, and diagrams. Supports auto-split for long articles. ALWAYS read SKILL.md before first use.
ssh-remote-connection
SSH connection to remote servers. Use when you need to execute commands on a remote server, check logs, restart services, or manage Docker containers.
crawl4ai-seo
SEO-краулер сайтов на базе Crawl4AI. Полный аудит страниц: title, meta, H1, canonical, breadcrumbs, навигация, внутренние ссылки. Инвентаризация сайта, навигационный аудит, сравнение лендингов, анализ конкурентов. Работает для Google и Яндекс SEO (Cyrillic URL, коммерческие факторы, региональность). Связка с yandex-search-api, yandex-metrika, yandex-webmaster, scrapedo-web-scraper. Triggers: crawl4ai, seo crawl, site audit, page inventory, site inventory, on-page audit, internal links, internal linking audit, navigation audit, landing comparison, competitor analysis, competitor pages, orphan pages, technical seo, аудит сайта, краулер, перелинковка, навигационный аудит.
Didn't find tool you were looking for?