Agent skill
telegram-channel-parser
Парсинг публичных Telegram-каналов через веб-превью t.me/s/. Посты, метрики, аналитика, дайджесты, конкурентный анализ. Cache-first подход для гигиены контекстного окна. Triggers: telegram канал, telegram channel, парсинг телеграм, дайджест каналов, telegram digest, анализ канала, шер-парад, telegram analytics, мониторинг каналов.
Install this agent skill to your Project
npx add-skill https://github.com/artwist-polyakov/polyakov-claude-skills/tree/main/plugins/telegram-channel-parser/skills/telegram-channel-parser
SKILL.md
telegram-channel-parser
Парсинг публичных Telegram-каналов через веб-превью (t.me/s/). Без API-ключей, без MTProto, zero config.
Config
Никаких токенов не требуется. Для дайджестов — скопировать .env.example:
cp config/.env.example config/.env
Без .env: скилл работает, но каналы нужно передавать явно через --channel / --channels.
С .env: дайджест AI-каналов готов из коробки. Пользователь может добавить свои категории.
Структура .env (категории дайджестов):
TG_CATEGORIES=ai,crypto # реестр доступных категорий
TG_DEFAULT_CATEGORY=ai # дефолтная при запросе "дайджест"
TG_CHANNELS_AI_LABEL=AI и технологии
TG_CHANNELS_AI=countwithsasha,evilfreelancer,...
TG_CHANNELS_CRYPTO_LABEL=Криптовалюты
TG_CHANNELS_CRYPTO=channel1,channel2
Алгоритм агента при запросе дайджеста:
- Прочитать
config/.env(если есть) - Распарсить
TG_CATEGORIES— получить список доступных категорий - Для каждой категории:
TG_CHANNELS_<ID>= каналы,TG_CHANNELS_<ID>_LABEL= название - Определить нужную категорию:
- Пользователь назвал тему → сопоставить с
_LABEL - Не уточнил → использовать
TG_DEFAULT_CATEGORY - Несколько категорий подходят → предложить выбор
- Пользователь назвал тему → сопоставить с
- Передать каналы нужной категории через
--channels
Если .env нет → спросить какие каналы парсить, предложить cp config/.env.example config/.env.
Приоритет: --channels явно > категория из .env > агент спрашивает.
Подробности: config/README.md.
Philosophy
- Always fresh — данные запрашиваются в реальном времени при каждом вызове. Никогда не пропустишь свежий пост.
- Context window hygiene — stdout ограничен 30 строками. Полные данные в TSV/CSV. LLM работает с компактным форматом, а не с сырым HTML.
- Rate limit — между запросами к t.me пауза 1.5с. Не жадничаем.
- Чистый POSIX sh — никаких зависимостей кроме curl, sed, awk, grep.
Workflow
Парсинг одного канала
-
Получи посты:
bashbash scripts/fetch_posts.sh --channel countwithsasha --limit 50Выведет последние 50 постов в TSV (id, date, views, reactions, fwd_from, fwd_link, text, media_url).
-
Инфо о канале:
bashbash scripts/channel_info.sh --channel countwithsasha -
Поиск по постам:
bashbash scripts/search_posts.sh --channel countwithsasha --query "скилл" -
Топ постов (шер-парад):
bashbash scripts/top_posts.sh --channel countwithsasha --limit 50 --sort reactions -
Расписание публикаций:
bashbash scripts/posting_schedule.sh --channel countwithsasha --limit 100 -
Экспорт:
bashbash scripts/export_csv.sh --channel countwithsasha --limit 100 --csv cache/export.csv
Дайджест по нескольким каналам
# Явный список каналов
bash scripts/digest.sh --channels "countwithsasha,evilfreelancer,aostrikov_ai_agents" --period today
# Дефолтный набор (без --channels)
bash scripts/digest.sh --period today
Периоды: today, yesterday, week, N (последние N дней).
Сравнение каналов
bash scripts/compare_channels.sh --channels "channel1,channel2,channel3" --limit 30
Таблица: подписчики, средние просмотры, частота публикаций, engagement.
React-артифакт для дайджеста
При запросе дайджеста — отображай результаты как React-артифакт (лента карточек).
Алгоритм (4 шага):
- Запусти
digest_json.sh— он пишет JSON в файл (не stdout!) и возвращает путь:bashbash scripts/digest_json.sh --period today # → prints: cache/digest_today.json - Прочитай JSON-файл по выведенному пути
- Прочитай шаблон
assets/digest-feed.tsx - Замени
__DIGEST_DATA__в шаблоне на содержимое JSON, отрендери как React-артифакт
Важно: скрипт пишет в файл, а не в stdout, чтобы обойти лимит буфера sandbox (~200KB). Для 30-дневного дайджеста 15 каналов JSON может быть 500KB+.
Посты автоматически сортируются по дате (новые сверху), перемешаны между каналами. Пользователь фильтрует по периоду и каналу через UI.
Scripts
Общий паттерн вызова:
bash scripts/<script>.sh --channel <username> [--limit N] [--before <post_id>] [--csv path]
| Script | Description | Special params |
|---|---|---|
fetch_posts.sh |
Посты канала → TSV | --limit, --before, --after-date YYYY-MM-DD |
channel_info.sh |
Название, описание, подписчики | — |
search_posts.sh |
Полнотекстовый поиск | --query "text" |
top_posts.sh |
Ранжирование постов | --sort views|reactions, --limit |
posting_schedule.sh |
Анализ времени публикаций | --limit |
export_csv.sh |
Экспорт в CSV | --csv path |
digest.sh |
Дайджест нескольких каналов | --channels "a,b,c", --period today|yesterday|week|N |
digest_json.sh |
Дайджест → JSON файл (для React-артифакта) | --channels "a,b,c", --period today|yesterday|week|N |
compare_channels.sh |
Сравнительная таблица | --channels "a,b,c" |
Общие параметры
| Param | Required | Default | Description |
|---|---|---|---|
--channel |
да* | — | Username канала (без @) |
--channels |
нет | из .env | Несколько каналов через запятую |
--limit |
нет | 20 | Сколько постов загрузить |
--before |
нет | — | ID поста для пагинации |
--after-date |
нет | — | Не загружать посты старше даты (YYYY-MM-DD) |
--csv |
нет | — | Путь для экспорта |
*--channel для одного канала, --channels для мультиканальных команд.
Ввод канала
Скилл принимает канал в любом формате:
countwithsasha— просто username@countwithsasha— с собакойhttps://t.me/countwithsasha— прямая ссылкаhttps://t.me/s/countwithsasha— ссылка на веб-превьюt.me/countwithsasha?before=500— с параметрами
Всё автоматически нормализуется до голого username.
Ограничения
- Только публичные каналы (у которых есть t.me/s/ превью)
- Счётчик пересылок (shares) недоступен — t.me/s/ его не отдаёт, только MTProto API
- Зато парсится откуда переслан пост (fwd_from + ссылка на оригинал)
- Реакции парсятся суммарно (общее количество по всем эмодзи)
- Пагинация: ~20 постов на страницу, для 100 постов = 5 запросов
- Rate limit: 1.5с между запросами к t.me
Didn't find tool you were looking for?