Agent skill
videocut:字幕
字幕生成与烧录。火山引擎转录→词典纠错→审核→烧录。触发词:加字幕、生成字幕、字幕
Install this agent skill to your Project
npx add-skill https://github.com/Ceeon/videocut-skills/tree/main/字幕
SKILL.md
字幕
转录 → Agent校对 → 人工审核 → 烧录
核心流程(总计约 8-15 分钟,含人工审核)
1. 提取音频 + 上传 ⏱ ~1min
↓
2. 火山引擎转录(带热词) ⏱ ~2min
↓
3. Agent 自动校对 ⏱ ~3-5min
↓
4. 人工审核确认 ⏱ 取决于用户
↓
5. 烧录字幕 ⏱ ~1-2min
Step 1: 提取音频并上传
# 提取音频
ffmpeg -i "video.mp4" -vn -acodec libmp3lame -y audio.mp3
# 上传到 uguu.se(临时文件托管)
curl -s -F "files[]=@audio.mp3" https://uguu.se/upload
# 返回 URL 如: https://o.uguu.se/xxxxx.mp3
Step 2: 火山引擎转录(带热词)
转录脚本会自动读取词典作为热词,提高识别准确率:
# 词典位置: /Users/chengfeng/Desktop/AIos/剪辑Agent/.claude/skills/字幕/词典.txt
# 脚本会自动加载
bash ../剪口播/scripts/volcengine_transcribe.sh "https://o.uguu.se/xxxxx.mp3"
词典格式(每行一个词):
skills
Claude
Agent
成峰
剪辑skills
claude code
Step 3: Agent 自动校对
3.1 生成带时间戳的字幕
const result = JSON.parse(fs.readFileSync('volcengine_result.json'));
const subtitles = result.utterances.map((u, i) => ({
id: i + 1,
text: u.text,
start: u.start_time / 1000,
end: u.end_time / 1000
}));
fs.writeFileSync('subtitles_with_time.json', JSON.stringify(subtitles, null, 2));
3.2 Agent 手动校对(不用脚本)
转录后,Agent 必须逐条阅读全部字幕,手动校对以下问题:
常见误识别规则表
| 误识别 | 正确 | 类型 |
|---|---|---|
| 成风 | 成峰 | 同音字 |
| 正特/整特 | Agent | 误识别 |
| IT就 | Agent就 | 发音相似 |
| edge的叉100 | Agentx100 | 误识别 |
| cloud code | Claude Code | 发音相似 |
| Schill/skill | skills | 发音相似 |
| 剪口拨/剪口波 | 剪口播 | 同音字 |
| 自净化/资金化 | 自进化 | 同音字 |
| 减口播 | 剪口播 | 同音字 |
| 录剪 | 漏剪 | 同音字 |
| 作为这个 | 做这个 | 同音字 |
| 斜杠V1/斜杠v | /v | 口语描述 |
| 斜杠v点口拨 | /v.口播 | 口语+同音 |
| a p i t/APIK | API Key | 误识别 |
| excuse | skills | 误识别 |
| 移完了 | 剪完了 | 同音字 |
常见漏字问题
| 原文 | 修正 | 说明 |
|---|---|---|
| 步呢是配置 | 第二步呢是配置 | 漏"第二" |
| 4步就是 | 第4步就是 | 漏"第" |
| 别省时间 | 特别省时间 | 漏"特" |
| 这个我们的 | 这个是我们的 | 漏"是" |
| 在里面看到 | 可以在里面看到 | 漏"可以" |
| 跟大家处理完 | 跟大家讲完 | 用词不当 |
| 剪辑了逻辑 | 剪辑的逻辑 | 语法错误 |
3.3 对照原稿校对(如有原稿)
如果有原稿/脚本,可以辅助校对,但不要用脚本自动匹配(文字差异会导致时间戳累积错误)。
Agent 应:
- 读取原稿作为参考
- 手动逐条对比,发现差异时修正
- 不确定的地方标记,留给人工审核
Step 4: 启动审核服务器
cd 字幕目录/
node /path/to/skills/字幕/scripts/subtitle_server.js 8898 "video.mp4"
功能:
- 左侧视频播放,右侧字幕列表
- 播放时自动高亮当前字幕
- 双击字幕文字编辑(时间戳不变)
- 倍速播放(1x/1.5x/2x/3x)
- 保存字幕 / 导出 SRT / 烧录字幕
- 底部显示词典快捷插入
Step 5: 烧录字幕
默认样式:22号金黄粗体、黑色描边2px、底部居中
ffmpeg -i "video.mp4" \
-vf "subtitles='video.srt':force_style='FontSize=22,FontName=PingFang SC,Bold=1,PrimaryColour=&H0000deff,OutlineColour=&H00000000,Outline=2,Alignment=2,MarginV=30'" \
-c:a copy \
-y "video_字幕.mp4"
| 参数 | 值 | 说明 |
|---|---|---|
| FontSize | 22 | 字体大小 |
| FontName | PingFang SC | 苹方字体 |
| Bold | 1 | 粗体 |
| PrimaryColour | &H0000deff | 金黄色 #ffde00 |
| OutlineColour | &H00000000 | 黑色描边 |
| Outline | 2 | 描边宽度 |
| Alignment | 2 | 底部居中 |
| MarginV | 30 | 底部边距 |
目录结构
output/YYYY-MM-DD_视频名/字幕/
├── 1_转录/
│ ├── audio.mp3
│ └── volcengine_result.json
├── subtitles_with_time.json # 核心文件
└── 3_输出/
├── video.srt
└── video_字幕.mp4
字幕规范
| 规则 | 说明 |
|---|---|
| 一屏一行 | 不换行,不堆叠 |
| 句尾无标点 | 你好 不是 你好。 |
| 句中保留标点 | 先点这里,再点那里 |
反馈记录
2026-01-31
- 火山引擎支持热词,已集成到转录脚本
- Agent 转录后需要自动校对,不能直接交给用户
- 字幕样式:金黄粗体 #ffde00,描边 2px
- IT 常被误识别为 Agent,需加入纠错规则
- 重要:Agent 校对必须手动逐条阅读,不能用脚本自动匹配
- 新增 17 条常见误识别规则(详见 3.2 节)
- 漏字问题比误识别更难发现,需要特别注意
Recommended Agent Skills
Expand your agent's capabilities with these related and highly-rated skills.
videocut:剪口播
口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误
videocut:自进化
自进化 skills。记录用户反馈,更新方法论和规则。触发词:更新规则、记录反馈、改进skill
videocut:安装
环境准备。安装依赖、配置 API Key、验证环境。触发词:安装、环境准备、初始化
setup-pre-commit
Set up Husky pre-commit hooks with lint-staged (Prettier), type checking, and tests in the current repo. Use when user wants to add pre-commit hooks, set up Husky, configure lint-staged, or add commit-time formatting/typechecking/testing.
handoff
Compact the current conversation into a handoff document for another agent to pick up.
edit-article
Edit and improve articles by restructuring sections, improving clarity, and tightening prose. Use when user wants to edit, revise, or improve an article draft.
Didn't find tool you were looking for?