Agent skill

ai-audio-generation

Stars 5
Forks 0

Install this agent skill to your Project

npx add-skill https://github.com/Gaku52/claude-code-skills/tree/main/ja/07-ai/ai-audio-generation

SKILL.md

AI 音声・音楽生成

AI が音の創造を民主化する。テキスト音声合成、音声クローニング、AI 作曲、サウンドデザインまで、AI 音声・音楽生成の全てを解説する。

このSkillの対象者

  • AI 音声・音楽生成技術を学びたいクリエイター
  • 音声合成をアプリに組み込みたいエンジニア
  • AI 音楽制作に興味がある方

前提知識

  • 音声・音楽の基礎概念
  • Python の基礎知識

学習ガイド

00-fundamentals — 音声 AI の基礎

# ファイル 内容

01-music — AI 音楽生成

# ファイル 内容

02-voice — AI 音声合成

# ファイル 内容

03-tools — ツールとワークフロー

# ファイル 内容

クイックリファレンス

AI 音声サービス比較:
  TTS:     ElevenLabs(高品質)/ OpenAI TTS(API統合)/ VOICEVOX(無料・日本語)
  音楽:    Suno(歌詞→楽曲)/ Udio(高品質)/ Stable Audio
  認識:    Whisper(オープン)/ Deepgram(API)/ Google STT
  分離:    Demucs / Spleeter

参考文献

  1. Radford, A. et al. "Robust Speech Recognition via Large-Scale Weak Supervision." OpenAI, 2023.
  2. ElevenLabs. "Documentation." elevenlabs.io/docs, 2024.
  3. Suno. "Documentation." suno.com, 2024.

Expand your agent's capabilities with these related and highly-rated skills.

Didn't find tool you were looking for?

Be as detailed as possible for better results