こんな課題はありませんか?
ACS Subtitle Aligner が解決します
字幕のタイミング調整に時間がかかる
動画編集で音声を聞きながら1行ずつタイムスタンプを設定する手作業が、制作時間の大きなボトルネックになっている。
外部の文字起こしAPIは高コスト
クラウドのAPIや外注サービスを利用するとコストがかさみ、しかも台本通りに正確な文字起こしがされないことが多い。
未公開のデータを外部に送りたくない
機密情報を含む音声やリリース前の動画データを、セキュリティの観点から外部サーバーにアップロードできない。
主な機能
動画制作のテロップ作成時間を劇的に削減
Whisper強制アライメント
Whisperモデルを利用し、アップロードした台本テキストの各行を、音声の実際の発話タイミングにミリ秒単位で正確に合わせます。
台本をそのまま字幕化
テキストファイルの改行をそのまま1字幕として認識。文字起こしAI特有の「言い間違いのテキスト化」を防ぎ、意図通りのテロップを作れます。
完全ローカル・GPU不要
外部サーバーと通信しない完全ローカル動作のため情報漏えいの心配がありません。CPUのみでも安定して動作します。
多言語・自動判定対応
日本語・英語など多数の言語に対応。Whisperが音声を解析して自動で言語を判定し、高精度なアライメントを実行します。
テキストファイルの自動判別読み込み
UTF-8、Shift_JIS、CP932などの文字コードを自動判別してテキストファイルを読み込みます。
SRTファイルを直接出力
生成された結果はそのままSRT形式で保存可能。DaVinci Resolve等の一般的な動画編集ソフトですぐに読み込んで使えます。
技術仕様
バージョン
1.0.0
OS
Mac / Windows
エンジン
OpenAI Whisper + stable-ts
依存環境
不要(スタンドアロン)
ライセンス
無料