https://transcription.homisoftware.net/index.html
| LP | APP |
|---|---|
![]() |
![]() |
whisperとffmepgをブラウザで動かしてフロントエンド完結で文字起こしができるアプリケーション
https://zenn.dev/homing/articles/9ea769ab12f310
メディアファイルの変換と文字起こしの処理をサーバではなくブラウザで実行しているのでサーバー代がかからない。
利用側はlinuxの知識無しで最新の文字起こしが使える。
CのコードをWebAssemblyにコンパイルしたコードを使っているためメンテにCの知識が必要。
フロント側でほぼすべて完結しているので簡単にアプリがパクられる。
cd cdk
cp .env.base .env
cdk deploy --all
- src配下のファイルをバケットに突っ込む
- modelsはファイルサイズが大きいのでここから持ってきて手動で入れる(ファイルサイズがお大きいのでgit管理はしない。)
https://huggingface.co/ggerganov/whisper.cpp/tree/main - CloudFrontのキャッシュを更新
- バケットの中身を空にする
cd cdk
cdk destroy --all

