Skip to content

フロントエンド完結で文字起こしが行えるwebアプリケーション

Notifications You must be signed in to change notification settings

ritogk/transcription

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 
 
 
 
 

Repository files navigation

フロントエンド完結で文字起こしが行えるwebアプリケーション

https://transcription.homisoftware.net/index.html

LP APP
image image

このアプリケーションは何?

whisperffmepgをブラウザで動かしてフロントエンド完結で文字起こしができるアプリケーション

技術記事

https://zenn.dev/homing/articles/9ea769ab12f310

良い点

メディアファイルの変換と文字起こしの処理をサーバではなくブラウザで実行しているのでサーバー代がかからない。
利用側はlinuxの知識無しで最新の文字起こしが使える。

悪い点

CのコードをWebAssemblyにコンパイルしたコードを使っているためメンテにCの知識が必要。
フロント側でほぼすべて完結しているので簡単にアプリがパクられる。

setup

1.インフラ生成と更新

cd cdk
cp .env.base .env
cdk deploy --all

2.ファイルを配置

  1. src配下のファイルをバケットに突っ込む
  2. modelsはファイルサイズが大きいのでここから持ってきて手動で入れる(ファイルサイズがお大きいのでgit管理はしない。)
    https://huggingface.co/ggerganov/whisper.cpp/tree/main
  3. CloudFrontのキャッシュを更新

インフラのあとかたずけ

  1. バケットの中身を空にする
cd cdk
cdk destroy --all

About

フロントエンド完結で文字起こしが行えるwebアプリケーション

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published