jsonファイルを扱いやすいように
Amazon Transcribeで文字起こしをすると、asrOutput.json
というjsonファイルが作成されます。
Amazon Transcribe(音声をテキストに変換する機能を簡単に追加)| AWS
jsonファイルは発話した時間が含まれていたりしますが、それらを除外して発話の内容だけを抽出する必要があります。
使用していたサイトが使用できなくなった
使用していた以下のサイトが「404 NOT FOUND」で使えなくなっていました。
http://transcribe-editor-static-web-page.s3-website-us-west-2.amazonaws.com/
jqコマンドでできる
これで出力できます。とても簡単です!
cat asrOutput.json | jq .results[][0].transcript