Amazon Transcribe でカスタム語彙を使った書き起こしについて書いた。

Amazon Transcribe でカスタム語彙を使う – Voice Archivist
https://transcri.ption.cf/2020/07/01/amaozn-transcribe-with-custom-vocabulary/

私は半角英数字の前後には半角スペースを入れるようにしている。そのほうが読みやすいと思うからだ。今回の書き起こしでもその原則に従った。

そしてカスタム語彙においても、英数字を語彙に登録した場合、半角スペースを単語の前後に書いて登録していた。

しかし、実際の書き起こしではその半角スペースは無視された。だから、手動での手直しが必要となった。

カスタム語彙に登録するような頻出する単語なら、置換で一括変換すると楽だろう。