先月からこの書き起こしサイトを始めた。最新のラジオ番組や過去の放送など、基本的に私が興味があるものを書き起こしていく。突然 10 年前のラジオ番組とかを書き起こしたりもするかもしれない。
書き起こしというものは初めてやったので、いろいろ発見があった。
まず私のやり方としては、録音した音声を Mac で再生。BlackHole という仮想オーディオデバイスを使って再生した音声を Google Docs の書き起こし機能で自動的に書き起こす。
ExistentialAudio/BlackHole: BlackHole is a modern macOS virtual audio driver that allows applications to pass audio to other applications with zero additional latency.
https://github.com/ExistentialAudio/BlackHole
機械による書き起こしが終わったら、実際に音声を聞きながら修正していく。Google Docs はそれなりに優秀ではあるけれども、まだまだ手直しが必要なレベルだ。
うちの家族も書き起こしのバイトをしているようで、それは音声を聞いて、同じ文章を自分で発話し直してそれを書き起こしツールで書き起こすらしい。自分がはっきり話したほうが、オリジナル音声よりも書き起こしツールの精度が上がるからみたいだ。たしかに、そのやり方もありかもしれない。Google Docs の書き起こしを手直しするのは結構大変な作業なんだよ。
Google Docs のもう1つの問題点は、ブラウザからフォーカスが外れると書き起こしが止まってしまうこと。音声再生用のアプリを操作している間はブラウザからフォーカスが外れる。再生アプリの再生ボタンを押してすぐに、ブラウザの Google Docs の書き起こし開始ボタンを押したり、ちょっと忙しい。
自動書き起こしは Mac でやるが、音声を聞きながら Google Docs の書き起こしを修正していく作業は iPad でもやっていた。iPad の Split View で、プレイヤーとエディターを同時に開けるからだ。
書き起こしをすると、それこそモノマネができるレベルまで聞き返すので番組内容を十分理解できる。普段なら聞き流している番組が記憶に残りやすい。
書き起こしは話者の話した内容をそのまま書き起こせばいいというわけではない。言いよどみや、言い間違いなどは基本的に削除していった。例えば以下のような言葉はほとんど意味なく使っている人がいるのでどんどん削除した。
・あの
・その
・なんか
・〜ね
・いわゆる
・結局
・ちなみに
・やっぱり
・非常に
文章というのは、一文を短くすると読みやすくなる。文章を書く際の基本である。しかし、話し言葉というのは、延々と文章が繋がることがよくある。そのまま書き起こせば非常に読みにくいので、思い切って編集した。
このように、書き起こしはどうしても編集作業が入る。だから、単に機械にやらせればいいというわけではない。書き起こし作業者の力量によって、成果物の読みやすさが左右される。実はそれなりにクリエイティブな作業だったりもする。
それと書き起こすのにも知識や教養が必要だ。内容を理解できないと認識に上がらない。文字化できない。誰でもできる作業ではない。
音声が乱れていたりして時々どうしても聞き取れないことがある。あるいは内容を理解できないがゆえに聞き取れないことがある。そういうときは、前後の文脈から推測するか、時間を置いて再度聞き直すと分かったりすることもある。
何を言っているのかを解明する作業という点で、書き起こしは翻訳と似ているともおもった。