仕事柄 、インタビュー取材を行うことがけっこうあります。
インタビュー取材のときは、ICレコーダーで録音し、そのデータを使って原稿を作成するのですが、そのとき必要になるのが、「テープ起こし」という作業です。
 
テープ起こしというのは、録音した音声データから文字データを作成する作業のことです。
 
ちなみに、「テープ起こしのテープってなに?」という若い世代の方に説明しておきますと、テープというのはカセットテープのこと。最近、ちょっと人気が出てきたような話を聞くのですが、見たことすらないという人がほとんどではないでしょうか?
 
その昔、インタビュー取材の録音は小形のテープレコーダーを使っていました。そのテープから文字を起こすので「テープ起こし」というわけです。今はICレコーダーが主流ですので、「文字起こし」という名称の方が使われているかもしれません。
 
ということは、いまだにテープ起こしなんて言葉を使っていると、若い編集さんやライターさんにはおじさん扱いされてしまうかもしれませんね……。気をつけよう(笑)。
 
さて、話が脱線してしまいましたが、このテープ起こし、実はかなり時間がかかります。話し方には人それぞれクセがありますし、理路整然と少しの淀みもなく、明瞭に話せるという方はほとんどいません。
 
専門用語が入ることもありますし、同時に複数の人がしゃべる、笑い声が入る、書類をめくる音、くしゃみや咳などで聞き取りにくいことも珍しくないので、何度も巻き戻して聞き直す必要があるのです。
 
そのため、言葉を正確に聞き取って、それを入力していくスキルが求められるわけです。この作業をそれなりの金額で専門に請け負う方もいるくらいの難しさといえば伝わるでしょうか?
 
さて、テープ起こしを専門家に外注できれば楽なのですが、このご時世そんな予算を貰える仕事は滅多にありません。そこで、自分でテープ起こしをすることになるのですが、なにしろ時間がかかるので、なんとか楽にできる方法はないかとずっと考えていました。
 
そこに登場したのが、スマホの音声入力機能です。
 
スピーカーの前にスマホを置いて、録音データを流しておけば勝手に文字になるじゃん! オレ天才!! と思ったのですが、あえなく失敗。録音データには、ホワイトノイズがのっていて、環境音も同時に録音されてしまうために、ほとんど聞き取ってもらえないのです……。
 
音量を大きめにしてうまくイコライザーで調整すれば、聞き取ってもらえることもあるのですが、抜けてしまう発言も多いので実用はムリでした。
 
しかし!
 
ここで、「録音データを聞き取ってもらえないなら、自分でしゃべればいいじゃん! オレやっぱり天才!!」という画期的(?)な方法を思いつきます。
 
正確な会議録や議事録を作成するわけではなく、インタビューの内容がわかればいいので、多少の誤字脱字は問題ありません。しかも、自分でしゃべることで内容が頭に入り、要点も整理できてしまう一石二鳥の方法です。
 
この方法を使い始めてから、大幅にテープ起こしにかかる時間が短くなりました。自分はAndroidのスマホでGoogle日本語入力を使っていますが、驚くほど正確に入力されていきます。おそらく、iPhoneでも同じでしょう。
 
このほかにGoogleドキュメントの音声入力を使って、パソコンのマイク端子から音声データを流して文字入力するという方法もあるのですが、うまくいくデータもあれば、いかないデータもあるのが現状です。
 
アナウンサーが読むニュースなど、発音がはっきりしていてノイズが少ない音源であれば、かなり高精度な自動入力になるのですが、インタビュー音源だと誤入力や入力漏れが多く、まだまだ厳しい感じです。これができるようになれば、さらに楽になるのに……。
 
Androidの「OK Google」やiPhoneの「Hey Siri」のほか、最近話題のスマートスピーカーでも注目を浴びる音声の認識機能ですが、工夫次第でまだまだいろいろな使い方ができそうです。
 
実はこの原稿、試しに音声入力で下書きをしてみました。思いついたことをパラパラとしゃべるだけで下書きができるので、これ楽かも。
 
今後も音声入力の進化から目が離せませんね!

この記事を書いた人
小日向 淳/フリーライター/1970年東京都生まれ。
商社の営業を退職後、専門誌でライターとしての仕事をスタート。現在はフリーライターとしてオールジャンルの記事を書籍、雑誌、Webで執筆。趣味はサッカー観戦と音楽鑑賞、車と自転車いじり。

ログインする

詳細をお忘れですか?