音声認識ソフトで会議・議事録・インタビューをテキスト化できるか
音声認識ソフトを使って会議の議事録やインタビューの音声をそのままテキスト化できるかどうか、説明していきます。
音声認識ソフトで議事録のテキスト化はできる?
会議室で録音された音声を文字起こしして、議事録として記録している企業も多いかと思います。こういった作業は非常に時間を取られるわりに、なかなか生産性がある作業ではない場合も多いです。
なので、できるだけ時間を短縮したいわけですが、会議室で録音した音声をそのまま文字にするというのは、現在の音声認識ソフトではなかなか辛いところがあります。
多くの場合、音声認識ソフトは、「マイクと適正な距離で発声された音声」を解析することが想定されています。
つまり、会議室の真ん中に設置されたマイクでは、発声源から距離がありすぎますし、また、雑音が入ることも多くてテキスト化はうまくいかないということです。言い間違いをしたり、咳き込んだりすると、それも正しくテキストにすることはできません。
こういった場合は、会議を録音した音声を聞きながら、後でマイクによって読み上げて入力していく(復唱)という方法が有効です。
二度手間にはなりますが、作業効率という面では普通に聞き取りをして文字を起こすよりも、音声認識ソフトを使用した方がはるかに能率が上がると思います。
音声入力前提の会議ならそのままテキスト化出来るかもしれない
音声入力を意識した会議の録音方法をしてみるのも一つの方法です。要するにマイクを発言者と適正な距離に設置し、発言者にも音声入力を意識した発声をするように前もって促すということです。
発言者をはじめ、会議の参加者に雑音や無駄話などをしないように徹底すれば、音声をテキスト化するときの認識率は高まるでしょう。
ただ、会議というのは文字起こしすることが最優先事項ではないわけで、アイデアの提案や問題の解決方法の決定など肝心な目的を阻害してしまうかもしれません。そのような場合は、無理に採用しないほうが無難です。
インタビューはそのままテキスト化できる?
これも議事録と同じですが、インタビュアーとインタビューされる人が、音声認識を意識したしゃべり方をすればテキスト化の認識率は高まります。インタビューなので、発声源とマイクの距離は適性位置で行いやすいかもしれません。
しかし、やっぱりインタビューの対象がいつもこうしたしゃべり方をしてくれるとは思えませんので、インタビューの音声も後から復唱を行って文字起こしをするのが適当だと思います。
結論
音声認識ソフトで、議事録やインタビューをそのままテキスト化することは難しい。
復唱による音声入力で文字起こしをすれば、かなり効率化できる。