AmiVoice SP2は音響学習レベルを上げると認識率が高くなる

onkyo-gakushu
AmiVoice SP2には音響学習レベルというレベルがあります。

音響学習が進むと、そのユーザーの発音のクセを読み取って、より正確に音声をテキストに変換できるようになります。

 

AmiVoice SP2の音響学習レベルと認識率

たとえば、母音ひとつ取っても人によって個性があります。

  • 大きく口を開けて発音した「あ」
  • 小さめの口の「あ」
  • 「えぁ」に近い「あ」
  • 「うぁ」に近い「あ」

など、こういった個人個人の発音のクセを覚えていくことがAmiVoice SP2の音響学習です。

 

使用体験から言うと、私の場合は導入して最初からそれなりの変換精度を見せてくれました。でも、人によっては「最初は使い物にならないかと思った」という感想を持つ人もいます。

こうした認識率に違いが出る理由となるのが、さきほど言ったような発音のクセに依るもので、つまり、認識されやすい発音をしている人とそうでない人がいるということになります。

 

滑舌が悪かったり、こもりがちな声だったりすると、最初はうまく認識してくれないかもしれません。しかし、それも音響学習レベルを上げていくことで、認識率はすぐに高まっていきます。

とりわけ最初の段階の学習が大切で、導入直後は2時間程度、なにかニュースやWikipediaなどの文章を読んで学習させると良いと思います。少しだけ音響学習レベルを上げるだけでも、認識精度がすぐに向上します。

 

音響学習の最高レベルは126までありますが、最高レベルになっていなくても変換精度は充分実用レベルです。

レベル 認識率
0 85%
10 90%
20 91%
30 91.5%

認識率の向上はこんなイメージです。※数字はイメージです。
最初の学習で大きく向上し、あとはさらに誤差を修正していくような感じです。

MAXのレベル126までレベルアップさせるためには、けっこう長い期間使わないといけませんが、育てるというゲーム感覚もあってちょっと楽しいです。

 

複数人で同時使用するときの音響学習レベルについて

AmiVoice SP2は一つのライセンスにつき、一つのパソコンでのみ使用できることになっています。使用人数についての制限はありませんので、どれだけ多くのユーザーが使ってもOKです。

ただ、たとえば同じパソコンでAmiVoice SP2を家族3人で使うような、複数人で同時使用する場合には、音響学習の記録は別々にしたいですよね。発音のクセは家族でも違いますので。

 

user-settei

そうした場合、AmiVoice SP2では簡単にユーザーを追加登録して、ユーザーごとの音響学習レベルを記録していくことができます。ユーザーの切り替えもAmiVoiceバーから簡単に行えます。

家族間でどれだけレベルが上がったか、競争するのも面白そうですね。

 

音響学習レベルによる認識精度を比較してみた

音響学習レベルによって、変換精度にどのくらい違いが出るのか、レベル0と29で比較してみました。

以下は同じ文章を、なるべく同じように音声入力した結果です。

 

レベル0の場合

henkan-seido02
230文字中、3箇所の認識ミス、2語の変換ミス(同音異義語)。

 

レベル29の場合

henkan-seido01
230文字中、1箇所の認識ミス、2語の変換ミス(同音異義語)。

 

やはり認識精度の向上を感じますね。レベル0よりもレベル29の方が、認識ミスが2つ少なかったです。

例えばレベル0で「かんけつ」を「かんてつ」と間違えて認識した場所は、レベル29では「k」と「t」の発音の個性を学習していることが結果に現れていると思います。

同音異義語に関しては、変換候補を文脈から読み取ってはくれますが、どうしても100%にはなりません。これはタイピングでも同じことです。

ちなみに、同音異義語は文字をクリックすると候補が表示されますので、すぐに修正することができます。

 

それにしても、あらためてレベル0でも充分な認識率だと感じます。

音響学習レベルが上がるにつれて認識率は向上し、さらには使用者自身が「認識されやすい発音方法」を覚えていけばさらに精度は高まります。

また、辞書登録も簡単にできますので、使い込むほどにAmiVoice SP2があなた色に染まってもっと使いやすくなっていくことでしょう。


<AmiVoice SP2の購入はこちらから↓>
サブコンテンツ

このページの先頭へ