本文へジャンプ

機械学習技術 自動的に賢くなる認識システム 東芝デジタルソリューションズ株式会社 ソフトウェア&AIテクノロジーセンター 知識・メディア処理技術開発部

機械学習技術 自動的に賢くなる認識システム 東芝デジタルソリューションズ株式会社 ソフトウェア&AIテクノロジーセンター 知識・メディア処理技術開発部

半教師あり学習を用いた蓄積データの活用により、自動的に予測精度を向上

近年、クラウド技術の発展やセンサの小型化などによって大量のデータを容易に収集できるようになり、製造、流通、金融をはじめとする多種多様な分野で機械学習を用いた高度な予測や業務改善が期待されています。しかし、大量のデータを機械学習に利用することは容易ではありません。

通常、機械学習ではデータに正解ラベルを付与して学習を行う「教師あり学習」が用いられますが、正解ラベルは人手で付与されるため、大量のデータに対してラベルを付与するには膨大なコストがかかってしまいます。「半教師あり学習」はデータの一部を正解ラベル未付与のまま学習に利用することができるため、大規模データ学習による精度向上とラベル付けコストの削減を両立することができます(図1)。半教師あり学習手法の一つに、ラベルありデータから学習した識別器を用いてラベルなしデータを識別し、予測結果をラベルとして付与した後に教師あり学習を行う手法があります。この手法では、誤ったラベルありデータが多くなると学習しても精度が悪化するという課題がありました。一方、予測結果の確信度の高いデータ、すなわちシステムが良く知っているデータを学習しても未知のデータに対する予測精度は向上しないなど、学習させるデータにより学習効果が違ってきます。我々はこの点に注目し、識別器の予測精度向上に寄与するデータを推定して、それらを選択的に学習することで半教師あり学習の効果を高める手法を開発しました[1]。実験では、手書き数字認識や工場ラインで撮影された文字の認識において、ラベルありデータのみで学習した場合よりも誤認識を2~3割低減できることを確認しました。

半教師あり学習は利用環境への自動適応技術としても応用が期待できます。画像認識や音声認識などのアプリケーション[2][3]では認識すべき画像や音声が利用するユーザによって一般的には異なるため、これまではユーザ毎に認識辞書をカスタマイズして精度を高めるという事前準備が必要でした。これに対して、半教師あり学習を用いてユーザが入力したデータをラベルなしのままで学習することで、自動的に環境に適応する認識システムを実現できます。複数のフォントを学習した汎用的な文字認識システムをゴシック体のみを使用する環境や明朝体のみを使用する環境に自動環境適応させたところ、いずれの条件でも精度が向上し、明朝体環境への適応では誤認識を8割程度低減できることを確認しました(図2)

本技術により、様々な現場で日々蓄積されるデータの価値を最大限引き出し、自動で予測精度を向上させる「賢くなる認識システム」の実現が期待されます。

半教師あり学習のイメージ図

ラベルありデータのみを用いる教師あり学習(右上)と比較してラベルなしデータを活用する半教師あり学習(右下)はよりよい識別境界の推定が可能。

教師あり学習と半教師あり学習の比較画像

教師ありと半教師ありの比較図の画像

半教師あり学習を用いた自動学習による認識結果改善の例

入力画像に対する自動学習前後の認識結果のうち精度が改善した例。自動学習よって赤字で示す誤認識が改善。

半教師あり学習を用いた自動学習による認識結果改善の結果画像

半教師あり学習を用いた自動学習による認識結果改善の結果画像