新着情報information

アノテーションを自動化しディープラーニングの学習プロセスを効率化

オートレジ

 2000年代後半のディープラーニング(深層学習)の登場により、AIによる画像認識は飛躍的に向上しました。

 

  • スマートフォンの顔認証
  • 車の自動運転
  • 製品の不良検出
  • CT画像のAI診断
  • コンクリート建造物の劣化診断

 

 上記のことなど様々な分野での活用が進んでいます。社員食堂向けレジシステム「CoolRegi」もAIの画像認識で食器を識別することで自動決済を可能とする「オートレジ」機能を搭載しています。今後も様々な分野で活躍が期待されるAIの画像認識技術ですが、導入にあたっては「教師データの準備」が大きなハードルとなることが少なくありません。

 

 ディープラーニングの学習プロセスでは大量のラベル付けされた画像(=教師データ)を必要としますが、精度を上げるためには数千~数万、それ以上の教師データが必要となることもあります。しかしながら、教師データを準備するための「撮影」「アノテーション(領域指定・ラベル付け)」と呼ばれる作業の多くは手作業で行われており、ここに非常にコストがかかってしまうわけです。

 

 本コラムでは、「撮影」「アノテーション」の自動化によりディープラーニングの学習プロセスを効率化したCoolRegiの事例を紹介します。

 

CoolRegiの学習プロセスと自動化範囲

 

 

CoolRegiでは学習プロセス前半の撮影・アノテーション作業の自動化に取り組みました。

 

手作業による撮影・アノテーション

撮影

食器の向きや光の反射にバリエーションを持たせるため、食器を少しずつ動かしながら撮影していきます。

 

 

アノテーション

撮影した画像の中で食器を範囲選択し、ラベル付けをしていきます。

 

 

 

 いずれも単体ではさほど時間がかかる作業ではありませんが、数万枚となると話が変わってきます。また手作業による範囲選択ミス、ラベル入力ミスなどの人的エラーが発生することも避けられず、結果的に学習プロセス全体が非効率なものとなってしまうわけです。

自動化ツールを使った撮影・アノテーション

動作イメージ

 

 

特徴

 

  1. 秒間1~20枚の撮影が可能(設定可)
  2. 撮影と同時にアノテーションが終了
  3. 明るさ、ホワイトバランス、ノイズ、ランダムトリムなどのバリエーションを自動生成可能(オプション)

 

ツール構成

パソコンとwebカメラだけで動作するため、特別な機器は不要です。

 

効果

※50種x200枚 = 合計10,000枚のケースにおいて

まとめ

 自動化ツールによって教師データの準備にかかる時間が大幅に削減され、後続作業の学習・評価(チューニング)により多くの時間を割くことができるようになりました。

 

 今回製造したツールはある程度の汎用性を持たせており、コンビニの画像認識レジなど「背景が動かない・認識対象を様々な角度から大量に撮影する必要がある」ケースに少しのカスタマイズで対応できるようになっています。

 

その他の機能は機能紹介よりご参照ください。また、多くお問い合わせいただく質問はよくあるご質問からご参照ください。

 

 今まで教師データの準備がハードルとなりAI画像認識の導入を諦めていたお客様、日常的に画像のアノテーション作業に関わっていらっしゃる方などAI画像認識に興味ある方や問い合わせやデモのご依頼についてはお気軽にお問い合わせください。