日本たばこ産業によるAIコンペティションで全1013チーム中、第3位に入賞しました!

分析コンペサイト「SIGNATE」にて行われた「日本たばこ産業 たばこ商品の画像検出」にて、当社のデータサイエンティストチームが全1013チームの中で見事第3位に入賞しました!
本ブログでは表彰式の様子についてご紹介したいと思います!

こんにちは。アナリティクスサービス部の井出です。
先日分析コンペサイトSIGNATEにて、日本たばこ産業株式会社(JT)がホストとなって行われた「たばこ商品の画像検出」に、同じくアナリティクスサービス部の兵藤さんと参加しました。結果、全1013チームの中で第3位の精度を出し、見事入賞しました!
プレゼンテーションも実施した表彰式当日の様子について紹介したいと思います。

■コンペの概要・趣旨について

SIGNATEとは データサイエンティストコミュニティです。ここでは、企業がホストとなってデータサイエンスコンペティションが行われています。
今回我々が参加した「たばこ商品の画像検出」は日本たばこ産業がホストとなって開催されました。
コンペページ :日本たばこ産業 たばこ商品の画像検出(ステージ1) | SIGNATE - Data Science Competition

背景(コンペページより原文のまま引用)
~加熱式たばこ等の登場によるたばこ銘柄増~
近年の技術革新により、従来の紙巻たばこに加え、新しいスタイルのたばこ製品として、加熱式たばこ等が登場してきており、銘柄が増えております。

~棚画像情報からたばこ商品を検出する機械学習アルゴリズムを提案いただきます~
販売店舗の方への売り場支援の一環として、棚割りのご提案を行うにあたり、棚における各銘柄の配置確認を行っています。本確認をより早く正確に行う上で、新たな機械学習アルゴリズムを募集します。

棚画像からタバコの銘柄を識別するイメージ

■本コンペにおけるアプローチ方法

本コンペの最大の特徴は、新発売の銘柄(クラス)に対しても、その銘柄のたばこを撮影した画像(マスタ画像)が一枚だけあれば、モデルを再学習することなく、予測できるようなモデルを実装しなければならないというルールが設けられていた点でした。

VGGやResNetなどの一般的な分類モデルでは、学習したクラスに対してしか予測できません。学習で使用していない新規クラスを予測できるようにするためには、新規クラスのデータを集め、モデルを再学習する必要があります。
そのため、一般的な分類モデルで新規クラスを予測するためには、データ収集やモデルの再学習などのコストが生じるという問題があります。

本コンペのルールは、上記のような一般的な分類モデルにおいて生じる問題に対応するために設けられたものでした。
アプローチの詳細についてはコンペの参加規約上ここに記載することはできませんが、我々はマスタ画像と予測対象画像の距離を学習する距離学習(Metric Learning)と呼ばれる手法を採用しました。


一般的な距離学習のアプローチ

  1. 同じクラスのマスタ画像と予測対象画像の距離が近くなるようにCNNモデルを学習する
  2. マスタ画像に(学習で使用していない)新規クラスの画像を加える
  3. 全マスタ画像(学習クラス+新規クラス)と予測対象画像の距離を学習済みCNNモデルで算出し、最も距離が近いマスタ画像のクラスを予測結果とする

アルゴリズムイメージ

■本コンペの取り組み方

本コンペは、最初は1人で進めていましたが、途中から同じ部の先輩である兵藤さんと一緒にチームを組んで進めることになりました。
当社ではSIGNATEやkaggleなどの外部コンペへの参加を推奨する風土があり、kaggleの過去のコンペのアプローチを有志でまとめたり、仕事でも応用可能な有用なコードを共有し合ったり、という活動を行っています。また、社内のチャットでコンペの参加状況や現時点の順位を共有したり、チームメンバーを募集するような活動も活発で、ここからチームを組むことになりました。
チームを組んでからは2人でコンペに関する意見交換をし、役割分担をしつつ進めていきました。社内に多数存在するGPGPUサーバは、業務に利用されていない場合はコンペ参加の用途でも使用可能であり、上記GPGPUサーバを利用しながらコンペに参加する先輩方もいます。

■表彰式の様子

表彰式では我々のアプローチ詳細についてのプレゼンも行い、たくさんの方に聞いて頂きました。

表彰式後の懇親会では、本コンペを運営して頂いた方々から、正解データ作りに関する苦労などコンペの裏話について色々伺うことができました。


■今回コンペに出てみた感想

本コンペでは、最終評価が精度0.98281と、我々でも驚くほどに、高精度でたばこを識別できるモデルを作成することができました。
私自身もモデルの予測結果を目視してみたのですが、人の目でも判別が難しいような画像に対してもモデルでは正しく予測できていました。
「棚における各銘柄の配置確認」を実際に行っている人と同等の精度で、私たちのモデルはたばこを識別できているといえるかもしれません。少なくとも、人間の作業をモデルに置き換えて自動化できる性能を十分に満たしている可能性が高いといえます。
本コンペのテーマに限らず、画像を目視して点検するような業務は、モデルによる自動化が期待できます。
当社としても、以下のような事例があります。

www.brainpad.co.jp
www.brainpad.co.jp

高精度なモデルを作成するためには、一般的に十分な質と量のデータを学習させる必要があります。本コンペでは、新製品の銘柄に関しては画像が1枚だけあれば予測できるようなモデルを作成しました。これは、新製品の銘柄が発売された際の正解データ作りとモデルの再学習の負担を減らすことができるため、とても意義のあるテーマだったと感じています。
一方で、既に発売済の銘柄に関しては、今回モデルの学習用に大量に正解データを用意して頂いています。
表彰式後の懇親会で運営の方々から伺いましたが、人の目でも判別が難しい画像も多く存在し、正解データ作りにはとても苦労されていた様子でした。
今後は、少量データでの効率的な学習や効率的な正解データ作りなど、正解データ作りの負担を軽減する仕組みを検討することが技術者としての課題の一つだと感じました。

本コンペには、学生・社会人、国内・海外に関わらず、様々な方々が参加しており、コンペへの注目が高まっていると感じました。
コンペでは、課題整理、データ理解、論文調査、モデル実装、チューニングなど、実際の案件でも重要な作業を経験することができます。
今回、私もコンペに参加したことで、スキルアップに繋がったと感じているため、今後も、コンペに参加し続けていきたいです。

■まとめ

今回は「日本たばこ産業 たばこ商品の画像検出」への取り組みについて紹介させていただきました。
コンペに参加することで、多様な作業を経験することができるので、データ分析のスキルアップを目指している方は、コンペへの参加を検討してみてはいかがでしょうか。
また、ブレインパッドでは、SIGNATEやKaggleなどの外部コンペへの参加が推奨されています。
その他、過去に行われていたコンペを用いた勉強会、知見の収集などを通じて個々人のスキルアップや組織知見の向上を目的とした活動も行っているので、興味を持っていただけると幸いです。


■最後に

当社では、データサイエンティストを募集しています!実際のビジネスで自分の知識・技術を活用してみたいという方、ぜひエントリーください!
www.brainpad.co.jp