機械学習やディープラーニングをビジネスに実装するのは誰の仕事? - データサイエンティストの目前に広がる大きな未来- 

こんにちは、ブレインパッド広報の藤本です。

10月14日(金)に、ブレインパッドが幹事会員を務める一般社団法人データサイエンティスト協会の最大のイベント「3rdシンポジウム~実務者が集うデータサイエンスの最前線~」が、東京駅からすぐのJPタワー ホール&カンファレンス(東京都千代田区丸の内)にて盛大に行われました。

今回のシンポジウムは、旬のAIをテーマに、「人工知能時代のデータサイエンティスト」をコンセプトとして開催されました。

最大の目玉であるキーノートでは、米国・カーネギーメロン大学ロボット研究所の金出武雄教授による、「計算機視覚技術:人工知能の古くからの問題と新たな可能性」というテーマの講演が行われました。
普段はアメリカで活躍していらっしゃる金出教授のお話を直接聞ける機会は本当に貴重ということで、朝10時の開演にかかわらず400名近くの参加者が集まりました。


▲カーネギーメロン大学ロボット研究所 金出武雄教授によるキーノートの様子


いま注目のAIライブラリが集合! 当社がモデレータを務めたパネルセッション

さて、今回のブログでメインにご紹介したいのは、午後に行われたパネルセッション「人工知能ライブラリ活用最前線」です。
このセッションは、日々進化を続ける3つの人工知能ライブラリ、Chainer、TensorFlow、CNTK(The Microsoft Cognitive Toolkit)の提供企業3社(株式会社Preferred Networks、グーグル株式会社、日本マイクロソフト株式会社)に一堂に会してもらい、それぞれのライブラリの紹介と、今後の展望を語っていただくというものです。
この豪華なセッションのモデレータを、ブレインパッドの太田 満久が務めさせていただきました。


▲株式会社ブレインパッド テクノロジー&ソフトウェア開発本部 A.I.開発部長 太田 満久

まず、太田による自己紹介からセッションがスタート。

「当社にはたくさんのデータサイエンティストやエンジニアがおり、目下、Chainer派とTensorFlow派に分かれていますが、今後、CNTKも触ってみようと思っています。私自身、普段から業務に機械学習や深層学習を活用している立場なので、技術者の視点から、ライブラリについてはもちろん、昨今の機械学習・深層学習ブームに対する各社の考えなど、幅広く伺っていきたいと思います。」(太田)

続いて、会場に集まった100名超の皆さんに、「あなたの職種は?」「深層学習を使ったことがありますか?」という質問を投げかけ、挙手をしてもらったところ、以下のような回答結果となりました。

さらに、「3つのライブラリを使ったことがあるか」という質問をしてみたところ、TensorFlowを使ったことのある人が1割強と最も多く、Chainerが1割程度、CNTKが1割弱という回答結果でした。
どうやら、機械学習や深層学習については、「使ってみたいけど、まだ使ってみたことはない」「使う機会がない」というのが世の中の実状なのかもしれません。

前半は、パネリストが各ライブラリを紹介

セッションの前半では、3名のパネリストからそれぞれの人工知能ライブラリをご紹介いただきました。


▲株式会社Preferred Networks 最高戦略責任者(CSO) 丸山 宏氏
「深層学習はまだまだ流動的な領域ですので、いかに新しいことにチャレンジしていけるかが重要だと思っています。Chainerは、以前は他に比べてスピードが遅いという評価もありましたが、最新版では遜色ない性能が出ています。Pythonで書かれているので、普段Pythonをお使いのデータサイエンティストなら快適に使いこなしていただけると思います」(丸山氏)


▲グーグル株式会社 クラウドプラットフォーム デベロッパーアドボケイト 佐藤 一憲氏
「TensorFlowについて、オープンソース化するくらいだから本当の最新技術ではないのでは?と言われることもありますが、正真正銘、Google本国のブレインチームが毎日使っているものと同じものを提供しています。GCP(Google Cloud Platform)上で動かすと、簡単な設計でクラウド上で分散学習ができ、その学習結果をすぐにクラウド上で実運用に移行したり、スマホやIoTに展開することも容易です」(佐藤氏)


▲日本マイクロソフト株式会社 技術統括室 業務執行役員 ナショナルテクノロジーオフィサー 田丸 健三郎氏
「CNTKは、より高い生産性と競争力を獲得するために、深層学習のアルゴリズムや仕組みがわからなくても使いこなしていただけるようなものにしたいと考えています。複数のGPUやサーバーをまたいだ分散処理によるスケールアウトができるのが特徴で、近日中にPythonによるサポートも開始する予定です。また、モデルの活用においては、マイクロソフトのクラウドサービスでFPGAによる大規模展開・高速実行をサポートしていく予定です。」(田丸氏)


ここでは、より詳細な各ライブラリの紹介は割愛させていただきますが、各社より様々なかたちで情報公開がなされていますので、ご興味のある方はご覧になってみてください。

Chainerについて
http://chainer.org/

TensorFlowについて
http://tensorflow.org/

CNTK(The Microsoft Cognitive Toolkit)について
https://aka.ms/cognitive-toolkit


後半は、AI時代に求められる人材の議論へ

セッションの後半では、ライブラリうんぬんを超えて、これからのデータサイエンティストやエンジニアに求められることは何か、という話題に発展していきました。
以下、登壇した皆さんのコメントを抜粋する形で、その一部をご紹介させていただきます。

太田
今後、機械学習や深層学習のエコシステムは、どのような方向に進化していくのでしょうか。また、その進化に伴い、私たち技術者に求められるものも変化していくのでしょうか。ぜひ、お考えをお聞かせください。

丸山氏
データサイエンティストにはRやPythonが好まれるのでしょうが、よりビジネスにフォーカスすることを考えると、機械学習や深層学習を実際に組み込んだシステムをいかに設計できるかが勝負の分かれ目になると思います。しかし、その方法論は、まだモヤモヤと曖昧であるように思います。

田丸氏
データクレンジングやパラメータ設定などが、既に人間の考えることではなくなってきているように、これからは「難しい問題を最も簡単にスピーディに解ける選択肢は何か?」を考える時代になってくるのではないでしょうか。いまはまだ研究開発段階である技術も、今後は加速度的にツールに組み込まれ、実用化されてくると思います。

佐藤氏
各ライブラリ共にAPIが固まってきて、より短い行数で、より多段層なモデルが作れるように進化していくでしょう。また、ハイパーパラメータのチューニングを自動化する機能なども進化していくでしょう。また、各ライブラリにも様々な開発手法がベストプラクティスとして蓄積されていくと思うので、データサイエンティスト、システムエンジニア、ビジネスの3者が、それらを参照しながら、開発の方法論の部分で意見を戦わせやすい状況になっていくと思います。

丸山氏
少し違う目線にはなりますが、深層学習は、データ分析の領域以外にも活用されていくと思います。例えば、生成モデル(多次元同時確率分布をノンパラメトリックに推定できる仕組み)が実用化されるようになれば、価値密度が低いセンサーデータなども、統計的な性質を担保したまま数メガバイトレベルに圧縮するようなことが深層学習で実現できる可能性があります。

太田
私も日々さまざまなデータ分析プロジェクトに関わる中で、機械学習・深層学習の登場によって、データ分析という概念が大きく変わってきたと実感しています。進化を続ける技術を使いこなす人材は、データサイエンティストなのでしょうか、それともエンジニアなのでしょうか?

丸山氏
コンピュータサイエンスをやってきた私にとっては、数学・統計もわかり、エンジニアリングもわかるなんて神様のような存在だと思っていましたが、既にこの両方に精通する“両生類”のような人たちが出てきています。これからのビジネスは、このような両生類型の人たちが切り開いていくのではないでしょうか。

最後に、機械学習や深層学習を扱っていく技術者の皆さんへのメッセージ

田丸氏
CNTKは、他の2社には後塵を拝していますが、時間をかけている分、使いやすく良いものをご提供できていると思っています。当社は、深層学習をいかに簡単にビジネスシーンで使っていただけるようにするかを志向していますので、ぜひ一度、CNTKをお使いになってみてください。

佐藤氏
大盛況に終わった先日のTensorFlow User Groupの第1回Meet-upにNHKのテレビ取材が入り、翌朝の「おはよう日本」にて放映されるくらい、深層学習は日本でも身近なものになってきていると実感しています。ぜひ皆さんもTensorFlowを実務に活用してみてください。

丸山氏
機械学習や深層学習を使うシーンでは、ウォーターフォール型やV字型とは全く異なる開発プロセスで問題解決がなされており、DevOps(※)ならぬ“ResearchDevOps”のような開発モデルが一般的になる時代がくるように感じています。私たちはいま、1960年代にソフトウェア工学が誕生した時と同じような黎明期に直面しているのではないでしょうか。皆さんの経験や知見を結集して機械学習工学のディシプリンを立ち上げ、新しい可能性を切り開いていきましょう。

※DevOps(デブオプス)とは、開発 (Development) と運用 (Operations) を組み合わせた用語であり、開発担当者と運用担当者が連携して協力する開発手法を指す。


以上、セッションの一端をご紹介しましたが、このセッションを通じて、データサイエンティストとエンジニアの境界線はますます曖昧になってきており、両者が互いの役割を超えて協調・発展していくことが求められる時代になっているのだなと感じました。


ブレインパッドは、「機械学習/ディープラーニング活用サービス」を通じて、研究開発としてではなく、実際のビジネスシーンに機械学習やディープラーニングを適用するご支援をさせていただいています。

実ビジネスで機械学習や深層学習を活用してみたいという方は、ぜひエントリーください。
新卒・中途問わず大募集しています!
www.brainpad.co.jp