【大学指導教員&出身社員対談】 大学・大学院での学びが社会につながる。 データサイエンティストの基礎となった「ドメイン知識」と「本質を捉える」ことの重要性

Platinum Data Blog編集部・編集長の木原です。
ブレインパッドは年間300回以上の勉強会が自主的に開催されており、学習意欲の高い人材が集まっています。そんなブレインパッドには、入社前に学業や研究活動に力を入れていた社員が多く在籍しており、今回の記事を皮切りに「指導教員×社員シリーズ」として、大学や大学院などでの学びが、今の業務にどう活きているのかを探っていきたいと思います。
今回はシリーズ第1回として、工学院大学の三木先生と、その指導を受けた当社データサイエンティスト沼瀬さんにお話を伺いました。

お話しいただく二人のプロフィール

三木 良雄先生
工学院大学 情報学部長 情報科学科教授
1986年、京都大学大学院工学研究科電子工学専攻修了後、株式会社日立製作所に入社。在籍期間30年の中で、前半15年はCPUやスーパーコンピューターなどのコンピューターシステムの開発にエンジニアとして従事。後半15年はITサービスや新事業の開発・推進に取り組み、社内のデータサイエンティスト部隊の立ち上げにも携わる。2015年に工学院大学に赴任し、システム数理学科(現・情報科学科)の設立に取り組む。エンジニア経験や、数多くの新事業立ち上げの経験を基に、学生に対してデータサイエンスやマーケティングの重要性を伝えている。

沼瀬 太朗
株式会社ブレインパッド アナリティクスコンサルティングユニット所属 データサイエンティスト
2023年、工学院大学大学院工学研究科システムデザイン専攻修了後、ブレインパッドに入社。入社後3か月間の新入社員研修の終了後、金融業界のプロジェクトを1年ほど経験し、現在は通信業界系のプロジェクトで業務に取り組む。データサイエンティストとしてマーケティング施策の企画立案や、業務効率化など、さまざまな領域の業務に携わる。

研究室での出会いと印象

木原
本日はよろしくお願いします。まず、三木先生と沼瀬さんの関わりについて教えてください。

沼瀬
三木先生と直接関わりを持ちはじめたのは、大学3年の時に研究室に配属されてからです。大学1、2年生の頃、自分はまだやりたいことが決まっておらず、ぼんやり「マーケティングとか面白そうだな」と考えていました。ただ、マーケティングに興味はあったものの、解像度は高くありませんでしたので、それを学ぶことができると思い、三木先生の研究室を選びました。

研究室配属後は、研究テーマを決めるのに時間がかかりました。例えば「こういう研究テーマにしたいんです」と伝えても「なんでそれをするの?」と三木先生から論理的に追求されることもあり、当時、難しさを感じたことを覚えています。最終的には「嗜好が固定的な顧客のID-POSデータにおける分析手法の提案」というテーマに取り組むことに決めました。

大学、大学院と学ぶ中で、三木先生が持つマーケティングに関する知識を教えていただいたお陰でマーケティングに対する理解も深まりました。また、研究で取り組んでいたことから、業務でマーケティング施策に携わる際にも、ギャップをあまり感じずに取り組めています。

木原
ありがとうございます。三木先生から、当時の沼瀬さんについての印象をお聞かせください。

三木先生
大学三年生の後半に研究室に配属されるのですが、それまではゼミという一種の授業なんです。ゼミでは、毎回、参加学生に課題を出して、発表してもらうという形式で進めているのですが、沼瀬さんは黙々と真面目に取り組んでいるという印象でした。多くの学生にとっては、毎回発表させられるというのは楽しくないと思うのですが、沼瀬さんの場合は一通り全部取り組んだ上で、その内容について淡々と発表してくれるんです。「一生懸命やっているんだろうな」とはよくわかるのですが、楽しんでやっているのかどうか、当時の私には判断がつきませんでした(笑)。ただ「ゼミでの課題や、データサイエンスをとても楽しくやっている」という話が人づてに伝わってきて、びっくりしました。楽しくないだろうと思っていたのが、実は楽しんでるんだっていうんで。(笑)

木原
沼瀬さんと研究室で接する中で、将来、どんな風になっていくのか、想像していましたか?

三木先生
沼瀬さん自身も、沼瀬さんの同期の皆も、課題に対して、あれやこれやと調べてきて「今度はこういう風に考えてみました」と、次から次へと探してくる、それから考えてみる、やってみる、そういうことを自主的に熱心にやっていました。それは社会人、プロのデータ分析においても、とても重要な姿勢なので、そうやって一生懸命取り組んでみる、あるいは角度を変えて考えてみるということを学生時代からできているわけですから、社会人になってもそれを続けるんだろうなと。「納得できなかったんで、こうやってみました」みたいなことを、次の日に言ってくるような技術者になるんだろうと思っていました。もし今、そうでなかったとしたら、ちょっと思い出してほしいなと思います(笑)。
いつも学生に大切に伝えていることの一つに「一つのデータにしがみつき続けても、絶対に答えは出てこない」ということがあります。次元が、ちょうど直線と直線が交わると点が決まるのと同じように、他のデータや別の視点を持ってくることによって、自由度が抑えられて、答えが決まってくるということも言っていたので、それを当時から体現してくれていたのかなとも思います。
また、学生の皆さんが課題に取り組んだり、研究を進める上で「何ができたら嬉しいの?」「何ができたらゴールなの?」ということを、しっかり考えられるようになってほしいと思っています。「とりあえず、何か作業だけすればいいんじゃないか」って思ってしまい、ずっとその場に留まっているようなときには、そのままではいけない、と指摘をするようにしています。ただ、沼瀬さんの代は、皆さん、真剣に自分のテーマを考えることができていましたし、私自身が何かを言うことは少なかったと記憶しています。

木原
沼瀬さんとしては、三木先生の毎回の課題に対して、どんなモチベーションで取り組まれていたのでしょうか。

沼瀬
自分自身、負けず嫌いではあると思いますし、自分に負けたら嫌だっていうのはあります。他人に対してというよりも、自分の中でいい結果を出したいなということがモチベーションになっていたと思います。

三木先生
「負けず嫌い」という言葉がありましたが、沼瀬さんは、ひと月に1つくらい、新たな観点を持ってくるような、意欲的な学生でした。沼瀬さんが取り組んだ「嗜好が固定的な顧客のID-POSデータにおける分析手法の提案」という研究テーマですが、このID-POSデータがとても特徴的なものだったんです。大手の流通業ですと、割と短い期間のデータを扱うことになることが多いのですが、我々は個人商店的な専門店を対象にしていたこともあり、十年以上のデータがあるんですよ。そのロングレンジのデータに対して、購買客自身の質が変遷していく、購買行動が変わっていくんじゃないか?というアイデアを彼自身が出してくれました。また、他に例をあげると、クランピネスという来店の不規則性を適用することも彼が持ち込んでくれました。洋菓子店はもともと夏に売りにくく、秋から冬にかけて売上が上がっていくという特徴があり、業界そのものに不規則性があるのですが、一般的な来店頻度にあらわれる不規則性を持ってきたら、同じような議論ができるのかどうかというアイディアも、沼瀬さん自身が持ち込んでくれたのを覚えています。

指導の中で、印象的だった「ドメイン知識」と「本質」

木原
三木先生の指導の中で、沼瀬さんが今でも覚えていることはありますか?

沼瀬
二つあります。一つは「ドメイン知識を習得しろ」ということです。いろんな媒体、ウェブサイトでも、新聞でも、なんでもいいから、とにかくその業界の情報を集めろということです。現在、業務でデータ分析に取り組んで実感していることですが、分析結果が出ても、ドメイン知識を知っているのと知らないのでは、その結果の解釈の質が大きく変わってくると思うんです。その点については、三木先生の研究室で教えこまれました。今でも業務の中で新しいプロジェクトに配属された時には、その業界のドメイン知識を最初に勉強するということは、染み付いています。
もう一つは「本質を捉えろ」ということです。例えばID-POSデータだと、分析手法については古くから研究されているので、いろいろな手法があるんです。ただ「とりあえず手法を適用してみました」ではなく「何のためにこの手法を使うのか? 」という点を、論理的に考えて分析しろということを教わったので、その点も業務に活きていると思います。

木原
この二つの要素というのは、データサイエンティストとしてとても重要なことだと思うのですが、三木先生も意識して学生には伝えているんでしょうか。

三木先生
そうですね。私は「とにかく実験に取り組めて楽しい!」という大学時代を過ごしていました。しかし、社歴の後半になって、急に新事業をやらないといけないということになり、そこで初めてマーケットの重要性に気づいたんです。15年間、順風満帆でずっとエンジニア、その領域だけの専門家であり続けていたとしたら「マーケティングなんてどうでもいい。売れ筋のものをガンガン作ればいい」という考えにしかならなかったはずなのですが、新規事業を開発することになり、自分で売れるものを企画しないといけないとなったんです。当時は課長職だったのですが、近くの三人の課長と自主的に、ハーバードビジネスレビューの輪講をしてました。「こういう世界があるんだ」「こんな風に体系的に物事を考えている人たちがいるのか」というのが新鮮でびっくりしたんです。マーケティングの基本中の基本ですが、市場を理解するというよりも、むしろ市場を作るという考え方や、顧客視点で商品や製品を考えるという点については、エンジニアだけに取り組んでいると、なかなかそこに目がいかないんですよね。

沼瀬さんが先ほど「本質を捉えろ」と言ってくれましたが、「本質」は「顧客自身も意識していないけど、重要だと思っていること」ですので、なかなか出てきません。それを理解しないまま、新しい事業を作ることはできないということを、もう十年以上、自分の反省を踏まえてやってきました。その反省をこれから社会に出ていく学生に伝えるために、マーケティングの授業を担当しています。意外と興味を持ってくれる学生が多いので、やっぱりそういう話を、理科系・工学系の大学でも、社会に出る前の学生時代に聞いておくとよいのではと、私自身の経験からも強く思います。

また「本質」について意識するようになったのは、社歴の前半で出会った方の影響です。その方は、物理・電気系出身で、非常に芯が強いことで、社内でも有名な方でした。彼は、データサイエンスの専門家ではないのですが、実験で出てきたデータについて、大雑把な解釈をしてしまう技術者に対して、非常に厳しい人だったんです。彼の口癖に「吟味」という言葉があったのですが「出てきた数値を自分なりにちゃんと解釈したのか」ということなんです。結果を説明するということは、誰か相手や顧客が必ずいるわけで、その相手を納得させるには、自分自身もその結果に完全に納得していないといけないはずなんです。それこそが出てきた結果に対して説明義務を果たすことなのだと思います。データサイエンティストの仕事は、誤差が一番小さくなったときに「できた!」と喜ぶようなものではなく、必ず相手が必要なんです。
「ドメイン知識」も「本質」も、日立製作所在籍時に自分の経験から学び、それを学生に伝えているというのが正直な背景です。


社会にデータサイエンスを活かしていくために重要なこと

木原
データ活用を推進する、または社会に活かすという点において、どんなことを意識すると良いでしょうか。ぜひ沼瀬さんからお願いします。学生時代の自分や、後輩に今の自分が何かアドバイスするとしたらいかがでしょうか?

沼瀬
まず、目の前のことを一生懸命やることだと思います。自分の場合にはそれが研究だったのですが、結構真面目に取り組んでいましたし、一生懸命やった分、今の仕事に活きているという実感があります。「何に取り組むべきか」といわれたら難しいのですが、興味を持ったものに対して、全力で一回取り組んでみるということを意識してやってみれば、何かが見つかるんじゃないかなと思います。また、当時を振り返ると、三木先生が結構チャンスをくれていたと思います。例えばビジネスコンテストの話を持ちかけてくださったり、外部で課外活動する機会を提案してくれたりと、いろいろなチャンスを設けてくださっていました。自分がそんなに積極的に自ら取り組むタイプではなかったので、そういうチャンスをいただけたのは、とても良かったと思います。実際に取り組んでみて、失敗を何回もしましたけど、取り組むこと自体に意義があったのかなと思います。そういうチャンスがあったり、もらえたりするところに、自らの身を置くことも、大事なことだと感じています。

木原
三木先生としては、社会でデータ活用を推進していくために、どんなことが大事だと考えていますか?

三木先生
いわゆる数理モデルを作る仕事、多変量解析だったり、統計だったり、人工知能のアルゴリズムだったり、その精度が高いモデルを作ろうとするエンジニアリングが、狭い意味でのデータサイエンスになると、私は思っています。それに取り組むにはもちろん知識が必要ですが、一番大事なのは「それらが必要としている前提条件を正確に知っているか」ということです。これが、狭い意味でのデータサイエンスの技術という意味ではかなり重要だと思います。例えば、前提を知らずに学生に計算させると「なんか結果が出てくる」という状態に陥ってしまって、先ほど話した「吟味」に引っかかってしまうんです。前提を忘れている、確認してないということで、何らかの結果は出てくるのですが、その意味がわかってない、もしくは間違えた結果に人間が引きずられるということに陥ってしまいます。そこまで重要視されないようにも見えてしまいがちですが、理論的には必ず前提がありますし、前提条件が重要だと思います。正確に言うと、世の中に転がっている実データっていうのは前提に従ってないんです。条件に当てはまらないものがデータとして存在するので、正確に理論通りの答えが出てないということを自覚しないといけないと思います。

理論の前提を知るということの一つとして、社会に活かす上では「社会との接点」というものを意識しないといけないんですよね。ドメイン知識はもちろんその一つです。もう少しそのドメイン知識の重要性を分解して、詳細に言うのであれば、今日、冒頭で申し上げたとおり、まず問題を定義すること。そのためにはそのドメインに属している、顧客業務における課題が何なのかということ、そのドメインが何を必要としているのかを理解するという入口の部分が大事です。それが社会との接点においては必要だと思っています。加えて、データサイエンスが、発展・浸透していく時に一番重要なのは、出口のところです。最終的には顧客の業務というのがあるわけですので、その業務を何らかの形で変えなければいけないんです。

そこまで提案できて初めて、広い意味のデータサイエンスだと私はずっと感じています。まだ業界的には、その方面が弱いという風に思っています。つまり「何をすればいいのか」ということは、データの結果からだけでは直接的には導出できないんですね。解釈をドメインの方まで持っていって初めて、何をすればいいのか、どう業務を変更すればいいのかがわかりますし、あるいは、業務の内容をこのように変えていくと、もともとの問題が解決しますという風に言えて、ようやく一つの問題解決になると思っています。社会に活かすためには、そこまでたどりつかないといけません。

木原
沼瀬さんも冒頭で「ドメイン知識の有無によって、結果の解釈の質が大きく変わってくる」と話していましたね。三木先生の指導が、今の沼瀬さんにも大きな影響を与えていると強く感じました。

三木先生が考える、データサイエンティストが担う役割と、沼瀬さんへの期待

三木先生
私自身は、データサイエンティストの業務は、患者と接して診察や治療を行う臨床医の業務と似ているとずっと思っています。臨床医である町医者は、入口では問診を行い、出口では薬の処方だったり、手術だったり、物理的な療法を講じたりしています。入口で行われる問診では、問題を定義して仮説を立てていますが、これは今のデータサイエンスの世界にも共通すると思います。しかし、薬を処方するという行為に当たるものはデータサイエンスの分野では、まだ確立しきれていないと私は思っています。医療の世界では、どの薬を使うと何が起こるかを専門としている薬剤師のような別の領域があるぐらいですが、データサイエンスにおいては、まだ確立してないんだろうと。確立していれば、患者が明確に「頭痛薬をください」と言ってくれると思うのですが「頭痛」という症状に対して「神経の興奮を抑える」「伝達物質を切る」ことをすれば、頭痛が和らぐというような、その因果関係はまだ確立していないと思うんですね。

ですので、沼瀬さんにも薬まで処方できる人になってほしいですし、この業界そのものが網羅的に発展して、そのような領域までカバーしてほしいと思っています。

そうすると、データサイエンティスト自体の認知や立場も徐々に変わってくるのではないかと思っています。今後は、データサイエンティストが、薬に相当する部分までをデータから導出でき、結びつけることができるような進歩や発展をしてほしいです。そうすると、初めて社会にそのまま役に立ちますし「相談してみようか」というレベルではなく「相談しなければならない」に、段々変わっていくと思います。「薬の処方」には、ブレインパッドみたいな会社が取り組むのかもしれませんが、いずれにしても、はっきりした方針と手法を最終的に提示してくれるという形に落ち着くのではないかなと思います。

木原
ありがとうございます。データサイエンスと医療の類似性について考えたことがなかったので、非常に新鮮な考えでした。最後に、沼瀬さんとして、今後、これまでの学びを活かして、こんな風に成長していきたいという目標があれば、ぜひ教えてください。

沼瀬
まだ新卒として入社して二年目なので、いろんな業務や業界、領域で仕事をして、多くの知識を吸収したいと思っています。以前にも増して、さまざまな領域でデータ分析、データサイエンティストが必要とされているので、自分自身が必要とされるような人材になるっていうのが一番の目標です。

三木先生
先ほどお話しした町医者、臨床医っていうのが一つのゴールだと思っています。まだできていない形態だと思うのですが、いわゆる検査技師というのが狭い意味でのデータサイエンティストであれば、ぜひ臨床医師になってほしいですね。そうなるためには成功ばかりではなく、いろんな失敗や課題にぶち当たってもらいたいです。ご自身で「負けず嫌い」だと言ってくれているので、「失敗が多いほうが得るものが多い」ぐらいの気持ちで、沼瀬さんには活躍してほしいと思っています。

木原
本日はありがとうございました。


ブレインパッドでは新卒採用・中途採用共にまだまだ仲間を募集しています。
ご興味のある方は、是非採用サイトをご覧ください!

www.brainpad.co.jp
www.brainpad.co.jp