【2020】SUMMER INTERNSHIPデータサイエンティストコースを開催しました!

昨年に引き続き、インターンシップ「データサイエンティストコース」を開催しました。今年はオンラインでの開催となる中、5日間にわたり、データサイエンティストに必要なスキルの習得と、顧客の購買データを用いて、ビジネス課題の解決に取り組んでいただきました。

22卒向けインターンシップの情報はこちらからご確認ください!

はじめに

こんにちは。人事部の森川です。

今年の8月と9月に、インターンシップ「データサイエンティストコース」を開催しました。

本インターンシップでは、プログラム前半にてデータサイエンティストに必要なスキルを習得し、後半は顧客の購買履歴情報を用いて、課題解決を行っていただく内容で実施いたしました。
新型コロナウイルス対策のため、今年ははじめてオンラインでの開催となりました。

今回、9月のインターンシップに参加いただいた、亀井友裕さんに体験レポートを書いていただきました。亀井さんは、多変量解析法の一つであるスパース推定について学ばれており、スパース推定を用いた新たな統計手法の開発を目指し研究に取り組んでいらっしゃいます。
大学院での授業でデータ分析を学ばれている中で、ビジネスの現場でのデータ分析の難しさ、テンポ感を肌で感じたいとの思いから、ブレインパッドのインターンシップにご応募されたそうです。
本記事では、亀井さんの体験記ともにインターンの模様をお届けします!


初のオンライン開催に向けて

ブレインパッドでは毎年、オフライン形式でインターンシップを実施していましたが、今年は新型コロナウイルスの感染拡大防止のため、オンラインで開催することになりました。

データサイエンティストが所属するアナリティクス本部とコーポレート本部情報システム部の皆さんの協力により、インターン生がご自宅からでも快適に参加いただける環境を整えました。

●オンラインでもスムーズな分析環境を構築

インターン生がご自宅からご自身のPCで分析作業を行えるよう、「Amazon WorkSpaces」という仮想デスクトップ環境を各自に配布しました。
この環境には分析作業に必要なSQL,Python,Rなどを事前にインストールしており、インターン開始後すぐに作業に取りかかれるようにしました。
また、リモートでも効率よくチームで作業出来るよう、Zoom・Slackでコミュニケーションを取り、Googleドライブでデータのやり取りをしつつ、GoogleスライドやMiroなどを使ってチームの成果物をまとめていってもらいました。

インターンシップ中の様子をご紹介!

●初日イントロダクション

まずはじめに、インターンシップのスケジュールの説明や、インターンシップに関わるブレインパッドのデータサイエンティスト社員の紹介を行った後、インターン生の皆さんの自己紹介を行いました。
第2クールでは、自分のチーム以外のインターン生のことも知ることができるように、皆さんに自己紹介シートを作成いただきました。

↓はデータサイエンティスト新卒入社の3年目のデータサイエンティストの金田さんの自己紹介シートです。

右上にあるのはマンダラートです。9つのマスの中心に自分の名前を書き、周囲の8つのマスに自分を表す単語を書いて、チームごとのアイスブレイクの際にお互いの理解を深めるツールとして使用しました。
それぞれの意外な一面を知ることができ、研修が始まる前にインターン生同士打ち解けることができたのではないでしょうか。

●ブレインパッドの新卒研修でも取り入れているSQL研修をインターンシップでも実施

1日目のメインであるSQL研修。
今回のインターンシップでは、SQLを用いてデータの抽出、分析を行うために、1日でSQLを習得いただく研修に臨んでいただきました。
これは、チャート形式で例題→練習問題と個人でクエリを書いてスキルを身に付けていく内容となっており、ブレインパッドの新卒研修でも取り入れられています。

新卒研修より短い期間である1日で、SQLを習得するという厳しいスケジュールの中、講師やチームメンバーで相談しながら研修に取り組んでいただきました。

<亀井さんコメント>
「SQL研修では、大規模のデータテーブルから条件を指定して必要な情報を抽出したり、複数のデータテーブルを結合する方法などを学びました。研修資料は例題、解説、演習問題のサイクルを繰り返す形式になっており、1日で必要なデータを引き出すスキルが身に付きました。」

SQL研修で使用した資料と類似のものは、OpenBrainPadプロジェクトからも公開しています!
speakerdeck.com

*OpenBrainPad Projectとは
社内にある技術資料の公開や、データサイエンティストメンバーの個人SNS発信などを通じて、業界に対してブレインパッド社をよりオープンにしていくプロジェクトです。
ツイッターでも発信していますのでぜひフォローお願いします!
twitter.com

●チームメンバー以外とも交流を深めた初日の懇親会

SQL研修後は、Zoomのブレイクアウトセッションを使用して数名に分かれての懇親会を実施しました!チームメンバーはもちろん、他チームやフォロワーのデータサイエンティスト社員とざっくばらんに交流いただきました。

第1クールの参加者の方から、「もっと社員の話を聞きたかった」というお声をいただいたため、第2クールでは、sli.doを利用してミニパネルディスカッションを実施しました。
インターン生からの様々な質問に対し、データサイエンティスト社員が、就活や仕事の楽しさ・辛さまで、包み隠さず(この場でしか聞けない内容も!)回答していきました。


●ビジネス課題解決のための分析基礎講義

2日目の前半は、ビジネス課題を解決するために必要な要素・プロセスを学んでいただく分析基礎講義を実施しました。ただ単に分析をするだけでは、ビジネス課題は解決できません。統計学やモデリング、機械学習、と分析手法を身に付けても、「何を目的」とし、「何を明らかにしなければならないのか」を正確に捉えなければ、モデルやレポートが蓄積されるだけで、有用な知見が得られないのです。
インターン生の皆さんには、「ビジネス課題を解決」するブレインパッドのデータサイエンティストに求められる、現状把握や課題の特定等の要素を習得いただきました。

<亀井さんコメント>
「分析基礎研修では、過去の分析事例を基に、企業が持つ課題の洗い出しからそこに向けてのデータの活用法、施策の提案までの流れを学びました。合間に質問対応や軽いワークの時間もあり、データ分析の理解を深めつつこの後に始まる分析プロジェクトの方向性を固めることができました。」

●分析プロジェクト実践演習-グループワーク-

2日目の後半から、グループワークが始まります。
取り組んでいただくテーマは「顧客の購買データを用いて、ビール会社の売上向上施策の提案を行う」というものです。
インターン生の皆さんには、顧客の購買履歴情報をお渡しし、これまで学んだSQLや課題解決プロセスを活かし、クライアントへの施策提案を想定した報告会に向けて、データの分析から課題特定、施策の検討、報告資料の作成までを、インターン後半3日間で取り組んでいただきました。

Zoom上でチームごとのブレイクアウトセッションに分かれ、それぞれ集計担当、外部データ収集担当等、各自で役割分担しながら作業をしていました。

インターンシップ期間中は各チームに1名ずつ、データサイエンティスト社員がフォロワーとして、プロジェクトをサポートします。SQLクエリの書き方から、課題特定のヒント、分析方針のアドバイスまで適宜フォロワーがサポートするとはいえ、インターン生の皆さんだけで短期間で施策提案まで実施するのは、様々な苦労があったと思います。
しかし、オンラインという制約がある状況の中で、皆さん活発に意見を交換し合いながら、熱心にワークに取り組まれており、分析スキルだけでなく、グループワークの進め方やデータから課題を発見し、施策を検討する難しさなど、多くのことを学んでいただけたのではないでしょうか。

<亀井さんコメント>
「私たちの班は、まず基礎分析を行い、その企業が強みにしている層を特定し、その層への施策を考えるという流れで進めました。

分析を進めている間に課題と感じたのは、時間の管理です。基礎分析やデータの可視化をいつ切り上げるかを決めていなかったために、データの解釈や中間報告資料の作成に時間がとれず、意見のまとまっていない状態で発表することになってしまいました。初めに大まかなタイムスケジュールをつくっていれば、後に控えている作業を考慮しながらワークを進めることができたため、特に短い期間でのグループワークでは必須の作業であることを痛感しました。

分析を進めるにあたって良かった点は、最後まで良い雰囲気の中チームで分析を進められたことです。リモートでの開催であることもあり、意思疎通が難しい場面が多くあったのですが、休み時間を多めにとり沢山雑談することで、最終日まで喋りやすい雰囲気を保つことができました。また、メンバーの作業内容を適宜確認しあうことで、作業の重複の阻止や分析の方向性の統一を図れたのは良かったです。」

●分析プロジェクト実践演習-最終報告会-

インターン最終日は、分析演習の集大成。
クライアント役に扮したブレインパッドの取締役や部長陣に対し、チームごとにプレゼンしていただきました。
自分たちがどのようにデータを分析して、どこに課題を発見し、その課題を解決するための施策が何であるかを伝えるために、プレゼンのロジックの組み立てや、資料の見やすさ等、報告会ぎりぎりまで、各チームで議論し合っていました。
全てのチームに同じ顧客の購買履歴情報をお渡ししていますが、課題の特定から施策内容まで、チームごとに異なり、それぞれがとても興味深い提案をしていただきました。
クライアント役の社員からは時には厳しい指摘もありましたが、「是非この施策を実施したいと思った」、「ロジックの積み上げが緻密で、内容がまとまっていて良かった」等のコメントもあり、とてもレベルの高いプレゼンばかりでした。

各チームのプレゼンの様子
弊社取締役の塩澤から、インターン生に対し、今後の成長に繋がるフィードバックをいただきました。


<亀井さんコメント>
「最終報告では、ブレインパッドの取締役や部長陣が扮するクライアントに対して、施策のプレゼンテーションを行いました。施策自体の問題点や、付け加えた方が良かった根拠など、短時間の質疑応答で多くのことに気づかされました。自分の思考の甘さを痛感したとともに、全力で分析に取り組んで良かったとも思いました。」

●最終日の懇親会は表彰式のほか、先輩データサイエンティストのキャリアに関するプレゼンも!

短くも長かったインターンプログラムが終了した後は、インターン生に新卒入社1~3年目のデータサイエンティスト社員も交えての懇親会を行いました!

懇親会最初は、優勝チームとMVPを発表する表彰式を実施。優勝チームにはブレインパッドオリジナルパーカーを贈呈(後日郵送しました*)しました!
優勝チームの皆さん、是非ご自宅等で着用してくださいね!

表彰式の後は、新卒入社3年目のデータサイエンティストの仁ノ平さんから、これまでのキャリアや1日の過ごし方等をプレゼンいただきました。かなりリアルなデータサイエンティストの仕事ぶりを知っていただけたのではないでしょうか。

そしていよいよ懇親会スタート!

最終日の懇親会も数名ごとのブレイクアウトセッションを作成し、自由に交流いただきました。
今回のインターンシップで扱ったテーマが「ビール」だったこともあり、ビールを飲みながら参加いただく方がとても多かったです。(今回の分析プロジェクトの施策提案先に選んだ会社のビールを初めて買いました、という声も!)
懇親会の場では、5日間やり切っていただいたインターン生の皆さんの明るい笑顔をたくさん見ることができました!



5日間という短い期間の中、オンラインでの開催となり、インターン生の皆さんは非常に苦労されたと思いますが、皆さんの成長に繋がる経験となっておりましたら幸いです。

<亀井さんコメント>
「インターンシップを通して、リモートでの開催にもかかわらず、社員の方との距離が近かったのがとても良かったです。分析プロジェクト中は常にデータ分析を業務としている社員の方に質問できる環境を用意してくださり、分析面で沢山助けていただきました。2回の懇親会や休憩時間中には過去の分析事例や就活の話、趣味の話など沢山お話しすることができ、ブレインパッドの様々な側面を垣間見ることができました。

インターンシップを通して感じたのは、データを価値に変えることの難しさです。
今回扱ったデータは、データの取り方に偏りや欠損があったりして、重回帰などの手法を適用して良いのか、また得られた結果がどこまで妥当なのかを判断できず、分析がデータの可視化に終わってしまいました。今後統計手法を会得、開発する際は、前処理としてどのような処理が必要になりそうか、出力結果がどのような価値につながるのか、など前後の処理も意識していきたいと思います。

また、このインターンシップで、チームで仕事に取り組むことの楽しさ、重要さに気づきました。今後は自分が得意なことを洗い出し、チームでの仕事でどのように貢献できるかの言語化を進めていこうと思います。
最後になりましたが、リモートでの開催にもかかわらず、5日間で沢山の学びと経験を得ることができました。ありがとうございました。」

亀井さん体験記をまとめていただき、ありがとうございました!

最後に

いかがでしたでしょうか。

ブレインパッドでは、データサイエンティストコースとエンジニアコースの2022年新卒採用本選考を実施しております。

少しでもデータサイエンティストの仕事に興味を持っていただいた方は、是非、エントリーをお待ちしております!


また、2022年新卒向けにオンラインでの会社説明会も開催中です。
ブレインパッドのことをもっと知りたい!という方は、こちらにもご参加いただければと思います。
随時新卒採用の求人ページにて、説明会日程をご案内しております。

また、ブレインパッドでは、新卒採用・中途採用ともに新しい仲間を積極的に採用しています。
弊社にご興味のある方は、是非採用サイトをご確認ください!
www.brainpad.co.jp