Platinum Data Blog by BrainPad

株式会社ブレインパッドのデータ活用に関する取り組みや製品・サービス開発の裏側、社員の日常などをご紹介します。

AWS Summit 2019 Tokyo に参加してきました!

2019年6月12日~6月14日にかけて、AWS Summit 2019 Tokyo が開催されました。今回はその参加レポートをお届けします。会場やセッションの様子、AWSの新しいサービス、オンプレからクラウドへの移行、DeepRacerリーグなど、盛り沢山な内容をご紹介します。
f:id:brainpad-inc:20190705120427j:plain


こんにちは、アナリティクスサービス部の家入です。

先日当ブログで、Google Cloud Next '19 San Francisco の様子をご紹介しました。一方、クラウドといえば Amazon Web Services(AWS) の情報も見逃せません。その AWS が主催する AWS Summit 2019 Tokyo が6月12日から6月14日にかけて開催されました。
去年は Amazon EKSAmazon SageMaker が東京リージョンで利用可能になったことが話題になり、今年も目が離せません。仕事の都合上、参加できたのは13日だけでしたが、今年注目の展示やセッション、re:Mix の様子などをお伝えします。

会場の様子

去年は品川でしたが、今年は幕張メッセでより一層大きく開催されました。会場に向かう電車では、平日にも関わらずディズニーに行く人達と乗り合わせました(笑)
また、隣の会場では、 Interop という技術動向とビジネス活用のトレンドを展示するインターネットテクノロジーのイベントも開催されていました。

f:id:bp-writer:20190617202657j:plain
会場入り口

9時ごろの会場の様子です。セッション開始は10時からなので、準備のためのいい緊張感を感じます。奥には大きく aws の文字が...!

f:id:bp-writer:20190617092021j:plain
展示ブース

こちらの A~D 会場はサイレントセッションとなっており、イヤホンをして視聴します。大人数でありながら、会場はとても静かなので独特の雰囲気でした。

f:id:bp-writer:20190617093038j:plain
サイレントセッションのブース

セッション内容

Amazon Sumerian

最初に聞いたのは、 Amazon Sumerian を使った XR アプリケーションの開発です。XR は Virtual Reality, Augmented Reality, Mixed Reality の総称で、Sumerian はこれら XR アプリケーションの開発サービスです。ブラウザで開発が可能で、複雑な処理には JavaScript が必要ですが、簡単なサービスならシーンと呼ばれる XR コンテンツ上に、エンティティと呼ばれるオブジェクトを置くだけで作成できてしまいます。

デモが2つあり、1つ目は、エンティティを変化させるステートマシンと呼ばれる機能を利用して、マネキンやドローンを操作していました (YouTube) 。見た感じは簡単にアプリケーションが作成できており、遊びでサクッと作るにはとても便利そうです。

2つ目は、Raspberry Pi ・拡張ボードの SenseHat と VR コンテンツを連携させて、ラズパイを操作することで VR 上のドローンを操作していました (作成例)。こういった、現実空間にあるものを仮想空間上に再現させることをデジタルツインと呼ぶそうです。こちらは AWS IoT と Amazon Kinesis との接続が必要なので、少し技術が必要ですが、頑張れば個人でもハード操作のデジタルコンテンツを作れるような時代なんだなと感じました。

Kubernetes 監視のベストプラクティス

セッションタイトルは 「Kubernetes 監視のベストプラクティス」でしたが、実際には ZOZOTOWN がシステムの運用監視全般で気をつけているポイントの解説でした。特に、あたりまえのことをあたりまえにできているかを注意しており、監視のプロセス設計として、

  1. サービスの監視対象一覧を決める、やることを決める、先にツールを決めるのはダメ
  2. 一覧で決めた設定を行う、ツールでできないところを諦めてはいけない
  3. 監視体制をつくる、一人で回すのはダメ
  4. なるべく自動化して負荷を下げる、特定の誰かが張り付くのは避ける、チーム運営

といった点を挙げていました。加えて、次のような失敗例もあったそうです。

  • 必要かもと思って監視を追加したら、何が大事かわからず、アラート多すぎて無視し始めた
    • サービスへの影響を考慮して必要なものだけをみる
  • 誰も見ていないダッシュボードや、テスト用・作者不明で放置されているものがある
    • 必要のないものは削除する
  • 障害対応のドキュメントが一部の人しか知らない、またはドキュメント通りに対応されていない
    • きちんと周知・適用する
  • 誰が運用・監視するか決まっていないことによる休日対応や、忙しそうなリーダーになりたくないといった雰囲気
    • 明確に持ち回りをすると、負荷分散しつつ、当事者意識が生まれた

また、監視の観点として、入門監視の6種類、ビジネス・フロント・アプリケーション・サーバー・ネットワーク・セキュリティを紹介していました。こういったものは SRE やインフラチームが主に担当すると考えていましたが、ビジネスやフロント部分に関しては、データサイエンティストたちこそモニタリング・分析している箇所です。例えば Amazon では、サイトのレスポンスが 100 ミリ秒改善することで売り上げが 2% 伸びたそうで、きちんとシステムとビジネスのメトリクスを結びつけてサービス改善をしており、そういった丁寧な仕事をしたいなと思いました。

不動産業向け B2B サービスのクラウドシフト

こちらは不動産業界向けに DX サービスを提供している、いい生活のクラウド移行の事例です。創業の 2000 年から 20 年近くが経ち、老朽化したデータセンターからクラウドへの移行方針・実施策について、クラウド移行のリアルで分かりやすいセッションでした。

まず課題として下記の点があり、

  • 開発プロセスのアジャイル化で、リリース頻度と並行開発が増えた
    • マイクロサービスへの対応、可観測性・オートスケール・オートヒールの必要性
  • 不動産業向け業務システムの事情
    • 製品ライフサイクルが長く、データが増えやすい
    • 機密性・可用性・完全性要件が高い
    • ストックした情報の再利用性が高い

判断材料として次の要素がありました。特にコストやサービスレベルに関してはクラウドの強みが活きる領域で、クラウド移行のモデルケースとして参考になります。

  • テクノロジー
    • インフラのコード化、標準化、新技術への挑戦
  • 組織と人材
    • プロダクトチームの責任拡大、開発の並列化、技術的情報源の広さ
  • コスト
    • 動的な資源配分、サービス原価の見える化
  • サービスレベル
    • オンラインマイグレーション、低いダウンタイム、段階的な移行

移行後の運用では、次のルールを決めていました。PoC 段階から思い切った原則を持ちつつ、設計自体は柔軟にいろいろ試すのを許していました。

  • AWS Organization によるアカウントの集中管理
    • Dev & Stage、Prod の2アカウントのみ
    • IAM ユーザとグループはマスターアカウントのみ
    • サブアカウントはロールだけ定義する
    • MFA 必須
    • アプリケーションの開発者が利用料金を把握できる
  • コード化された構成だけを許可
    • CloudFormation, Kubernetes Manifest のみで構成
    • 環境の差は変数化し、パラメータファイルも管理対象

結果として、開発チームが意識的にDevOpsを考えるようになったり、新たなフレームワークへの心理障壁が下がったりしたそうです。さらに、インフラチームも構成を管理するようになり、インフラの準備だけでなく、効率的に活用することが価値の中心になったそうです。

また、クラウド移行を通じて、技術職のキャリアとしても明確化が進んだという話が印象的で、よりビジネス目線での開発を考えるサービスリードと、より優れたシステムの構築を目指すテクノロジーリードに専門性が具体化されたそうです。データサイエンティストも、よりビジネスサイドにフォーカスする人とアルゴリズムや基盤構築を重視する人に、キャリアが分化しているところもあるので、興味深かったです。

Amazon Forecast & Personalize

最後に視聴したセッションは Amazon ForecastAmazon Personalize についてです。Forecast はまだプレビューの段階で、Personalize はすでにローンチされています。それぞれ時系列予測と推薦のマネージドサービスとあって個人的注目度は高かったです。

Forecast の使い方は、3種類のデータセット (Target time-series, Related time-series, Item metadata) を提供し、下記のステップでモデルの学習・デプロイをするだけです。裏側では、ARIMA, ETS, Prophet など伝統的な時系列予測モデルや、深層学習の DeepARMQ-RNN を使用しています。

  1. パイプライン作成
  2. AutoML か Built-In アルゴリズムの選択
  3. 精度比較
  4. デプロイ
  5. 予測

Personalize の使い方も Forecast とほぼ同じで、入力データにユーザーアクティビティ・アイテムインベントリ・デモグラフィ情報を使います。アルゴリズムは、検索用の Personalized-ranking、アイテム軸レコメンドの SIMS、ユーザー軸レコメンドの HRNN などがあります。

どちらもマネージドサービスでインフラの心配をする必要がなく、Amazon で培われたアルゴリズムを使用するので、お手軽に機械学習サービスを実装したい場合は非常に有用だと思います。モデリングに手間をかける必要がないので、工数をかけずにプロトタイピングするのには便利でしょう。ただ、例えば Personalize に関しては、正しく推薦するにはカスタムモデルが必要とのコメントもあり、音楽・映画・商品・その他コンテンツは特徴の異なるアイテムなため、個別にチューニングする必要があるそうです。Google Cloud の AutoML Table を使った検証記事を見る限り、精度がとても良いわけではないようです。

また、Google Cloud も AutoML Table で時系列データを扱ったり、Recommendation AI で推薦ができたりと、同様のサービスを提供しています。この辺りをひっくるめていつか検証・比較したいですね。

展示の様子

DeepRacer

会場では、強化学習で走行を覚えた DeepRacer というミニチュアカーのイベントをやっていました。DeepRacer は AWS が強化学習を利用するために開発したスケールカーで、こちらのドキュメントはまるで強化学習の教科書みたいです。なんの準備もなく、AWS が提供するシミュレータや学習環境で始めることができます。実際、開発ブースとコンピュータ上で試走できるバーチャルトラックが用意されており、その場で開発を体験できたようです。

f:id:bp-writer:20190618000855j:plain
開発ブース兼バーチャルトラック

うまく学習させるのはやはり難しいようで、リアルトラックでよく壁に激突して係員にコースに戻される様子が微笑ましかったです。

f:id:bp-writer:20190618003801j:plain
トラックの様子

Snowball

AWS の展示ブースでは各種サービスの紹介があり、こちらはそんな一コマです。Snowball の筐体は、並のデスクトップマシンくらいの小ささですが、この中にペタバイトクラスのデータがセキュリティを担保しつつ入るのです...!

f:id:bp-writer:20190618001742j:plain
Snowball (写真OK、笑)

re:Mix

セッションや展示の終了後は、サイレントブーススペースで re:Mix というパーティが行われました。司会進行は AWS の方と、プログラミングができることで有名な女優の池澤あやかさんです。AWS のユーザーグループである JAWS のイベント案内や、AWS ウルトラクイズとこちらも大盛り上がりでした。

f:id:bp-writer:20190618002900j:plain
re:Mix

感想

1日だけの参加でしたが、各企業の事例を聞いたり、AWS の普段さわらないサービスや機械学習サービスのアップデートがあったりなど、とても濃い内容の1日でした。本記事では AWS Summit 2019 Tokyo の様子をご紹介しましたが、いかがだったでしょうか?少しでも参考になれば幸いです。

BrainPad ではクラウドサービスを活用してデータ分析や機械学習システムの開発をするメンバーを募集しています。興味のある方はぜひ応募してください!

www.brainpad.co.jp