これまで3回に分けて多数の人気アパレルブランドを展開する株式会社TSIホールディングス(以下、TSI)との取り組みをご紹介してきましたが、また新たな取り組みがスタートしています。
本記事では、前編・後編に分けてお届けします。後編では、TSIのデータ活用戦略を統括する竹山健司さんと竹山さんが率いるチームで各ブランドの広告施策を担当する(大橋さん・佐藤さん・上石さん)との「Python」の取り組みについて、一緒に進めているDAC内プロジェクト「D.Table」の担当である、渡辺と今栄によるインタビュー内容をお届けします。
※本文中の敬称略
関連ページ
- 連載第3回:Google新ソリューションRecommendations AIを用いたサイト内レコメンド活用
- 連載第2回:データ活用施策実施のインハウス化と機械学習の応用
- 連載第1回:『広告配信での機械学習』導入事例
『Python』への挑戦
- SQLを用いたデータ分析人材の育成に加え、Pythonを用いたデータ分析も行っていると伺いました。Pythonを用いたデータ分析支援プロジェクトを行うに至った背景を教えてください
TSI竹山:これまでD.TableにSQLを中心としたデータ分析を支援いただき、本プロジェクトにて3年目を迎えます。
TSIではSQLを用いた分析はできるようなりましたが、さらに分析の精度を高めれば、より成果につながるのではないかという考えがありました。
そこで、これまでBigQuery(以下、BQ)環境で機械学習を用いた分析を中心に支援をいただきましたが、より高度で発展的な分析が可能な、Pythonへ挑戦したいとい思いました。Pythonを理解し活用、複数の分析ができるようになることを目的に、D.Tableへご相談をさせていただいた形です。
- Pythonというと、プログラミング言語の中でも難しい言語になるのかなと思います。プロジェクトが始まる前どういった心境でしたか
TSI大橋:SQLに比べるとPythonは、よりプログラミング言語に近しいイメージを持っています。
Pythonで分析を行う場合は、BQ環境で機械学習を行う際のコード量よりも多くなると思いますし、その分、理解も大変になるのではと考えていました。一方で、Pythonを用いることで分析の幅が広がると思うので、その点は楽しみでもあります。
TSI佐藤:Pythonという言語の存在も、先回の取り組みの中で知った形になります。大橋と同じように、さらにデータを細かく分析できるようになるという点は興味を持っていますが、難しい言語を学習していくことに対しては、率直に不安を感じていました。
TSI上石:私もPythonというものが何なのか分からない状態でした。SQLを用いた分析の頃から、資料等丁寧にレクチャーいただいていたので、レクチャー自体には不安はないものの、Pythonという言語に対しては、正直不安を感じていました。
理解を深めるため意識した『Python』トレーニングの進め方
- Pythonでのデータ分析支援はどのように提案したのでしょうか
D.Table渡辺:まずPythonを用いたデータ分析は、SQLを用いたデータ分析と大きな壁があると思います。プログラミングの言語としてのPythonはSQLとは活用の幅が全く異なりますし、いろいろなデータ分析を行うことができます。
これまで、SQLを用いてデータ分析を行ってきたTSI様の場合は、Pythonを理解するにあたって、SQLで分析する場合とどのように変わるのかという点を理解いただくことが重要だと考えたため、過去の取り組みの中で行った、機械学習モデルを使用したLTV予測をPythonにて提案を行いました。
- 実際にどのように進行したのでしょうか
D.Table今栄:これまでD.Tableとして行ってきたMLBoosterをベースにして、Pythonの基礎講座を含める形でカリキュラムを構築し進行しました。プログラミング言語としてのPythonに初めて触れるという点を踏まえて、基礎講座はなるべく丁寧にかつハンズオンを多く含める形で進行しました。また、すべてのデータ分析をPythonで行うと理解が難しくなる点があるので、一部はSQLを用いて対応を行うなどの使い分けをしました。Pythonに抵抗感をいただかないように、という点を意識したつもりです。
関連ページ
トレーニングを終えて
- トレーニングを受けてみての率直な感想を教えてください
TSI大橋:Pythonを以前に学んでいたこと、資料やハンズオンに関しても丁寧レクチャーいただいたこともあり、大きな問題なくスムーズに理解ができました。
TSI佐藤:難しかったというのが本音です。Pythonのライブラリやモジュール等、聞きなれない知識等が多かったためです。ただ、詳細に理解できてない点も使い方等を丁寧に細かく説明いただいたので、大変ありがたかったです。まだまだ自分自身で活用ができるのか等と難しい点もありますが、今回のプロジェクトを通じて、Pythonを用いた分析の大枠は理解ができたと思っています。
TSI上石:Pythonの概要から説明いただいたということ、BQを用いた分析の手法をPythonで置き換える形で説明いただいたので、理解は早くできたと思っています。BQを用いた分析の手法との比較は、これまで学んだことを復習することもでき、分りやすかったです。
- D.Tableとしての提案や進行はいかがでしたか
TSI上石:D.Tableから支援いただいたレクチャーの動画と資料を見返すことで、自分でデータを置き換えて分析ができます。資料の中に細かい説明があり、復習の時等大変分かりやすいです。
TSI佐藤:録画と資料を丁寧に作成いただいて、勉強しやすく進行いただいています。Pythonを用いた分析になってから、より深い知識が必要になることが多くなったと感じています。その説明を毎週60分のMTG中で行っていただいていますが、この点をどこまで深く理解する必要があるのか、どう時間を使うべきかに関しては、さらに最適化ができるのではと思います。
- 「教育」や「データ人材育成」という観点で、どういった取り組みになりましたか
TSI竹山:今回のプロジェクトは、データの事前整形はSQL、機械学習での分析はPythonで使い分けを行ったと認識しています。
前者のデータの事前整形においては、ユーザのサイト行動ログをSQLを用いて分析し、機械学習に必要な変数として組み込むということを行いましたが、この変数の作成も、他の分析でも使用できる汎用的な知識として、学べてよかったと思っています。Pythonを用いた分析においても、LTV予測と二値予測の二つの分析手法をPythonで実装できた点は、大変意義があったと思います。
さっそく見えてきた『成果』と今後の展望
- Pythonを用いた機械学習モデルによるLTV予測の施策の検討や想定を教えてください
TSI上石:私が担当するブランドデータを対象にして分析をし、結果として出力された予測リストに対して、広告の配信を行いました。別の施策の関係で精緻な検証はできなかったのですが、他のオーディエンスリストと比較してよい結果になりました。
- Pythonでのデータ分析を踏まえて、今後やっていきたいことがあれば教えてください
TSI大橋:2つあります。1つは、会員情報等のデータからどういったユーザが退会しやすいのかの分析を行い、退会防止施策を行うことです。もう1つは、値引きなどのキャンペーンを行った際に、どれくらいの売上が見込まれるか、また、その値引きに対して売り上げが見込まれるユーザの特徴を分析して、施策検討に生かしたいです。
TSI佐藤:ブランドごとに色々な課題があると思っています。自分がかかわるナノ・ユニバースにおいては、新規の獲得が課題です。どの広告が新規獲得に寄与するのか、その広告費をどう配分すれば効率的にアプローチ可能なのか、Pythonを用いて分析を行っていきたいです。
新規ユーザのサイトログデータ等を用いて回帰分析を行う、また、まさに今取り組んでいるMMM(マーケティングミックスモデリング ※)分析等を用いて、上記に取り組んでいけたらと思います。
TSI上石:MMM分析を自身が担当するブランドにおいて実施したいです。媒体別に効果を確認し、既存の広告出稿への予算投下を最適化できればと思います。もう1つ、TSIが掲げている『ブランドを横断してユーザにアプローチを行う』というミッションに積極的にかかわるためにも、ブランドを横断する統合されたデータに対しての分析も行っていきたいです。
※:マーケティング活動のどの部分が売上や利益に貢献したかを統計学的に分析する手法。
まとめ
データ分析や活用支援をコンサルティング企業などに頼るケースも少なくないと思いますが、データを保有する事業会社自身が分析を行うための、先進的なTSIの取り組みを紹介しました。
Pythonを用いた分析への挑戦は始まったばかり。
さらに高度な分析や独自の分析もまさに、今行っている最中です。
また本取り組みをご覧になり、ご興味をお持ちいただいた方がいらっしゃいましたら、お気軽にお問合せください。