Data Scientistに必要な、グラフを描く能力

標準

マーケテイングにBig Dataという言葉が登場して何年になるだろうか。2012年にWeb広告研究会では、「Cooking Big Data」という宣言をしているので、早くも5年以上は経つのだろう。

そして、私はしばらく宣伝会議の講座で、データマーケター育成講座の講義を担当させていただいている。今までは、企業の中で、マーケティングに関するDataのまとめ方や、分析ツールの導入を中心に話してきた。しかし、先週行った講義では基本に戻って、グラフを描くワークショップを行った。

データマーケター育成講座

データマーケター育成講座

以前、このBlogでも日本航空株式会社 Web販売部渋谷 直正 さんの、実務で使う統計手法は、5つ。すごい、そんなシンプル?という考えを紹介させて頂いた。マーケティングにおいて、売り上げや利益の向上のような時系列データの分析はもっとシンプルである。グラフを描けば、実は多くの見通しが立つのである。

グラフ。皆さんは、基本を理解しているだろうか。横軸に選ぶものは何が良く、縦軸には何を選ぶべきか。トレンド(時系列)のグラフを描くときに、その横軸の刻み(周期)は、日毎?週毎?月毎?

そんなこと分かっているとおっしゃるマーケッターの皆さん。きちんとグラフの描き方習いましたか。実は、グラフの描き方は、大学の科学の実験で、多くのことを学ぶのです。従って、大学の実験の講座を受けていない、マーケッターの皆さんは、実はグラフの描き方を知らないのです。

例えば、大学では東北大学自然科学総合実験のページや、総務省のなるほど統計学園などが公開されているように、実は基本的なことを知らない方が多いのだろう。

たまご(鶏卵)の価格の年平均

たまご(鶏卵)の価格の年平均

今回の宣伝会議の講座データマーケター育成講座では、データを2種類提示して、簡易なData分析を行ってもらった。案の定、多くの方がデータを眺めるだけで、グラフを描こうとしない。人間、数表からでは、全体の増減や傾向など、わかりにくい。グラフにして視覚化することにより、増減などわかるのである。

マーケティングにおける、Data Scienceは、それほど難しくない。グラフを描く力と最低限の統計州法があれば、乗り越えられる。間違ってはいけないのは、分析ツールは単に計算支援ツールで、あなたに答えを教えてくれるものではない。まずは、何を証明したいのか、グラフを描きながら考え、そして、分析ツールに向き合おう。

きっと、データマーケター育成講座は、今後も開催されるし、さまざまな他の講座もある。このBlogを読んで不安だと思う方は、ぜひ自分のグラフを描く能力を振り返って、自己研鑽して欲しい。

大学の数学研究者に会いたい方は、ぜひ公開シンポジウムにいらしてください。私もいますので。

標準

さて、先週1月14日の、NHKスペシャル「シリーズ MEGA CRISIS 巨大危機 ~脅威と闘う者たち~
第3集 ウイルス“大感染時代”  ~忍び寄るパンデミック~」を、ご覧になりましたか。未知のウィルスの存在や、その伝播というか、感染拡大について取り上げた番組でした。この番組の中で、ウィルスの感染のシミュレーションや予測に、北海道大学の西浦 博 教授の、研究が取り上げられていました。ここで使われていたのが、「感染症数理モデル」という、数学です。いまや、医療の現場でも、多くの領域で数学が積極的に使われるようになりました。

もちろん、企業でもData Scienceの強化は待ったなしの状況で、私のところに多くの相談を頂きます。そして、よく分析・モデル作りの能力不足を、伺います。そこで、以前からお話しているように、アカデミアとの協働取り組みをお勧めすることがあります。とはいえ、多くの方が大学をきちんと卒業しているのにも関わらず、かなり大学から疎遠になっており、大学の門を再度通ることに不安感を覚えている方が多いのではないでしょうか?

そこで、今回は以下の公開シンポジウムをご紹介します。ただし、締め切りが1/27と迫っていますので、ぜひ興味のある方は、忘れずにお申し込みください。

CREST・さきがけ・数学協働プログラムの合同シンポジウム 数学パワーが世界を変える

CREST・さきがけ・数学協働プログラムの合同シンポジウム 数学パワーが世界を変える

セミナー「CREST・さきがけ・数学協働プログラムの合同シンポジウム 数学パワーが世界を変える」というものです。これは、数学と諸科学との連携、さらに数学と産業界との連携について、報告、議論されます。どのように、大学の数学研究者と一緒に取り組めば良いかのヒントが得られると思います。

最後の産業界との協働では、実際に企業の方で、大学と共同研究を行われている方が登壇します。企業としては、

  • アビームコンサルティング株式会社(私)
  • アリッツ株式会社
  • 株式会社デンソー

の方が、登壇されます。そして、このシンポジウム北海道大学の西浦 博 教授もご講演されます。なお、私は、2/11の午後から、2/12の最後まで出席します。もし、参加される方で、知り合いがいないと心細くなる方は、ぜひ私を探してください。適宜、アカデミアの方を東大の客員教授としての役割でご紹介いたします。

なお、数学が産業界で活用されている事例については、以下の本にまとめられていますので、興味のある方はごくごく一部の例ですが、参考にしてみては如何でしょうか?

41qyjsgcbhl-_sx331_bo1204203200_

数学は役に立っているか?

企業の中は、どこも人材不足です。ぜひ、このように大学という研究機関とのコネクションから、新しいData Science、数理モデルへのアプローチを行ってみることを考えてみては如何でしょうか?このシンポジウムの申し込みはこちらから出来ます。

 

自分自身を解説するセミナーに登壇してみよう。どこまで、シャープに自分を切り出せるかLet’s TRY!

標準

いや、私が好きなNFLというスポーツは無常です。9月に開幕し、私のチームは1/2に全試合が終了しました。まぁ、弱かったんですね。まだ、勝ち残っているチームには試合が残っていて、アメリカ時間2/5(日本時間2/6)に、ご存知Super Bowl 51回大会が残っているのですが。

そう、つまり1月,2月はアメフト・ファンは暇になることがあります。本当は、暇だと言いたくないのですが。今年の私は、ずばり1月の2週目から、暇なのです。

そこで、今年はSuper Bowlまで、暇な時間を上手に使うために、自分への大きな課題を科すことにしました。ずばり、自分を見つめなおし、自分を理路整然と説明するという課題です。そして、それをセミナーで皆さんにわかり易くお話しするという大きな宿題を行うことにしたのです。

bored-with-homework-1439310-639x781

宿題はいつも嫌ですよね。

こんな宿題、正直言えば自発的に思いつくものではありません。折込文化研究所の鍋島裕俊さんのご指導のおかげです。

すばり、セミナーが私の宿題の提出日になります。参加される方が、私の宿題の判定を指定頂ける先生となります。セミナーは、以下です。

なぜ、「数学」を好きなり、「企業の研究者」になり、「UNIX」に触れることになり「Internet Engineer」になり、「Digitalを活用した、マーケッター」になり、今、「コンサルタント」、「数学教授」、「マーケティん講師」になり、さまざまな国の委員も受けて活動しているのか。

MIKE HOMMAの要素分解

MIKE HOMMAの要素分解

これを、歴史ではなく、別な何か大きな理由があるのか?これから1ヶ月で見つめて、因数分解して、このセミナーでお話をしたいのです。単なる自己紹介ではなく、意味のある話として行わないといけません。だって、聞いてくださる方がいるのですから、意味のある「知の交換」時間にすることが必要でしょうから。

そして、このようなセミナーの完成度の高さは、スピーカーの出来によることも理解しています。そして、話し手の準備と当日の熱量に比例して、私も参加頂いた方からギフトをもらえます。だから、しっかりこれから自分を見つめたいと思います。タイトルも、とても挑戦的ですよね。「達人シリーズ」ですから。

そうそう、このGIFTという言葉、「才能」という意味もあります。私のこれらの仕事や社会への貢献は「才能」からだけで与えられたものではないと思います。そんなに天才でないことは私が一番知っていますから。知らず、知らず、何か人生で行いたいことや、残したいことが根底にあり、それが突き動かしていたと考えたいのです。今回は、これからそれについても整理をしないといけません。

そして、2年前に「花王・本間氏、良品・奥谷氏が転職、有力デジタルマーケターが新天地へ」というl記事にまでして頂いた私の転職が成功しているのかも判定しないといけないのでしょうね。

今回頂いた宿題は、本当に難しくて、本当に恥ずかしいです、そして論理構築が大変なセミナーをお受けすることになりました。でも、ワクワクもしています。曜日も、金曜日。私の話をきっかけに、新しいケミストリー、化学反応がおくるようなセミナーになればと思っています。。

興味のある方は、ぜひ参加して私のセミナーの構成者の一人になって頂けないでしょうか。私も皆さんに精一杯のお話をしたいと思っています。そして、私の宿題の判定もお願いします。

セミナーの申し込みは、ORIKEN揚揚(youyou)講座」達人シリーズ アビームコンサルティングの本間充って何者ぞ?から、出来ます。

3500GRPって、宣伝部で言っている本当の値は?

標準

なんか、今日公開した今さら聞けない、テレビ視聴率について、じっくり話を聞いた。そして、それをテレビでOn Airします。の記事への反応が多く、驚いています。
そして、大変驚いているのはGRPが、誤差つきだということをあまり認識ししてないということですね。ここは、東京大学の数学の先生としては、きちんと教育しなくてはということで、少し解説をしますね。

数学
まず、Gross Rating Point(GRP)のお話をしましょう。GRPというのは、ある期間に露出するコマーシャルなどの積算視聴率になります。

例えば、10GRPというのは、資料率3%のon airと7%のon airを行なうと、10GRPになります。そして、テレビ視聴率は、ビデオリサーチさまの関東の(個人)視聴率調査では、600サンプルでの統計データなので、誤差が下記のように判っています。

世帯視聴率 標本数600 標本数200
5%・95% ±1.8% ±3.1%
10%・90% 2.4 4.2
20%・80% 3.3 5.7
30%・70% 3.7 6.5
40%・60% 4.0 6.9
50% 4.1 7.1

こでは、視聴率10.0%と表示されているデータの真の値は、7.6%~12.4%ですよということです。

(出展:ビデオリサーチ様のサイトから)

では、3500GRPを獲得する以下の2ケースを考えましょう。ここでは、単純に、

  • 視聴率10%の広告枠を350回購入
  • 視聴率5%の広告枠を700回購入

の2種類の方法を考えましょう。

まずは、視聴率10%の方から、考えますね。この場合の数値の最小値は、7.6%、最大値は12.4%ですね。それぞれに、3500をかけると、最小値は2660GRPで、最大値は4340GRPとなります。かなりの幅があることがわかります。

では、次に視聴率5%の場合について考えましょう。この場合の最小値は上記の表から5-1.8=3.2%と、最大値は5+1.8=6.8%となります。そして、この広告枠を700回購入するので、それぞれに700をかけると、2240GRPと4760GRPとなります。

つまり、ここでお伝えしたかったのは、同じ3500GRPと、宣伝部が言っても、実際のアクチュアルのGRPは、買っている番組の視聴率の状況によって、誤差範囲が変わるということです。ここまで、理解してテレビの広告を活用していますよね。皆さん!!

明日からは、GRPの話がでたら、きちんとその誤差範囲も聞きましょう。

ちなみに、誤差を少なくするには、サンプルを増やせば良いのですが、そのために広告主の方は、視聴率のデータ購入金額を、2~3倍の費用を払いますか?その話も、今さら聞けない、テレビ視聴率について、じっくり話を聞いた。そして、それをテレビでOn Airしますのテレビ番組で話していますので、ぜひご覧ください。

 

NFL選手が、数学者を目指す

標準

私は、NFLが好きな数学者ですが、なんとそれを超えた話が登場した。NFLのボルチモア・レイブンズの攻撃の選手である、John Urschelが、なんとオフ・シーズンにMITの数学のPh.Dのコースに通うというのである。tつまり、数学の博士になるというのである。

John Urschel #64 C

John Urschel #64 C

当然このニュースは、話題になりNFLのサイトでも、Ravens’ John Urschel begins Ph.D program at MITという記事になっているし、さらに面白いのは、AMS(American Math Society/アメリカ数学会)の学会誌でも、“I plan to be a great mathematician”:An NFL Offensive Lineman Shows He’s One of Usという記事になっている。

NFLの選手ということもあり、注目があるだろうが、日本で考えないといけないことは、社会人の大学への復学の方法が少ないことである。日本では、社会人が大学・大学院に戻ることは非常に難しい。しかし、これからは社会に出たからこそ学びたい学問や分野も多くなる。

ぜひ、日本でも社会人の大学・大学院への入学・復学が増えることを望む。

WS000002

 

 

そうか、組織もIoTやウェアラブルで良くなるんだ。

標準

今日は、XPD 2016に出席しています。今も、『WIRED』日本版 編集長 若林 恵さんと、株式会社ロフトワーク 代表取締役 林 千晶さんの「問いのデザイン」 というCross Talkを聞きながら、このBlogを書いています。あ、林さんごめんなさい。でも、聞いたことは忘れないうちに整理しないと……

今日のセッションは、非常に私にとっては普段考えない領域でありながら、DataとDesignという大きなテーマは、実は普段から私のなかでもやっとした課題でもあり、刺激になるお話しが一杯でした。

Ben Waberさん

Ben Waberさん

その中でも、Humanyze Co-Founder, President, and CEO Ben Waberさんと、株式会社ロフトワーク プロデューサー カワナ アキさんの「行動データ分析で変える働き方」の話は、大変興味のある内容でした。

オフィス改革を行う人事部さん、PDCA回していますか?という内容なのである。人の働き方測定していますか。勤怠ではなく、個人ごとにofficeでのアクティブティー計っていますか?という内容なのである。

このベンさんの話の中では、Money Ballの内容が引用されていたが、スポーツでは、各選手にセンサーを着けてスポーツ選手の評価を行い、選手の活動が良くなるようにコーチしている。このBlogでも、以前に、NFLが、IoTを導入。その名も、”NFL Next Gen Stats”という記事を書いたが、それをビジネスマンにも行おうという話である。これを、People Paralyticsという言うらしい。

なんとなく、IoTといえば健康関係や、製造や、自動車なんかに話が行きますが、就業者の1/3の働く時間の効率化、質の向上は、重要なテーマですよね。残業時間に制限をかける、日本の法改正よりも、日本は働きやすい会社であるほうが、良いビジネス・マンが日本に集まり、日本の経済も再生され、結果1億総活躍になるのではないでしょうか。

People Analytics: How Social Sensing Technology Will Transform Business and What It Tells Us about the Future of Work

People Analytics: How Social Sensing Technology Will Transform Business and What It Tells Us about the Future of Work

今日のお話を聞いて、このPeople Analyticsはとても面白く重要な分野だと思いました。まずは、これから

データの見えざる手 ウエアラブルセンサが明かす人間・組織・社会の法則矢野 和男 (著)

データの見えざる手 ウエアラブルセンサが明かす人間・組織・社会の法則矢野 和男 (著)

これの基本的な、データの見えざる手 ウエアラブルセンサが明かす人間・組織・社会の法則矢野 和男 (著)を読んで研究してから、勉強を始めようと思いました。

その意味では、意外と足元の自分たちの働き方のような場所にこそ、Data分析を行い改善する部分が多いと。今日は、とても刺激的なセッションを沢山聴けました。

週末Data Scientist養成。

標準

Marketing業界で、Data Scientistのニーズが引き続き、高い。数学のアカデミア関係者としては、非常にありがたいことです。

一方、Data Scientistがあまり大学から排出されない課題として、高校生や大学で専門を決める前に、Data Scientistという職業が認知されていないことも課題になっています。先月、文部科学省で最近の高校生の進路決定のお話を聞いたのですが、高校進学時に自分の進路を決めている高校生が多いそうなのです。つまり、優秀なData Scientistをアカデミアから排出するためには、高校生などにData Scientistをあこがれてもらわないといけないということですね。これは、まさに産業界の課題でしょう。Star Data Scientistを産業界で創ることも急務なのでしょう。

そして、そのStarになるかは別として、自らData Scientistになりたい方は多いはずなので、ここでは少し、Data Scientistになる勉強方法について参考までに紹介したいと思います。

まずは、いくつか動画のサイトを紹介します。

文部科学省委託事業「データサイエンティスト育成ネットワークの形成」では、統数研の先生たちによる講義があります。

データサイエンティスト育成クラッシュコース(データサイエンティストの基礎が2.5時間で学べます)

この講義は、とても充実しています。これが無料で好きなときに見れるというのは非常に良い時代になりました。

統計数理研究所では、その他に多くの講義をYouTubeにて公開しています。なかには、「音楽情報処理が切り拓く未来」などという応用の講義も含まれていて、大変充実していります。視聴者が増えれば、公開される講義も増えると思います。ぜひ、積極的に活用してみてはいかがでしょうか。

次に、総務省統計局が行う講義です。こちらは、2016年4月19日に、「社会人のためのデータサイエンス演習」がスタートします。《特別開講》「社会人のためのデータサイエンス入門」は、3/1に公開され、もう受講羽化脳です。いずれも、テキストだけ購入すれば受講可能です。おそらく、「社会人のためのデータサイエンス入門」→「社会人のためのデータサイエンス演習」がBestな受講パターンなのでしょう。講師も豪華ですし、必要なのはエクセルだけというのも非常に良いですね。

最近ではこのような、ネットの動画サイトも多くなってきましたが、家で勉強するのは無理!という方には、講義軽視の講座も沢山あります。先ほど紹介した、統計数理研究所(統数研)では、統計思考院という取り組みを行っており、そこで無料・有料のセミナーを多数開催しています。例えば、「HadoopとRによるビッグデータ解析」では、開催は6月28日(火)10時~16時 (5時間)で、受講料は5000円です。とても、安いです。ただし、倍率は高いので、そこは覚悟をしてくださいね。

さらに、もっと基本的なことから勉強したいという人に、さまざまな統計手法の前に、統計に触れてみたい人への私のお勧めの本は、

です。この本は、統計を体系立てて勉強するのではなく、事例からそこに使うべき統計の手法を理解するという本です。統計のさまざまな手法のどれを学んだらよいかわからないという方には、この本からスタートするのをお勧めします。問題が一杯あるので、本を読みながら、実際に計算してみるのも良いのではないでしょうか。

まぁ、このように自分でデータ・サイエンスの勉強を出来る機会が沢山あるのは良いですね。上手く、目的やスタイルに合わせて選んでみては如何でしょうか?また他の勉強方法や講座などあれば、教えてくださいね。