目指せ!データサイエンティスト

2020年9月12日作成,2022年7月10日更新

はじめに

21 世紀で最も魅力的な職業と言われるデータサイエンティスト(Data Scientist)を目指し,学習するためのページである。

なぜ,データサイエンティストは 21 世紀で最も魅力的な職業なのか

20 世紀は,既存の市場やルールの中で切磋琢磨し,活動することがモノ・カネを生み出してきた。しかし,21 世紀は枠組みを超えた新しい価値を創出・創造することが富へとつながる時代となると考えられる。

新しい価値を生む鍵となるのが,データや AI(Artificial Intelligence : 人工知能)である。データをどのように扱い,どのような価値を,どのような社会を生み出していくかをデザインし,実現させるスキルを持つ人,それがデータサイエンティストと考えられる。つまり,データサイエンティストは,新しい価値を創出・創造する魅力的な職業と考えられる。

そもそも人間の直感や経験がうまく機能しないケースにおいて,膨大な種類と量のデータをすべて調べ上げることは,コストを考えると人手でまかなうことが困難である。その場合に,データサイエンティストが機械学習を導入して,データから知見につなげるまでを自動化する有用なしくみを実現できれば,大きな価値をもたらすことができるだろう。

データが切り札

人やコンピュータが生み出したり,センサーが集めたりしたデータは近年(2021年7月時点),爆発的に増え,科学,経済,そして社会を動かすようになってきた。データが切り札になってきたのである。デジタル化(いわゆるデジタル・トランスフォーメーション)の成否も,必要なデータを集めて活用できるかどうかにかかっている。

なぜ,データなのか。背景には,社会の課題が複雑になってきた現実がある。問題が単純ならば,データは不要で,自分でモデルを作ればいい。

しかし,人間の生理現象にしても,気候変動にしても,経済の動きにしても,残っているのは,ややこしい難問ばかり。方程式など立てようもない世界である。大量のデータを集めて分析することによってしか問題は理解できない。

AI(人工知能)も今はデータがなければ動かない。データは AI の燃料なのである。

データサイエンティストとは

データサイエンティストのためのスキルチェックリスト/タスクリスト概説』によると,データサイエンティストとは,「データサイエンス力,データエンジニアリング力をベースにデータから価値を創出し,ビジネス[1]課題に答えを出すプロフェッショナル[2]」とされている。

データサイエンティストとは,裏打ちされたスキルを駆使してデータを分析し,ビジネス課題の回答を導き出すプロフェッショナルを指す。スペシャリスト,エキスパート,プロフェッショナルそれぞれの人物像を下表に示す。

表 スペシャリスト,エキスパート,プロフェッショナルの人物像
スペシャリスト 何らかの分野に特化した人
エキスパート 何らかの分野について,体系的で秀でた知識とスキルを持っている人
プロフェッショナル 体系的にトレーニングされた専門性の高いスキルを持ち,それをベースに顧客(お客さま,クライアント)にコミットした価値を提供し,結果に対して認識された価値の対価として報酬を得る人

  1. 企業の営利活動だけでなく,社会に役立つ意味のある活動全般を指す。
  2. 体系的にトレーニングされた専門的なスキルをベースに顧客(お客さま,クライアント)に価値を提供し,その対価として報酬を得る人。

データサイエンティストのスキル

データサイエンティスト協会

一般社団法人 データサイエンティスト協会ではデータサイエンティストに求められるスキルセットとして,次の 3 つを挙げている。3 つのスキルセットはとても重要なファクターで,どれか一つが欠けてもデータサイエンティストとして十分な力を発揮できない。

  • ビジネス力に欠ければ,そもそも解決すべき問題が定義,整理することができない
  • データエンジニアリング力が乏しければ,ビジネス課題についてのサイエンスの活用はわかっても,肝心の実装(実際に利用できるシステムを仕立て上げること)ができない
  • データサイエンス力がなければ,ビジネス課題の上で実装を用意できても,要となるサイエンスの知恵が足りないため,データの力を活かすことができない

ビジネス力,データエンジニアリング力,データサイエンス力のスキルセットは,いわば三位一体なのである。

ビジネス力(business problem solving)
課題背景を理解し,ビジネス課題を整理・解決に導く力
データサイエンス力(data science)
情報処理・人工知能・統計学などの情報科学系の知恵を理解し使う力
データエンジニアリング力(data engineering)
データサイエンスを意味ある形として扱えるようにし,実装・運用する力
データサイエンティストのスキルレベル

データサイエンティスト協会では,データサイエンティストにとって必須であるスキルセットに対して,それぞれに 4 段階のスキルレベルを定義している。

表 データサイエンティストのスキルレベル
スキルレベル 目安 対応できる課題
シニア・データサイエンティスト
Senior Data Scientist
業界を代表するレベル 産業領域全体,複合的な事業全体
フル・データサイエンティスト
Full Data Scientist
棟梁レベル 対象組織全体
アソシエート・データサイエンティスト
Associate Data Scientist
独り立ちレベル 担当プロジェクト全体,担当サービス全体
アシスタント・データサイエンティスト
Assistant Data Scientist
見習いレベル プロジェクトの担当テーマ
データサイエンス

データサイエンスとは,アルゴリズムや統計などといった情報科学系の理論を活用してデータを分析し,有益な知見を見出すことを追求する新しいアプローチである。

データサイエンスと聞くと,「難しそう」「特定の業種や職種の人しか使わない」と感じるかもしれないが,データサイエンスは,すでに生活の中で身近な存在となっている。例えば,インターネット広告,自動運転,スポーツ分野などである。データサイエンスのスキルは,特定の業種や職種に限らず,あらゆる業種や職種の方にとっても重要な基礎素養となっていくと考えられる。

ベイカレント・コンサルティング

ベイカレント・コンサルティングの著書『データレバレッジ経営 デジタルトランスフォーメーションの現実解』によると,データサイエンスは「大量のデータから何らかの示唆を導き出すスキル」と定義されている。そして,データサイエンスのスキルとは,次の三つである。

  1. データアナリティクス力
  2. コンピュータサイエンス力
  3. 問題解決力

データサイエンティスト協会の 3 つのスキルセットと比較すると,データアナリティクス力はデータサイエンス力,コンピュータサイエンス力はデータエンジニアリング力,問題解決力がビジネス力に該当すると考えられる。

野村総合研究所

野村総合研究所 城田 真琴 氏による『ビッグデータの衝撃』によると,データサイエンティストに必要な資質として,以下の 3 つが挙げられている。

(1) コミュニケーション能力

ビッグデータから有用な洞察を得ても,それをビジネスに実装できなければ,その価値は半減してしまう。このため,データ分析の知識に乏しいビジネス部門側のスタッフや経営層にもデータの分析結果を効果的に伝えられる「ストーリー」を組み立てる資質は非常に重要である。

(2) アントレプレナーシップ(企業家精神)

まだ世の中に存在しないデータ中心の新しいサービスを生み出そうとする起業家精神も,データサイエンティストに求められる重要な資質である。

(3) 好奇心

膨大なデータの背後に何があるのかを見つけ出そうとする強い好奇心に加えて,成功しているデータサイエンティストには,芸術,技術,医療,自然科学など特定の分野にとらわれず,あらゆる分野に対して,好奇心が旺盛であるという共通点があるようだ。異なる領域のデータを掛けあわせて分析することで,従来は得られなかった価値ある洞察が得られる場合があるためである。

データアナリストとデータサイエンティストの比較

ここで,データアナリストとデータサイエンティストを比較する。

表 データアナリストとデータサイエンティストの比較
スキル 内容 データ
アナリスト
データ
サイエンティスト
数学・統計学
  • 統計モデルの構築
  • 予測モデルの構築
  • モデルの最適化
プログラミング
  • スクリプト言語(PythonR など)
  • データベースのエンジニアリング
  • ソフトウェアエンジニアリング
機械学習
  • 教師あり学習
  • 教師なし学習
  • 強化学習
データの可視化
  • 複雑な問題や課題の可視化
  • 顧客をエンゲージできる説得力
ビジネス戦略
  • データ分析から事業の改善案を提案する
  • データ分析から新しいビジネス提案をして ROI (Return On Investment : 投下資本利益率,投資利益率)を生み出す。

Cyber Physical System (CPS)

IoT(Internet of Things, モノのインターネット)の技術革新により,人だけでなくモノのデジタル化・ネットワーク化も急速に拡大し,データを通じて人間を介さず,直接サイバー空間に実世界の状況が写し取られ,サーバー空間での情報処理結果が実世界の動きを制御する Cyber Physical System(CPS)が現実のものとなった。

IT の社会への実装は,以下のような段階を踏んで発展し,現在はまさにレベル Ⅳ の CPS の実現という段階に位置している。

表 IT の社会への実装
レベル 社会への実装 年代
レベル Ⅰ 個別機器を独立して使用(スタンドアロン) ~1990年代後半
レベル Ⅱ 一部機器がネットワークに接続され,デジタルデータの流通が開始(ネットワーク化) ~2000年代前半
レベル Ⅲ データ集積・集計・処理といった機能が,個別の端末からネットワーク上のデータセンター等へ移行(クラウド化) ~2000年代後半
レベル Ⅳ 実世界をデジタルデータに変換し,そのデータを処理した上で,現実にフィードバックするというループの発生(CPS 2010年頃~
レベル Ⅴ AI による価値創造と完全自律・自動化 今後

CPS の深化のレベルに応じ,以下のような変化が産業や社会にもたらされると考えられる。

  1. 実世界とサイバー世界の相互作用による高付加価値化
  2. データの二次利用や,特定分野での技術基盤等の他分野への応用による新たな価値創造
  3. デジタル化の進展による水平分業化,開発・生産手法の変容と規模の経済性・ネットワーク外部性の発現
  4. セキュリティ・リスク,コンプライアンス・リスクの増大
キーワードの定義
CPS(Cyber Physical System)
デジタルデータの収集,蓄積,解析,解析結果の実世界へのフィードバックという実世界とサイバー空間との相互連関。ドイツが掲げる第四次産業革命(industry4.0)は概念としては同義であるが,実際には製造プロセスにおける取組が中心。
データ駆動型社会
上記 CPS が IoT によるモノのデジタル化・ネットワーク化によって様々な産業社会に適用され,デジタル化されたデータが,インテリジェンスへと変換されて現実世界に適用されることによって,データが付加価値を獲得して現実世界を動かす社会。

機械学習

機械学習(ML : machine learning)[1]は,明示的な指示を用いることなく,その代わりにパターンと推論に依存して,特定の課題を効率的に実行するためにコンピュータシステムが使用するアルゴリズムおよび統計モデルの科学研究である。機械学習は人工知能(AI : artificial intelligence)[2]の部分集合とみなされている。

さらに機械学習の部分集合として,ディープ・ラーニング(deep learning)がある。ディープ・ラーニングはデータの中に存在しているパターンやルールの発見,特徴量の設定,学習なども機会が自動的に行うことが特徴である。ディープ・ラーニングにより,人間が見つけられない特徴を学習できるようになったおかげで,人の認識・判断では限界があった画像認識,翻訳,自動運転といった技術が飛躍的に上がった。

AI, ML, Deep Learning
図 AI,ML,Deep Learning

  1. 人工知能研究のスタートは「Artificial Intelligence」という言葉を生んだ 1956 年の Dartmouth Conference だと言われている。この報告書では,機械(コンピュータ)によってどのような知的な振る舞いが人工的に実現できるのかの展望を示している。

機械学習が実用化されるためのハードル

機械学習が実用化されるためのハードルとして,次の 3 つが考えられる。

  • 実用上の制度が十分なレベルに到達すること
  • 機械学習を導入し,運用するコストが,旧来のオペレーション(特に人手による作業)よりも低くなること
  • データの種類や量,求められる反応速度の面から人間には難しいタスクの実行を機械で補うこと

ディープ・ラーニング

ディープ・ラーニング,または深層学習とは,多層構造化したニューラルネットワーク[1]による機械学習手法である。ディープラーニングの活用により,十分な訓練データさえ用意できれば,人手を介することなく,機械が自動的に特徴抽出できるようになる。ディープ・ラーニングがディープと呼ばれるのは,ネットワークの階層が深いためである。ディープ・ラーニングの登場以前,4 層以上の多層ニューラルネットは,局所最適解や勾配消失などの技術的問題により,十分な学習が困難で,性能も限られていた。しかし,近年,ディープ・ラーニングが実現可能になった理由は,Pretraing,Dropout,Pooling といった古くからあるテクニックの再利用,Web の発達による大規模な訓練データ取得の容易化,および GPGPU などの計算機の高性能化といった環境変化がある。その結果,音声・画像・自然言語などの諸問題に対し,他の手法を圧倒する高い性能を示し,2010 年代になって急速に普及して大ブームとなり,過熱気味でさえある。また,最近は Caffe,Chainer,TensorFlow,Azure Machine Learning などのツールの出現により,ディープ・ラーニングによる機械学習がコモディティ化し始めている。

表 主なディープ・ラーニングフレームワーク
名称 主要言語 主な開発元
Caffe C++/Python カリフォルニア大学バークレー校
Chainer Python Preferred Networks
Cognitive Toolkit C++/Python/ マイクロソフトリサーチ
MXNET C++/Python/Scala/R Amazon, Apache Software Fundation
TensorFlow Python/C/Java/Go Google Brain チーム
PyTorch Python/C++/CUDA Facebook
Theano Python/CUDA モントリオール大学

ディープであることの意味

一般に,ディープラーニングは,従来 3,4 層程度であったニューラルネットをさらなる多層化によって 5 ~ 20 層を超える深い構造を有するネットワークにした,という意味で捉えられているようである。しかし,それは表面的な特徴に過ぎない。

Deep な構造がもたらす機能的な意味は,非線形関数を何重にも入れ子にすることで実現される万能近似器としての性質にある。


  1. 機械学習のアイデアは,1959 年に Arthur Lee Samuel によって試みられたチェッカーゲームの論文が嚆矢だと言われている。機械が明示的に決められた振る舞いに従うのではなく,学習によって適切な振る舞いを獲得するというアイデアは,コンピュータ技術の発展とともにさまざまな研究の拡がりをみせた。
  2. ニューラルネットワークは,脳の情報処理を模倣した数理モデルであり,ニューロンと呼ばれる神経細胞を多入力 1 出力の非線形素子のノードで,シナプスと呼ばれる結合部位を重みと呼ばれるパラメータで模倣したネットワークである。

最近のバズワードと常に関係する機械学習

機械学習は,最近のバズワードと常に関係している。

表 最近のバズワード
バズワード 説明
ビッグデータ 長年蓄積された,または,インターネットなどを通して蓄積された膨大かつ多様なデータ群のことである。このデータを解析することで今まで得られなかった知見を導出し,ビジネスに役立てる。
データサイエンティスト 加工や集計を超えて意思決定に役立つ知見を得る
人工知能 人間が行う知的な振る舞い(違いを見分けるなど)をコンピュータプログラムで人工的に再現すること。AI(Artificial Intelligence).
IoT 身の回りのあらゆるモノがインターネットに接続されて情報の取得や利用が行える状態は,IoT(Internet of Things)と呼ばれている。

ビッグデータ

ビッグデータをテーマにした日本語の記事では,米マッキンゼー・グローバル・インスティテュート(MGI)が 2011年5月に発表したレポート "Big data: The next frontier for innovation, competition, and productivity"(ビッグデータ――イノベーション創出,競争優位,生産性向上のための次なるフロンティア)の内容がよく引用されている。

城田氏『ビッグデータの衝撃』では,欧米の IT 業界での論調,および欧米の IT 関係者への取材を通じて,ビッグデータを以下のように捉えている。

ビッグデータとは,既存の一般的な技術では管理するのが困難な大量のデータ群である

リレーショナル・データベースで管理するのが困難であったり,ボリュームが増大した結果,データに対するクエリ(問い合わせ)の応答時間が許容範囲を超えてしまう状態を招く膨大なデータを指す。

ビッグデータの特性は,単にボリュームが大きいというだけではない。頭文字が V から始まる次の 3 つのキーワードで示される。

  1. Volume (ボリューム:量)
  2. Variety (バラエティ:多様性)
  3. Velocity (ベロシティ:速度)

上記はデータの性質について着目したものに過ぎない。城田氏『ビッグデータの衝撃』では,講義として次のようにビッグデータを定義している。

ビッグデータとは 3V(Volume/Variety/Velocity)の面で管理が困難なデータ,および,それらを蓄積・処理・分析するための技術,さらに,それらのデータを分析し,有用な意味や洞察を引き出せる人材や組織を含む包括的な概念である

IoT 活用のための戦略的バリュードライバー

産業界はデジタル変革(いわゆるデジタル・トランスフォーメーション)が求められる時代となり,経営者は自社のビジネス上の戦略オプションをどのように定義すべきか迫られている。その中で,ディープ・ラーニングや IoT の先進テクノロジーがビジネスを変革する期待感は大きい。

以下に IoT 活用のための戦略的バリュードライバーを示す。

表 IoT 活用のための戦略的バリュードライバー
No. ターゲット 説明
1 業務パフォーマンスの最適化 企業内の資産,業務システム,人々から発するリアルタイムのデータをうまく組み合わせながら,機器,工場,物流の業務効率を向上させること
2 リスク管理の改善 財務,安全,環境,規制コンプライアンス上のリスクを事前に特定し,緩和する能力を改善すること
3 製品およびサービスコストの削減 事前対応型のサービスの導入や保証コストを制限することで,サービス業務や製品開発プロセスを最適化すること
4 ユーザの利便性や使い勝手の向上 製品をよりスマートにアップデートしやすく,顧客好みにパーソナライズすることで,ユーザの利便性や使い勝手を高めながら顧客価値を改善すること
5 製品およびサービスの差別化 顧客の需要を予測し,それらを満たす魅力的な製品やサービスを,競合企業より迅速に提供すること
6 新しい収益源の実現 新しいサービスモデルやビジネスモデルを定義し,収益機会や価値の獲得を最大化すること

注目されるデータサイエンティスト

最も魅力的な職業

2009年,Google のチーフエコノミスト ハル・ヴァリアンは,これからの 10 年で最も魅力的な職業は統計学者であると言っている。すでに 10 年経過しているが,統計学者は魅力的な職業であり続けているか。

I keep saying the sexy job in the next ten years will be statisticians.

これからの 10 年で最も魅力的な職業は統計学者(statisticians)であると言い続けている。

(2009年8月5日,Google チーフエコノミスト ハル・ヴァリアン)

ハーバード・ビジネスレビューでは,21 世紀で最も魅力的な職業として,データサイエンティストを紹介している。この頃からデータサイエンティストという言葉が世界的に流行し,日本でも多くの人が注目するようになった。

The Sexiest Job of the 21st Century.

(2012年,ハーバード・ビジネスレビュー)

21 世紀の新たな石油

『データの世紀』によると,21 世紀の新たな石油であるデータ資源が,経済や社会に様々な恩恵をもたらすとされている。その例えに従えば,グーグルやフェイスブックは石油の採掘(データ収集)から,タンカー輸送(海底ケーブルによる送信),備蓄と化学工場での製品化(データセンターでの蓄積と処理),さらに消費者への販売(スマホへの送信)まで全行程に関わっていることになる。もはや単なるソフト産業,ネット企業ではない。

個人のネット上の行動,企業の生産や物流が生み出す膨大なデータ資源は,21 世紀の「新たな石油」といわれる。ビッグデータや人工知能(AI),あらゆるモノがネットにつながる「IoT」といった,ネット社会を支える新技術も猛スピードで進化する。そして私たちの経済や社会に様々な恩恵をもたらす。

オリジナルの英文は次のとおり。ここでいう "broken down" がデータモデリングである。データモデリングとは,データを構造的に整理し,ビジュアルなモデルに表現することにより,効率的に扱えるようにすることである。

The world's most valuable resource is no longer oil, but data!

Data is the new oil. It's valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc to create a valuable entity that drives profitable activity; so must data be broken down, analyzed for it to have value.

ビジネスのためのデータ活用

『IT エンジニアのための機械学習理論入門』によると,データサイエンティストの役割は次のように語られている。

「データサイエンス」という言葉は,さまざまな意味で用いられる。本書では,特にビジネスのために戦略的にデータを活用する手法,つまり「データを活用してより質の高いビジネス判断を行うこと」をデータサイエンスの目的として位置づけます。そして,これを実現するのが「データサイエンティスト」の役割です。

グリーに深く浸透する「データ駆動型アプローチ」は,次のように語られる。

一個人のセンスよりも数千万人のデータを信じる

様々な課題の解決や展望を予測

『まるわかり 電力デジタル革命キーワード 250』において,データサイエンティストは電力デジタル革命のキーワードの 1 つとして挙げられている。

様々な課題の解決や展望を予測するため,膨大に蓄積されているビッグデータの内容・分布を調べ,特定の傾向や性質に基づいた解析によって適切な解決方法を提示・評価する専門家のこと。ICT の環境整備を背景に,企業などが収集・蓄積するデータの種類や量は爆発的に増加し続けており,ここから必要なデータを取り出し,効果的に実際のビジネスや社会活動に利用するデータサイエンティストの存在が注目されている。従来の IT エンジニアが担っていた情報処理やプログラミングの技術に加え,社会や企業の動向を数理モデルに反映するためのより幅広い知識が必要とされる。

政府統計の総合窓口 e-Stat

e-Stat は,日本の統計が閲覧できる政府統計ポータルサイトである。

データにまつわる格言・発言

データにまつわる格言や著名人の発言を集めてみた。

「データは軽視しないほうがいい,データには真実が隠されている」

「データはあくまでツール。それを読み解く人間の力が大事」

「データは『21 世紀の石油』と同じ」(アンドレアス・ワイガンド)

「AI における革命は深淵だ。間違いなく僕を驚愕させたよ。僕はこの世界のど真ん中に座ってきたのにね」(2017年 世界経済フォーラムにおける Google の共同創業者セルゲイ・ブリン氏(Sergey Brin)の発言)

危機が差し迫っていると感じたら,最初にやるべきなのはオオカミが来たと叫ぶことではなく,データを整理することだ。

『FACTFULNESS 10 の思い込みを乗り越え,データを基に世界を正しく見る習慣』

"Data Scientist’ is a Data Analyst who lives in California"

(俗説)カリフォルニアに住むデータアナリストを『データサイエンティスト』と呼ぶ

"A data scientist is someone who is better at statistics than any software engineer and better at software engineering than any statistician."

(俗説)エンジニアよりも統計学に優れ、統計家よりもエンジニアリングに優れた人種のこと

データ駆動型経済が社会を変革する

モノのデジタル化により,リアルな世界とサイバー空間との相互連関(CPS : Cyber Physical System)があらゆる領域で適用されるようになり,大きな社会的価値が生み出されていく。

森川 博之,『データ・ドリブン・エコノミー ――デジタルがすべての企業・産業・社会を変革する』,ダイヤモンド社,2019年4月3日

データサイエンティストは「アナリスト」の延長

  • 統計分析で「意思決定を支援する(場合によっては自ら意思決定する)」のがメイン
  • 必要に応じて機械学習で「自動化の推進」も進める
  • オールラウンダー的な立ち位置のため、必要に応じてデータ基盤・データ活用体制の構築も担う
渋谷駅前で働くデータサイエンティストのブログ,「データサイエンティスト・機械学習エンジニア・データアーキテクトの定義とスキル要件(2021年版)

データサイエンスの実践

データサイエンティストを目指し,データサイエンスしてみた。

本ページの参考文献

  • 高橋 淳一 他,『Software Design plus シリーズ データサイエンティスト養成読本 登竜門編 データ分析の新常識/ビギナーのための必須スキルが満載!』,2017年4月7日,技術評論社
  • 一般社団法人 データサイエンス協会 スキル定義委員会,独立行政法人 情報処理推進機構 ITSS +(データサイエンス領域)『データサイエンティストのためのスキルチェックリスト/タスクリスト概説 Skill checklist & Task list Overview』,2020年7月7日
  • ベイカレント・コンサルティング,『データレバレッジ経営 デジタルトランスフォーメーションの現実解』,日経 BP,2019年6月
  • 千葉大学 小圷 成一,『ディープ・ラーニングについて』
  • 横浜国立大学 濱上 知樹,『機械学習の観点から』
  • PTC ジャパン 後藤 智,『ビジネスモデル変革の観点から』
  • 城田 真琴,『ビッグデータの衝撃』,東洋経済新報社,2012年7月12日
  • 日本経済新聞社 データエコノミー取材班,『データの世紀』,日本経済新聞出版社,2019年11月14日
  • 中井 悦司,『IT エンジニアのための機械学習理論入門』,技術評論社,2015年11月15日
  • 西村 陽,巽 直樹,『まるわかり 電力デジタル革命キーワード 250』,日本電気協会新聞部,2018年8月8日
  • ハンス・ロスリング,オーラ・ロスリング,アンナ・ロスリング・ロンランド,『FACTFULNESS 10 の思い込みを乗り越え,データを基に世界を正しく見る習慣』,日経 BP 社,2019年1月15日
  • 森川 博之,『データ・ドリブン・エコノミー ――デジタルがすべての企業・産業・社会を変革する』,ダイヤモンド社,2019年4月3日
  • 産業構造審議会 商務流通情報分科会 情報経済小委員会,『中間取りまとめ~CPS によるデータ駆動型社会の到来を見据えた変革~』,平成27年5月
  • 国立情報学研究所所長 喜連川 優,『あすへの考 【IT と日本社会】 データの時代 失敗する勇気』,読売新聞,2021年7月25日
  • データサイエンティスト・機械学習エンジニア・データアーキテクトの定義とスキル要件(2021年版)
  • データサイエンティストの終わりなき戦い
  • そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる
inserted by FC2 system