「データサイエンティストって何かかっこいいな」
「何ができるとデータサイエンティストになれるのかな?」
という好奇心で、とあるデータサイエンティストの講演会に行ってきました。
今回の講演会に参加してみて「40歳を過ぎた僕でもデータサイエンティストを目指せるかも」と思うぐらい役に立つ講演会でした。
このページのタイトルは、「データサイエンティストになるための方法〜PythonやRができればOK?〜」にしました。
答えはNoです。
もちろんPythonやRの知識や活用するスキルが必要(必要条件)ですが、PythonやRの知識やスキルがあればデータサイエンティストになれるか(十分条件)というと、答えはNoと考えるからです。
この記事はその理由についてお話します。
データサイエンティストとは?何ができる人?
今回の講演会で学んだデータサイエンティストの定義は以下の通りです。
「データを活用して利益を出せる人」
おそらく、世の中には「データサイエンティスト」という職業の様々な定義があると思います。
ですが、講演会の先生の話を聴いて私がとても納得したのは「利益を出す」という言葉です。
利益を出す訳ですので、一番分かりやすい例としては、ビジネスで儲けるということになります。
PythonやRなどのツールがどれだけ使えたとしても、それが誰かの利益に繋がらないと何の価値にもならないからです。いわゆる「分析屋」との決定的な違いだと思います。
そして、利益を出すためには、データを分析した結果を根拠にして、今までとは違う行動を起こす必要があります。
例えば、「今まで週末にだけ出していた広告を水曜日にも出すようにする」というのが、「今までと異なる行動」ということを意味します。
また「今までと異なる行動」を起こすのが自分ではない場合(二人以上の組織であれば全て当てはまりますね)、自分以外の誰かに「今までとは違う行動」をしてもらう為の論理や交渉力も必要となります。
以上のことから、データサイエンティストには以下の能力が必要です。
- 利益を出すための課題を発見できる人
- その課題をデータ解析を通して解ける人
- 解析結果を関係者に納得させて、利益に繋がる具体的な行動に結びつけられる力を持つ人
1の課題発見の仕事や、3で行う説明・交渉・折衝などの経験が豊富な方であれば、データ解析のスキルさえ身につければ「データサイエンティスト」になれます。
多くのサラリーマン、公務員、フリーランスの方々は日常的な業務の中で多かれ少なかれ1と3の経験がありますよね。従って、学生がいきなりデータサイエンティストを目指すより、社会で様々な経験をしてきた人の方がアドバンテージがあると思います。
データサイエンティストを目指す人が最初に読むべき本
私もデータサイエンティストに興味を持って2年ぐらい前に何冊か本を読み漁ったことがあります。(今、またその情熱が再燃しています)
今回の講演会でも3〜4冊の本が紹介されていました。
その中で「会社を変える分析の力」という本がおすすめです。
何のためにデータ解析をするのか?という事を深く考えさせてくれる良本だと思います。
本日のセミナーの講師は、この本の著者の河本さんの考え方を、かなり取り入れていました。
どんな人がデータサイエンティストになれるのか?
僕はデータサイエンティストに興味がある人なら誰でもなれる可能性があると思います。(と言ってしまうと身も蓋もないですね。。)
興味があるということは、統計学、プログラミング、データ解析に対してアレルギーがないということですし、興味さえあれば私自身が今回受けた講演会のように無料で勉強できる講習会やセミナーがいくらでもあります。
もちろん、ネット上でも無料の情報が溢れるぐらいにあります(そういう意味ではこのページも無料の情報の1つです(^^))
というわけで、興味がある(=好き)ということがデータサイエンティストになるための資質だと思います。
今現在は、世の中で必要とされるデータサイエンティストが何万人も不足していると言われている時代ですので、データサイエンティストになろうとしている方は自分の人生を切り拓くチャンスですね。
特にビジネス上の課題を解決してきた経験のある方には、データサイエンティストになることによって自分のキャリアアップを図れるのではないでしょうか。
しかも、データサイエンティストは人手不足による売り手市場が今後も続くことが予測されていますので、800〜1200万円くらいの比較的高水準の年収を狙いやすい職業だと思います。
データサイエンティストになるためにはRとPythonを学ぶ必要があるか?
必要です。
例として、解析ツールとしての「R」や機械学習のプログラミングのための「Python」は必須のツールです。
ただし、既にできあがっている関数やライブラリを「利益を出す」ための目的に応じて、流用するスキルがあれば、相当なデータ解析ができますので、C言語やVBAなどの一昔前のプログラミング言語のように、最初から順番に学習する必要がないところがポイントです。
真面目な方ほど、プログラミングのテキストを最初から読み進めてしまいがちですが、その必要はありません。
それよりも、「何を解決したいか?」「その課題を解決するとどんな利益が生まれるのか?」という視点が重要です。
見つけた課題に対して、データ分析用ツールやプログラミング言語をどのように適用させるのが効果的かを知るために、Rやpythonの学習が必須となってきます。
Pythonの学び方 とりあえず無料でお試しが◎
データ解析のスキルを実際に解決したい課題に適用できるようになるためには、いくつかのハードルを超えていく必要があります。
なぜなら、単に自分の頭で「分かった」というレベルと実務で「使える」というレベルには大きな差があるからです。
そこで、僕がおすすめなのは、まずは無料で優良な講演会やセミナーを受講して大まかな習得方法を学んだ後で、ゴリゴリと独学で進める勉強方法です。
いきなり本を買い込んで1ページめから順番に勉強し始めたりすると、挫折する可能性が高いと思います。それは学習の全体像とポイントが分からないからです。
下のTechAcademyは第13回日本e-Learning大賞 プログラミング教育特別部門賞に選ばれた教育機関で、すでに15,000名以上が参加したという実績があります。
僕が感心したのは、TechAcademyのサイトのデザインです。とてもシンプルで見やすく分かりやすい。ホームページを作る人のお手本になるようなデザインですので一見の価値があります。
TechAcademyのサイトを見て頂くと分かりますが、受講料が結構お高いです。。
ですが、
データサイエンティストという職業が自分に向いているか?
本当にお金を払う価値があるか?
なんてことを考えていたら、どんどん世の中の流れから置きざりにされます。
まずは無料体験を盾に行動あるのみ!
コメント