データサイエンスという概念が広く認知されるようになったのは2010年代以降です。以下のような経緯があります*1。
・2000年代初頭:WindowsやSaaS(Software-as-a-Service)の普及により、個人のパソコン所有が一般的になり、データのやり取りが急増
・2006年:オートエンコーダ(自己符号化器)を使用したディープラーニングが登場し、人工知能の進化が飛躍的に加速
・2008年:Googleなどで、データサイエンティストと自称する人々が登場し、そのスキルや職務内容が議論されるように
・2010年:データ転送量が大幅に増加し、それに伴い「ビッグデータ」という言葉が提唱される
「ビッグデータ」の時代になり、データの分析・解析に特化した「データサイエンティスト」という新しいポジションの重要性が増してきたともいえるでしょう。
データサイエンティストとは、「ビッグデータ」という、これまでは未知の存在だったものと向き合い、その使い手となる職業です。
データといっても、放っておけば勝手に取れるというわけではありません。また、取るだけでは何の役にも立ちません。
・どんなデータを取るべきか
・どんな手法でデータを取るべきか
・取ったデータをどう処理すべきか、加工すべきか
・得られたデータは信頼できるものかどうかの判断
というように、人の介入がなければ、データは存在するだけでは無価値なものなのです。
多くの角度から「データ」の扱いを熟知し、新しい発見をもたらしていくのがデータサイエンティストです。