データサイエンティストとは?仕事内容と必要なスキルを解説
2023.08.23ビジネス私たちの生活に浸透したスマートフォンの急速な普及や情報処理技術の発達から、個人や企業が蓄積して扱えるデータが増え、大規模なデータ活用が可能になりました。膨大なデータのリアルタイム処理も可能になり、データ活用の重要性は高まり続けています。
その中で、データ活用から新しい価値を提案できる人財、「データサイエンティスト」が求められています。本記事では、データサイエンティストとはどのような人財なのか、背景や今後の展望もふまえてご紹介します。
データサイエンティストとは
データサイエンスが活用される業界は幅広く、あらゆる業種や職種の方に重要な素養になりつつあります。アナログからデジタルへ移行した近現代のように、ITとは縁がないように思える業種の方もデータを活用する世界が近づいています。
昨今、職業の需要が高まるデータサイエンティストとは、そしてデータサイエンスとはそもそも一体何かを解説します。
データサイエンティスト・データサイエンスとは何か
まずデータサイエンスとは、アルゴリズムや統計など情報科学理論を活用してデータを分析、有益な知見を見いだすことを指します。そしてデータサイエンティストとは、データサイエンティスト協会によると「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」と定義されています。 一般の方には聞き慣れない言葉が並びますが、実はデータサイエンスは私たちの生活にすでに深く根づいています。
代表的な例は、ネット通販で現れるレコメンド機能です。膨大な消費者全体の情報から「商品Aを買った人は商品Bを買いやすい」といった仮想の私たちの行動が、データの中から具現化されるイメージになります。他にも自動運転のセンシングやスポーツのリアルタイムでの映像解析など、データサイエンスが持つ力を利用拡大して現在の私たちの生活は成り立っています。
誕生の背景
データサイエンスという言葉が一般に注目されたのは2010年代以降ですが、その発端は50年以上前です。統計解析を業務に活かす方は一定数存在し、リサーチャーと呼ばれてきました。
特に2000年代以降のデータ活用の手法は大きく発展し、現在では多くの分野で人財不足が懸念されています。誕生の背景を振り返ると、2000年代以降だけでも以下が挙げられます。
- Windows、SaaS(Software-as-a-Service)が普及して個人のパソコン所有が一般的に。生活にインターネットが浸透し、行き交うデータ量が増加。
- 2002年データベースの管理に関する論文を掲載する「データサイエンスジャーナル」が創刊される。
- 2006年オートエンコーダを利用したディープラーニングにより人工知能が飛躍的進化。
- 2008年Googleなどで「データサイエンティスト」を自称する人々が現れ、そのスキルや仕事内容が議論される。
- 2010年インターネット上のデータ転送量が大幅に増加したことから「ビッグデータ」という用語が提唱される。
- 2012年画像認識の精度を競う大会でディープラーニングを採用したチームが目覚ましい成果をあげて優勝。GoogleもYouTube画像からの猫の認識に成功した事を発表するなど、現在まで続く第三次人工知能ブームに発展。
他にも2004年にFacebook、2005年にYouTube、2006年にTwitterがサービス開始、2007年にはiPhoneが発売され、現在の生活に必要不可欠なものの誕生と同時にデータ量が増大しました。
扱うデータ量が急激に増加する中で、データ活用の技術が素晴らしい成果をあげているという事実が、ニーズの多様化などにより焦点がぼやけることが多くなったビジネス課題に直結する提案が欲しいという市場のニーズにつながりました。そこから生み出された概念であり職業が、データサイエンティストであるといえます。
データサイエンティストの需要
AI (Artificial Intelligence:人工知能)が特定の領域において人間を超え始めていて、さらにその先にはAI時代の到来が予想されています。根幹技術であるディープラーニングだけでなく、それを扱うデータサイエンティストに対する注目はさらに高まっています。
2012年以降はデータサイエンス学部を設立する大学が日本でも現れ、修士・博士号が取得できる大学院も増加しており、データサイエンスを学ぶ重要性や人財の価値が認められていることが分かります。これらの背景からデータサイエンティストは今後大きな需要が見込まれているといえるでしょう。
一方で、将来AIに取って代わられる可能性について論じられる向きもあります。確かにスーパーコンピュータや量子コンピュータによって得られる、計算処理に関する速度、精度が共に高い識別や予測を要する領域については、AIに代替されていくと考えられます。しかし、根本的にデータを使って社会をどう変えていくか、どこに価値を見いだすかは人間が話し合い、デザインして実行していくことになります。ただ計算資源として、パートナーとしてのAIがあるという考え方になります。 そこにデータサイエンティストの価値があり、ただの「解析屋」であってはならない理由もここにあります。現場と一体になって、データから改善を提案できて成果をあげる人財に限っては、その需要はなくなることはなく今後も増大し続けていくといえます。
データアナリストとの違い
データサイエンティストとデータアナリストとの違いについては、共通する仕事もありますが、データアナリストがデータの収集と分析を専門としているのに対して、データサイエンティストは、統計学、コンピュータサイエンスに基づいて、企業が抱える課題の解決までを目指す仕事です。データアナリストと比べて担当する領域が広い点が、両者の大きな違いです。
データサイエンティストはデータ活用の前提として、課題の洗い出しと優先順位付け、課題設定および達成目標の明確化、仮説立案を行います。以前は事業企画部門やコンサルが担う仕事でしたが、ビッグデータ活用による経営戦略が一般的になり、データサイエンティストの担当領域に加わった経緯があります。
このようにデータアナリストは主にデータの「収集」「分析」に特化しているのに対して、データサイエンティストはデータの「課題抽出」「収集と分析」「仮説構築」「アルゴリズムや予測モデルの実装」といった広い守備範囲を担うという違いがあります。
データサイエンティストの仕事内容
データサイエンティストの実際の業務は多岐にわたりますが、まとめると一般的に4つのフェーズに分かれていて、流れは以下のようになります。
データサイエンティストの仕事の流れ
- 分析企画→分析プロジェクトの立ち上げ→組み込み後の業務設計
- アプローチ設計とデータ収集→構造化データ処理/非構造化データ処理
- データ解析→データ可視化→評価
- 業務への組み込み→業務評価と改善
大量の蓄積データを分析、解析結果を「活用」することがデータサイエンティストの主な仕事内容です。ビッグデータ分析というところにフォーカスされがちですが、あくまでも現場判断に従ってビジネスへの貢献を図ることが主眼となります。
データサイエンティストに必要なスキル
1.データサイエンススキル
—基礎数学,データの理解・検証,機械学習技法 など
2.データエンジニアリングスキル
—環境構築,プログラミング,IT セキュリティ,データ加工 など
3.ビジネススキル
—論理的思考,課題の定義,活動マネジメント など
これまでのデータサイエンティストの歴史や他の職種との比較でも述べてきたように、統計解析専門職を発展させる形で、機械学習分野のスキルや実際のビジネスの現場で活動をマネジメントしていく力がデータサイエンティストに求められています。
おわりに
ここまでデータサイエンティストについて、誕生の背景、今後の需要と仕事内容、必要なスキルについてご紹介してきました。扱う業務の範囲の広さとその専門性からますます今後も活躍が期待される分野である一方で、技術の発達でスタンダードが上がるほど、その人財の強みや色が必要になる職業ともいえます。
データサイエンティストは、専門性を磨いてビジネスの現場で活躍することでさらに社会の発展に貢献できる、やりがいのある職業といえます。
i-Learningのデータサイエンティスト/データ×AIスキルに関する研修コースはこちら
👉https://www.i-learning.jp/service/it/machinelearning.html