MIT専門教育プログラム「データサイエンス」から学んだこと。 Data to Insights”
On 12月 15, 2021 by adminはい!マサチューセッツ工科大学、通称MITのデータサイエンスに関する授業を終えたところです。 残念ながら、私はまだ、米国マサチューセッツ州ケンブリッジにあるキャンパスを訪問していませんが、私はこのコースが非常にやりがいのあるものであると感じました。 “データサイエンス “です。 データからインサイトへ」。 このコースは、「データを使って複雑な問題を解決する」というもので、ティーザーの説明にある通りです。 世界のデータの90パーセントは過去数年間に作成されたものです。
このような授業を受けるべきかどうか迷っていますか? そこで、私なりの考察をお話ししましょう。
私はコンピュータサイエンスの学位を取得し、さらにデジタルメディアの科学修士号も取得しています。 私の教育期間中は、AI は今ほど人気のあるテーマではありませんでした。 しかし、2005年の卒業論文では、AI に焦点を当てました。 残念ながら、私は開発者として短期間しか働くことができず、AIの中の別の分野で働くことはできませんでした。 10年程前から、ITコンサルティングのテーマを中心に、ITショアリング、ソーシング、ベンダーの統合などに取り組んでいます。
このクラスには10個のビデオと1から7のケーススタディーが含まれます(主に複数選択式の評価に終止する)。
モジュールを成功裏に完了するために、(助)教授は、アニメーションやグラフで強化されたオンラインコースを学生に提供します。 参加者は、オンラインフォーラムで公開トピックや質問について議論することができます。 アルゴリズムやコンセプトは、常に産業界や実生活の例、例えばNetflixやFacebookで説明されます。
トピック「データサイエンス」は、5つのモジュールに分かれています。
- Making sense of unstructured Data
- Regression and prediction
- Classification, hypothesis testing and deep learning
- Recommendation systems
- Networking and graphical models
第1モジュールではデータのパターンや潜伏構造を発見する方法を学習することができます。 例えば、ラップトップ上のすべてのテキストファイルを特定のテーマに基づいて構造化する方法を学習することができます。
回帰と予測では、予測や因果関係の推測を目的とした二変量および多変量回帰に焦点を当て、次にロジスティック回帰と非線形回帰を学びます。 高次元データを用いた予測問題の解決方法、すなわちlasso、ridge、回帰木、 boosted trees、random forestsのほか、その他を学びます。
第3モジュールの分類、仮説検定、深層学習は、分類、仮説検定とその応用(統計異常の検出、詐欺、スパム、その他の悪質行為の検出など)の統計方法から始まります。 例えば、メールがスパムかそうでないかに分類されるようなバイナリ分類です。 ニューラルネット、パーセプトロン(2値分類器の教師付き学習のアルゴリズム)、深層学習とその限界について紹介します。
Module 4 推薦システムでは、膨大なデータから関連情報を発見する方法について学習します。 Netflixがどのように新しい映画をユーザーに推奨しているか、Amazon、Facebook、Spotifyがどのようにユーザーに推奨しているかを学びます。
最後のモジュールであるネットワーキングとグラフィカルモデルでは、ネットワークの挙動を理解することができます。 例えば、ソーシャルネットワークで情報やアイデアがどのように広がっていくのか、それはマーケティング的な意味だけでなく、例えば犯罪の検知など他の目的にどのように利用できるのか、などです。
私はすでにPrüfungsangst(試験への不安)のにおいがしていましたが、私は仮想教室にいただけでした!
私はこのプログラムが本当に好きでした。なぜなら、テクノロジーの未知の可能性への扉を開き、絶えず変化し、次の年も劇的に我々の世界を変え続けるであろうものであったからです。 講師は最高レベルで教えてくれますし、コースに参加した私たち全員を代表して、正直言って、何か新しいことを学んだと言えます。 彼は、他の人がニュースの見出しを読むように数式を読むのです! 尊敬の念を抱かないわけがない。 このビデオを何度も見ているうちに、内容が何となく分かってきた。 インターネット、特にYouTubeの数学の動画がとても役に立ちました。 そこがまさに違いましたね。
Machines are climbing up the ladder and take over mental labor.
一度この厳しい講義を乗り越えれば、他の講義は全く問題ない。 特にディープラーニングについては、目からウロコで、2度見してしまいました。 ディープラーニングでは、開発者は、学習方法や問題解決方法をシステムに教えているだけです。 例えば、システムは動物の画像と、設定されたテストにおける動物の名前を読み取っています。 ですから、画像上で犬を検出する方法を自ら学習しているのです。 純粋に画像だけで、その犬がどういう特徴を持っているかを学習していくシステムです。 このようなアルゴリズムによって、これまで人間だけが行っていた仕事の新しい分類を機械が担うことができるようになりました。 例えば、医療画像を解釈してがんを発見する場合、これまではレントゲン写真の代わりに犬の画像が使われてきたに過ぎません。 ティーチングセットには、がんが発見されたかどうかという情報も含まれています。 レントゲンの読み方を学習した上で、医師が画像の解析に費やす時間を短縮することができるのです。
実際に体験してもらうために、各モジュールの後にケーススタディが含まれています。 いくつかの研究では、Pythonや’R’の開発者スキルが必要です。 プログラム言語に精通していない場合、ケーススタディのドキュメントはコードフラグメントでサポートされています。 例えば、外部ファイルから読み込む方法や、データを可視化するためのコードが示されています。 実践的な実戦の中でスキルを身につけることができます。 例えば、Netflixのレコメンデーションシステムを参考に、自分なりの映画レコメンデーションシステムを構築します。 また、自閉症の原因となりうる新しい候補遺伝子を特定するために、ネットワーク理論のアイデアを使用するケーススタディもあります。 終始、問題を直接実装して、実際のデータで自分なりの解を開発します。
一方では、数学とプログラミングを深く掘り下げ、6週間という限られた時間枠で行うため、非常にチャレンジングなコースでした。
しかし、一方で、コース教材に数ヶ月しかアクセスできないこと、特にビデオに関しては、これでは不十分であることが欠点です。 また、動画はダウンロードできず、テキストファイルのみなので、使い勝手が悪い。 2017年2月から再び講座がスタートします。 デジタルトランスフォーメーションに注力するコンサルタントにとっては、間違いなく必見です。 どうぞお楽しみに
データサイエンスをもっと掘り下げたい方:
機械学習のビジュアル入門オンライン:
● http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
講座と同様のテーマを網羅した良書です。
●Data Science for Business by Foster Provost, Tom Fawcett
●Foundations of Machine Learning by Mehryar Mohri and Afshin Rostamizadeh
MITコースへのリンク:
●https://mitprofessionalx.mit.edu/courses/
著者紹介:。 Florian Hoeppner は、北米の金融サービスにおける新しい IT のテクノロジー アドバイザーとして働いています。 彼の焦点は、エンタープライズ アジャイル、DevOps、SRE、およびソーシングとシャアリングの戦略です。 現在、Florianはニューヨークで夢のような生活を送っています。
コメントを残す