2018年8月4日土曜日

【edx】データサイエンスのオンライン学習コースを修了 所要時間1ヶ月

データサイエンスの入門コース(MITx: 6.00.2x)を complete しました (修了しました)。 修了するのに要した時間は約1ヶ月ほどでした。 使用言語は英語です。

全体の成績はA (96%) なので、ぼちぼち良い方だと思います。 日本の大学でいえば、優です。 全体的な感想を述べます。

私が学んだこと一覧

これが 私が「MITx: 6.00.2x」の授業で学んだことです。シラバス(syllabus) から引用します。

  • 最適化問題とナップサック問題 (Optimization and the Knapsack Problem)
    • Computational models
    • Intro to optimization
    • 0/1 Knapsack Problem
    • Greedy solutions
  • 決定木と動的計画法 (Decision Trees and Dynamic Programming)
    • Decision tree solution to knapsack
    • Dynamic programming and knapsack
    • Divide and conquer
  • グラフ (Graph)
  • 確率論的思考 (Stochastic Thinking)
    • Rolling a Die
    • Random walks
  • ランダムウォーク (Random Walks)
    • Drunk walk
    • Biased random walks
    • Treacherous fields
  • 推測統計学(Inferential Statistics)
  • モンテカルロ・シミュレーション1 (Monte Carlo Simulations)
  • モンテカルロ・シミュレーション2 (Monte Carlo Simulations)
  • 実験データ1(Experimental Data Part 1)
  • 実験データ2(Experimental Data Part 2)
    • Goodness of Fit
    • Using a Model for Predictions
  • 機械学習 (Machine Learning)
    • Feature Vectors
    • Distance Metrics
    • Clustering
  • 統計の誤った推論(Statistical Fallacies)
    • Misusing Statistics
    • Garbage In Garbage Out
    • Data Enhancement

ちなみに、このコースは コンピュータサイエンス(Computer Science, CS)専攻の人に限定した授業ではないらしいです。 CS専攻でない人も教養科目として受ける授業のようです。

生物学、医学、化学など、どんな科学的な学問を研究するとしても、シミュレーションを行うだろうし、 データ分析もやるだろうから、データサイエンスは必須なのでしょう。 科学系の研究をするなら、機械学習の基礎くらいまでは必須なのかなという気がします。

演習問題や問題集を解くと、かなり鍛えられる

ちなみに、このコースの 問題集3(Problem Set 3)では、「患者の体内でのウイルスの増減」を シミュレーションしました。

time step = 150 のときに 薬(drug) を服用したら、 通常のウイルスがほぼ死滅して、薬に耐性があるウイルス(resistant virus)が増えました。

たぶん、実際に研究で使われたテーマを簡単にして、教材化したのかもしれません。 面白い問題が多かったです。

このコースの演習問題や問題集を解くと、プログラミング能力を鍛える事ができます。 たった1ヶ月の間にそこそこ上達した気がします。

テストの難易度:中間テストはふつうだが、最終テストは難しい

私の中間テストの成績は中途半端な B(88%) でした。 全体的にそれほど難しくなかったです。

でも、グラフ理論の問題が難しくて、大量に間違えました。 その結果、プログラミングの問題を全問正解したのに、中間テストの点数は9割を下回りました。

私の最終テストの成績は ぼちぼち良いA(96%) でした。 でも全体的にかなり難しかったです。

とくにプログラミングの問題が難しめな上に量が多かったです。 あの問題を全問正解できる人は、意外と少ない気がします。

私はギリギリ全問正解だったので、自信がつきました。 個人的にちょうど良い難しさでした。

「数学」と「プログラミング」は物事の本質を分析&理解するのに必要不可欠

私がこのコースを受けて感じたことは

「微分積分、線形代数、統計学、プログラミングの基礎は 物事の本質を分析して理解する上で必要不可欠といってもいい」

という事です。

これからの時代、あらゆるものがIT化、AI化されていきます。 戦略や政策を考える上で 「数学」や「プログラミング」は必要な基礎知識です。

実際に、データ分析(Data analysis)しないとしても、 大まかなイメージをつかめていた方がいいです。

細かい統計学の知識はいりませんが、 統計学の基礎(中心極限定理など)をおおざっぱに理解しておく必要があると思います。

「統計の基礎」を噛み砕いて分かりやすく説明している本があると思うので、それを読んだらいいと思います。 別にネット検索ですませてもいいです。

さもなくば、統計学やプログラミングが得意な人と政策の議論をしたら、 議論が噛み合わない可能性があります。

ITは既存のシステムを最適化 人間は創造する分野に注力

海外の映画会社はデータを分析して、マーケティングに活かしている らしいです。 ちなみに、そのような演習問題がこのデータサイエンスのコースにもありました。

大ヒットさせるつもりで大々的に映画を公開したら大赤字だった、なんて事あったら、みんなが損しますし、 およその興行収入を予測できるのはメリットです。知らんけど。

すでに存在する物を効率化・最適化する事が「データサイエンス」や「機械学習」の役割だと思います。 一方、人間は「前例のない面白い事」を考えるのに注力します。

  • 情報技術の役割=既存のシステムを最適化
  • 人間の役割=創造性

「創造的な映画を一つ挙げて」と言われたら、私はトイ・ストーリー・シリーズ (Toy Story series)を挙げます。 「オモチャが人間のように感情を持って動く」という設定のもとで描かれるストーリーが創造的だと思います。 「オモチャは現実世界では意思を持って動かないはず」という既存概念をぶち壊した映画です。

創造性を発揮する大人になるには

個性が尊重された教育を受け、創造性を発揮したい子供は、 「 インターナショナルスクール」や 「 国際バカロレア認定校」などで学んだら良いかもしれません。

しかも、大学レベルの数学、物理、プログラミングを学習することができます。 上記の学校にはそのようなコースがあります。

そして、海外留学も視野に入れましょう。 アメリカの大学は層が厚いです。 MITのような超有名大学以外にも素晴らしい大学はたくさんあります。 アメリカは連邦国家ですから。

アメリカ以外の留学先としてよく挙げられる国は、シンガポール、香港、カナダ、オーストラリア、イギリス等です。 2018年のTIMESの世界大学ランキング によると、上記の国の大学ランキングは日本よりも高いです。

海外留学できたら現地の会社に就職できる可能性が高くなります。 それに学業で超忙しいとはいえ、大学以外でいろんな体験ができるでしょう。

日本にとどまって、edx のようなオンライン学習コースを受けてもいいです。 いずれにせよ、英語が使えて、世界のどこでも活躍できる個性的な人材になるでしょう。 努力とその方法次第だと思います。

0 件のコメント:

コメントを投稿

投稿されたコメントは承認後に公開されます。