データサイエンスの入門コース(MITx: 6.00.2x)を complete しました (修了しました)。 修了するのに要した時間は約1ヶ月ほどでした。 使用言語は英語です。
全体の成績はA (96%) なので、ぼちぼち良い方だと思います。 日本の大学でいえば、優です。 全体的な感想を述べます。
目次
私が学んだこと一覧
これが 私が「MITx: 6.00.2x」の授業で学んだことです。シラバス(syllabus) から引用します。
- 最適化問題とナップサック問題 (Optimization and the Knapsack Problem)
- Computational models
- Intro to optimization
- 0/1 Knapsack Problem
- Greedy solutions
- 決定木と動的計画法 (Decision Trees and Dynamic Programming)
- Decision tree solution to knapsack
- Dynamic programming and knapsack
- Divide and conquer
- グラフ (Graph)
- Graph problems
- Shortest path
- Depth first search
- Breadth first search
- 確率論的思考 (Stochastic Thinking)
- Rolling a Die
- Random walks
- ランダムウォーク (Random Walks)
- Drunk walk
- Biased random walks
- Treacherous fields
- 推測統計学(Inferential Statistics)
- Probabilities
- Confidence intervals
- モンテカルロ・シミュレーション1 (Monte Carlo Simulations)
- Central Limit Theorem
- Simulations to Find Pi
- モンテカルロ・シミュレーション2 (Monte Carlo Simulations)
- Sampling
- Standard error
- 実験データ1(Experimental Data Part 1)
- Errors in Experimental Observations
- Curve Fitting
- 実験データ2(Experimental Data Part 2)
- Goodness of Fit
- Using a Model for Predictions
- 機械学習 (Machine Learning)
- Feature Vectors
- Distance Metrics
- Clustering
- 統計の誤った推論(Statistical Fallacies)
- Misusing Statistics
- Garbage In Garbage Out
- Data Enhancement
ちなみに、このコースは コンピュータサイエンス(Computer Science, CS)専攻の人に限定した授業ではないらしいです。 CS専攻でない人も教養科目として受ける授業のようです。
生物学、医学、化学など、どんな科学的な学問を研究するとしても、シミュレーションを行うだろうし、 データ分析もやるだろうから、データサイエンスは必須なのでしょう。 科学系の研究をするなら、機械学習の基礎くらいまでは必須なのかなという気がします。
演習問題や問題集を解くと、かなり鍛えられる
ちなみに、このコースの 問題集3(Problem Set 3)では、「患者の体内でのウイルスの増減」を シミュレーションしました。
time step = 150 のときに 薬(drug) を服用したら、 通常のウイルスがほぼ死滅して、薬に耐性があるウイルス(resistant virus)が増えました。
たぶん、実際に研究で使われたテーマを簡単にして、教材化したのかもしれません。 面白い問題が多かったです。
このコースの演習問題や問題集を解くと、プログラミング能力を鍛える事ができます。 たった1ヶ月の間にそこそこ上達した気がします。
テストの難易度:中間テストはふつうだが、最終テストは難しい
私の中間テストの成績は中途半端な B(88%) でした。 全体的にそれほど難しくなかったです。
でも、グラフ理論の問題が難しくて、大量に間違えました。 その結果、プログラミングの問題を全問正解したのに、中間テストの点数は9割を下回りました。
私の最終テストの成績は ぼちぼち良いA(96%) でした。 でも全体的にかなり難しかったです。
とくにプログラミングの問題が難しめな上に量が多かったです。 あの問題を全問正解できる人は、意外と少ない気がします。
私はギリギリ全問正解だったので、自信がつきました。 個人的にちょうど良い難しさでした。
「数学」と「プログラミング」は物事の本質を分析&理解するのに必要不可欠
私がこのコースを受けて感じたことは
「微分積分、線形代数、統計学、プログラミングの基礎は 物事の本質を分析して理解する上で必要不可欠といってもいい」
という事です。
これからの時代、あらゆるものがIT化、AI化されていきます。 戦略や政策を考える上で 「数学」や「プログラミング」は必要な基礎知識です。
実際に、データ分析(Data analysis)しないとしても、 大まかなイメージをつかめていた方がいいです。
細かい統計学の知識はいりませんが、 統計学の基礎(中心極限定理など)をおおざっぱに理解しておく必要があると思います。
「統計の基礎」を噛み砕いて分かりやすく説明している本があると思うので、それを読んだらいいと思います。 別にネット検索ですませてもいいです。
さもなくば、統計学やプログラミングが得意な人と政策の議論をしたら、 議論が噛み合わない可能性があります。
ITは既存のシステムを最適化 人間は創造する分野に注力
海外の映画会社はデータを分析して、マーケティングに活かしている らしいです。 ちなみに、そのような演習問題がこのデータサイエンスのコースにもありました。
大ヒットさせるつもりで大々的に映画を公開したら大赤字だった、なんて事あったら、みんなが損しますし、 およその興行収入を予測できるのはメリットです。知らんけど。
すでに存在する物を効率化・最適化する事が「データサイエンス」や「機械学習」の役割だと思います。 一方、人間は「前例のない面白い事」を考えるのに注力します。
- 情報技術の役割=既存のシステムを最適化
- 人間の役割=創造性
「創造的な映画を一つ挙げて」と言われたら、私はトイ・ストーリー・シリーズ (Toy Story series)を挙げます。 「オモチャが人間のように感情を持って動く」という設定のもとで描かれるストーリーが創造的だと思います。 「オモチャは現実世界では意思を持って動かないはず」という既存概念をぶち壊した映画です。
創造性を発揮する大人になるには
個性が尊重された教育を受け、創造性を発揮したい子供は、 「 インターナショナルスクール」や 「 国際バカロレア認定校」などで学んだら良いかもしれません。
しかも、大学レベルの数学、物理、プログラミングを学習することができます。 上記の学校にはそのようなコースがあります。
そして、海外留学も視野に入れましょう。 アメリカの大学は層が厚いです。 MITのような超有名大学以外にも素晴らしい大学はたくさんあります。 アメリカは連邦国家ですから。
アメリカ以外の留学先としてよく挙げられる国は、シンガポール、香港、カナダ、オーストラリア、イギリス等です。 2018年のTIMESの世界大学ランキング によると、上記の国の大学ランキングは日本よりも高いです。
海外留学できたら現地の会社に就職できる可能性が高くなります。 それに学業で超忙しいとはいえ、大学以外でいろんな体験ができるでしょう。
日本にとどまって、edx のようなオンライン学習コースを受けてもいいです。 いずれにせよ、英語が使えて、世界のどこでも活躍できる個性的な人材になるでしょう。 努力とその方法次第だと思います。
0 件のコメント:
コメントを投稿
投稿されたコメントは承認後に公開されます。