深層学習の基礎(Nvidiaビデオより)
Nvidiaが色々出しているビデオ
最近、Nvidiaが色々な講演・イベントからのビデオをたくさん、ウェブ上公開していることを発見。今日は、本年3月のGPU Technology Conferenceからの、深層学習(Deep Learning)のごく簡潔な紹介、といったビデオを見てみました。
もともともビデオは1時間近くあるのだけど、YouTubeで短縮版(20分強)も見られます。私のような文系初心者にもわかりやすい内容です(オリジナルは後半ちょっと、Nvidiaの宣伝っぽくなるため、見るなら前半だけでもいいかも)
以下、自分のお勉強を兼ねての、前半部分の簡単なまとめです。
Deep Learningの定義
まずDeep Learningの定義、AIのなかに機械学習(Machine Learning)があり、そのまた中にDeep Learningがある。AIそのものは1950年代からありましたが、Deep Learningが急速に発達したのは2010年代に入ってから。下の図のようになります。
どのような分野で使えるか
Deep Learningは色々な分野に応用が利く。例えば
インターネット・サービス
医療
メディア・エンタメ
セキュリティー
自動運転車、などなど
身近にすぐわかるところではネット・サービスの中の、例えばFacebookで人の顔をかなり正確に判別するとか、このところ格段に正確になってきた音声認識でに通訳機能が加わったSkype Translatorがあり、後者は今、40カ国語の通訳が可能。
なぜ今、急速に発展したのか
ここ数年になって機械学習、特にDeep Learningが急速に発展したのかというと原因はざっと3つある
Bid Dataの発展
GPUなどのコンピュータ計算機能の高速化
アルゴリズムの発達
2番目にGPUが出てくるところがちょっと手前味噌っぽいですが(笑)、まあ、この3つが一挙に出そろったところで急激に発展した、というのは正しいようです。AIというと新しいアルゴリズムに目が行くことが多いけど、「法則」を機械が見つけるための大量のデータがあり、そのデータを高速で処理する半導体の能力があって初めて、と言うことでしょう。
既存のプログラミングとの違い
これまでの一般のプログラミングでは何かを機械にやらせるのに、専門家のプログラマーがいちいち、コードを書いていた。その為、膨大なコーディングが必要、時間もかかり、しかしその結果としてできたプログラムはその特定の作業に使えるだけで、他への応用はしにくかった。
Deep Learningではプログラムに極めで大量のデータを流し込み、機械に、どうやってタスクを遂行するかを「学習」させる。このやり方だとデータをすこし変えただけで似たような問題の解決に応用できる。
ゼロから始めるな
今回のスピーチでも、先日見たMIT EmTechのAndrew Ng先生のスピーチでも強調していて印象に残ったのが、機械学習・深層学習の基本のツールは既に、オープンソースで提供されている物が多数あるので、それらをうまく取り入れ、決してゼロから自社で作るな、と言うことです。
例えばよく出てくる、画像認識・分類技術(この画像は犬か、猫か?など)では、
カリフォルニア大学バークレー校(UC Berkeley)のModelZoo
AI Gymnasium
等がある。これらをうまく利用して下さい、とのことのようです。
この後も続いているのですが何せ1時間のプレゼンなので全部書くときりが無いです。見てみたい方は、リンクはこちらです。
(文中画像出典:Nvidia)
ご意見・ご感想はchako (at) candoadvisors.com までお寄せ下さい。すぐにお返事いたします。
Comentarios