人工知能(AI)を支える流行りの技術「機械学習」って何? 1/2
こんにちは、たもです。
近年、人工知能(AI)や機械学習、Deep Learningという言葉がよく聞かれます。
例えば、
- 中国トップの囲碁棋士に勝った、DeepMindの人工知能*1
- アメリカで一部サービスを展開した、Google系列会社の完全無人タクシー*2
- サーブやスマッシュに対応した、オムロンのAI搭載卓球ロボット*3
などのニュースで、聞かれます。
自身も、本職に役立つかと思い機械学習を勉強してました。
今回は、自身の理解確認も兼ねて、機械学習とは何かを紹介できればと。(今さら感はありますが。)
そもそも人工知能とは
そもそも人工知能(AI)とは何なのか。
実は人によって言うことが定義が変わります。一例として、東京大学の松尾豊先生の言葉を借りると
人工的につくられた人間のような知能、ないしはそれをつくる技術
出典:『人工知能学会誌』より
とのこと。
わかったようなわからないような、ちょっとフワフワした表現ですね。
とはいえ、人工知能というのは色んな概念や技術を内包しているため、フワッとした表現になってしまうのもある程度しょうがない面はあります。
では、人工知能(AI)にはどういった類のものがあるのか?
AIはこれまでに3回ブームが来てますが、それぞれ異なった特徴を持つものが主流となっておりました。3回のブームはそれぞれ
- 第1次AIブーム:推論と探索の時代(1950~1960年代)
- 第2次AIブーム:知識の時代(1980年代)
- 第3次AIブーム:機械学習と特徴表現学習の時代(2010年~)
と呼ばれてたりします。
それぞれのブームにおけるAIの大まかな特徴は、
- 第1次ブームのAI:
人間が設計したアルゴリズムやルールに沿って、正解を推論したり探索する。
例)迷路の正解ルート探索 - 第2次ブームのAI:
人間が大量の知識やルールをAIに詰め込み、AIはその知識に沿って認識や判断、行動する。
例)血液検査の結果から感染した細菌を特定し、抗生物質を処方するシステム(MYCIN) - 第3次ブームのAI:
大量のデータから、AI自身が入力データと出力データの関係性を学習し、入力データから出力データを予測する
例)画像認識、機械翻訳
となります。
ざっくり言えば、第1,2次ブームのAIは、人間が設計したルールで動き、第3次ブームのAIは大量のデータを与えてあげれば自己学習すると言えます。
なお、機械学習は、主に第3次AIブームで主流となった技術です。
機械学習とは
先ほども言ったように、機械学習はAIを作る技術の一つです。
機械学習は、大量のデータから入力/出力データの関係性を学習し、入力データから結果を予想する技術です。
このままだとちょっとわかりにくいので、少し例を出してみます。
例えば、与えられた画像から、それが猫の画像か、犬の画像かを当てる人工知能(AI)を作るとしましょう。
この場合、画像データ(入力)と、それが何の画像かを表す「ラベル」(出力)をセットでAIに与えます。これにより、AIは「こういう画像だったら、猫の画像」「こんな感じの画像だったら、犬の画像」といったことを学習していきます。
専門的には、これを教師あり学習と言います。「正解」のラベルを学習に使うから「教師あり」、というわけですね。
さて、学習したAIに、今度はラベルなしで猫の画像をAIに与えてみましょう。学習がうまくいっていれば、猫の画像データを見たAIが、「この画像のラベルは猫だ!」と言ってくれます。
これを推論と呼びます。画像データからラベルを「推論」する、というわけです。
※ここで言う推論は、第1次AIブームの「推論」とは別モノになりますのでご注意を。
こんな感じで、入力データと出力データの関係性をAIに学習させ、入力データを与えたら妥当な出力データを推論するAIを作るのが、機械学習です。
※機械学習の手法は色々ありますが、今回は比較的ポピュラーな「教師あり学習」について説明しました。
少し長くなったので、今日はこの辺まで。
続きは7/8にて。それでは~。