機械学習
第2次AIブームでは、「知識」をたくさん入れれば、それらしく振舞うことはできたが、基本的に入力した知識以上のことはできない。そして入力する知識は、より実用に耐えるもの、例外にも対応できるものを作ろうとするほど膨大になり、いつまでも書き終わらない。根本的には、記号とそれが指す意味内容が結びついておらず、コンピューターにとって「意味」を扱うことは極めて難しい。
こうした閉塞感の中、着々と力をのばしてきたのが「機械学習(Machine Learning)」という技術であり、その背景にあるのが、文字認識などのパターン認識の分野で長年蓄積されてきた基盤技術と、増加するデータの存在だった。ウェブで初めてページができたのが1990年、初期の有名なブラウザ「モザイク」ができたのが1993年、グーグルの検索エンジンができたのが1998年、顧客の購入データや医療データなどのデータマイニングの研究が盛んになり、国際的な学会ができたのが同じ1998年。特にウェブ上にあるウェブページの存在は強烈で、ウェブページのテキストを扱うことのできる自然言語処理と機械学習の研究が大きく発達した。
その結果、統計的自然言語処理(Stratistical Natural Language Processing)と呼ばれる領域が急速に進展した。これは、たとえば、翻訳を考えるときに、文法構造や意味構造を考えず、単に機械的に、訳される確率の高いものを当てはめていけばいいという考え方である。
従来の言語学で研究されてきた文法に関する知識や、文の伝えようとする意味をきちんと把握して訳すのではなく、対訳コーパスという日本語と英語が両方記載された大量のテキストのデータを使って、「英語でこういう単語の場合は日本語のこの単語に訳される場合が多い」と単純に当てはめていくのである。こうして、従来の推論や知識表現とはやや異なる分野で、既存のデータを所与のものとして、それを活用する研究として、機械学習の研究が進んでいた。グーグルは、まさにこの統計的自然言語処理の権化のような企業であり、創業から10年ほどで急成長を遂げた際の時価総額は230億ドル、そして2014年には3500億ドル(42兆円)となり、トヨタ自動車の2000億ドル(24兆円)を大きく上回る。
「学習する」とは「分ける」こと
機械学習とは、人工知能のプログラム自身が学習する仕組みである。
そもそも学習とは何か。どうなれば学習したといえるのか。学習の根幹をなすのは「分ける」という処理である。ある事象について判断する。それが何かを認識する。うまく「分ける」ことができれば、ものごとを理解することもできるし、判断して行動することもできる。「分ける」作業は、すなわち「イエスかノーで答える問題」である。
たとえば、あるものを見たときに、それが食べられるものかどうか知りたい。これは、「イエス・ノー問題」である。あるものがケーキなのか、お寿司なのか、うどんなのか知りたい。これは3つの「イエス・ノー問題」が組み合わさったものと考えることができる。ある人にお金を貸していいのか、ある案件にゴーサインを出していいのか、あるユーザーにこの広告を出していいのか、こういった「判断」は、すべて「イエス・ノー問題」に帰着する。
もともと、生物は生存のために世界を分節する。食べられるか食べられないか。敵か味方か。雄か雌か。われわれ人間より高度な知識を持っているので、非常に細かく、一見すると無意味なくらい、世界を分節している。
このように、人間にとっての「認識」や「判断」は、基本的に「イエス・ノー問題」としてとらえることができる。この「イエス・ノー問題」の精度、正解率を上げることが、学習することである。(ここで言っているのは「分類」だが、ほかにも「回帰」などのタスクもある)。
機械学習は、コンピューターが大量のデータを処理しながらこの「分け方」を自動的に習得する。いったん「分け方」を習得すれば、それを使って未知のデータを「分ける」ことができる。いったん「ネコ」を見分る方法を身につければ、次からネコの画像を見た瞬間「これはネコだ」と瞬間に見分けられるということだ。