1.機械学習を学ぶ前に

機械学習について学んできたので、備忘録も兼ねてまとめていきたいと思います。機械学習ってのは要するに最適な定数を自動的に見つけてもらおうということですね。数式とは離れて、ちょっとふざけた話をしていきます。

このきゅうりのサイズはLなのかLでないのか、機械に判断してもらうには、Lサイズのきゅうりを見たときに発火するニューロンを作ることが必要になります。これは人間が猫を見たときに、「猫だ!」という脳内の回路が発火することと全く同じです。ニューラルネットワークというのは人間の脳内回路を数学的に表現し、プログラムで書き直したものであります。まだまだ人間には近づけませんが、ある分野では人間を超す精度を発揮することがあります。

Lサイズのきゅうりを見分けるにはLサイズのきゅうりを人間が用意する必要があります。これが教師データですね。ここは人間の手が必要です。Lサイズかそうでないのかという判断はあくまで人間が作った枠組みなのですから、コンピュータが勝手に判断することはできません。人間が作った枠組みをコンピュータに教える必要がありますよね。そして「この1000枚の画像は全てLサイズのきゅうりで残りの5000枚の画像はLサイズのきゅうりでないよ」と教えた後は、コンピュータが勝手にLサイズのきゅうりに共通点を探すようになります。元々は何の意味もない行列を、Lサイズのきゅうりを見ると発火する(1を返す)ように行列内の定数が自動で最適化されるようになります。これが機械学習です。

Lサイズのきゅうりを学んだコンピュータにとって、この世界はLサイズときゅうりとLサイズのきゅうりでないものとで二分されます。「目の下がだるだるのおっさん」の画像を見ても何の反応も示さないようになります(学習がうまくいけば)。目の下がだるだるのおっさんというのはLサイズのきゅうりを学んだコンピュータにとっては、「取るに足らないLサイズのきゅうりでないものの一つ」ですから、このコンピュータにとって、特に大きな意味があるわけではありません。

さて、きゅうりがLサイズという枠組みが人間が作ったものですが、ググれば多くの知見が得られますから、世界中のwebサイトをクロールすればその人間が作った枠組みについて、コンピュータが知ることができることもあります。そうすれば、人間の知識の集積であるwebサイトの集合をコンピュータが学ぶことで知的財産の結晶となるコンピュータができるかもしれません。夢のような話ですが、多分まだまだ夢です。自動運転さえできていないわけですから、人間の処理能力であったり直感というのはなかなか侮れないですね。

よく巻き起こる議論ですが「人工知能のせいで職を奪われる!」という人と「人工知能に頑張ってもらって人間は楽をしよう!」という人がよく議論をしています。前者は弱者の論理で後者は強者の論理という気がします。まあどちらも極論な気がしますが。私は楽観的に見ています。人間にしかできないこともたくさんありますから。絵画教室の先生が機械だったらなんか冷めますよね。スポーツジムのトレーナーがペッパーくんだったらやる気にならないでしょう。そこには人間の本能的な何かを感じますね。だから結構楽観的です。そんな極論は置いておいて、現実問題これからどうすればよいのかといえば、現在の話になります。現在の話をすると、深刻な人手不足の日本において、自動化というのは一つのアンサーどころか、喫緊の課題であります。ですので、どんどん推進していくべきでしょう。

つまらない雑談でした。次回からちゃんと数式を追って機械学習についてノートを書いていきたいと思います。

次回は2.単層ニューラルネットワーク