"グーグルのフェローで、システムズ・インフラストラクチャー・グループに所属するジェフ・ディーンは、神経回路網(ニューラル・ネットワーク)をつくり上げるプロジェクトに取りかかった。それは、神経回路網に“自己..."
グーグルのフェローで、システムズ・インフラストラクチャー・グループに所属するジェフ・ディーンは、神経回路網(ニューラル・ネットワーク)をつくり上げるプロジェクトに取りかかった。それは、神経回路網に“自己学習”をさせることにより、タグ付けのされていない大量の画像から、例えば顔だけを選び出させる試みである。そのアルゴリズムを構成するのは、多数のコンピューターをつなぐことで作成される膨大な数の“神経単位(ニューロン)”だ。ここでいうニューロンとは“訓練可能な要素”のことで、それを10億個も集めたわけだが、それでも人間の大脳視中枢を構成するニューロンの数からみれば比較にならないほど少ない。「個々のニューロンが観察するのは(サンプル画像群の)ごく狭い断片です」と、ディーンが説明してくれる。「個々のニューロンは画像のピクセル群をそのまま情報として取り込んで、その解釈に取り組みます」。
歯切れのよいディーンの説明がいったん止まる。ひと息ついてから、またよどみなく喋り始める。「新生児と同じ経験をさせるわけですよ。生まれたての赤ん坊は視覚から多くの刺激を受け、やがて目に映るもののパターンに着目するようになります。新生児が最もよく目にするものが何かといえば、それは、ひとつには人の顔です。赤ん坊はすぐに、これはしょっちゅう見ているもの、だからこれは重要なもの、と関連づけて考えるようになります」。
そんなディーンの言葉通りに、Googleは“赤ん坊”役のコンピューター群に、YouTube動画からランダムに選んだ1,000万点の静止画像を見せることをした。その結果判明したのは、ニューロン群のなかに、顔が映っているかどうかを顕著な選択基準にし始めたものがあることだ。「訓練用画像データに顔写真が含まれているなんて、コンピューターたちにはひと言も説明していないのにですよ」という。ディーンがノートパソコンを開いて画像をいくつか見せてくれる。眼窩が空洞になっている幽霊の顔だ。「これらの画像には、とても激しく反応してくれましたよ。問題のニューロンは、2つの目、口、鼻、そして丸っこい輪郭を、顔の要素として着目しているのです」。そのようにしていくつものチェックポイントを設定することで、神経回路網は観察したものをよりよく認識できるようになっていった。
ニューロン群がよく認識するようになったものがもうひとつある。ネコである(猫を認識できるGoogleの巨大頭脳:日本版記事)。YouTubeにはネコの映像が多数含まれているからだ。ニューロン群が拠って立つ論理を通訳すると、ネコは多くの映像に出てくる。ということは、どうやら重要であるようだ。だからネコを認識できるように、われわれは自らを最適化したほうがよさそうだ、となろうか。それは、ひと言で言えば検索だ。ディーンの言う“自己学習”を、自己検索と言い換えてもいい。つまり、機械が何かを見つけるだけでなく、見つけた何かの解釈もするのだ。要するに、アルゴリズムを自らつくり上げる検索エンジンだ。
さらにディーンは、言葉に対しても同じことができないかと考えている。つまり、言葉を多次元のヴェクトルで表現するということだ。具体的には、“イルカ”というような言葉が、百次元空間に投げ込まれることになる。「いずれは、近縁関係にある言葉同士をぐっと近づけて、無関係な言葉同士をいっそう遠ざけるような仕組みができるでしょう」。つまり、一群の言葉がほかの言葉とどれだけ近い関係にあるかということを、文脈や関連度を判断する際の手助けにできるようになるというのだ。
”
- 未来の検索は「言葉」を超える:Googleのナレッジグラフ Page5 « WIRED.jp (via yaruo)
via Tumblr http://ift.tt/1twGhF2 September 10, 2014 at 11:29PM