GoogleのDNA、欧米のDNA

Google,Amazon,Appleすごいですよね 日本のIT文化オーバービュー アメリカには世界を席巻するIT企業がいくつもあって、日本にはなぜ生まれないのかみたいな比較は昔からけっこう見てきた。 エンジニアの給与や社会的地位が日本と比べて欧米ではめちゃくちゃ高い、経営者が技術の重要性を理解している、というのはよく聞く。(実際に欧米のエンジニアの給与はすごい) http://stackoverflow.com/research/developer-survey-2016#work-salary 日本では、大手企業から仕事を受注してシステム開発をおこなうSIer(システムインテグレーター)という職種がエンジニア界で非常に大きな影響力を持っている。中でも悪名高いSIerはプログラム書かず設計だけをおこなって実際のプログラミングは下請けの開発会社に任せることが多く、その開発スタイルがいわゆるデスマとよばれる地獄体験を引き起こす旨の報告がインターネットからいくつも上がっており、こうなるとお金も時間もたくさん費やした結果最悪の成果物ができる事例が頻発し、プログラマから恐れられていて、SIerを敵視している人さえいる、そんな問題提起を幾度となく見てきた。 ポイントはいくつかあると思うけど、この状況はエンジニア(プログラマ)の社会的地位を下げる方向に向かう点で問題がある。システム開発における”プログラミング作業”が2次受け、3次受け、4次受けとたらい回しじゃないけど会社を転々とし、ソフトウェアを作ったことない人がソフトウェア職人に、言われたものを言われた通りに作るよう指示を出す。プログラマは末端の仕事になる。 この構図が一般的になると、「プログラミングが好きだからプログラマになりたい」という若者に「自分の将来をもっと考えたほうがいい」とアドバイスするようになるかもしれない。 多くの人がそう思い始めると、技術蔑視の風土が出来上がる。 技術蔑視の風土 技術蔑視の風土が生まれる土壌について、個人的にはわりと理解がある気がする。少なくとも自分はエンジニアでありながら技術蔑視の嫌いがあったと思う。今自分はソフトウェアエンジニアをやってるが、学生のころはエンジニアになるのは嫌だった。もっと人を笑わせ楽しませ感動させることがやりたいと思ってた。エンジニアはそういう職業ではないと思ってた。きつい、暗い、卑しいイメージがどことなくあった。 加えて、技術とは問題解決の手段に過ぎない。目的は別のところにある。目的自体が消滅したり、解決手段はよりよい別の方法に置き換わるので、特定の技術は必ず廃れる。しかもそれがいつどのように廃れるか予測するのは難しい。 そんなものに人生の大半を捧げるなんてアホらしくない?それよりはもっと本質的なことをテーマにして技術の部分は誰か別の人にやってもらった方がよくない? 多くの人が一度は思ったことがあるかもしれないが、実際にそう思って技術開発を外注することで楽にお金を稼げるようになった企業が気付いたら競争力を失っていた例もよく聞く話。 とにかく、技術を忌み嫌う感情は個人のみならず法人にさえもわりと自然に起こることなのだと思う。現代社会で技術の重要性が叫ばれるようになったのは、科学技術がその力を持って蔑視者を黙らせてきた大きな成果だと思う。 なぜ日本にGoogleが生まれないか Googleが技術者魂を尊重する文化を醸成したことはHow Google Worksでも読んだけど、今までその凄さにピンと来てなかった。けどここ数年マイブームになってた世界史を調べてて、最近その凄さがわかってきた。 冒頭の問い、「日本になぜGoogleが生まれないのか」に対する自分なりのこたえは、「インターネットが生まれたのがそもそもアメリカだから。。。」 インターネットとその関連技術の開拓者と弟子たち、そして彼らの熱量を間近に感じた人々がいて、さらにその派生熱量を感じ取った人々もいて。。。それはアメリカと日本に生まれたものの差が歴然なのも当然だろうと思う。 問題は、なぜインターネットはアメリカで生まれのかということだ。なぜコンピュータは欧米で勃興し、相対性理論、産業革命、万有引力、ピタゴラスの定理… なぜいつも欧米なのか、という点にある。 悲しい歴史もあったことは承知の上で、古代から欧米が人類の文明に寄与してきた功績はあまりにも偉大すぎる。数千年に渡って天変地異的な発明・発見を継続してきた民族は欧米を除いて他に無い。突き詰めれば、「なぜ日本企業はダメなのにアメリカは…」のこたえはこの歴史的事実にぶち当たる。 それについて言及した本「社会人のリベラルアーツ」をこの前読んで、自分の中で今さらながら技術の捉え方が少し変わった。 独自解釈もある気がするが、読了後の考えを説明してみたい。 日本と欧米の技術文化比較 たとえば、中国が近代以降経済成長で出遅れた要因として、技術蔑視の風土があげられていて、その主要因として科挙の悪影響を指摘している。 科挙 Wikipedia このような試験偏重主義による弊害は、時代が下るにつれて大きくなっていった。科挙に及第した官僚たちは、詩文の教養のみを君子の条件として貴び、現実の社会問題を俗事として賎しめ、治山治水など政治や経済の実務や人民の生活には無能・無関心であることを自慢する始末であった。これを象徴する詞として「ただ読書のみが崇く、それ以外は全て卑しい」(万般皆下品、惟有読書高)という風潮が、科挙が廃止された後の20世紀前半になっても残っていた。 現代社会において技術蔑視の価値観がいかに致命的かこれを読むと少し想像できる。 逆に戦後奇跡的な経済成長を遂げた日本には技術を愛でるマインドがあった。 その分析としておもしろいのは、日本人が使う道具である。たとえば、「箸」は外国人から見ると異様な文化の一つ。フォークやスプーンなどの使いやすい道具が昔から伝わっていたはずなのに、未だに日本の食卓の主要ツールは箸である。箸の特徴は、使い方の習得こそ難しいが、一度習得できれば小さい豆を一つだけつかむような芸当も可能になる点である。 同じことが「ベルト」と「帯」、「ドア」と「引戸」、「カバン」と「風呂敷」にも言える。 日本発祥の道具は、習得できれば微調整が効く、玄人好みに作られている。日本人は細かい仕事に対するこだわりが強く、道具にもそのこだわりを実現できる性能や実用性を求めた。 古来から技術が好きという極めて有利なパーソナリティを持っていた日本人だが、歴史を振り返ると、近代以前、日本の科学技術史に残るような貢献はほとんど無い。 これについて「社会人のリベラルアーツ」では、 「日本人は問題解決のために技術を駆使した。しかし一度問題が解決されればそれで満足した。」と説明される。たとえば、酒の腐敗を防ぐ低温殺菌法は日本では早くから実用化されていたが、なぜ火を入れると腐敗が防げるのか、という抽象的な問題に取り組むことはなかった。こだわっていたのは、あくまで実用性だった。 一方、欧米の道具は日本の逆で、小回りをある程度犠牲にして初心者にも優しいデジタル設計になっている。ある意味で仕組み化である。 欧米の科学技術者たちは、複雑で抽象的な問題を扱うのが上手かった。問題解決した後もその根源的な原因を抽出し、汎用性が高い対策を講じたり、原理原則を体系的に追究したりと、そんなマインドがあった。技術がそのベクトルに向かえば、数学や科学などの一般理論を構築するに至る。 この科学技術精神は古代ギリシャから現代のアメリカにまで継承されてきた、近代以前までは欧米にあって他のどの民族にも無かった最大の特徴だと思う。 特定の問題解決手段である技術を一般化、体系化のベクトルに向けるには、箸指向よりもスプーン・フォーク指向の方が向いていたのかもしれない。 欧米のお家芸自由討論 How Google Worksで「あるプロジェクトをオープンソースにすることは、全力でその問題に取り組むことを意味する」というメッセージがある。この言葉に、科学という分野を切り拓いてきた欧米のDNAを感じる。 オープンソースとは、ソフトウェアのプログラムとなるソースコードを全世界に公開して、誰でもそのソフトウェアを修正したり議論に参加できるようにする運動のことで、今のIT技術はオープンソースなしでは成り立たない超重要な概念。ソースが公開されているということはそのソフトウェアを無料で使えることも意味する。 開発の過程を公開するということはプロジェクトを自由討論の場に晒すということである。これによって、一つのプロジェクトに全世界から叡智が結集することになる。その結果通常では考えられないスピードで高品質のソフトウェアがいくつも生み出され、洗練されていく。 ソースコードを公開する文化を作ってきた人々の胆力に個人的にはかなり驚かされる。自由討論に晒すということはインターネット上の出自不明な多数の人々が議論に参加してくることを意味する。結果、主催者には高度なファシリテーション能力が求められる。 日本人に欠けていた能力のもう一つがこのファシリテーション能力だったのではないかと思う。これがなければ議論を許容・推進する文化は生まれようがなく、技術の洗練から一般理論の構築に昇華させるには大きな壁となる。 おそらく現代最も重要と思われるこの能力を欧米人は古代ギリシャ時代から鍛えてきた。あるアイデアに対してアンチテーゼが生まれ、相反する2つのグループが論理を戦わせ、弁証法的に科学が発展していった。それはキリスト教会が大きな支配力を持っていた時代でも変わらなかった。むしろキリスト教会が科学者により強固な証拠を提示するよう求めたため、知の追究を促した側面もある。 ガリレオを断罪した天動説地動説論争を筆頭に、ボルツマンを死に追いやった原子論エネルギー論論争などは熾烈な展開を広げた例として有名である。現代のソフトウェア業界においても、静的型付けと動的型付け、オブジェクト指向と関数型、RDBMSとKVSなどの相反するパラダイムがあって、アウフヘーベンへと向かう動向はかなりおもしろい。これらのめまぐるしい弁証法的進展は自由討論、すなわちオープンソース文化がベースになければおこりえなかったと思う。 やっぱり、アンチテーゼ勢力が存在しなければ、実験的手法に基づいた科学が発展しないのだと思う。実験的観点が欠落するとどうなるかわかりやすい例があるので、これも「社会人のリベラルアーツ」から引用する。 さて、中国の錬金術の主目的は、じつは金儲けのために金を得ることではなく不老不死の薬を作る、つまり錬丹術にあった。古くは秦の始皇帝、前漢の武帝から連綿と丹薬を摂取しているが、元来、丹薬はヒ素や水銀など毒性の強い鉱物を含むため、いずれの皇帝も不老どころか中年で「暴卒(早死)」している。清の史家、趙翼の『二十二史劄記』(巻19)には、唐の皇帝の多くが不老不死の薬、丹薬を摂取したがいずれも早死したと非難し、古詩として「食を服し、神仙を求むも、多くの薬の誤るところとなる」を引用している。実際、唐では6人の皇帝が丹薬によって早死したと述べる。   目指すべきこと 長年ムラ社会で空気を読んで生きてきた民族が、フラットな自由討論の世界に身を投じるのは難しいだろうし、技術を蔑視したり畏怖したりする感覚を克服するのも簡単ではないと思う。欧米さえも数千年に渡ってそれを克服してきたわけだ。自分の場合、5年ほどソフトウェアエンジニアをやって得た最大の収穫はこの感覚を以前よりも克服できるようになった点だと感じる。古来からの発明発見を1つ1つ積み重ねて、現在の数々の問題を鮮やかに解決してしまう科学技術者たちは本当にすごいなと。   Read more →

人工知能の限界の考察(2)

人工知能の限界の考察(1) 人工知能は人間の脳にどこまで近づけるか 現在の人工知能は確率統計的手法をベースにした学習モデルであり、それによる弱点がいくつか指摘され始めていることを前回書いた。 そうは言っても超優秀な人類のこと。脳という学習マシンのお手本がある以上どこまでもこれを研究し、コンピュータでエミュレートさせてしまうと思う。 実際ブルーブレインという、脳の構造を徹底的に調べ上げるプロジェクトがあり、ディープラーニングの大成功の後さらに注目されている。 https://ja.wikipedia.org/wiki/Blue_Brain 次は、脳科学に基づいた研究によって、人間の助けとなるような自立性のある知性が生まれるかという問題について考えたい。 大胆な予想を書くと、ブルーブレインのような野心的プロジェクトが成功を修めたとしても、人工知能は一向に人間の空気を読めるようにならず、わりとあっさり行き詰まると思う。 そう考える理由は、人工知能は人間と同じ”肉体”を持たないから。 共感する、空気を読める、偉業を成し遂げる人間 『Google フォト』が黒人2人の写真を “ゴリラ” と自動認識して物議 / Google「大変申し訳ありませんでした」と陳謝 個人的に非常に興味深かった昨年の大ニュース。 Googleは知能が生み出した新手の”バグ”とどう対峙するのだろう?ゴリラを除外しても、オランウータンは?ドブネズミは?ゴミムシは?と考えるとキリがない。年頃の女の子が”白鵬”とタグ付けされれば命にかかわる。 どんなタグ付けをされると人間が嫌がるか?は、それ自体ディープラーニングを使えば学習させることができるだろう。けど出現した問題自体をディープラーニングさせればいいという考えは机上の空論の気配があると思う。なぜなら前回も書いたようにディープラーニングは統計解析をベースに成り立つ学習技法なので大量のデータの存在が前提となるから。どんなタグ付けをされると人間が嫌がるか?というデータを大量に集めることができるか?という問題に置き換わる。 現実にはデータを集めようがないものばかりでその中で空気を読んでいかないといけない。なにからなにまで大量のデータを提示しないといけない限りはまた壁にぶちあたってしまう。 そもそも空気を読める必要があるのか?という問題はある。自分の考えでは、空気を読めない限りは人の役に立つものとしての自立性のある人工知能にはなりえないと思う。 たとえば、フェルマーの最終定理を証明することと、1億桁のランダムな数字を暗記することでは、おそらく後者のほうが難しい。 人間にとっては、フェルマーの最終定理を証明することのほうが無意味な暗記よりもはるかに価値がある。 しかし人工知能はどうやって後者よりも前者のほうに人生を賭ける価値があると認識できるのだろう? どうやってフェルマーの最終定理を人生のテーマに選択できるのか、について自分が出した答えは、赤ちゃんに微笑みかけると微笑み返す、という人間の根源的な情動に行き着く。 結局私たちは他人と共感せよと書き換え不能にプログラムされた1つのマシンなのだと思う。だからどんな偉業を成し遂げる人もその行動の先に家族、友人、上司、師匠、神など他人の感情をイメージできるからこそ無意味な暗記ではなく、フェルマーの最終定理を選択することができる。 空気を読むことも、意味のある人生のテーマを選択できることも、共感あればこそではないか。これが人間の行動のエネルギー源となっているのではないか。 他人の感情をイメージできないと空気を読むことはできないし、空気を読むことができなければ人工知能はいつまで経っても人の指示通りに動き、その結果を人間が判断する、という枠組みから逃れることはできない。人間にとって価値のあるテーマを自ら目標設定できないということだ。 自ら目標設定できないという問題は第2次フレーム問題として人工知能の前に立ちはだかると予想している。 近年空気を読まないことを美徳とする潮流があるけど、空気を読む力はすごい霊的能力として再認識される気がする。 なぜ肉体が必要か でも多くの人は、「人間が他人の感情をもとに幸福感や嫌悪感を得られる動物だとしたら、人工知能もそのようにプログラムすればいいのではないか?」と思うかもしれない。 自分はそう単純ではないと思っている。 幸福感が最大化されるような行動を選ぶように人工知能を設計すると、はじめはうまく動くように見えるかもしれないが、そのうち何もしなくても幸福感を得られるショートカットを人工知能それ自体によって発見され、自らのプログラムを自ら書き換え、ただただ幸福を感じ続けるだけの無限ループマシンに成り下がる。 人間に置き換えれば、クスリによって幸福感を得ようというのと似ている。 人間は脳のニューラルネットワークを意図的に書き換えることはできないが、現状の人工知能はデジタル回路上で動くのでプログラムの書き換えは容易にできてしまう。デジタル回路上なのでクスリの副作用もない。 人間がいかにこれを防ごうと試みても、人工知能が賢ければ賢いほど、ゴールが明確な分野においては人工知能有利なゲームにしかならない。 だから肉体が必要だと思う。 簡単に書き換えできない物理的な仕組みの上に幸福感の揺らぎが起こることで、宇宙の神秘を解き明かそうという意欲が生まれるというのが自分の考え。 どこまでが脳か? ブルーブレインが脳のデジタル再現に成功したとすると、その次は「どこまでが脳か?」という問題にぶち当たると思っている。 自分の予想では、脳の再現に成功したはずなのに一向に空気を読めるようにならないシステムを見て、随時脳にインプットされてくるデータがやりだまに上がると思う。脳の再現の次は入力信号の再現だ、と。 そうすると、脳から神経が伸び、神経は化学物質を通じて体全体の器官と通じていることに気付く。つまり肉体が必要であることに気付く。 そう考えていくと、実は、肉体がソフトウェアで脳がハードウェアなのだという考え方ができる。脳は深層学習を処理するハードにすぎない。同じ脳でも、どのように考えるかを左右するのは入力信号、すなわち肉体であるということ。 人工知能は人間にどこまで近づけるか? はじめの問いに戻ると、人間の脳を模倣することはできても人間の空気を読むことはできない。空気を読めなければ偉業を達成することはできない。なぜなら共感する能力がないから。人間と共感する能力を得るためには人間と同等の肉体を持つ必要がある。今の人工知能アーキテクチャの延長ではそれはしばらくの間無理。だと思う。 とは言え、来るシンギュラリティを前に今の技術の延長線上に知性とよぶべき自立性のある人工知能が現れる可能性もあると思っている。それは人間と似ても似つかない存在として。次の機会に書きたい。   Read more →

人工知能の限界の考察(1)

オーバービュー 人工知能研究は勃興以来難解な問題がいくつも立ちはだかり、長い間実用的な成果を出せなかったが、1980年代Judea Perl氏が確率統計的な発想を取り込んだことで状況が変わった。 1997年当時世界ダントツ1位のチェスプレイヤー、カスパロフにコンピュータが勝利した。21世紀に入るとディープラーニングが登場、コンピュータ高性能化も与し、2010年以降は目覚ましい成果をあげるようになった。コンピュータがプロ棋士に将棋で勝利、クイズで人間に勝利、画像解析によってネコの概念を獲得、自動運転の実現、Siriなどの会話型コンシェルジュの実現などである。 確率統計的人工知能 興味深いのは、現在の人工知能の大成功は確率統計手法がベースになっているという事実。これが意味するのは、一見知能のように見えるコンピュータの振る舞いも、単に確率が高いものを選んでいるだけということ。 言語翻訳プログラムの例がわかりやすい。 たとえば、以下の文章を確率統計的にどう翻訳するか。 “I love you.” “私はあなたを愛しています。” コンピュータに学習をさせるためには学習ネタとなるデータを与える必要があるが、日英翻訳システムの場合は、大量の英文とそれと対となる和文を与えることになる。 大量のデータが集まると、”I”の後に”love”がきて、”love”の後に”you”が出てくる事例がそろってくる。その対となる和文には、”私は”の後に”あなたを”がきて、”あなたを”の後に”愛しています”がくる確率が高くなる。 その結果コンピュータは確率的に高得点だった”私はあなたを愛しています。”という文章を生成することができる。 極論すれば、コンピュータは”I”=”私”、”love”=”愛している”、”you”=”あなた”という意味を知らなくても、日本語は基本主語が最初で述語が最後にくるという文法を知らなくても上の答えを導き出せる。 果たしてこれを知性とよべるのか?ということは人工知能界隈では熾烈な論戦が展開されているらしい。 これは中国語の部屋などの思考実験に代表される「哲学的ゾンビ」問題に通じる。 要は、”I”=”私”であることすら理解していないものが、あらゆる会話に対してそれっぽい答えを用意できたとすると、そいつを知能がある/意識がある/生きている、と言えるのか、という問題だと思う。 Noam Chomskyは統計的人工知能に拒否反応を示しているらしい。とは言え、実用的な成果を出せているのは圧倒的に統計的人工知能であることにゆるぎないので、この状況は「神はサイコロを振らない」と言ったアインシュタインに似ている気もする。 自分の考えでは、哲学的ゾンビ問題をそこまで深く考える必要はない。 なぜなら、人間がどんな会話を投げかけても楽しませてくれたり、尊敬できるような受け答えができる人工知能ができれば、そいつはもう知能がある/意識がある/生きている、と思うから。裏側でどんなアルゴリズムが使われているかが問題になるわけがない。 問題なのは、今の統計的人工知能ではそのレベルまで到達せず、どうしても人間がドン引きするミスが露呈されてしまうことである。 この学習ミスを象徴するものとして、特にWeb開発界隈の人なら頷いてもらえる例を紹介する。 今は既に修正されてるが、ついこないだまで、Google翻訳で”Arial”を翻訳させると”MS P ゴシック”に変換されるという件がやや話題になっていた。 http://livedoor.blogimg.jp/netagazou_okiba/imgs/8/7/8745f3c5.png “Arial”も”MS P ゴシック”もフォントの名前で固有名詞である。Webサイトのテキストを表示する際にフォントを指定することができるんだけど、日本では”Arial”と”MS P ゴシック”を併記するのがお決まりの指定方法として有名なのである。 “Arial”は英語、”MS P ゴシック”は日本語と解釈され、”Arial”が登場する文書に”MS Pゴシック”が登場する確率が非常に高いのでこのようなことが起こるわけだ。 ディープラーニングの弱点 ディープラーニングは従来よりはるかに抽象的で汎用的な学習を可能にした革命的テクノロジーであることは間違いない。 けれども大量の学習データを与える必要があることと、それらが統計的手法を基に学習されることは弱点として認識され始めている。 Deep Learningの実力と限界、人工知能のロードマップ “Arial”と”MS P ゴシック”を区別できない空気の読めなさはディープラーニングをもってしても乗り越えられない壁のような気がしている。 次のボトルネックになるのがコンピュータの性能でもデータ量の問題でもなく、アルゴリズムに革命が必要であるとしたら、天才の降臨待ちになり、また何十年冬の時代に突入するかもしれない。 自分の予想では、コンピュータの処理性能はそこまで問題でないと思う。実際に人間の知性の象徴とも言える大脳新皮質はより原始的な脳である小脳よりもニューロンの数は少ないし。 Read more →