東京大学大学院 情報学環・学際情報学府 The University of Tokyo III / GSII

研究Research

March 3, 2017

教員インタビュー 金子知適准教授Interview with Associate Professor Tomoyuki Kaneko

ゲームを通して人工知能の未来を切り開く

金子先生は、囲碁や将棋などのゲームを通して、人工知能の研究に取り組んでいる。
2013年には、開発に携わったソフト「GPS将棋」で、プロの棋士と対局した。研究テーマや学生時代の経験、そして学生へのメッセージを伺った。

――先生の研究テーマから教えてください。
「囲碁や将棋を題材に、人工知能や機械学習の研究をしています。囲碁や将棋は、勝敗がはっきりしていることから、コンピュータの判断能力を測るのに向いています。将来、人間が人工知能に知的な判断を助けてもらうとしたら、囲碁や将棋などが弱い(賢さの劣る)システムより、強い(賢い)システムの方が望ましいはずです。さらに、人工知能が人間にとって信頼できるパートナーとなるためには、勝負だけでなく、判断の根拠を説明し、現況を要約するコミュニケーション能力も重要です。人間はアマチュアでも、局後の感想戦を行うことで互いの実力向上につなげていますが、コンピュータにはまだ難しいのが現状です。人工知能を研究していると、人間の能力の高さに気づかされることも多くあります。」

――「ゲームと人工知能」といえば、2016年3月に、囲碁プログラムAlphaGoがトップ棋士の1人であるイ・セドルに5番勝負で勝利したことが、大きく話題になりました。このニュースは金子先生から見て、どのような学術的意義があるのでしょうか?
「囲碁で人工知能が人間に勝つことは、他の2人零和ゲームであるチェスや将棋より難しいと考えられていました。コンピュータが上手にゲームをプレイするためには、局面をぱっと見ただけで形勢を判断する評価関数を作ることが鍵ですが、囲碁ではそれが難しく、別の手法で強くするしかないと考えられていたからです。ところが、AlphaGoでは様々な技術の組み合わせと計算機資源を惜しみなく投入したことにより、高精度の評価関数に相当する機能の実現に成功しています。技術的な話になりますが、ディープラーニングだけでなく、強化学習やモンテカルロ木探索にも新しい工夫があります。まだプロ棋士に勝つ見込みが薄い段階から、トップ棋士に5番勝負で勝ち越すほどになるまでには常識的には大きな壁があるはずですが、それを一気に乗り越えたことは私の想像を超えていました。
学術的意義としては、囲碁でも高性能な評価関数を作成できることが示されたこと、それから、学習さえできればよいというわけではなく依然としてモンテカルロ木探索――つまりその場その場で時間をかけて考えること――が大事なこと、さらには世界最高峰に達するには膨大の計算機資源が必要なこと、この3 点が重要だと考えています。」

――先生ご自身も、将棋ソフト「GPS将棋」を開発され、2013年4月の「電王戦」でプロの棋士に勝利されました。対局に勝利したときのお気持ちはいかがでしたか?
「プロ棋士のなかでもA級棋士との対局は貴重な機会だったので、良い棋譜を残せるように努めました。無事に1局を指し終え良い棋譜が残せるかが一番の心配でした。コンピュータ将棋は序盤に躓くとよく言われていたので、序盤のミスで負けてしまうこともありえたからです。まずはミスなく対局が進んで、ほっとしたのを覚えています。当時のコンピュータ将棋の実力を出しきれたという嬉しさは、だいぶ日数がたってから実感しました。」

――先生の学生時代について、お話を伺いたいと思います。大学院に入学する前には、どのような学生生活を送っていましたか?
「大学に入ったら好きなことをして過ごそうと思っていたのですが、実際は大学に入っても勉強することになりました。今では、入学後こそ色々なことを広く学べる良い機会だと思っています。東京大学では3年進級時に学科を選びますが、情報系の学科と迷った末に基礎科学科第二(後の広域科学科、学際科学科)に進学しました。噴火前の三宅島実習で、一部の区域をロープで区切って植生調査したのを覚えています。葉を見てどの種類か分かるように、班で手分けして、私はオオムラサキシキブ、ヤブニッケイ、スダジイをカウントしました。葉の特徴はとっくに忘れてしまいましたが、名前だけは今でもなぜか覚えていて、思い出深いです。

――大学時代には全く違うことを学んでいたんですね。なぜ今の研究領域を選ばれたのでしょうか?
「様々な領域について広く学ぶ学科に進学したわけですが、卒業研究を行う際には研究室を選ぶ必要がありました。宇宙や生態学などいくつか興味のあるテーマのうち、一番自信が持てたのが情報系でした。その中でも、卒研テーマ集のなかの「その他」の中に書いてあった「ゲームなど」というテーマに、とくに興味をひかれました。自分が子供の頃に将棋を教わってもあまり強くなれなかったので、代わりにコンピュータに学習させたらどうなるだろうという気持ちも、多少動機としてありました。」

――最後に学生へ向けて、ひと言頂ければ幸いです。
「人工知能技術の発展が社会の変化を予感させていますが、きっといつの時代でも社会は変化していて、学生のあいだも卒業してからも学び続ける必要があるのだと思います。学生ならではのメリットとして、他では開講されていないような授業を受けたり、図書館や電子ジャーナルを活用して調べものをしたりできる点があります。さらに情報学環のような学際的な組織では、多方面の先生方や学生とディスカッションすることで、自分の専門とは異なる考え方に触れる機会もあるでしょう。環境を活かして、教養と専門性の両方を深めてもらえると良いと思います。」

インタビュー・構成:吉田航(修士課程)

※ディープラーニング:脳の認知機能を模したニューラルネットワークを利用した人工知能技術。従来のソフトウェア技術が苦手だった画像、動画、音声などの処理を得意とする。(「ディープラーニング」『現代用語の基礎知識 2016年版』自由国民社)
※強化学習:ここでは、コンピュータ自身で自己対戦を繰り返すことを指す。(参考:「特集 人工知能の破壊と創造 事例編 囲碁 深層学習でプロの「直観」獲得=伊藤毅志」『週刊エコノミスト2016年05月17日号』毎日新聞出版)
※モンテカルロ法(モンテカルロ木探索):乱数を用いたシミュレーションを何度も行って、近似的な解を得る数値計算の手法。解析的なアプローチが困難な場合などに用いられる。高い精度の解を得るためには、試行回数を増やす必要がある。(「モンテカルロ法」『デジタル大辞泉』小学館)