世界最強の人間の棋士より強い囲碁の人工知能(AI)を開発した英ディープマインド社が、さらに腕前を上げたAI「アルファ碁ゼロ」を開発した。人間の棋譜は学ばず、AIどうしが対局を繰り返して上達し、独自の「定石」も見つけたという。18日の英科学誌ネイチャーで発表する。

 同社の囲碁AIはこれまで、人間の棋士による過去の膨大な棋譜を学習したうえでAIどうしが繰り返し対局する「強化学習」という手法で腕を磨いてきた。2016年には韓国の李世乭(イセドル)九段を4勝1敗で下し、注目を集めた。

 アルファ碁ゼロは、棋譜のデータに頼らず、人間の初心者以下の状態から強化学習だけで上達する。490万回の自己対局の後、李九段に勝ったAIと対局して、100戦全勝。2900万回の自己対局の後では、今年初めまでに日本の井山裕太・現七冠を含むトップ棋士らに60戦全勝したAI「アルファ碁マスター」も圧倒した。

 ログイン前の続き基本的な打ち方のパターンとされる定石の多くに自力で到達しただけでなく、これまで知られていない定石も見つけた。同社のデビッド・シルバー博士は、「(コンピューターに)『まっさら』の状態から学ばせる技術は、囲碁以外のどんな分野にでも応用できる」と話している。

 論文はウェブサイト(http://nature.com/articles/doi:10.1038/nature24270別ウインドウで開きます)で読める。(小宮山亮磨)