알파고 vs 이세돌 3국 예상

알파고의 알고리즘을 네이처 논문을 통해서 분석해 보면, 선택가능 착수를 정책망(policy network) 연산을 통해서 5개를 선택하고 이를 MCTS의 tree 확장에 이용한다.

이때, 정확도는 논문상으로는 최대 60%(인간처럼 두는 확률)이다. 그리고, MCTS 최대 depth를 40으로 설정한 파라메터를 확인할 수 있다.

따라서, 시간만 주어진다면 알파고는 최대 40 depth 까지 tree를 생성한다.

만일, 그 안에 tree 의 리프 노트의 승패가 정해진다면.. 아니 가치망의 값이 상당한 승률(67% 이상)이 나온다면, tree 확장을 더이상 하지 않고 마무리 한다.

따라서, 바둑 경기의 초반에는 사람과 비슷하게 두긴 하지만 40수를 예상하더라도 승률의 정확도는 매우 떨어진다.

이세돌 9단이 이기려면 초반에 싸움을 벌려서 MCTS의 정확도가 떨어지는 상황에서 큰 차이를 내야 한다.

승기를 잡지 못하고 중반으로 넘어가면 알파고의 승률 정확도가 점점 높아지기 때문에 이기기가 어렵다고 본다.

이런 알파고의 성향은 이세돌 9단도 이미 파악했을 것으로 본다. 초반 격렬한 싸움이 벌어지고 게임의 승패가 날 것으로 본다.

그리고, 초반에는 이세돌 9단의 경우 속기로 두는 것이 유리해 보인다. 알파고의 MCTS 생성 속도가 상당히 빠르게 보이기 때문에 이9단의 장고는 알파고에게 엄청난 이득이 된다.

3국이 기다려진다.

‪#AlphaGo‬ ‪#이세돌‬

Share this post