인간의 뇌를 모방하는 인공지능기술이 진일보했다. 체스보다 복잡하고 섬세한 바둑에서 사람을 상대로 이기는 것을 10년 뒤로 내다봤었는데, 작년 10월 유럽 바둑챔피언 Fan Hui를 5대 0으로 누르더니, 이번에는 이세돌을 이겼다.
게임 직전, 이세돌은 바둑에서 이기려면 직관력이 필요한데 컴퓨터가 그런 훈련을 받지 않았을 테니까 본인이 이길 거라고 이야기했었다. 최근 뉴욕타임스에 이 알파고라는 게임소프트웨어가 이긴 것이 무엇을 의미하는가를 놓고 벌인 토론이 게재됐다.
알파고는 일종의 다목적 알고리듬에서 시작한 기술인데, 이 알고리듬은 시행착오를 거쳐 각종 게임을 마스터하게 하는 것이었다.
시행착오를 거치면서 보상을 극대화하는 방향으로 조정해 나가게 하는 방식이다. 그러면 게임을 거듭하면서 소프트웨어가 적절한 전략을 알아내고 실수 없이 적용할 수 있게 된다.

IMD 비즈니스스쿨의 하워드 유(Howard Yu)는 이번 승리는 처음으로 기계가 사람이 하는 방식으로 배우고 생각한다는 것을 입증한 계기가 되었다고 주장한다.
예술품의 위작을 알아내거나 임상에서 진단을 하는 일에서도 사람의 능력우위가 침식당하고 있다고 경고했다. 공감이 더 중요해지고 정보로서의 지식만으로는 충분치 않은 시대가 온 만큼 가장 먼저 바꿔야 할 것은 교육 체계라고도 했다.
맥길대의 컴퓨터공학과 교수 도이나 프리컵(Doina Precup)은 알파고의 ‘기계학습’은 알파고의 승리가 게임 알고리듬의 역사에서 특별하지만, 기계학습의 지속적인 개선가능성이 입증된 정도라고 일축한다.
기계가 사람이 시행착오를 거쳐 배우는 과정을 어떻게 모방하는지 구체적으로 설명한다. 사람에게서 강화학습은 긍정적인 피드백이 보상신호로서 신경전달물질인 도파민을 내게 했을 때에 일어난다.

컴퓨터에도 강화학습을 프로그래밍할 수 있다. 알고리듬이 바라던 결과를 냈을 때 특정 숫자로 긍정적 피드백을 받게 하는 것이다.
뭔가를 제대로 할 때마다 또는 긍정적인 피드백을 받을 때마다 인공뉴런들이 심층신경망을 형성함으로써 일종의 메모리를 형성한다. 사람의 ‘경험’ 축적과 유사하다. 컴퓨터의 처리속도가 엄청나게 빨라져서 이 신경망의 형성도 매우 빨라졌다고 한다. 컴퓨터의 강화학습은 의족을 한 사람이 의족을 조절하는 장치에서나 로봇과 사람의 상호작용에 쓰이고 있는데, 알파고의 알고리듬은 게임의 영역을 넘어서 컴퓨터를 더 효과적으로 활용하게 하는 데에 도움이 될 거라고 한다.

포츈지의 편집자인 지오프 콜빈(Geoff Colvin)은 단언하기를, 복잡한 게임은 원래 컴퓨터가 월등하게 잘 하는 것이니까, 체커스에 이어 체스에서도 이겼듯이 바둑에서도 사람을 상대로 이기게 되어 있었다고 했다.
중요한 것은 그동안 인류사에서 경제적 발전을 가능하게 했던, 그리고 교실에서 배우던 논리와 지식과 분석은 기계가 많이 해낼 거라는 점이다. 앞으로 세 가지 인간지능이 중요해질 거라고 내다봤다.

타인이 생각하고 느끼는 것을 분별하는 능력으로서의 공감이 첫째요, 조직구성원간의 사회적 감수성, 그리고 조직의 어느 누구도 모두 위에 군림하지 않게 하면서 그룹효과성을 높이는 방식의 창조적 문제해결력이 둘째, 그리고 집단 내에서의 스토리텔링이 셋째다.
어떤 일을 탁월하게 수행하는 사람은 본인이 어떻게 그렇게 잘 할 수 있는지 말로 다 설명하지 못하는 상황을 두고, 철학자 칼 폴라니는 “할 줄은 아는데 말로는 다 못한다”라고 요약한 바 있다.

MIT 디지털경제연구소(MIT Initiative on Digital Economy)를 공동창립한 앤드류 맥아피(Andrew McAfee)와 에릭 브링졸슨(Erik Brynjolfsson)은 이번 알파고의 승리 의미는 바로 그 ‘폴라니의 역설’을 극복할 수 있다는 가능성을 보여주었다는 데에 있다고 주장한다. 고수들이 보여준 게임에 대한 방대한 정보를 예제로 써서 강화학습을 통해 경험을 쌓아 가능했는데, 이런 식의 기계학습을 실제에 활용할 가능성이 커졌다는 것이다.

키워드
#N
저작권자 © 덴탈뉴스 무단전재 및 재배포 금지