알파고는 바둑을 정말 이해합니까?
< P > 저는 알파고 (AlphaGo) 를 여전히 받아들일 수 없다는 말을 잘 알고 있습니다. 사람들이 바둑을 두는 것은 반드시' 바둑' 을 이해해야 하기 때문이라고 생각합니다. 하지만 알파고는 "바둑은 두 사람의 것이고, 두 사람은 마주보고, 대립하고, 제로섬, 바둑판 19*19, 바둑판은 정사각형이고, 위에는 체크무늬가 있고, 체크무늬도 정사각형이며, 흑백의 두 키가 있고, 흑점이 먼저 내려간다" 는 것을 알 수 없다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 도전명언) < P > 우선 알파고는 바둑을 이해할 수 있다고 생각합니다. < P > 컴퓨터는 바둑에 대해 이런 규정 (Tromp-Taylor 규칙 정의) 을 가지고 있는데, 바둑은 19*19 격자에서 진행된다. 두 선수는' 블랙',' 화이트' 로 번갈아 가며 바둑판의 한 격자를 검은색이나 흰색으로 염색하는 게임이다. 여기에 리프트, 순환금지 규칙, 최종 판단까지 더하면 완전한 Tromp-Taylor 규칙이다. 이런 바둑은 우리 눈에 보이는 바둑과 무슨 본질적인 차이가 있습니까? 바둑 문화를 고려하지 않는다면, 나는 확실히 차이가 없다고 말할 수 있다. < P > 그렇다면 왜 알파고가 이렇게 큰 관심을 불러일으켰는지, 인류의 마지막 진지를 지키지 못했다고 말하는 사람들도 있고, 인공지능이 인간을 대신할 것이라고 말하는 사람들도 있다. A: 바둑은 세계에서 가장 복잡한 게임 중 하나입니다. 이른바' 한 수의 부주의로 만판이 모두 졌다' 는 것은 매 단계마다 전반적인 결과를 좌우할 수 있다. 일반적으로 한 수의 바둑 결정은 두 단계로 나뉜다. 첫 번째 단계, "선택점": 경험이나 느낌으로 몇 가지 후보의 점을 제시한다. 두 번째 단계,' 판단': 이 점들을 각각 형식적으로 판단하고 비교한다. 이 두 단계는 말하기는 쉽지만, 최고의 고수의 수준을 달성해야 하며, 재능과 근면에 대한 요구는 우수한 수학자가 필요로 하는 것 못지않다. < P > 알파 바둑 (AlphaGo) 은 구글 (Google) 의 DeepMind Corporation 의 데이미스 하사비스, 데이비드 실바, 황사걸과 그들의 팀이 개발한 바둑 인공지능 프로그램이다. 주요 작동 원리는' 심도 있는 학습' 이다.
그렇다면 "심화 학습" 이란 무엇입니까? 심화 학습의 개념은 인공 신경망의 연구에서 비롯된다. 다은층을 함유한 다층감지기는 일종의 심도 있는 학습 구조이다. 심화 학습은 하위 수준 피쳐를 결합하여 보다 추상적인 상위 수준 표현 속성 범주 또는 피쳐를 형성하여 데이터의 분산 피쳐 표현을 찾습니다. 심도 학습은 기계 학습에서 데이터에 대한 표상 학습을 기초로 하는 방법이다. 관찰 (예: 이미지) 은 각 픽셀 강도 값의 벡터 또는 일련의 모서리, 특정 모양의 영역 등으로 더 추상적으로 표현될 수 있습니다. 특정 표현 방법을 사용하면 얼굴 인식이나 얼굴 표정 인식과 같은 인스턴스로부터 작업을 쉽게 배울 수 있습니다. 심화 학습의 장점은 수동 획득 기능 대신 감독되지 않은 피쳐 학습 및 계층 피쳐 추출 효율적인 알고리즘을 사용한다는 것입니다. 심도 있는 학습은 기계 학습 연구의 새로운 분야로, 인간의 뇌를 분석하고 학습하는 신경망을 구축하고 시뮬레이션하여 이미지, 사운드, 텍스트와 같은 데이터를 해석하는 데 동기를 부여한다. (윌리엄 셰익스피어, 윈프리, 독서명언) (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 과학명언) 기계 학습 방법과 마찬가지로 심도 있는 기계 학습 방법도 감독 학습과 감독되지 않은 학습의 구분이 있다. 서로 다른 학습 틀 아래 세워진 학습 모델은 매우 다르다. 예를 들어 컨볼 루션 신경망 (CNNs) 은 심도 있는 감독 학습 아래 기계 학습 모델이고 깊이 신뢰 네트워크 ( < P > 바로 이런' 심도 있는 학습' 덕분에 알파고가 심오하고 심오한 바둑을 배우게 된 것은 바로' 심도 있는 학습' 으로 인해 알파고가 바둑에 대한 무지에서 세계 최고의 바둑에 도전하게 되었기 때문이다.
그렇다면 사람들은 왜 바둑을 두는가? < P > 사람이 바둑을 둘 때, 각 바둑 단계의 결정도 비슷한 신호를 통해 가감되었다. 우리는 현재의 바둑판 상태에 대해 가치 판단, 승패 확률 판단이 있다. 바둑을 두는 것은 서로 다른 칸에 있다. 이런 선택도 경험을 통해서다. 서로 다른 칸에 대해 승패확률의 상승과 하락이 서로 다른 추산이 있다. 동시에, 우리는 또한 경험을 통해 상대방의 다음 몇 라운드의 바둑 단계를 예측할 것이다. 전문가의 경험이 많아지면 이 세 가지 측면에 대한 가치 판단 능력도 더욱 명확해진다. < P > 바둑을 처음 접했을 때 이런 것들에 대한 예측력이 없거나, 비슷한 상황을 경험할 기회가 전혀 없었기 때문이다. 모든 것이 새로운 상태이다. 차근차근 익숙해지면 더 많은 상태 기억을 보존할 수 있다. 전에 경험했던 것을 떠올릴 것이다. 그래야 다른 선택의 가치를 더 정확하게 판단할 수 있다. 아무리 프로페셔널한 사람들이라도, 그들은 일부러 생각할 필요가 없다. 이미 무의식이 되었다. (존 F. 케네디, 공부명언) 사고는 이미 상층건물과 상층부로 뛰어갔다. 언제가 잘못되었거나 어떻게 가야 할지 모르는 것은 어느 정도 개념이 부족하거나, 아직 이런 상황을 경험하지 못했기 때문에 pattern 을 인식하지 못했기 때문이다. 아파개도 비슷한 학습 방식을 통해 차근차근 자신의 판단력 정확도를 건설한다. 신경 네트워크의 가중치는 인간이 배운 "규칙" 에 해당합니다. 그의 규칙 수준, 마지막 선택도 이유, 경험, 마찬가지로' 이해' 이다. 인간의 이해와 크게 다르지 않다.