티스토리 뷰
딥러닝
딥 러닝 방식의 성공 요인 4가지
- 비지도 학습방법을 이용한 전처리과정
- 컨볼루셔널 뉴럴 네트워크의 진화
- 시계열 데이터를 위한 리커런트 뉴럴 네트워크
- GPU 병렬 컴퓨팅의 등장과 학습 방법의 진보
참고
AlphaGo
The computer that mastered Go
관련자료,기사
- In a Huge Breakthrough gooles AI beats a top player at the game of Go
- [2016-001] AlphaGo의 인공지능 – 구글의 바둑인공지능 AlphaGo, 인간 챔피온을 꺾다.[2016-001] AlphaGo의 인공지능.pdf
- AlphaGo: using machine learning to master the ancient game of Go
- [2016-002] AlphaGo의 인공지능 알고리즘 분석
- 이세돌과 맞붙는 구글 바둑로봇 ‘알파고’를 계기로 살펴본 기계학습의 원리와 한계
- 딥러닝
-
컨벌루션신경망
AlphaGo에서는 입력으로 19×19 크기의 바둑판 상황이 들어가고 출력도 19×19 각 바둑판 위치의 선택 확률 분포가 나오는 13단계의 신경망을 구성하고 KGS Go Server에 있는 3천만가지 바둑판 상태를 학습
- 강화학습(Reinforcement Learning)
- 정책망(policy network) SL정책망(Supervised Learning Policy Network), RL정책망(Reinforcement Learning Policy Network)
- 몬테카를로 트리 탐색(Monte Carlo Tree Search)
- 다음 수를 찾기 위해 현 상태에서 나와 상대가 모두 동일한 정책망을 가진 것으로 가정하고 여러 번 시뮬레이션을 돌려서 가장 높은 빈도로 선택한 수를 택하는 방식이다
댓글