목록전체 글 (139)
Neuroscience Study

앞에서 소개한 강화 학습 모델은 이 세상이 어떻게 작동하는지에 대한 지식이 전혀 없다. 단순히 가능한 모든 행동을 시도하고 평균적으로 어떤 행동이 최상의 결과를 내는지를 학습하는 모델이다. 연구진은 이를 다소 혼란스러운 표현이지만 '모델 프리' 강화 학습이라고 부른다. 학습자에게 세상이 작동하는 방식에 대한 모델이 주어지지 않았기 때문이다. 슬롯머신과 같은 단순한 상황에서는 문제될 것이 없다. 하지만 실제 세상에서는 부적합한 모델이다. 내가 샌프란시스코에 있는 우리 집에서 스탠퍼드 캠퍼스까지 운전을 해서 이동한다고 가정해보자. 남쪽으로 약 65킬로미터를 달려 팔로알토에 가야 한다. 이 경로에는 스무 개가 넘는 교차로와 스무 개가 넘는 고속도로 출구가 있다. 지도가 없다면 캠퍼스까지 가기 위해 교차로와 고..
샌프란시스코에서는 서너 명의 엔지니어가 차 위에 센서를 단 소형차를 운전하며 누비는 모습은 매우 흔한 광경이다. 괴짜 파티 차량같이 보이지만 사실 실리콘밸리의 수많은 기업에서 개발 중인 자율주행 차량의 시제품이다. 제대로 된 자율주행 차량을 만드는 데는 인간 지능의 다양한 면을 컴퓨터로 신속하고도 효율적으로 구현해야 하기에 난관이 무척 많다. 1950년대부터 시작된 인공지능을 향한 탐구는 수십 년간 의학적 진단이나 체스 등 까다로운 업무에서 인간처럼 추론하는 시스템을 개발하는 데 주로 초점이 맞춰져 있었다. 이러한 접근법은 인간 차원의 문제를 단호하고도 유연하게 해결하려는 데 발걸음조차 떼지 못하고 암흑기를 맞았다. 하지만 21세기에 들어서 인공지능을 향한 다른 접근법이 인간 수준의 지능에 도달하기 위해..

가장 달갑지 않은 흔한 습관 중 하나는 손톱 물어뜯기다. 아동의 절반가량과 청년층의 20퍼센트 정도가 이 행동을 보인다. 나도 아내가 손톱 밑에 어떤 박테리아가 있는지 지적하기 전까지는 오랜 세월 손톱을 물어뜯는 버릇이 있었다(혐오스러운 이야기를 굳이 자세히 들려주지는 않겠다). 다른 수많은 운동 습관과 마찬가지로 손톱 물어뜯기의 특징은 실제로 그것을 하고 있다는 사실을 인지하지 못할 때가 많다는 것이다. 그 이유는 시간이 흐름에 따라 두뇌에 습관이 형성되는 방식에서 찾을 수 있다. 습관이 형성되는 과정을 이해하기 위해서는 우선 기저핵의 구조를 깊이 파헤칠 필요가 있다. 제2장에서 선조체는 피질선조체 고리로 알려진 회로로 대뇌피질과 연결되어 있다고 한 것을 기억할 것이다. 습관의 형성을 이해하는 데 이 ..