2-08 학습을 통해 모델링하기 어려운 상황도 추정해 낸다.
군대에서 사격을 하면 일단 가운데를 조준해서 몇 발을 쏴 본다. 그런 다음 결과가 한쪽으로 쏠려 있으면, 애초의 총과 나의 조합으로 틀어져 있는 성향을 보완해 주기 위해 쏠린 결과의 반대 방향으로 오조준을 하게 한다. 실패를 통해 더 좋은 결과를 얻기 위해 모델 자체를 수정하는 '학습'하는 것이다.
퍼지를 포함한 기존의 제어 방식이 물리 상황을 수리적으로 모델링하고 그 오차를 제어에 반영해서 조정한다면, 인공지능을 이용한 신경망 제어에서는 학습을 통해 기계 스스로 규칙을 만들고 발전시키기 때문에 규칙이나 모델을 설계할 필요가 없다. 마치 사람의 뇌가 오감을 통해 자극을 받아 뉴런에 축적하고 시냅스를 통해 이웃 뉴런에 전달하듯이 인공지능망이 입력된 신호와 출력값의 비선형적인 관계를 학습을 통해 추정한다.
인공신경망은 입력층(input layer)과 은닉층(hidden layer) 그리고 출력층(output layer)으로 구성된다. 은닉층은 필요에 따라 여러 층을 쌓아줄 수 있는데 각 층마다 여러 개의 노드(뉴런)들로 구성되어 있고, 서로 연결되어 있다. 각 연결마다 그 강도를 가중치에 따라 결정해 주는 데 한 노드와 또 다른 노드 사이의 가중치가 크다면 서로 강하게 연결되어 있는 것이고, 작으면 약하게 연결되어 있는 것이다.
인공지능망에서의 학습은 최적의 가중치 조합을 찾아가는 과정이다. 가중치는 처음에는 랜덤한 값으로 설정되지만 출력된 값과 1차 예상한 값의 차이, 즉 오차를 네트워크에 역방향으로 전파해서 그 오차를 줄이는 방향으로 가중치가 조정한다. 잘 훈련된 인공신경망을 통하면 마치 오조준을 통해 과녁 중앙을 맞추는 것처럼 우리가 기대하는 값을 출력할 수 있다.