YOLO는 이미지가 입력되면 먼저 이미지를 S×S개의 영역으로 나누고, 하나의 영역을 기준으로 경계 상자 N개를 표시한다. 그리고 모든 영역마다 동일하게 N개의 경계 상자를 표시하면서 각각의 경계 상자에 특정 객체가 존재할 확률도 예측한다. … 각 경계 상자의 데이터는 Bx, By, Bw, Bh, Pc와 C로 표시되는데 Bx, By는 경계 상자의 중심점 좌표이며 Bw, Bh는 폭과 높이이다. 그리고 Pc는 해당 경계 상자에 어떤 객체가 존재할 확률값이고, C는 그 객체가 특정 객체일 확률값이다. 이때 Bx, By는 항상 기준이 되는 하나의 영역 안에 속해 있지만, 경계 상자의 크기는 영역의 크기와 상관없이 다양하게 표시된다. C는 미리 학습된 m가지 종류의 객체 데이터와 비교하여 각 객체일 확률을 표시한 값으로, 미리 학습된 객체의 가짓수에 따라 판별할 수 있는 객체의 가짓수가 결정되며, 그에 따라 C의 개수도 결정된다.
[이것만은 … ]
*사진과 같이 시각적으로 볼 수 있는 것. ( )
*일정한 울안이나 지경의 안. ( )
*지역이 구분되는 한계. ( )
*객관, 대상, 존재, 사물 혹은 개념. 또는 접촉할 수 있으며 감각들을 통해 파악할 수 있는 것. ( )
*사물의 한가운데에 있는 점. ( )
*평면이나 공간 안의 임의의 점의 위치를 나타내는 수나 수의 짝. ( )
*종류의 수효. ( )
이미지… 영역… 경계 상자
<철수 쌤의 슬기로운 국어 공부II>에서 강조한 것 중에 하나가 수학적 개념에 관한 것이다. 이번에 설명할 것은 이와 관련 있다.
구성요소들이 계층을 이루는 구조를 머릿속에 도식으로 나타내며 읽는 연습을 많이 하라 했다. 흔히 계층 구조는 다음과 같이 도식화한다.
어떤 구조의 구성요소는 구조가 되어 하위에 구성요소를 가질 수 있다.
A라는 구조는 구성 요소 a1, a2, a3, …, an으로 되어 있고, 각각의 구성 요소는 구조가 될 수 있으므로, 예컨대 a2는 a2_1, a2_2, a2_3, …, a2_m이라는 구성 요소들로 이루어진 구조로 표시할 수 있다.(n, m은 수학에서 ‘임의의 수’라 해서, 무엇이라 정하지 않은 수를 표시할 때 흔히 쓰는 것으로, 읽는 사람이 편한 대로 아무 알파벳이나 쓰면 된다.)
지문의 ‘이미지’도 ‘영역’, ‘경계 상자’ 등으로 계층적인 구조를 이루는데, 다음과 같은 도식으로 나타낼 수 있다.
영역sxs, 경계상자2_n이 마지막 구성요소로 표시된 것은 구조가 유한한 수의 구성요소로 이루어졌음을 나타낸 것이다.
지문에 ‘이미지를 S×S개의 영역으로 나’눈다고 했고 ‘모든 영역마다 동일하게 N개의 경계 상자를 표시’한다고 했으므로 이미지, 영역, 경계 상자는 위와 같은 계층 구조로 이해할 수 있는 수학적 개념이다.
여기서 S×S라 했으므로 가로, 세로의 수는 같다. 예컨대 S가 2라면 ‘2×2(=4)’, 3이라면 ‘3×3(=9)’이 될 것이고, 그 수는 무엇이라 정하지 않은 임의의 수일 것이므로 마지막 영역은 ‘영역s×s’가 될 것이다. 그리고 N개의 경계 상자를 표시하기 위해 영역 중에 하나인 영역2를 ‘영역2_n’까지 표시하였다. 정하지는 않았지만 구성 요소가 유한한 개수임을 표현한 것이다.
물론 ‘모든 …마다 동일하게 …개’라고 했으므로, ‘영역2’의 경계상자 개수만큼, ‘영역1’, ‘영역3’, …, ‘영역sxs’에는 경계상자가 있을 것이다.(이는 수학적 사고로 글을 읽는 것에 해당하므로 좀 복잡하더라도 이해하려 노력했다가 추후 다시 자세히 설명할 테니 그때 가서 완전히 이해하도록 하자.)
다시 한번 말하지만 철수 쌤은 수학 문제 풀이를 잘 하는 것이 아니라 수학적 사고를 잘 활용한다. 구조 분석이라는 국어 능력을 바탕으로 수학적 개념들을 이해하며 글 읽기에 능숙한 것이다. 국어 시험에서는 얼마나 능숙하게 그것을 할 줄 아는지 알아 보는 문제를 출제한다.
Bx, By는 … 하나의 영역 안에 속해 … 경계 상자의 크기는 영역의 크기와 상관없이 … 표시
분석하는 글은 구성요소들 사이의 관계에 유의하며 읽어야 한다고 했다. 지문에서도 영역과 경계상자의 관계에 유의해야 한다. 지문에 ‘Bx, By는 경계 상자의 중심점 좌표’라고 하였다. 그러면서 ‘Bx, By는 항상 기준이 되는 하나의 영역 안에 속해 있지만, 경계 상자의 크기는 영역의 크기와 상관없이 다양하게 표시된다’고 했다. 이를 2×2의 영역과 2개의 경계상자가 있다고 가정하여 도식으로 나타내면 다음과 같다.
수학적 개념의 구조와 구성 요소의 관계를 가정을 통해 경우의 수로 파악하는 훈련을 많이 하자.
각 영역에 •가 몇 개씩 있는지 세어 보자. 지문에 의하면 ‘가’와 ‘나’, ‘다’,‘라’는 있을 수 있다. 왜냐하면 경계상자의 크기나 다른 영역에 걸침에 상관없어 •가 하나의 영역 안에 두 개씩 있기 때문이다. 그러나 ‘마’는 •가 경계에 있어 지문에 따르면 있을 수 없는 경우이다. 이 외에도 다양한 경우가 있을 것이나 여기에서는 대표적인 경우만 그림으로 나타냈다.(위와 같이 가정하여 경우의 수를 파악하는 것도 중요한 수학적 사고인데, 이에 대해서는 추후 자세히 설명하겠다.)
<철수 쌤의 슬기로운 국어 공부I>에서 강조했다시피, 글을 읽으며 그림을 그리되 수학적 개념을 구조적으로 분석해 그릴 수 있어야 한다. 이 또한 국어 능력인 것이다.
경계 상자의 데이터는 Bx, By, Bw, Bh, Pc와 C로 표시… 학습된 객체의 가짓수에 따라 판별할 … 객체의 가짓수…에 따라 C의 개수도 결정
철수 쌤에 대한 데이터를 ‘나이, 아들 수, 딸 수’로 표시한다고 하자. 이는 철수 쌤이라는 구조를 나이, 아들 수, 딸 수라는 구성 요소로 나눠 분석한 것이라 할 수 있다. 마찬가지로 지문에 있는 ‘Bx, By, Bw, Bh, Pc와 C’는 경계 상자라는 구조의 구성 요소들인 것이다.
그런데 아들 수, 딸 수는 ‘자식 수’라는 구조의 구성 요소들이라 할 수 있다. 즉 철수 쌤이라는 구조와 아들 수, 딸 수라는 구성 요소 중간에 자식 수라는 중간 구조를 설정할 수 있는 것이다. 마찬가지로 ‘Bx, By’, ‘Bw, Bh’는 각각 경계 상자의 ‘중심점 좌표’, 경계 상자의 ‘크기’라는 중간 구조의 구성요소들인 것이다.
그런데 ‘C의 개수’는 ‘학습된 객체의 가짓수에 따라’ 결정된다. 예컨대 학습된 객체의 가짓수가 3이라면 C의 개수도 3이 될 것이다.(이는 함수 또는 대수라는 수학적 사고와 관련된 것으로 추후 설명하겠다.)
이상의 내용을 도식으로 나타내면 다음과 같다.
구조와 구성 요소 사이에 중간 구조를 설정하여 이해하는 훈련을 많이 하자.
철수 쌤을 머리, 몸통, 팔다리로 나눠 분석할 수도 있고, 학교에서의 생활, 집에서의 생활로 분석할 수도 있다. 또한 청소년기, 청년기, 장년기로 나눠 분석할 수도 있다. 아주 추상적인 구성 요소, 예컨대 정치관, 경제관, 사회관 등으로 분석할 수도 있다. 즉 구성 요소를 다양하게 설정해서 분석할 수 있는 것이다. 머리, 몸통, 팔다리라는 구성 요소는 다른 구성 요소들과 달리 구체적인 형상을 갖고 있어 이해에 어려움이 없다. 그에 반해 수학적 개념의 분석은 매우 추상적이고 관념적이어서 이해에 많은 어려움을 준다. 어렵다고 해서 포기해서는 안 된다. 고등학교 국어 시험에는 그런 분석을 잘 해야만 풀 수 있는 문제가 많이 출제되기 때문이다.