+ 5-2-6. 평균과 가능성 / 6-1-5. 여러가지 그래프
앞서 말했듯 자료를 처리하는 여러 방법 중 꺾은선 그래프라는 방법 하나를 더 정리해보려 합니다. 방금 전 막대그래프에 대해 정리하면서 자료 처리 방법을 배운 순서대로 차근차근 확인했었으므로, 이번에는 이미 정리한 내용은 간단히 확인만 하고 바로 꺾은선그래프에 대해 이야기해보려 합니다. 각각의 표현 방법에 대해 더 궁금한 점이 있다면 이전 단원 정리 내용을 보며 스스로 한 가지 상황을 정해 표현해보면 훨씬 더 이해가 잘 될거에요. 그럼 시작해 봅시다.
표 만들기
우리가 상황을 파악하는 데 필요한 여러 자료들이 여기저기 흩뿌려져있다면 내용을 확인할 수가 없겠지요? 이러한 자료들을 정리하는 방법 중 가장 기본적인 것이 표의 형태로 나타내는 것이었습니다. 흩어져 있는 자료들을 한 곳에 모아 각각의 항목에 맞게 가로와 세로를 맞춰 쓰는 방법이었지요. 이렇게 표로 정리했을 때 우리는 자료를 빠뜨리지 않고 정확한 크기를 알 수 있었습니다.
그림그래프로 나타내기
표의 형태로 자료를 정리했을 때는 정확한 숫자는 알 수 있지만 한 눈에 크기를 비교하기는 어려웠지요. 자료가 많아질수록 표 안의 글자와 숫자들의 양이 많아지기 때문에 무엇이 제일 큰지, 어떤 것이 제일 작은지 등에 대해 확인하기 위해서는 모든 칸을 다 비교해야 했습니다. 그래서 이러한 단점을 극복하고 한 눈에 쉽게 알아보기 위해 그림이라는 방법을 도입했지요. 상황에 맞는 그림과 크기, 색깔 등을 정한 후 이를 활용하여 표현한다면 모든 숫자를 하나씩 확인하지 않아도 크기 비교 정도는 쉽게 할 수 있었습니다.
막대그래프로 나타내기
하지만 그렇다고 해서 그림으로 나타낸 그림그래프가 완벽한 것은 아니었습니다. 먼저 그림으로 그려서 나타내기 때문에 해당 그림이 무엇을 뜻하는지에 대해 미리 정하는 것이 필요했지요. 지도에서 기호를 읽을 때와 마찬가지로 범례를 통해 이를 안내해야 하는데, 어느 정도까지를 어떤 크기와 색깔, 형태로 표현할 지에 대해서도 모두 생각해야 합니다. 그리고 이를 표현하고 싶은 자료들의 상황에 맞게 정해야 한 눈에 간단한 비교가 가능하다는 그림그래프의 장점을 살릴 수가 있었지요. 또한 정한 형태가 복잡할수록 손으로 직접 그리기는 시간도 오래 걸리고, 표현하는 사람에 따라 조금씩 다르게 나타날 수 있어 그래프를 읽는 사람이 잘못된 이해를 할 수도 있구요.
이처럼 그림그래프의 한계가 있기 때문에 이를 극복하기 위해 하나의 형태로 통일하여 자료를 나타낸 것이 막대그래프입니다. 여러 종류의 그림 대신 막대로 통일하고, 색깔이나 크기 등이 아닌 막대의 길이를 바탕으로 자료의 크기를 나타낸 것이지요. 이러한 막대그래프를 활용하면 앞서 말한 그림그래프의 단점들을 극복할 수가 있었습니다. 누구나 같은 방법으로 그리기 쉬우며, 따로 범례가 없더라도 길이를 보고 바로 크기를 비교할 수가 있었지요.
그렇다면 막대그래프의 단점은 없을까요? 단점이라기보다는 상황에 따라 막대그래프가 잘 어울리지 않는 경우가 있다는 것이 조금 더 괜찮은 표현인 것 같습니다. 그렇다면 어떤 경우가 여기에 해당할까요? 이번에는 실생활에서 막대그래프와 꺾은선그래프가 많이 쓰이는 상황 하나를 바탕으로 이야기해 보려고 합니다.
꺾은선그래프 알아보기
꺾은선그래프의 내용 알아보기
꺾은선그래프로 나타내는 방법 알아보기
자료를 모아서 꺾은선그래프로 나타내기
꺾은선그래프를 보고 의사 결정하기
알맞은 그래프로 나타내기
우리 주변에서 정말 쉽게 찾을 수 있는 한 가지 상황입니다. 날씨에 대한 이야기이지요. 일반적으로 날씨와 관련된 자료를 표현할 때는 비가 얼마나 왔는지에 대한 자료인 강수량은 막대그래프로, 기온이 어떤지에 대해서는 꺾은선그래프로 나타내곤 합니다. 어떤 차이가 있을지 조금 더 생각해보도록 합시다.
먼저 강수량입니다. 월별로 비가 얼마나 왔는지에 대해 막대의 길이로 나타냈지요. 막대 길이를 비교해봄으로써 우리는 가장 많이 비가 온 달이 언제인지, 반대로 가장 적게 온 달이 언제인지 한 눈에 알아볼 수 있습니다. 지금까지 우리가 표현하고 찾아보려고 했던 내용들이지요.
그럼 기온에 대해서 볼까요? 막대의 길이로 표현하지는 않았지만 점이 찍힌 위치에 따라 가장 기온이 높았던 달과 낮았던 달이 언제인지는 어렵지 않게 찾을 수 있습니다. 막대그래프와 큰 차이가 없지요. 그런데 막대의 길이로만 나타냈을때는 알 수 없었던 추가적인 정보를 몇 가지 얻을 수 있습니다. 어떤 것들이 있을까요?
꺾은선그래프는 기본적으로 각각의 수치에 맞는 위치에 점을 찍은 후 그 점들을 직선으로 연결하는 형식의 그래프입니다. 그런데 점이 여러 개 있으면 어떤 모양처럼 보이게 되나요? 잘 모르겠다면 더 많이 찍어보면 조금씩 형태가 보일겁니다. 어떻게 보이나요? 그렇습니다, 점이 여러 개 이어지다보면 하나의 선처럼 보이게 됩니다. 갑자기 왜 이런 이야기를 하냐구요? 우리가 보고 있는 꺾은선그래프를 봅시다. 점 사이가 어떻게 연결이 되어있나요? 선으로 이어져 있지요? 방금 했던 이야기를 거꾸로 생각해볼 수 있는 거에요. 점이 여러 개 이어지면 선처럼 보이게 된다면, 선에서 한 점을 가져올 수도 있지 않을까요?
무슨 말인지 이해가 잘 되지 않는다면 위의 그래프로 다시 돌아가 봅시다. 위의 그래프에선 사실 생략된 부분이 있습니다. 점이 찍힌 부분과 아래 가로축을 잘 보세요. 매 월 단위로만 찍혀있지요? 한 달 안의 30여일의 온도를 모두 기록한 것이 아니라 월별 측정값을 바탕으로 꺾은선그래프가 이어져 있습니다. 만약 해당 자료가 매월 1일에 측정한 온도라고 생각해 봅시다. 5월 1일에 평균기온 19.5도, 6월 1일에 평균기온 23.4도가 되겠네요. 그러면 측정값으로는 확인할 수 없는 5월 중순쯤의 온도는 얼마쯤일까요? 10도? 30도? 이게 아니란건 여러분의 지금까지의 경험으로도 알 수 있겠지만 그래프를 통해서도 짐작할 수 있습니다. 5월부터 온도가 천천히 올라가기 시작해서 6월의 높은 온도까지 갔을 거라는 게 그래프의 모양에서 보이지요? 5월과 6월 결과를 이은 선에서 중간 부근에 점을 찍어보면 대략적인 그 때의 기온을 알 수가 있는 것입니다. 이해가 잘 되지 않는다면 아래의 그림을 봅시다.
이처럼 꺾은선그래프의 가장 큰 장점은 우리가 가지고 있지 않은 시점의 자료도 적절한 어림을 통해 어느 정도 짐작할 수 있다는 점입니다. 그렇기 때문에 이러한 꺾은선그래프는 주로 계속해서 변화하는 자료를 나타낼 때 많이 쓰이고 있지요. 앞서 보았던 기온의 경우, 5월부터 매일매일 끊기지 않고 조금씩 변화하면서 6월의 기온까지 올라간 것처럼요. 이 외에도 예전 코로나19가 한창일 때의 누적 확진자 수를 나타낼 때나 물가 변동을 보여주기 위해 물건값의 변화를 표현할 때 등 계속해서 변화하는 자료들을 꺾은선그래프로 표현한다면 우리가 가지고 있지 않은 중간 시점의 자료값도 어느정도 어림할 수 있습니다.
이제 막대그래프와는 다른 꺾은선그래프만의 장점에 대해서 어느정도 이해가 되나요? 서로 다른 장점을 가지고 있기 때문에 각각에 알맞은 상황에 활용된다는 점도 알 수 있겠지요? 이렇게 4학년에는 중요한 두 종류의 그래프인 막대그래프와 꺾은선그래프를 배우며 실제 뉴스 등을 읽을 때 활용할 수 있습니다. 그렇다면 이제 정말 끝일까요? 그럴 리가요…
자료와 표현
먼저, 우리가 가지고 있는 자료들을 나타내는 방법으로 배웠던 표나 그래프 외에도 또다른 방법들이 있습니다. 표나 그래프가 많은 자료들을 눈으로 보기 쉽게 정리하는 방법이었다면, 이러한 자료들이 어떠한 특징을 가지고 있는지를 보여주는 방법이 있지요. 이렇게 말하면 뭔가 낯설고 어려운 방법일 것 같지만, 사실 여러분이 평소에도 많이 쓰는 단어이기도 합니다. 특히 시험을 치고 난 후에 자주 쓰는 단어지요. 무슨 단어인지 알아차렸나요? 시험치고 선생님께 이번 시험 **이 몇점이에요? 라고 묻곤 하는데… 빈 칸에 들어갈 단어가 무엇일까요? 그렇습니다, ‘평균’ 이지요.
모두 24명이 있는 우리반 학생들이 수학 시험을 쳤다고 생각해 봅시다. 그렇다면 1번 학생의 점수 85점, 2번 학생의 점수 49점, 3번 학생의 점수 75점… 이런 식으로 24번 학생까지 수학 점수가 나올테니 점수는 총 24개가 나오겠지요? 그런데 이 시험의 평균은 몇 개 나올까요? 당연히 1개뿐이지요? 그럼 30명이 있는 반에서는요? 100명이 넘는 우리 학년의, 혹은 500명이 넘는 우리 학교 전체의 평균은? 단 하나밖에 나오지 않지요. 이처럼 많은 자료들이 있을 때, 여러 자료들을 대표하는 값을 나타내는 것 또한 자료를 정리하는 방법 중 하나입니다.
이러한 평균 외에도 여러 자료들이 가진 특성을 대표해서 나타내는 값들은 여러가지가 있습니다. 우리반 학생 중 가장 높은 점수는? 가장 낮은 점수는? 가장 많은 학생들이 맞은 점수는? 이렇게 다양한 자료들이 있을때 그래프처럼 눈으로 보기 쉽게 나타내는 방법 외에도 여러 값들의 특성을 대표해서 나타내는 방법으로도 표현할 수가 있지요. 여기에 대해서는 5학년 때 조금 더 자세히 공부해보도록 하겠습니다.
비율그래프로 나타내기
평균 혹은 다른 방법을 활용하여 여러 자료들의 특징을 하나의 숫자로 정리하여 표현할 수 있다는 것은 이제 알 수 있겠지요? 그렇다면 앞서 배웠던 그래프로 표현하는 방법들은 더 없는 걸까요? 물론 더 있습니다. 우리가 배웠던 그래프들이 가지고 있는 치명적인 단점이 있기 때문이지요. 과연 어떤 단점이길래 또다른 종류의 그래프가 필요한 걸까요?
막대그래프에 대해 정리하면서 생각했던 상황을 다시 가져와 봅시다. 점심 시간에 어떤 학년이 운동장을 사용할지에 대한 이야기였지요. 앞서 상황에서 1년이 지나 이제 졸업과 입학을 거쳐 각 학년들의 숫자가 달라졌다고 생각해 봅시다. 그래서 다시 점심시간 운동장 사용을 가지고 이야기를 하려고 한다네요. 지난번과는 달리 이번에는 우리 학교 전체 학생 중 각 학년 학생들이 차지하는 비율에 맞춰 어떤 학년이 며칠 사용할지를 정한다고 합니다.
여기서 잠깐, 우리가 평소에 여기저기서 들어봤지만 아직 제대로 공부하지는 않은 내용이 나왔네요. ‘비율’이라는 단어를 한 번쯤은 다들 들어봤겠지요? 보통 ‘퍼센트%’ 정도로 더 많이 들어봤을 것 같기도 하네요. 조금 더 정확히 말하자면 비율에 대한 것은 고학년이 되어 더 자세히 공부할 내용인데요, 지금은 ‘전체 중에 어느 정도를 차지하는지’에 대한 내용이라는 것 정도만 알고있으면 되겠습니다. 앞서 말한 상황에서 생각하자면 우리 학교 전체 학생 중 각 학년이 어느 정도를 차지하는지에 대한 내용이 되겠네요. 조금 극단적인 예를 들어서, 만약 전교생이 200명인데 4학년이 100명이라면 전체 중의 절반이 4학년이지요? 이럴땐 ‘4학년이 전교생의 50%이다’ 라고 말할 수 있는것과 비슷한 내용이라고 생각하면 되겠습니다.
다시 운동장 이야기로 돌아갑시다. 우리 학교 전교생 중 각 학년이 어느 정도의 비중을 차지하고 있는지를 바탕으로 운동장 사용 시간을 정하기로 했었지요? 이전에 우리가 사용했던 방법인 표와 막대그래프를 가지고 먼저 확인해보도록 할까요?
이제 표와 막대그래프가 무엇을 표현하는지에 대해서는 바로 확인할 수가 있지요? 그럼 우리의 목적인 각 학년이 전체에서 어느 정도를 차지하는지에 대해서는요? 숫자가 많긴 한데 아마 한 눈에 알아보긴 힘들 것 같습니다. 그럼 우리에게 친숙한 퍼센트로 다시 정리하여 표를 나타내 볼까요?
이제 좀 눈에 잘 들어오네요. 이렇게 보니 전체에서 각 학년이 어느 정도가 되는지를 알 수 있겠네요. 그런데 표의 형식으로 자료를 표현할 때 단점이었던 한 눈에 알아보기 힘들다는 것은 여전하네요. 그렇다면 전체에 대한 부분을 표현한 퍼센트와 같은 비율을 그래프로 나타내면 어떨까요? 막대그래프는 막대의 길이로 자료의 크기를 표현하였는데, 지금은 전체에 대해 어느 정도를 차지하는지가 중요하다보니 각각의 막대보다는 하나의 큰 막대를 나누어 표현해보는 건 어떨까요? 이렇게요.
이렇게 하나의 긴 막대를 각각의 비율에 맞게 잘라서 표현하면 전체에서 어느 정도를 차지하는지를 한 눈에 알아볼 수가 있습니다. 이처럼 단순히 자료의 크기가 아니라 비율 또한 그래프로 나타낼 수가 있다는 것이지요. 다양한 상황에 맞는 그래프들을 적절히 선택하여 표현하는 것이 여러분이 길러야 할 능력입니다.
본 저작물 중 기상 통계 관련 데이터 및 그래프는 기상청 기상자료개방포털에서 작성하여 공공누리 제1유형으로 개방한 기후통계분석 자료를 이용하였으며, 해당 자료는 기상청 기상자료개방포털(https://data.kma.go.kr/)에서 무료로 다운받으실 수 있습니다.