국어 문법, 신박한 헛소리가 생성되는 현장을 목격하다
공부나 과제를 할 때 생성형 인공지능에게만 의존하다가는 낭패를 볼 수 있다.
이를 잘 보여주는 사례가 있다.
어느 국어 질문 오픈채팅방에서 있었던 대화를 옮겨 싣는다. 가독성을 위해 자잘한 수정이 가해졌지만 골자는 그대로다.
학생:
“제가 ... 수행평가를 봤는데요. 선생님은 ‘핑크빛만’ 이라는 단어가 된소리가 일어나 [핑크삔만]으로 발음되는게 맞다고 합니다.
선생님이 ... 핑크빛은 [핑크삗]으로 소리나니 핑크빛만 이라는 단어도 [핑크삔만]이라는 된소리되기가 나야 한다고 하는데,
저는 만이라는 조사가 오기도 했고 외래어+고유어 는 사잇소리 첨가가 되지 않아 된소리 없이 음절의 끝소리 규칙으로 인해 ㅊ이 ㄷ으로, ㄷ이 ㅁ을 만나 ㄴ+ㅁ이 돼서 [핑크빈만]이 맞다고 생각합니다.
학원 선생님도 사잇소리가 없어 제 발음이 맞다고 하고요. ...”
학생이 한 말 중에 밑줄 친 부분에 집중해 보면,
‘핑크빛만’이라는 말(학생은 ‘단어’라고 표현했지만 학교문법 기준으론 한 단어가 아니다)의 발음이 [핑크삔만]인지 아니면 [핑크빈만]인지를 따지는데 조사 ‘만’의 존재를 언급하는 게 매우 이상하다.
우리말의 비음은 바로 앞에 있는 인접 폐쇄음을 비음화할 수 있을 뿐,
‘핑크빛만’에서 /ㅁ/이 자음 /ㅊ/과 모음 /ㅣ/를 사이에 두고 저 멀리 앞에 떨어져 있는 /ㅂ/의 발음에 영향을 줄 수 있을 리가 없다.
(다만 과라니어에는 비음이 자기 앞에 나오는 여러 음절의 음소들을 원격으로 쭉쭉 비음화하는 신기한 규칙이 있다고 배운 적이 있다.)
학생은 어째서 이런 이상한 말을 하고 있는 걸까?
이때까지 나는 전혀 모르고 있었다.
그저 평소와 같이 성심성의껏 답변을 달아 볼 뿐.
나:
“ ... 2. ‘만이라는 조사가 오기도 했고’는 맥락과 전혀 무관한 정보로 보입니다.
조사 ‘만’이 붙는 것 때문에 복합어의 발음이,
정확히는 그 복합어에서 ‘만’과 인접하지 않은 음소의 발음이 달라지는 사례를 하나라도 가져다 주시면 재고할 수 있겠습니다.
3. ‘외래어+고유어 는 사잇소리 첨가가 되지 않아‘는 근거를 알 수 없는 말씀인데 잘못된 걸로 보입니다. 사이시옷을 적지 않는 것과 사잇소리가 첨가되지 않는 것은 서로 전혀 다른 개념입니다.
4. 한국어 원어민으로서 제 직관을 말씀드리자면 ‘핑크빛’은 [핑크삗], ‘피자집’은 [피자찝]으로 발음합니다. ...
https://youglish.com/pronounce/%ED%95%91%ED%81%AC%EB%B9%9B/korean
... 표준어를 확인하는 수단은 아니지만, 유글리시 사이트에서 한국어 원어민들의 발음을 확인할 수 있는데 [핑크삗]이 아닌 예를 찾기가 어렵네요.
‘피자집’은 예외가 전혀 없이 전부 다 [피자찝]이군요.
‘외래어+고유어 는 사잇소리 첨가가 되지 않아’라는 말씀은 적어도 현실 언어에서만큼은 전혀 옳지 않은 말씀인 걸로 보입니다.”
내 정성어린 대답을 읽기는 읽어 본 건지,
학생은 대뜸 웬 긴 글을 하나 가져다 보여주었다.
학생:
“• 제11항 (음절 끝소리 규칙): 받침 ‘ㅈ’은 소리 낼 때 [ㄷ]으로 바뀜
→ ‘빛만’ → [빋만]
• 제26항 (비음 앞의 자음은 비음으로 바뀜 = 비음화):
‘ㄷ’ 뒤에 오는 ‘ㅁ’ 때문에 자음 동화 발생
→ [빋만] → [빈만]
• 제27항 (경음화): 이 경우에는 된소리(경음화)는 적용되지 않음
→ 왜냐하면, [‘핑크빛만’에서] 뒤에 오는 ‘만’은 된소리 유발 자음(ㄱ, ㄷ, ㅂ, ㅈ)이 아니고
조사이기 때문에 경음화 조건이 성립하지 않음
핑크빛’은 말씀대로 **[핑크삗]**이 맞습니다. 이건 된소리되기 때문이에요.
• 하지만 ‘핑크빛만’은 된소리 유발 환경이 아니고,
오히려 음절 끝소리 규칙 + 비음화가 일어나서 **[핑크빈만]**이 됩니다.
• 즉, ‘삗’처럼 된소리는 단독일 때만 나타나고,
조사나 비음이 뒤따를 땐 연음·비음화가 우선 적용돼요.
• 국립국어원 ‘표준 발음법’ 제11항, 26항에 근거한 설명입니다.”
보자마자 단번에 이상한 점을 눈치 챈 사람들이 있을 것이다.
바로 이런 부분.
**[핑크삗]**
**[핑크빈만]**
여기서 앞뒤에 붙는 ** 표시가 좀 뜬금없다.
이것은 **로 둘러싸인 텍스트를 굵은 글씨로 만들어 주는 마크다운(markdown) 문법인데,
ChatGPT와 같은 인공지능이 생성하는 답변에서도 흔히 볼 수 있다.
ChatGPT와 대화하는 화면에서는 대개 굵은 글씨로 변환되어 나타나지만,
답변 내용을 복사 붙여넣기해서 마크다운 문서가 아닌 다른 곳에 옮겨넣으면 저렇게 변환 전의 모습으로 **...**과 같이 표시되곤 한다.
요새는 마크다운 문서가 아닌 글에 저런 마크다운 문법 요소가 막 등장해 있는 걸 보면 대번에 인공지능이 생성한 글이 아닌가 하는 생각이 든다.
이어지는 학생의 말.
“이 문장은 챗지피티에서 가지고 온거여서 신뢰가 많이 없어 윗 문장을 토대로 선생님에게 제 스스로 반박하기가 어렵지만 여기 말에서 틀린 부분이 있을지 궁금합니다. 정확한 자료를 찾아보기 어려운게 맞는것 같아서 쌤에게 건의는 좀 그렇고 그냥 맞는지 아닌지가 궁금하네요”
역시 chatGPT가 써 준 글이었다.
사실 문제는 마크다운 문법이 뜬금없이 쓰였다는 형식상의 이상함만이 아니었다.
‘빛’의 받침 발음을 따지는데 ‘ㅈ’이 등장한다는 사실은 애교로 넘어간다 하더라도,
글 내용에 아주 심각한 오류가 있다.
그 오류가 무엇인지는 이따가 따져 보기로 하고,
여기서는 학생의 태도를 한번 잘 생각해 보자.
학생의 말은 요컨대,
자기가 수행평가에 제출한 오답을 정당화할 의도로 챗지피티에게서 이상과 같은 글을 작성받았고,
자기는 챗지피티의 글에 오류가 있는지 없는지를 스스로 판단할 자신이 없단 얘기다.
아니, 자신이 없다기보다 그냥 귀찮은 거 아닐까 싶다. 대단히 어려운 문제도 아니고 그냥 차분히 읽다 보면 금방 오류를 감지할 수 있을 테니 말이다.
꽤 허무했다.
기껏 정성들여 답했더니 제대로 읽지도 않고 챗지피티 말을 ‘복붙’하다니.
한편으론 신기하기도 했다.
모르긴 몰라도 ‘핑크빛만’을 [핑크빈만]으로 읽을 근거를 ‘만’에서 찾는다는 발상을 사람이 해 내기는 어려웠을 것이다. 국어 문법을 잘 알든 모르든 간에 말이다.
질문하는 학생 스스로도 아마 그런 생각은 못 떠올렸을 것이다. 생성형 인공지능이 이런 참신한 헛소리를 만들어냈기 때문에 비로소 이 학생에게는 그런 오해가 자리잡은 것이다.
이런 류의 국어 질문 오픈채팅방에서 활동한 지 벌써 4년이 됐는데, 처음 시작할 때만 해도 이런 일은 상상하기 어러운 일이었고,
학생들의 오해는 대개 인간적인 발상, 그러니까 어쩌다 그런 생각을 하게 됐는지 충분히 그 동기를 이해할 수 있는 유형의 것이었다.
이제는 시대가 바뀌니 이런 새로운 헛소리도 마주하게 되는 것이다.
하여튼 짜증이 나긴 했지만, 일단 차분히 지적을 해 보기로 했다.
위에서 ‘[챗지피티의] 글 내용에 아주 심각한 오류가 있다’고 했는데, 이제 그 오류가 밝혀진다.
나:
“위에 제가 열심히 쓴 말은 제대로 이해하셨나요?
‘[‘핑크빛만’에서] 뒤에 오는 ‘만’은 된소리 유발 자음(ㄱ, ㄷ, ㅂ, ㅈ)이 아니고
조사이기 때문에 경음화 조건이 성립하지 않음’
이 부분이 얼토당토않네요.
잘 생각해 보시면 이해하실 수 있을 겁니다.
‘된소리 유발 자음’이란 게 ‘국밥’에서 ‘밥’을 [빱]으로 만드는 ‘국’의 받침 /ㄱ/ 같은 걸 말하는 거라면,
이건 된소리 유발 자음 /ㄱ/이 예사소리 /ㅂ/의 ‘앞에’ 위치해서 그 예사소리 /ㅂ/를 된소리 /ㅃ/로 만드는 거니까,
챗지피티가 말하는 ‘핑크빛만’에서의 /ㅂ/과 /ㅁ/의 관계랑 아무 상관이 없고요.”
학생: “완벽히는 아니어도 제 말이 틀린 부분이 어디에 있는지 이해가 되네요”
나: (아직 안 끝남) “ [‘된소리 유발 자음’의 목록에] 다른 자음은 안 넣고 ㄱ, ㄷ, ㅂ, ㅈ만 모은 것도 심히 해괴합니다.
/ㄱ, ㄷ, ㅂ, ㅈ/만 따로 모이는 그룹은 이를테면 ‘유성음 사이에서 유성음이 되는 예사소리’ 등이 있을 수 있겠는데, 이건 된소리되기하곤 아무 상관이 없죠.
‘국밥’의 /ㄱ/과 같은 ‘된소리 유발 자음’을 말한다면 /ㅅ/, /ㅊ/, /ㅋ/, /ㅌ/, /ㅍ/ 등을 포함해 모든 장애음을 다 나열하든가, 아니면 음절의 끝소리 규칙을 고려해서 /ㄱ/, /ㄷ/, /ㅂ/ 셋만 나열하든가 둘 중 하나여야 할 테니 /ㅈ/이 뜬금없이 끼어드는 게 어이 없고요.”
헛소리를 한 게 사람이 아니라 인공지능이라고 생각하니 더 예의 차리지 않는 도발적인 표현을 쓴 것 같다.
학생은 결국 사과를 남기고 떠나갔는데,
학생: “쌤한테 이의제기 할 근거가 거의 없네요 제 말도 대부분 앞뒤가 안 맞는 거 같습니다
긴문장 읽어주시고 정성스럽게 답해주셔서 감사합니다”
결국 뭐가 문제였던 건지, 챗지피티가 뭘 잘못한 건지를 제대로 이해하고 떠나간 건지 아니면 그냥 아니라고 하니까 아닌가 보다 하고 떠나간 건지 모르겠다.
오늘의 교훈:
1. 국어문법은 챗지피티로 공부하지 맙시다.
2. 생성형 인공지능은 아직 헛소리를 많이 합니다.
3. 그런 헛소리를 걸러낼 수 있도록 배경지식과 집중력과 논리력을 갖춘 상태에서 사용하도록 합시다.
https://m.blog.naver.com/ks1127zzang/223927707802
+ 번외로 이 학생의 입장에서 한번 생각해 보았다.
1. ‘핑크빛만’을 [핑크빈만]으로 발음할 근거를 ‘만’에서 찾으면 안 되는 이유가 뭔지, 그걸 알든 모르든 학교 바깥에선 무슨 의미가 있나?
-> 솔직히 잘 모르겠다. ‘논리적 사고 능력’라는 일반추상적인 가치 말고 들 수 있는 게 있나?
‘낙뢰’의 발음에 관한 글에서도 이런 얘기를 한 적이 있다.
‘한숨을 돌려 진정하고 보면,
사실 국어 선생님이 수업 시간에
[낭뤠]가 인간이 할 수 없는 발음이라고 하든
아니면 내가 바라고 요구하는 대로 '[낭뤠]는 할 순 있는 발음이지만 비표준 발음이니까 시험에 나오면 틀렸다고 하렴'이라고 하든
세상을 더 나은 곳으로 만드는 데에 무슨 영향이 있는지는 잘 모르겠다.’
난 그냥 문법을 좋아해서 그에 관해 종종 읽고 생각하고 쓰고 할 뿐이고, 그렇게 하는 게 나와 세상에 무슨 도움이 되는지는 잘 모른다. 누가 알려주면 좋겠다.
2. 그런 지식이 별 쓸모가 없는 마당이면 뭐 다소간 오류가 있다 하더라도 이런 과제나 공부는 인공지능에게 맡기고 더 실제성이 있는 공부에 집중하는 게 나은 거 아닌가?
-> 그럴 수도 있겠다. 근데 위에 인용한 챗지피티의 답변에서 그 간단한 오류조차 못 찾아낼 정도로 귀찮음 가득한 태도라면 다른 공부라 해도 어떤 성과를 낼 수 있을지...
3. 챗지피티가 국어 문법을 잘 설명 못 하는 건 그냥 지금의 문제일 뿐, 조만간 더 발전하면, and/or 유료 버전을 쓰면 국어 문법도 완벽하게 알려줄 수 있을 것이다!
-> 아마 그럴 것 같다.
아래는 학생과의 대화 원문. 위에 인용한 내용보다 더 길고 자세하다.
++ ‘시대가 바뀌며 나타난 새로운 헛소리’ 운운하다 보니,
스키추닐 오뒤에스프의 차기작은 생성형 인공지능을 활용해 만들어 봐도 재밌겠단 생각이 들었다.
‘바스크어와 한국어의 뿌리가 같다는 언어적 증거를 제시해 줘’라든가...ㅋㅋ