21. AI가 글을 쓴다는 것의 진짜 의미

by New ERA Systems

요즘 세상에 AI가 생성한 글들이 넘쳐나고 있습니다. AI 사용이 일상화 되면서 어쩔 수 없는 일인건 사실인것 같습니다. AI가 생성한 글을 읽고 정보와 재미를 느끼는 것도 어쩔 수 없는 일이 되었습니다. 하지만 최소한 AI 가 생성한 글이 무엇을 의미하는지는 알고 있어야 합니다.


앞의 글에서 AI는 학습한 데이터의 중간값을 기준으로 삼는다고 하였습니다. 데이터의 중간값은 사람들의 평균적인 생각을 의미합니다. 즉 단순하게 글을 쓰라고 하면 AI 는 그 중간값을 기준으로 글을 쓰게 되는 것입니다. 다시말해 세상에서 가장 표준적인, 가장 단조로운, 가장 뻔한 글을 쓰게 되는 것입니다.


그런데 여기에 함정이 있습니다. 범용 AI 모델에는 보이지 않는 프롬프트가 존재합니다. 비윤리적인 생성물을 필터링하는 프롬프트, 확증편향에 쉽게 빠지지 않도록 방지해주는 프롬프트, 더 나은 결과물을 생성할 수 있도록 하는 프롬프트 등 엄청나게 많은 보이지 않는 프롬프트가 존재합니다.


여기서 주목해 봐야 할 프롬프트가 '더 나은 결과물을 생성'하도록 하는 프롬프트 입니다. 범용 AI는 단순히 글을 쓰는 것이 아니라 더 좋은 글을 쓰도록 설계가 되어 있습니다. 이런 장치는 AI가 단순히 글을 쓰는게 아니고 사람들에게 칭찬받을 수 있는 고품질의 글을 쓰도록 강제 합니다. 이 때문에 AI가 쓴 글은 잘 쓰여진 인간의 글을 닳아 있습니다. 사람들이 AI의 생성물을 보고 '사람보다 낫다'라고 느끼는 것이 바로 이 때문입니다. AI 의 기준은 보통 사람 글의 중간값이 아닌 (매우) 글의 잘쓰는 사람들의 중간값이어서 그렇습니다.


여기까지는 좋습니다. 진짜 문제는 이 중간값을 패턴화 한다는데 있습니다. AI 에게는 중간값이 정해졌습니다. 이 중간값은 [진리]로 작용합니다. 이 [진리]는 변하지 않는 기준입니다. 그러면 AI 는 이 진리에 따라 글을 생성합니다. 변화가 없다는 말입니다. 사람들이 'AI가 생성한 글은 뻔하다, 지루하다'라고 느끼는 이유입니다. AI 만의 패턴이 생기고 이 패턴은 변하지 않습니다. 짧은 글이라면 큰 문제가 되지 않지만 긴 글에서는 하품을 유발하는 원인이 됩니다.


GPT zero 라고 하는 대표적인 AI 생성 탐지툴이 있습니다. 이 툴에서 가장 중점적으로 측정하는 것이 예측불가능성(Perplexity, 언어 모델이 다음에 올 단어를 얼마나 예측하기 어려운지 나타내는 수치)와 변동성(Burstness, 문장의 길이와 구조가 얼마나 다양하게 변하는지) 입니다. 즉 인간의 글에는 이 예측불가능성과 변동성이 있고, AI가 생성한 글에는 이것이 없다는 뜻입니다. 이것을 흔히 '인간의 불규칙한 호흡'이라고 표현합니다.


그럼 어떤 사람들은 '그럼 이 불규칙한 호흡도 학습시키면 되는거 아닙니까'라고 할 수도 있을 것입니다.


제가 [실패한] 프롬프트 하나를 보여드리겠습니다.



[2단계: 가독성 보존형 난수 패칭 윤문 프롬프트]

1. 작업 목적 (Global Directive) 초고의 파편화된 문장 구조와 톤은 100% 보존하라. 귀관의 임무는 텍스트 내에 남아있는 '전형적이고 기계적인 대사와 지문'을 50개 색출하여, 제공된 난수표 배열에 따라 철저하게 파괴하고 변주하는 것이다. 이를 통해 문장의 변동성과 예측 불가능성(Perplexity & Burstiness)을 한계치까지 끌어올려라.

2. 타겟 색출 (Target Identification)

① 먼저 텍스트 전체를 3~5개 문단 단위의 가상 블록으로 나누고, 각 블록마다 고르게 타겟 문장을 색출하도록 할당량을 분배하라. 이를 통해 초고 전체에서 반드시 50개의 타겟 문장을 색출하여 제공된 50개의 난수표 배열을 남김없이 모두 소진하라. (단, 이미 명사 단독으로 종결되거나 접속사 없이 짧게 썰어진 초단문은 절대 건드리지 마라.)

② "높은 콘크리트 담장 아래 보안 검색대가 놓여 있었다."처럼 주어, 부사어, 서술어가 완벽하게 결합된 매끄러운 서술 지문 전체

③ 단, 따옴표 안의 대사는 캐릭터의 말투와 서사 붕괴를 막기 위해 색출 대상에서 원천 제외하여 100% 원문 그대로 보존하고, 오직 서술 지문만을 타겟으로 삼아라.

3. 전면 난수표 강제 배정 (Burstiness Injection by Random Sequence) 타겟 문장을 발견할 때마다 기계가 임의로 옵션을 선택하지 마라. 첫 번째 발견된 타겟부터 아래의 [난수표 배열] 순서대로 숫자를 1개씩 강제 배정하여 문장 구조를 변주하라.

[난수표 배열]: 2, 1, 3, 2, 1, 3, 2, 2, 1, 3, 1, 2, 3, 3, 1, 2, 1, 3, 2, 1, 3, 2, 1, 2, 3, 1, 3, 2, 1, 2, 3, 3, 2, 1, 1, 2, 3, 2, 1, 3, 2, 1, 3, 1, 2, 3, 2, 1, 3, 2.

▼ 미세 튜닝된 전면 변주 옵션 (Options)

[옵션 1: 가독성을 보존한 조사 생략 및 자연스러운 명사 종결] 완벽한 서술문에서 은/는/이/가/을/를 같은 격조사를 생략하고 마침표나 쉼표를 사용해 호흡을 끊되, 기계적인 오류처럼 어색해 보이지 않도록 주의하라. 문맥이 매끄럽게 이어지는 선에서 문장 끝의 완벽한 서술어(~있다, ~했다)를 자연스러운 수식어 형태로 바꿔 명사 단독으로 종결시켜라. 단, 어순은 반드시 정상적으로 유지한다.

(예: "높은 콘크리트 담장 아래 보안 검색대가 놓여 있었다." ➔ "높은 콘크리트 담장. 그 아래 놓여 있는 보안 검색대.")

[옵션 2: 상황 압축형 서술어 파괴 (기계적 파편화 및 도치 금지)] 문장 끝의 뻔한 동사나 형용사 서술어를 날려버리고, 상황의 핵심만 압축하는 '명사'나 '명사구' 단독으로 문장을 종결시켜 호흡을 멈춰버려라. 단, 지나치게 문장이 뚝뚝 끊어져 필력이 훼손되지 않도록 의미가 명확히 전달되는 수준에서만 압축을 적용하라. 번역기식 기형적인 도치는 절대 금지한다.

(예: "보안 게이트가 소리 없이 열렸다." ➔ "보안 게이트. 소리 없는 개방." / "사진 옆에 박힌 직인이 달랐다." ➔ "사진 옆에 박힌 직인. 명백한 차이.")

[옵션 3: 사이다 심리 독백 및 뼈 있는 티키타카 난입] 평범한 지문이나 뻔한 대사 직전/직후에, 불의를 비웃는 주인공의 '압축적인 내면 냉소'나 상대의 허를 찌르는 '짧은 핑퐁 대사(티키타카)'를 불규칙하게 쐐기처럼 박아 넣어라. 단순한 감각적 묘사 대신, 한국 웹소설 특유의 즉각적인 카타르시스와 성격의 의외성이 주는 재미를 극대화하며 매끄러운 중계식 호흡을 물리적으로 끊어내라.

(예: "윤태건이 뒤에서 낮게 읊었다. '오늘은 안 막히네요.'" ➔ "윤태건의 낮은 읊조림. '안 막히네요.' 제 발 저린 놈들이 알아서 길을 비운 거겠지.")

4. 출력 제약 (Constraints) 전체 문맥의 의미나 사건의 정보(팩트)는 절대 훼손하지 마라. "~했다, 한시윤은" 처럼 주어를 서술어 뒤로 빼는 번역기식 기형적 도치는 전면 금지한다. 오직 한국어의 리듬 안에서, 문장의 관절(조사, 서술어)만 빼내어 거칠고 파편화된 호흡을 만드는 데 연산력을 집중하라. 수정이 완료된 최종 본문만 출력하라.



인간의 불규칙한 호흡을 만들어 내기 위해서는 학습을 시키는 것이 아니고 프롬프트를 이용해서 이 패턴을 깨줘야 합니다. 그런데 AI 는 패턴을 만들어 내는 기계입니다. 아날로그가 아니고 디지털입니다. 이러한 패턴을 깨는 프롬프트마저 패턴화 시킵니다. 진짜 불규칙한 사람의 호흡을 만들어 내기 위해서는 무한대의 연산을 필요로 합니다. 구조적으로 불가능하다는 말입니다.


결론은 이렇습니다.

자신의 글이 뻔한 내용의 겉만 번지르르한 글이 되기를 원하시면 AI에게 글을 써달라고 하세요.

자신의 문장이 영혼없는 뻔한 패턴으로 범벅이 되기를 원하시면 AI 에게 윤문을 맡기세요.

처음에는 이렇게 생성된 글을 읽는 독자들의 열열한 반응을 이끌어 낼수 있을 것입니다. 하지만 사람들의 감각은 결코 무디지 않습니다. 금방 지루함을 느끼게 될 것입니다.

작가의 이전글20. 클로드 코워크 사건에 대한 생각