TeXray를 만든 이유
지난편에서 잠깐 언급했던 이야기입니다.
공공기관 영상 작업을 하면서 HWP 파일을 정말 많이 받았습니다. 그걸 AI로 빠르게 요약해서 영상 방향을 잡으려 했더니, AI가 HWP 파일을 읽지 못했습니다. 손으로 복사하고, 붙여넣고, 다시 정리하는 2차 작업이 반복됐습니다.
"AI가 HWP를 읽을 수 있게 하면 이 문제가 해결되지 않을까?"
그런데 반대 방향의 문제가 보였습니다
AI가 HWP를 읽을 수 있게 됐다는 건
누군가 ChatGPT로 초안을 뽑아서 아래한글에 붙여넣고 HWP로 저장해 납품하는 것도 가능하다는 뜻입니다.
발주처는 그 문서가 사람이 쓴 건지, AI가 쓴 건지 알 방법이 없습니다.
이것이 가능성의 문제가 아니라는 걸 보여주는 수치가 있습니다. 전국 행정기관 종사자 14,208명 조사에서 68.9%가 생성형 AI를 실제 업무에 활용했고, 30.8%는 행정문서 작성·요약에 씁니다. 현장에서 이미 벌어지고 있는 일이었습니다.
HWP는 왜 유독 사각지대인가
기존 AI 판별 서비스는 텍스트 붙여넣기만 지원합니다.
HWP 파일을 주면 읽지 못합니다.
AI로 내용을 만들고, 아래한글에 붙여넣고, HWP로 저장하면,
기존 서비스는 이 우회를 잡아내지 못합니다.
공공기관에 납품되는 보고서, 기획안, 용역 결과물의 상당수가 HWP 형식입니다.
가장 많이 쓰이는 형식이 가장 큰 사각지대였습니다.
TeXray — HWP를 직접 읽고 AI를 판별한다
TeXray는 HWP·HWPX 파일을 직접 업로드해서 AI 작성 여부를 판별합니다. 8가지 독립된 분석 축이 동시에 작동합니다. GPT·Claude·Gemini·Perplexity 중 어떤 모델로 작성됐는지까지 추정합니다.
카피킬러가 표절을 잡는다면, TeXray는 AI 작성 자체를 잡습니다. AI가 새로 생성한 문장은 기존에 없으니 표절로 걸리지 않습니다. 현재 완전 무료, 횟수 무제한으로 운영 중입니다.
세 편을 돌아보며
처음부터 이 세 가지를 설계한 게 아니었습니다. 현장에서 겪은 문제를 하나씩 풀다 보니 이렇게 됐습니다.
기술은 현장에서 나옵니다.
현장의 문제를 직접 겪은 사람이 만든 도구는 — 책상 위에서 설계된 도구와 다릅니다.
TeXray
https://huggingface.co/spaces/ginigen/TeXray
https://blog.naver.com/ginigen_ai/224215417496
스텔스마크https://huggingface.co/spaces/ginigen/StealthMark
허그와트 바나나https://www.ginigen.ai/ko