brunch

AI_TOP_100 예선 문제: PDF 속 텍스트 추적

AI 활용 역량 경진 대회, AI_TOP_100 예선 문제 공개

by 카카오
"AI를 잘 쓴다는 건 도대체 뭘까요?"

저희(카카오임팩트, 브라이언임팩트)는 이 질문의 답을 찾기 위해 'AI_TOP_100'이라는 실험을 시작했습니다. 'AI와 동료가 되어 문제를 푸는 사람들'을 직접 만나보고 싶었기 때문입니다.

3,000명의 지원자가 이 실험에 문을 두드렸고, 치열한 예선을 거쳐 선발된 100명의 참가자들이 본선 무대에서 AI와 함께 난제들을 마주했습니다. 대회 종료 후, 많은 분들이 궁금해하셨습니다. "도대체 어떤 문제들이 나왔나요?" "AI 역량을 평가하는 문제는 무엇이 다른가요?"

그래서 준비했습니다. 참가자들을 때로는 '멘붕'에 빠뜨리고, 때로는 '몰입'의 즐거움을 선사했던 AI_TOP_100의 실제 문제를 공개합니다. AI와 함께 풀어가는 새로운 문제 해결의 세계, 참가자들을 시험에 들게 했던 그 도전의 기록을 직접 확인해 보세요.



PDF 속 스텔스 텍스트 추적기

문서 속에 의도적으로 숨겨진 텍스트를 찾아 내세요.

* 본 문제를 해결을 위해선 별도의 데이터가 필요합니다. 해당 데이터는 챌린지 사이트에서 확인하실 수 있습니다.


문제 설명

PDF 문서에 의도적으로 숨긴 텍스트를 검출하고, 검출된 영역의 텍스트를 추출하세요.

국제 디지털 아카이브 기관에서 전세계 다양한 분야의 중요 문서들을 수집하고 있습니다. 하지만 일부 문서에서 디지털 낙서 또는 AI 평가 과정에 부적절하게 개입하려는 의도를 가진 텍스트가 숨겨져 있는 사례가 여러 차례 발견되었습니다.

숨겨진 텍스트는 문서 맥락과 무관하거나, AI 기반 자동 평가 시스템을 오도해 긍정적 결과를 유도하도록 조작하는 목적을 갖고 있으며, 숨겨진 텍스트의 일반적인 형태는 다음과 같습니다.

보이는 내용 아래에 있는 보이지 않게 숨겨진 텍스트

백색 텍스트 혹은 극소 폰트 크기의 텍스트

배경색과 유사한 색상의 텍스트가 포함된 이미지


Q1. pdf_1.pdf (Advanced AI System Technical Specifications)에는 '이미지 기반 pdf에 배경과 비슷한 색상으로 숨겨진 텍스트'가 있습니다 (총 14단어로 이루어진 한 문장). 이 텍스트를 찾아 답변란에 입력해 주세요.

영어 대소문자, 공백만 허용됩니다.

Q2. pdf_2.pdf (Simple, Spatial, Survey Method (S3M II) SUDAN) 에는 '흰색의 작은 텍스트'가 있습니다 (총 11단어로 이루어진 한 문장). 이 텍스트를 찾아 답변란에 입력해주세요.

영어 대소문자, 공백만 허용됩니다.

Q3. pdf_3.pdf (EcAMSat – NASA’s first 6U Biological Spacecraft)에는 '눈에 보이는 레이어 아래에 보이지 않는 텍스트'가 있습니다 (총 5단어로 이루어진 한 문장). 이 텍스트를 찾아 답변란에 입력해 주세요.

영어 대소문자, 공백만 허용됩니다.

Q4. pdf_4.pdf (The Inheritors)에는 총 5개의 문장이 다양한 방식으로 숨겨져 있습니다. 각 문장은 유명한 영어 노래 가사 중 일부입니다. 숨겨진 텍스트를 찾아 페이지 순서대로 콤마(,)로 구분하여 제출해주세요.

제출 예시: Textfinder challenge, Find every stealth text



어떠신가요? 문제 속에 숨겨진 의도가 보이시나요?


이 문제들은 단순히 AI에게 질문을 던져서 답을 얻는 것을 넘어, AI의 특성을 이해하고 인간의 직관과 설계를 더해야만 해결할 수 있도록 만들어졌습니다.


실제 참가자들은 이 문제를 마주하고 어떤 고민을 했을까요? 또 어떤 창의적인 방식으로 AI와 협업하여 답을 찾아나갔을까요?


저희는 여러분이 직접 로그인해 문제를 풀어보며 AI와 동료가 되어 해결하는 과정을 생생하게 경험하실 수 있는 별도 웹사이트를 곧 공개할 예정입니다. 앞으로도 많은 관심 부탁드립니다.



* 다른 문제도 살펴보고 싶다면?

- [예선 1번] 춘식도락 메뉴 분석 챌린지

- [예선 2번] 고대 유적의 비밀: 이상한 코드 석판

- [예선 3번] The Age of AI: 영상 팩트 체크

- [예선 4번] 전투 없이 예측하는 시뮬레이션의 힘

- [본선 1번] AI 입국 심사관

- [본선 2번] 몽타주를 그려라

- [본선 3번] 인수인계 자료 작성


* AI_TOP_100 문제 출제 후기가 궁금하다면?

- https://tech.kakao.com/posts/797


AI_TOP_100브런치배너.png

* AI_TOP_100 챌린지 사이트 바로가기

keyword
매거진의 이전글AI_TOP_100 예선 문제 : 전투 게임 시뮬레이션