brunch

매거진 34th BITors

You can make anything
by writing

C.S.Lewis

콴다, 기술로 만들어낸 임팩트

연세대 경영혁신학회 32기 남수빈


 수학문제를 촬영해 업로드하면 풀이를 찾아 제시해주는 앱 서비스가 있다. 모르는 문제, 어려운 문제의 풀이를 찾아보고, 해설을 읽을 수도 있고 풀이영상을 시청할 수도 있다. 정확히 일치하는 문제가 없다면 유사문제를 대신해서 제시해준다. 국내 에듀테크를 논할 때 빼놓을 수 없는, ‘콴다’의 이야기다.



우리가 콴다를 쓰기까지-


 광학문자인식(OCR, Optical Character Recognition)은 텍스트 이미지를 AI 컴퓨터가 읽을 수 있는 포맷의 텍스트로 변환하는 기술이다. 사용자가 텍스트를 이미지로 입력해도 기술이 자체적으로 텍스트 문서로 변환하여 텍스트 데이터로 저장하기에, 보다 다양한 작업이 가능하다. 인쇄물 스캔이 단순히 이미지 스캔본으로 저장되는 것이 아니라, 텍스트 파일로 저장되어 단어의 편집/검색 혹은 단어의 수 계산 등이 가능해지는 것이다. 우리가 파파고에 캡쳐본을 업로드하기만 해도 파파고가 자동으로 번역해주는 것도 이 OCR 기술 덕분이라고 할 수 있다.

 OCR은 크게 전처리(Pre-processing), 문자 검출(Text Detection), 문자 인식(Text Recognition), 재구조화(Restructuring) 또는 후처리(Post-processing)의 4단계로 이루어진다. 사용자가 입력하는 이미지는 기울어지거나 회전되어 있거나, 노이즈로 인해 손상되어 있는 경우가 많다. 이처럼 손상된 이미지를 모델이 인식할 수 있도록 사전에 복구하는 단계를 전처리 단계라 한다. 문자 검출 단계에서는 글자들이 존재하는 위치를 찾아내고 이들을 bounding box로 묶는 과정이 이루어진다. 이렇게 묶인 글자들은 인식 모델의 입력으로 들어가게 된다. 문자 인식 단계는 bounding box 안의 글자가 어떤 내용인지 인식하는 과정이 이루어진다.


 이 단계에서 텍스트와 함께 이미지 내 좌표와 영역이 나열된 텍스트 파일을 얻을 수 있다. 마지막으로, 재구조화를 통해 좌표에 따라 텍스트를 배치하고 후처리를 통해 텍스트의 내용적인 부분을 따져 맥락상 자연스럽도록 수정해주는 과정을 거치면, 사용자가 받아보는 최종 텍스트 파일이 완성된다.


 OCR 기술은 문서를 모두 검색 가능한 정보 아카이브로 변환해준다. 디지털 필기나 아날로그 필기를 모두 가리지 않고 이미지로 스캔하여 텍스트화하기 때문에 수작업 문서 처리나 데이터 입력에 드는 시간이 절약된다. 인공지능 솔루션에 속할 때 그 가치가 극대화된다. 자율주행 자동차에서 번호판 및 도로 표지를 스캔하여 읽는 경우가 OCR 기술이 빛을 발하는 대표적 예시다. 뿐만 아니라 OCR 기술은 뱅킹, 의료, 물류 등의 다양한 산업에서 활용되고 있기도 하다.


 한편, 자연어처리(NLP, Natural Language Processing)는 인간의 언어를 해석, 조작하고 이해하는 능력을 컴퓨터에 부여하는 기계 학습 기술이다. 컴퓨터가 모호함으로 가득 찬 인간의 언어 속에 의도된 의미를 정확하게 파악하고 이해하도록 하기 위해서는 NLP 작업이 이루어져야 한다.


자연어처리 분석단계 (이미지제공: KT Enterprise)


 NLP는 크게 형태소 분석(Morphological Analysis), 구문 분석(Syntax Analysis), 의미 분석(Semantic Analysis), 담화 분석(Discourse Analysis)의 4단계로 이루어진다. 형태소 분석은 입력된 문장을 형태소라는 최소 의미 단위로 분리하는 과정이다. 구문 분석 단계에서는 문장의 구성요소가 분해되고, 그들 사이의 위계 관계와 그에 따른 문장의 구조가 분석된다. 분해된 구성요소들은 구문 분석 트리(Parse Tree) 상에서 ‘태그’를 부여받고, 부여받은 태그에 따른 분류대로 위계가 만들어지는 것이다. 의미 분석 단계에서는, 문법적으로는 맞지만 의미상으로 부적절하거나 부자연스러운 문장을 파악하는 작업이 이루어진다. 담화 분석 단계는 앞서 파악된 문장을 전체 문맥과 연결하여 보다 정확한 의미를 도출해낼 수 있도록 하는 단계다. 발화자의 의도에 알맞은 대화 흐름을 파악하고 그에 따른 적절한 응답을 가능케 하는 것이 담화 분석 단계에서 이루어진다고 볼 수 있다.


 우리가 오늘날 흔히 보는 챗봇이 고객의 메시지를 분석하고, 응답을 남기고, 관련 고객 지원으로 리디렉션할 수 있는 것은 전부 자연어처리 기술 덕분이다. 이처럼 컴퓨터가 대량의 텍스트( 혹은 음성) 데이터를 자동으로 처리하고 메시지를 분석하여 실시간으로 응답할 수 있도록 한다는 데에서 NPL 기술의 가치가 발견된다. 



콴다, 들어보셨나요?

 

 매스프레소는 OCR 기술과 NPL 기술을 가장 잘 활용하고 있는 기업이다. 매스프레소는 ‘콴다(QANDA)’라는 앱서비스로 우리에게 친숙하게 알려져 있다. 매스프레소는 콴다를 다음과 같이 소개한다.


콴다 소개글 (이미지 제공: 매스프레소 홈페이지)


 소개 문구에서 알 수 있듯, 콴다는 학생이 수학 문제를 촬영해 입력하면 인공지능이 해당 문제에 대한 해설을 찾아 제시해주는 서비스이다. 이때 해설과 유사한 유형의 문제는 물론이고, 학생 수준에 맞는 맞춤 강의와 개념서까지 제공된다. 사용자가 찍은 문제를 정확히 인식하는 데에서 OCR 기술이 활용되고, 문제를 풀어 텍스트로 추출하는 데에서 NLP 기술이 활용된다.


 매스프레소의 OCR 기술은 특히 정확도 측면에서 월등하다. 분수, 제곱수 등 복잡한 수식은 물론 각종 수학 기호까지 정확하게 읽어내고 있다. NLP 기술 또한 마찬가지다. 콴다에 수집된 실제 문제 데이터에 NLP 기술을 접목하여 사전학습 언어 모델이 구축된다. 이 모델은 문제의 유형과 개념을 판단하여 해당 유형의 문제와 콘텐츠 간의 연결을 만들어주는데, 유형 분류에서 Top3 Accuracy 83.59%를 기록하는 등 높은 성능이 확인되고 있다. 이 기술력이 지금까지 매스프레소의 비즈니스를 뒷받침해주었으며, 앞으로도 비즈니스적 지속가능성의 근간이 되어 줄 것이다.



비즈니스적으로도 성장하고 있는 콴다



 이처럼, 기술력을 기반으로 콴다는 많은 수요를 이끌어내고 있다. 누적 가입자 수는 8000만 명에 이르고, 올라오는 질문 수는 일평균 1000만 건에 이른다(2023년 7월 기준). 국내만 해도 1초에 약 30개씩 업로드되고 있다.


 폭발적인 수요는 콴다의 수익모델로 직결된다. 콴다는 기본적으로 광고 모델을 채택하고 있다. 학생 유저가 풀이를 보기 위해서는 광고를 먼저 시청해야 하고, 콴다는 이렇게 제공하는 광고로부터 광고 수수료를 수취한다. 콴다는 구독 모델 또한 채택하고 있다. 동영상 풀이에 대한 월구독 스트리밍 서비스를 제공하는 것인데, 프리미엄 멤버십 구독자의 경우 무제한 스트리밍이 가능한 것은 물론, 모르는 문제에 기반한 응용/심화 문제까지 제공받을 수 있도록 한다. 이러한 콴다의 잠재력은 투자 유치 현황에서도 드러난다. 2016년 메가인베스트먼트로부터 2억원의 시드를 투자받은 것에서 시작하여 꾸준히 투자가 유치되었고, 2021년에는 560억원 규모의 시리즈 C 투자 유치에 성공하였다. 2022년 12월까지 총 1430억원의 누적 투자금을 달성하기도 하였다.


 이렇게 만들어진 플라이휠을 기반으로, 시장과 수익모델의 지속적인 확장을 기대할 수 있다. 실제로 콴다는 국내 시장에 서비스를 론칭한지 3년이 채 되지 않은 2018년 해외 시장 진출을 시작하였고, 현재는 70개 이상의 국가에서 이용되고 있다. 수익모델 또한 온라인 유료 과외 서비스까지 다변화되고 있음이 확인된다. 향후에는, 꾸준히 수집되고 있는 대량의 데이터를 활용해 사업을 더욱 다각화할 수 있을 것으로 보인다. 


 매스프레소가 만들어가고 있는 임팩트는 단순히 수익성 측면에만 그치지 않는다. 콴다 서비스가 온라인 상에서 누구나 쉽게 수학 학습에 도움을 받을 수 있도록 하는 서비스이다 보니, 지역적/경제적 배경에 무관하게 모든 학생이 더 양질의 학습을 할 수 있도록 기여하고 있다고 볼 수 있다. 실제로 매스프레소는 자사의 서비스에 대해 “맞춤형 교육은 여전히 오프라인 중심으로, 소수만 누릴 수 있다. 콴다 팀은 지금까지 특정 계층과 지역에서만 가능했던 개인화된 학습을 AI 기술을 통해 누구나 접근 가능하도록 함으로써 교육 시장의 혁신을 이루고자 한다. 우리는 모두가 더 효과적이고 평등한 교육 환경에서 공부하는 미래를 꿈꾼다.”고 말하고 있다.



마치며


 지금까지 매스프레소가 세상에 어떻게 임팩트를 내고 있는지에 대해 살펴보았다. OCR, NLP 기술은 지금의 콴다 서비스를 만들어주었고, 콴다는 수익적 측면과 사회기여 측면 모두에서 계속해 임팩트를 만들어나가고 있다. 기술은 점점 더 빠르게 발전하고 있고, 세상도 그에 맞추어 급변하고 있다. 비단 매스프레소(콴다)만이 아니라, 또 어떤 다른 비즈니스가 이 세상에 가치를 창출해낼 수 있을지도 기대해볼 시점이라 생각된다.



연세대 경영 남수빈

sbnam21@yonsei.ac.kr




참고자료


과학기술정보통신부 블로그, <이미지 속 문자를 손쉽게 디지털화하는 ‘OCR’>, 2020.03.10

문상선, <OCR 이란? – 정의, 기술, Use case, 데이터 품질>, Datahunt, 2023.07.05

AWS 홈페이지, <광학 문자 인식(OCR)이란 무엇인가?>

박여주, <자연어처리(NLP) 과정과 서비스 활용 분야>, kt Enterprise, 2021.07.22

IBM 홈페이지, <자연어 처리(NLP)란?>

매스프레소 공식 홈페이지 https://mathpresso.com/ko/product 

Sean Park, “콴다에서 AI 기술은 어떻게 활용되고 있나요?”, 콴다 팀블로그, 2021.01.23

박지훈, “[박지훈 기자의 비상장기업 원석 찾기] 매스프래소 / 해외에서 더 유명한 AI 수학 일타강사 ‘콴다’”, 매일경제, 2023.08.08

 “[AI기업] 매스프레소 “2~3년내 세계 톱10 에듀 기업 도약””, 방은주, ZDNET Korea, 2022.01.18

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari