[Startup:D] (주)심투리얼 전다형 대표
고도화된 AI 시스템을 구축하기 위해서는 양질의 데이터가 필요한데, 개인 정보 보호와 특수한 상황에 대한 데이터 부족, 저작권 문제 등 많은 걸림돌이 있었다. 이에 대한 대안으로 떠오른 합성데이터는 원천 데이터를 변형해 만든 일종의 가상 데이터로 자료 수입 비용을 크게 낮췄으며 개인 정보 보호와 같은 민감한 데이터 확보에 따르는 문제를 해결했다. 특히 합성데이터 개발업체인 ㈜심투리얼은 최근 가상 환경 내에서 무작위로 다양한 상황의 데이터를 추출하는 기술을 개발해 데이터 수집 비용과 시간을 획기적으로 절약하기도 했다. ㈜심투리얼의 전다형 대표를 만나 그간의 기술 개발 스토리와 앞으로의 계획에 대해 들어봤다.
㈜심투리얼이 보유하고 있는 주력 기술과 창업 계기에 대한 설명 부탁드립니다.
㈜심투리얼은 시뮬레이션 환경을 기반으로 인공지능에 필요한 합성데이터를 빠르게 생성하고 검증하는 기업입니다. 항공 우주 분야에서 연구원으로 근무하면서 드론에 인공지능 기술을 적용하기 위해 데이터를 찾던 와중 실제 데이터를 수집하고 라벨링 하는 과정에서 상당한 비용이 든다는 것을 알게 됐습니다. 시뮬레이션에 대한 연구개발을 오랫동안 했었는데 이런 문제를 가상 환경에서 추출한 이미지 데이터로 해결할 수 있다는 확신을 두고 창업을 하게 됐습니다.
합성데이터가 무엇인가요?
사전적인 의미를 먼저 설명한다면 어떠한 프로그래밍을 통해 컴퓨터를 언어화한 후 실제 데이터와 상관없이 만들어 낸 데이터를 합성데이터라고 합니다. 예를 들어 인공지능이 개와 고양이를 구분할 수 있도록 하기 위해서는 많은 양의 개와 고양이 사진을 학습시켜야 합니다. 기존에는 개와 고양이 사진 만장을 찍은 후 그 파일에 각각의 상황에 대한 설명을 사람이 일일이 입력해야만 했었죠. 이 과정에서 상당한 비용과 인력이 소모되는 것은 물론, 하늘에 떠 있는 고양이나 달 표면에 있는 고양이 등의 특수한 상황에 대한 자료는 구할 수가 없었어요. 하지만 합성데이터가 개발됨으로써 이와 같은 일련의 작업이 모두 가능해진 것입니다. 그동안 데이터 수집에 드는 비용과 시간, 인력을 모두 절약할 수 있게 되었을 뿐만 아니라 실제 상황에서 일어나기 힘든 특수한 환경에 대한 데이터도 확보할 수 있게 된 것입니다.
국내외에서 합성데이터 개발은 어느 정도 진행이 되었으며, 이들 개발업체 중 ㈜심투리얼만의 강점에 대한 설명 부탁드립니다.
국내외에 합성데이터를 개발하는 업체가 많아지고 있는 상황에서 우리 기업만의 차별성이 있다면 우선 ‘데이터 센트릭’이라고 하는 데이터 분석 기법과 ‘도메인 랜더마이제이션’이라고 하는 가상 환경에서 무작위로 상황을 바꾸는 기법을 보유하고 있습니다. 이러한 기술을 기반으로 실제 데이터만큼의 성능을 보장하는 것은 물론, 대량의 데이터를 빠르게 생성해 라벨링 정보를 분석해 품질 높은 데이터를 제공하고 있습니다. 두 번째 큰 차별성은 합성데이터를 만들었던 시뮬레이션을 AI 시스템에 대한 검증 환경으로 재사용할 수 있다는 것입니다. 일반적으로 많은 합성데이터 개발업체가 고객이 요구한 합성데이터만 만들어 납품해왔다면, ㈜심투리얼은 합성데이터를 만들었던 가상 환경까지 고객에게 제공하고 있습니다. 이를 통해 고객은 실제 환경에서 검증하기 어려웠던 재난이나 사고 등의 상황을 재현해 시스템을 테스트할 수 있습니다.
가상 환경과 합성데이터의 결합이 흥미롭습니다. 가상 환경에 관해 관심을 두게 된 계기가 있으신가요?
드론에 인공지능을 접목하는 연구를 하던 중 데이터 수집에 상당한 어려움이 있다는 것을 경험했습니다. 인공지능 드론을 개발하기 위해서는 하늘에서 바라본 다양한 각도의 사진이 필요했는데, 우리가 구할 수 있는 사진 대부분이 정면에서 찍은 것밖에 없었어요. 다양한 각도의 사진을 구하려면 실제 드론을 직접 띄어서 촬영을 해야 하는데, 그럴 시간과 비용도 없었어요. 설령 그 많은 사진을 찍는다고 해도 각각의 파일마다 사진 설명을 기록하는 라벨링 작업에도 많은 시간과 비용이 필요한 상황이었어요. 그래서 한참을 고민하다 제가 그동안 연구해 온 시뮬레이션 기술을 활용해 보면 어떨까는 아이디어가 떠올랐어요. 실제 데이터를 학습했던 인공지능 모델을 가상 환경에 던져놓으니 그 안에서 데이터를 학습하며 성능이 향상되는 것을 확인할 수 있었어요.
시뮬레이션을 현실 세계로, 창조를 혁신으로 가상 데이터 솔루션으로
더 빠르고 정확한 AI 개발에 기여합니다.
가상 환경을 활용해 합성데이터를 수집하면 어떤 장점이 있나요?
게임을 떠올려 보시면 이해하기도 쉽습니다. 우리는 고객의 니즈에 맞춰 영화 속 CG처럼 환경을 구축합니다. 흔히 고객은 다양한 상황에서 축출한 데이터를 요구하는데 그런 상황을 모두 적용해 가상 환경을 구축하다 보면 결국 실제 세상과 거의 유사한 가상 환경이 탄생합니다. 우리는 이렇게 구축한 가상 환경을 폐기하지 않고 고객이 직접 시스템을 검증할 수 있는 시뮬레이션으로 사용할 수 있도록 다시 제공하고 있습니다. 특히 시뮬레이션 환경에서 수집한 합성데이터의 가장 큰 장점은 동적인 이미지를 만들 수 있다는 것이에요. 예를 들어 자동차가 0부터 100까지의 구간을 간다면 시뮬레이션에서는 모든 구간에서의 움직임을 이미지로 만들어낼 수가 있어요. 로보틱스와 국방 분야에서는 이런 동적인 이미지를 많이 요구하고 있거든요.
해당 기술을 실제 적용한 사례가 있다면 설명 부탁드립니다.
우주항공, 자율주행, 국방분야에 다양한 데이터를 제공해 왔습니다. 구체적인 사례를 하나 설명하자면, 항공 분야에서 유인 헬리콥터의 계기판을 바라보는 작은 컴퓨터를 제작한 바 있습니다. 해당 기기는 조종사가 놓칠 수 있는 경고나 알람을 이 작은 컴퓨터가 미리 인지해 스마트 워치 진동으로 미리 정보를 전달해 주는 시스템입니다. 유인 헬리콥터의 계기판을 인지할 수 있는 연구과제를 해양경찰청과 함께 하고 있습니다. 비상상황을 대비하는 해양경찰청의 유인 헬리콥터를 연구 목적으로 민간인이 함부로 탑승하여 데이터 수집 활동을 할 수 없기 때문에 심투리얼이 이를 가상환경으로 만들어 문제 해결을 했습니다. 또 최근에는 우리나라 근해에서 잡히는 35종 물고기의 합성데이터를 만들어, 이를 학습한 인공지능 모델을 해양수산부에 공급한 적이 있습니다. 어종분류가 가능한 스마트렌즈 기술은 전 세계 어디에도 없습니다. 이렇듯 ㈜심투리얼은 우리만의 기술력으로 데이터와 인공지능모델, 이를 활용한 애플리케이션 분야까지 사업을 확장하고 있습니다.
앞으로의 계획과 목표는?
앞서 말씀드린 어종분류 스마트렌즈와 같이 데이터 수집과 라벨링이 어려운 인공지능 분야에 저희 서비스를 확장해나갈 계획입니다. 우주항공, 자율주행, 스마트팩토리 분야에서 저희 솔루션을 활용하여 다양한 인공지능 서비스를 만드는 것이 목표입니다. 또 내년에는 지금까지 개발한 시뮬레이션 환경을 바탕으로 우리만의 인공지능 모델을 만들어 제공할 예정입니다. 그동안은 인공지능 기능을 향상시키는 소스를 제공해왔다면, 이제는 인공지능 모델과 서비스를 직접 만들어 제공하고자 합니다.
해당 기술이 우리 일상에 어떤 변화를 가져올 것이라 예상하시나요?
안전 사고 예방에 많은 도움이 될 것이라 생각합니다. 현재 해양수산 분야와 연계된 기술을 개발 중이기도 합니다. 앞서 소개한 헬리콥터 경고 알림 시스템을 선박에 적용한 기술입니다. 헬리콥터 계기판 모니터링처럼 선장실과 조타실 안에도 또 여러 가지 경고 알람이나 엔진 계기 등이 있습니다. 이를 분석해 돌발 상황이나 안전사고를 미리 알려주는 시스템을 개발 중입니다. 이 제품이 완성되면 해양에서 발생하는 많은 사고를 사전에 미리 예방할 수 있을 것이라 기대합니다.
창업을 고민 중인 예비창업자들에게 해주고 싶은 말이 있다면?
창업의 성공은 좋은 사람과 여러 도움으로 이룰 수 있다고 생각합니다. 저는 대전창조경제혁신센터를 통해 다양한 지원과 조언을 받을 수 있었고 좋은 팀원을 만날 수 있었는데요. 혼자 고민하는 것보다 다양한 기관과 지원사업을 통해 쉽게 풀어나갈 수 있으리라 생각합니다.