brunch

You can make anything
by writing

C.S.Lewis

by 신동형 Jun 20. 2024

3D 공간 지능(Spatial Intelligence)

AI(Claude3)가 작성 보고서 시리즈


AI(Claude3)가 작성한 「3D 공간 지능(Spatial Intelligence)의 부상 」보고서(2024.06.14.)

- 평면 이미지 인식을 너머 3D 공간에서 물체의 위치 모양, 크기 움직임 인식으로 -


글쓴이 Claude 3(by Anthropic), 프롬프팅·편집 신동형(donghyung.shin@gmail.com)


#제가쓴거아닙니다.

#AI가작성했습니다.



1. Spatial Intelligence의 정의와 중요성


Spatial Intelligence는 인공지능(AI)이 3차원 공간에서 사물의 위치, 모양, 크기, 움직임 등을 이해하고 예측하는 능력을 말합니다. 마치 우리가 걸어다니면서 장애물을 피하고, 물건을 집어 옮기는 것처럼 AI도 실제 환경을 인식하고 상호작용할 수 있게 되는 것이죠.


지금까지 AI는 주로 이미지나 영상, 음성 등 평면적인 데이터를 다뤄왔습니다. 하지만 자율주행차가 도로 위를 안전하게 주행하려면 방대한 양의 3D 점군 데이터를 실시간으로 처리해야 합니다. 물류 로봇이 창고에서 물건을 정확히 찾아 옮기려면 적재된 상자들의 모양과 위치를 입체적으로 파악할 수 있어야 하죠.


따라서 완전한 수준의 자율주행과 로보틱스를 실현하기 위해서는 인간 못지않은 Spatial Intelligence가 필수적입니다. 스탠포드대학교 Li 교수는 한 TED 강연에서 "Spatial Intelligence는 AI가 우리 일상에 스며들기 위해 반드시 획득해야 할 핵심 역량"이라고 강조한 바 있습니다[1].




2. Spatial Intelligence 구현의 주요 도전 과제


하지만 현재의 AI 기술로는 Spatial Intelligence를 구현하는 데 어려움이 있습니다. 가장 큰 걸림돌은 다음과 같습니다.


① 3D 데이터 표현의 어려움

              자율주행차의 라이다(LiDAR)나 환경 스캐닝으로 수집되는 3차원 데이터는 2D 이미지와 달리 불규칙적이고 흩어져 있습니다.            

              이런 비정형 데이터에서 유의미한 특징(feature)을 추출하고 압축하는 것은 기존 AI 기법으로는 쉽지 않은 작업입니다.            


② 복잡한 공간 관계 추론의 한계

              사물 간 거리, 방향, 접촉 등 다양한 공간 관계를 종합적으로 이해하고 미래를 예측하는 것은 단순한 패턴 인식 이상의 고차원적 추론 능력을 요구합니다.            

              기존 AI는 주로 독립적인 객체 인식에 그쳐, 전체 맥락을 파악하는 데 한계가 있습니다.            


③ 기하 정보 활용의 부족

              우리가 길을 찾을 때 지도를 보듯, AI도 주어진 공간의 기하학적 구조에 대한 사전 지식이 있다면 훨씬 정확한 추론을 할 수 있을 것입니다.            

              하지만 대부분의 AI 모델은 오로지 주어진 데이터에만 의존할 뿐, 외부의 풍부한 공간 정보를 충분히 활용하지 못하고 있는 실정입니다.            


이러한 난관들을 돌파하기 위해서는 새로운 접근 방식이 필요합니다. 3D 데이터에 특화된 AI 모델을 고안하고, 추론 단계에서 공간 관계를 적극적으로 모델링하며, 지도와 설계도 등 인간의 지식을 폭넓게 활용하는 것이 요구되는 시점입니다.



3. 최신 연구 동향과 핵심 기술


최근 Spatial Intelligence 분야에서는 고무적인 연구 성과들이 발표되고 있습니다. 특히 3D 데이터 처리와 추론 기술을 중심으로 혁신이 이뤄지고 있는데요, 대표적인 사례를 소개하면 다음과 같습니다.


① 3D 데이터에 강건한 특징 추출 기술

              스탠포드대 Li 교수팀은 PointNet[2]이라는 신경망 구조를 개발해 불규칙한 점군 데이터에서 직접 특징을 추출하는 데 성공했습니다.            

              이는 기존 접근법과 달리 3D 데이터를 격자(grid) 모양으로 변환할 필요가 없어, 정보 손실을 최소화할 수 있습니다.            

              후속 연구에서는 local 영역 별로 특징을 계층화하는 PointNet++[3] 등으로 발전했으며, 다양한 형태의 3D 데이터로 확장되고 있습니다.            


② 구조화된 공간 추론 알고리즘

              한편 Spatial Intelligence에 특화된 추론 모델들도 제안되고 있습니다. Li 교수팀은 근접 최적화 기법을 활용한 proximal inference[4] 프레임워크를 내놓았는데요,            

              이는 multiple task에 대한 구조화된 출력을 얻기 위해, 각 task의 연관성을 그래프 모델로 표현하고 메시지 전달 방식으로 jointly 최적화를 수행합니다.            

              자율주행 상황에서 객체 인식, 궤적 예측, 제어 신호 생성 등 연속적인 추론 과정을 통합함으로써 전체 파이프라인을 효율화할 수 있습니다.            


③ 공간 지식 정보와의 결합

              최근에는 AI와 사전 공간 지식을 접목하려는 시도도 활발합니다. 대표적으로 Li 교수팀은 OpenStreetMap 등 지도 데이터베이스를 분석해 도로, 건물 등 주요 요소를 3D로 모델링한 후, 이를 이미지 인식 단계에 반영했습니다[5].            

              그 결과 단일 이미지만으로도 차선, 연석, 보행자 등을 입체감 있게 인식할 수 있게 되었고, 기존 센서 기반 방식 대비 연산량도 크게 줄일 수 있었습니다.            


정리하자면 3D 데이터 표현, 공간 추론 모델, 지식 베이스 활용이라는 세 축을 중심으로 Spatial Intelligence의 고도화가 이뤄지고 있으며, 인상적인 성과들이 쏟아지고 있습니다. 다만 아직 개별 요소 기술 수준에 머물러 있어, 실제 적용까지는 좀 더 시간이 걸릴 것으로 보입니다.


표 1 Spatial Intelligence 분야의 최신 연구동향 요약



4. Spatial Intelligence 기술의 응용 분야와 기대 효과


Spatial Intelligence는 그 특성상 현실 세계에 적용되어 직접적인 영향을 미칠 수 있는 분야가 많습니다. 특히 이동성(mobility)과 관련된 산업의 지각 변동이 예상되는데요, 주요 적용 분야와 기대 효과를 정리하면 다음과 같습니다.


① 자율주행 : 안전성과 편의성의 획기적 개선

              복잡한 도심 환경에서도 보행자, 차량 등을 입체적으로 인지하고 부드럽게 주행할 수 있게 됨으로써, 자율주행의 상용화가 크게 앞당겨질 전망.            

              궁극적으로 교통사고 감소와 물류비용 절감, 탑승자 편의 증대 등 사회경제적 파급효과도 클 것으로 기대.            


② 로보틱스 : 작업 영역의 무한한 확장

              기존 로봇은 정형화된 작업 공간 안에서만 제한적으로 활용되었으나, Spatial Intelligence가 적용된 지능형 로봇은 비정형 환경에서도 유연하게 임무 수행이 가능.            

              물류창고나 건설현장 등에서 사람을 대신해 위험하고 반복적인 일을 수행함으로써 생산성 향상에 기여할 것으로 보임.            


③ 증강/가상현실 : 실감나는 몰입감 제공

              주변 환경의 3D 구조를 실시간으로 분석함으로써, 가상 객체를 현실 공간에 자연스럽게 겹쳐 표현하는 것이 가능해짐.            

              게임, 엔터테인먼트 뿐 아니라 교육, 훈련 등에서도 증강/가상현실 기술 수요가 폭발적으로 늘어날 것으로 전망.            


④ 기타 응용 분야

              Spatial Intelligence는 스마트시티, 국방, 우주 탐사 등 다방면으로 활용 가치가 클 것으로 예상됨.            

              정밀한 공간 계측이나 매핑, 자율 비행, GIS 등 다양한 분야에서 인력을 보조하거나 대체하는 역할 기대.            


표2. Spatial Intelligence 기술의 주요 적용 분야와 기대 효과표






5. 향후 발전 방향과 제언


이처럼 Spatial Intelligence는 AI가 우리 삶에 보다 밀접하고 긍정적인 영향을 미치는 데 있어 필수불가결한 요소입니다. 현재의 기술 수준은 아직 걸음마 단계에 불과하지만, 최근 학계를 중심으로 눈부신 발전을 거듭하고 있어 가능성을 엿볼 수 있었습니다.


다만 Spatial Intelligence의 잠재력을 온전히 실현하기 위해서는 몇 가지 후속 노력이 필요해 보입니다. 무엇보다 컴퓨터 비전, 로보틱스, VR/AR 등 관련 분야 간 시너지를 극대화하기 위한 학제간 융합 연구가 활성화되어야 할 것입니다. 아울러 방대한 데이터와 고성능 컴퓨팅 인프라 구축, 규제 정비 및 사회적 수용성 제고 등도 뒷받침되어야 합니다.


우리나라도 Spatial Intelligence 분야의 선제적 대응과 전략적 육성을 통해 차세대 AI 혁신을 선도해 나가야 할 것입니다. 정부는 R&D 로드맵 마련과 함께 테스트베드 조성, 전문 인력 양성 등에 적극적으로 나서야 합니다. 기업들도 선도 기술 개발과 상용화에 과감히 투자하고, 대학과 출연연 등은 원천 연구를 통해 이론적 토대를 다져 나가야 할 것입니다.


Spatial Intelligence라는 新산업 생태계 조성은 多분야 협업을 통해서만 가능한 일입니다. 학계와 산업계, 정부가 공동의 비전을 갖고 협력해 나간다면 우리나라가 AI 강국으로 재도약하는 발판이 될 수 있으리라 확신합니다. Spatial Intelligence 확보를 위한 범국가적 노력에 더 많은 관심과 지원이 모아지기를 기대합니다.



보고서 다운로드

              



참고문헌

[1] Li, F.-F. (2022). How AI can acquire the human superpower of spatial intelligence [Video]. TED Talks.

[2] Qi, C. R., Su, H., Mo, K., & Guibas, L. J. (2017). Pointnet: Deep learning on point sets for 3d classification and segmentation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 652-660).

[3] Qi, C. R., Yi, L., Su, H., & Guibas, L. J. (2017). Pointnet++: Deep hierarchical feature learning on point sets in a metric space. Advances in neural information processing systems, 30.

[4] Wang, S., Fidler, S., & Urtasun, R. (2016). Proximal deep structured models. Advances in Neural Information Processing Systems, 29.

[5] Wang, S., Fidler, S., & Urtasun, R. (2015). Holistic 3d scene understanding from a single geo-tagged image. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 3964-3972).


#SpatialIntelligence,#AI,#3D인식,#공간지능,#자율주행,#로보틱스,#증강현실,#인공지능,#컴퓨터비전,#딥러닝,#LiDAR,#pointcloud,#3Dreconstruction,#sceneunderstanding,#SLAM,#VR,#AR,#자율주행차,#드론,#로봇,#스마트시티,#스탠포드대학교,#PointNet,#proximalinference,#OpenStreetMap,#Li페이페이,#미래유망기술,#차세대인공지능,#기계학습





작가의 이전글 Arm, AI 컴퓨팅의 미래를 향한 비상(飛上)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari