brunch

You can make anything
by writing

C.S.Lewis

by 신동형 Apr 08. 2024

2024년 중국 AI LLM 산업 발전 보고서 정리

AI(Claude3)가 작성 보고서 시리즈

2024년 중국 AI LLM 산업 발전 보고서 기반으로 AI(Claude3)가 작성한 보고서

(LINK)(2024.04.08)


#제가쓴거아닙니다#AI가작성했습니다.


1. 서론 

중국은 최근 인공지능, 특히 AI 대형모델 개발에 많은 노력을 기울이고 있다. AI 대형모델은 대규모 데이터와 계산 자원을 활용해 범용적 문제해결 능력을 갖춘 모델로, 여러 산업에서 활용 가치가 높다. 본 보고서는 중국 정부와 기업의 AI 대형모델 지원 정책, 모델 개발 현황, 당면 과제 및 향후 전망에 대해 분석한다.



2. 중국의 AI 대형모델 산업 발전 정책 

중국 정부는 AI를 국가전략 핵심기술로 삼고 AI 대형모델 개발에 적극 나서고 있다. 과학기술부, 공업정보화부 등 관련 부처가 다양한 지원 정책과 국가 프로젝트를 통해 대형모델 연구개발을 지원하고 있다.


2.1 정부의 AI 대형모델 지원 정책 

2017년 발표된 '차세대 인공지능 발전계획'은 중국 AI 발전의 마스터플랜으로, 2030년까지 AI 선도국가로 부상하겠다는 원대한 목표를 제시했다. 이어 '시나리오 혁신 가속화 및 고품질 경제발전 촉진에 관한 의견'에서는 AI가 각 산업의 디지털 전환을 선도할 핵심동력임을 강조했다. 최근에는 AI의 사회적 책임과 윤리적 개발을 강조하는 지침도 발표된 바 있다.


2.2 AI 대형모델 관련 국가 계획 및 프로젝트 

정부 각 부처는 AI 기술 발전을 위한 다양한 국가 프로젝트를 추진 중이다. 과기부 주도의 '차세대 AI 기술 개발 프로젝트'는 대형모델의 기초연구에 집중하고, 공신부의 'AI 오픈 이노베이션 플랫폼 구축 프로젝트'는 클라우드 기반 AI 개발환경 조성에 주력한다. 또한 'AI 칩 개발 및 산업화' 프로젝트를 통해 자체 AI 반도체 기술 확보에도 노력을 기울이고 있다.




3. 중국 AI 대형모델의 현황과 특징 

중국의 대표적 IT 기업들은 자체 AI 대형모델 개발에 매진하고 있다. 바이두, 알리바바, 텐센트 등이 수천억 규모 파라미터의 거대 모델을 연이어 공개하며 중국 대형모델의 기술을 선도하고 있다.


3.1 주요 AI 대형모델 소개
 바이두는 2021년 6월 1750억 파라미터 규모의 다국어 모델 '원신의안(文心一言, Ernie 3.0 Titan)'을 발표했다. 원신의안은 영어와 중국어를 비롯한 100여개 언어를 이해하고 번역, 요약, 질의응답 등 다양한 태스크를 수행할 수 있다[1]. 같은 해 4월 알리바바는 중문 자연어 처리에 특화된 '통이천문(通义千问, M6)' 모델을 공개했다. 1000억 파라미터 규모의 이 모델은 텍스트, 이미지, 표, 영상, 음성 등 10가지 형태의 데이터를 처리할 수 있는 멀티모달 모델이다[2]. 한편 중국 최대 음성인식 기업 아이플라이텍은 중국어 음성인식 분야 최고 성능을 자랑하는 자체 개발 인지모델을 보유하고 있다. 약 3억개 파라미터로 구성된 이 모델은 복잡한 환경에서도 98% 이상의 인식률을 달성했다[3].


3.2 중국 AI 대형모델의 특징 및 강점 

중국의 AI 대형모델들은 방대한 스케일의 코퍼스로 사전학습을 수행해 얻은 풍부한 지식을 바탕으로, 다운스트림 태스크에 범용적으로 적용할 수 있는 일반화 능력을 갖추고 있다. 바이두의 ERNIE 3.0 모델은 자연어 추론 벤치마크 CLUE에서 9개 태스크 중 8개 태스크에서 최고 성능을 기록하며 뛰어난 일반화 능력을 입증했다[4]. 중국의 대형모델들은 또한 텍스트에 한정되지 않고 이미지, 음성 등 다양한 양식의 데이터를 함께 학습하고 추론할 수 있는 멀티모달 AI 모델로 진화하고 있다. 알리바바의 M6 모델은 ImageNet 이미지 분류 태스크에서 91.6%의 Top-1 정확도를 달성했고, WMT20 중-영 기계번역 태스크에서도 46.9 BLEU를 기록하는 등 시각-언어 영역에서도 우수한 성능을 보였다[2]. 이 밖에도 사전 정의된 규칙 없이도 새로운 문제해결 능력이 학습 과정에서 창발적으로 발현되는 사례들이 관찰되고 있다. 원신의안은 복잡한 수학 문제의 풀이나 대화형 질의-응답 등의 기능이 자연스럽게 생성되는 모습을 보였다[5].




중국의 IT 공룡들은 자체 AI 대형모델 개발에 막대한 자금과 인력을 투입하고 있다. 바이두, 알리바바 등이 잇달아 발표한 1000억 이상 규모의 초거대 AI 모델은 중국 대형모델 기술의 현주소를 보여준다. 중국의 대형모델들은 100여개 언어를 이해하는 다국어 모델, 텍스트-이미지-음성을 넘나드는 멀티모달 모델 등을 통해 뛰어난 일반화 능력과 다양성을 과시하고 있다. 사람이 정의하지 않은 문제해결 능력이 모델 스스로 만들어지는 창발성의 사례도 등장하고 있다. 권위있는 AI 벤치마크에서 세계 최고수준의 성능을 기록하는 등 기술적 역량을 입증하고 있는 중국 대형모델들은 향후 산업계 활용에서도 존재감을 발휘할 것으로 기대된다.



4. 중국 AI 대형모델 산업의 주요 과제 

중국 AI 대형모델 산업은 괄목할 성장세를 보이고 있으나 기술적, 환경적 도전에 직면해 있다.


4.1 컴퓨팅 파워 부족 

슈퍼컴퓨터와 AI 가속칩 등 고성능 컴퓨팅 인프라의 부족은 대형모델 훈련의 걸림돌이 되고 있다. 자체 개발 AI 칩의 성능 개선과 보급 확대가 시급하다.


4.2 핵심 기술의 한계 

대부분의 대형모델은 Transformer 구조에 기반하고 있는데, 이는 높은 자원 소모와 병렬화의 어려움 등 한계를 안고 있다. 보다 효율적인 신경망 구조에 대한 연구가 절실하다.


4.3 고품질 데이터셋 구축의 어려움 

중국어 데이터의 절대적 부족과 데이터 품질 관리 미흡은 대형모델의 성능 발전을 저해하는 요인이다. 다양한 도메인의 양질의 데이터를 확보하고 전처리하는 일이 중요한 과제로 떠오르고 있다.


4.4 킬러 애플리케이션 부재 

현재 개발된 대형모델들은 대부분 범용 모델로, 특정 산업의 수요를 만족시키는 킬러 애플리케이션은 아직 등장하지 않았다. 산업계의 실제 문제 해결을 위한 모델 최적화 노력이 요구된다.



5. 중국 AI 대형모델 산업의 발전 전망 

중장기적으로 AI 대형모델 기술은 더욱 발전하고 응용 범위도 확대될 것으로 전망된다.


5.1 모델의 보편화 및 전문화 방향 

향후에는 강력한 범용 모델과 함께 특정 태스크에 특화된 경량 모델이 병행 발전할 것이다. 클라우드에 올려 서비스하는 대형모델과 엣지 단에 적용되는 모델의 분화도 예상된다.


5.2 수직 산업으로의 확장 

중국은 AI 대형모델을 제조, 의료, 금융 등 주력 산업의 혁신을 주도할 핵심기술로 육성할 계획이다. 기업들의 수직영역 특화 모델 개발과 실증 프로젝트가 활발해질 전망이다.


5.3 AI 모델의 오픈소스화 

연구기관과 대기업들이 개발한 대형모델이 오픈소스로 공개되면서 중소 개발자들도 대형모델의 성능을 활용해 애플리케이션 개발에 참여할 수 있게 될 것이다.


5.4 AI 칩 및 전체 생태계 고도화 

중국은 AI 반도체의 자립화를 위해 대규모 투자를 단행하고 있다. 고성능 AI 칩의 개발과 양산은 대형모델 발전에 더욱 탄력을 줄 것이다. 아울러 소프트웨어 스택과 개발 프레임워크 등을 아우르는 AI 전체 생태계도 한층 성숙해질 것으로 기대된다.



6. 결론 

이상에서 살펴본 바와 같이 중국은 정부의 강력한 AI 육성 정책과 IT 대기업들의 적극적인 투자에 힘입어 AI 대형모델 분야에서 눈부신 성장을 이루고 있다. 고성능 컴퓨팅, 데이터, 알고리즘 등 기술적 제약이 남아있고 실제 산업에서 모델의 활용도 아직 초기 단계지만, 중국의 AI 대형모델은 머지않아 글로벌 경쟁력을 확보하고 산업 전반의 지능화를 견인하는 핵심동력이 될 것으로 기대된다. 중국 정부와 기업이 국제협력을 강화하고 대형모델의 혁신적 활용에 매진한다면 AI가 이끄는 미래 경제에서 중국의 역할은 더욱 커질 것이다.


- 끝 -


[참고문헌] 

[1] https://ai.baidu.com/blog/2021/06/01/ebe-titan 

[2] https://www.alibabacloud.com/blog/alibaba-damo-academy-launches-a-multimodal-deep-learning-framework_597708 

[3] http://www.iflytek.com/en/audioengine/tech.html 

[4] https://arxiv.org/abs/2107.02137 

[5] https://hub.baai.ac.cn/view/10630


#중국, #China, #인공지능, #AI, #LLM

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari