brunch

You can make anything
by writing

C.S.Lewis

by 최두옥 Dec 08. 2023

스마트워크를 가속하는
구글의 인공지능 - Gemini

Gemini 발표 영상 한국어 핵심 요약

오늘 아침, ChatGPT 에 도전하는 구글의 인공지능인 Gemini (제민아이)가 공개됐어요. 이 새로운 인공지능의 특징은, 구글 공식 채널에 올라간 두 개의 영상을 보면 쉽게 이해가 되는데요. 당연하긴 하지만 영어 소개 영상이고 전문적인 용어도 많이 나와 일반 한국인들에게는 조금 거리감이 느껴질 수 있어요. 그래서 이 영어발표의 핵심을 알기 쉬운 한국어로 정리해 봤어요. 초등학생이나 어르신들도 쉽게 이해하도록 질문과 답변의 형태로 구성해서 도움이 되실 거예요.



첫번째로 볼 영상은 Gemini 의 공식 소개 영상이에요. 원본은 구글의 핵심 멤버들이 다양한 각도에서 소개를 하는데요, 핵심 내용을 질문과 응답으로 쉽게 한국어로 번역해 보았어요. 


Gemini: Google newest and most capable AI model


Q. 구글에서 대단한 걸 만들었다고 들었어요! Gemini가 그 주인공인가요? 

맞아요!
Gemini는 구글이 새롭게 선보인 인공지능 모델이에요. 우리가 평소 사용하는 다섯 가지 감각처럼, 이 모델은 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 정보를 이해하고 처리할 수 있답니다. 


Q. 다섯 감각이라니, 인공지능이 감정도 느끼나요? 

아니요, 감정은 아니지만, Gemini는 정보를 처리하는 방식이 우리의 감각과 비슷해요. 예를 들어, 문서를 읽고, 그림을 보고, 음악을 듣는 것처럼요. 이 모델은 여러 형태의 정보를 종합적으로 이해하고, 그에 맞는 반응을 할 수 있답니다. 기존의 다른 인공지능과는 달리 여러 모드 (multimodal) 통합적으로 고려해서 설계되었어요.


Q. 혹시 Gemini가 마법도 부릴 수 있나요?

거의 마법 같은 기능이죠! Gemini는 50개 분야에서 인간 전문가 수준으로 성능을 발휘해요. 또한, 크기나 성능에 따라 다양한 버전이 있어서, 복잡한 작업부터 모바일 기기에서의 간단한 작업까지 다양하게 활용할 수 있어요.


Q. Gemini 에는 여러 버전이 있다던데, 어떤건가요?

맞아요! Gemini는 이용자들의 다양한 요구를 만족시키기 위해서 세 가지 버전으로 출시됐어요. 첫 번째는 'Gemini Ultra'로, 가장 강력한 성능을 자랑해요. 복잡한 작업에 최적화되어 있죠. 두 번째는 'Gemini Pro'인데요, 이건 광범위한 일반적인 작업에 최적화된 모델이랍니다. 마지막으로 'Gemini Nano'는 효율성을 중시하는 모델인데요, 모바일 기기와 같은 작은 디바이스에서도 뛰어난 성능을 보여줘요.


Q. 예를 들어 각 버전은 어떤 용도로 사용될 수 있을까요? 

'Gemini Ultra'는 어려운 데이터 분석이나 복잡한 알고리즘을 요구하는 작업에 적합하고요, 'Gemini Pro'는 기업의 빅데이터 분석이나 고급 연구에 활용될 수 있지요. 'Gemini Nano'는 모바일 앱이나 작은 디바이스에서의 간단한 음성 인식이나 이미지 처리 같은 작업에 유용하답니다.


Q. 이렇게 다양한 버전이 있는 게 이점이 되나요?

물론이죠. 버전이 다양하면 사용하는 사람들이 자기의 필요와 상황에 맞게 가장 적합한 모델을 선택할 수 있어요. 예를 들어서 아주 복잡한 작업을 수행해야 하는 연구소는 'Gemini Ultra'를, 일반적인 비즈니스 목적으로는 'Gemini Pro'를, 모바일 앱 개발자나 소형 디바이스 제작자는 'Gemini Nano'를 선택할 수 있겠죠.


Q. Gemini는 어떻게 이렇게 똑똑해진 건가요? 

Gemini는 처음부터 다양한 모드를 통합적으로 고려해서 설계됐거든요. 이전 모델들은 텍스트, 비전, 오디오 모델을 따로 만들고 나중에 합치는 방식이었는데, Gemini는 이런 한계를 넘어서며 더욱 효율적이고 정확한 반응을 보여줘요. 


Q. 앞으로 Gemini는 어디에 사용될까요? 

Gemini는 개발자나 기업에서 아주 창의적으로 활용하게 될 거예요. 예를 들어, 더 정교한 음성 인식, 더 정교한 이미지 분석, 심지어는 비디오 내용까지도 깊이있께 이해할 수 있죠. 정말 양한 분야에서 활용될 수 있어요.


Q: Gemini 안전하고 책임감 있게 만들었다고 들었어요. 

정말 중요한 부분이에요. 구글에서는 Gemini를 개발하면서 처음부터 안전성과 책임감 있는 사용을 고려했어요. 특히, 다양한 형태의 입력이 결합될 때 발생할 수 있는 문제들을 사전에 예측하고, 거기에 맞는 정책을 수립하는 등 엄격한 테스트를 진행했답니다.


Q. 자 그럼, 구체적으로 Gemini 를 실제로 어떻게 사용할 수 있는지 알려주세요. 

우리가 준비한 아래 비디오를 보면, Gemini 의 멀티모달이란 게 어떤 의미있지 이해하실 거에요. 너무 놀라지 마세요!


Hands-on with Gemini: Interacting with multimodal AI


◼︎ 오늘 발표된 구글의 발표 영상(영어)를 최대한 비전문가들도 이해하기 쉽게 인터뷰로 재구성했는데요, 어떠셨나요?

◼︎ 구글의 새로운 인공지능을 쉽게 이해하는 데 도움이 되셨다면 '좋아요' 와 '댓글'을 많이 달아주세요. 앞으로도 스마트워크와 관련된 중요한 정보를 알기 쉽게 설명하는데 큰 힘이 된답니다!!

◼︎ 위 내용은 제가 직접 번역한 내용으로 다른 곳에 복사할 수 없어요. 이 내용을 공유하고 싶다면 포스트의 주소로 직접 공유해 주세요~!!



매거진의 이전글 분리가 아닌 통합을 지향하는 '베타방식'
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari