brunch

You can make anything
by writing

C.S.Lewis

by 순전한작업실 May 08. 2024

파라미터와 하이퍼 파라미터

챗GPT와 같은 인공지능 서비스가 상용화되면서 파라미터와 하이퍼 파라미터라는 용어가 자주 들리기 시작했죠.



파라미터와 하이퍼 파라미터는 비슷하지만 다른 개념인데요, 인공지능 분야에 한해서 간단하게 차이점을 알아볼까요?





파라미터(parameter)


© freepik



 파라미터를 우리말로 번역하면 매개변수(媒介變數)라고 합니다. 다른 말로 모수(母數)라고도 하는데,수학과 통계학에서 어떠한 함수의 특정한 성질을 나타내는 변수 말합니다.


파라미터는 인공지능 시스템이나 모델의 결과값을 조절하는 요소라고 볼 수 있습니다.


챗GPT와 같은 인공지능 예측 모델에서 파라미터는 새로운 데이터 샘플이 주어질 때 무엇을 예측할지 결정할 수 있게 하는 역할을 합니다. 파라미터 수가 많을 수록 정교한 학습이 가능해 인공지능의 성능이 높아집니다.


파라미터는 인공지능 모델 내부의 데이터로부터 추출되는 값인만큼 이용자가 임의로 조절할 수 없습니다.





하이퍼 파라미터(Hyper Parameter)


© freepik


 하이퍼 파라미터란 인공지능의 머신러닝에서 최적의 훈련 모델을 구현하기 위해 모델에 설정하는 변수를 말합니다. 챗GPT와 같은 인공지능 서비스에서 쓰이는 writing style, tone, temperature 등과 같이 이용자의 요구에 맞는 최상의 결과물을 얻기 위해 설정할 수 있는 요소죠.



따라서 하이퍼 파라미터는 파라미터와 달리 인공지능 모델을 이용하는 개발자나 이용자가 조정 가능하고, 이용자가 설정하는 하이퍼 파라미터 값에 따라 인공지능 모델은 다양한 결과값을 내놓게 됩니다.  


챗GPT와 같은 인공지능을 이용해 원하는 정보를 얻기 위해서는 하이퍼 파라미터를 정교하게 설정할 수 있는 능력이 요구되겠죠. 





파라미터와 하이퍼 파라미터에 대한 자세하고 전문적인 내용을 다룬 블로그 글들을 아래에 링크합니다.

참고하시길 바랍니다.


↓↓↓


[ML]4-1.머신러닝에서의 하이퍼 파라미터란 무엇일까?


구글, 네이버, LG 등 국내의 초거대 AI 개발ㅣ딥러닝ㅣ파라미터ㅣ람다ㅣ하이퍼클로바ㅣOpenAI - 투이컨설팅 (2e.co.kr)



매거진의 이전글 정보 검색, 어떻게 변해왔을까?

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari