brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Mar 24. 2024

AWS 48탄-4. 툰스퀘어의 이미지 생성 모델LoRA

세이즈 메이커 알아보자.

튠스퀘어(Toonsquare)의  text to image 서비스 알아보자.

자동화 알아보자.



<1> Amazon SageMaker

<2> 튠스퀘어(Toonsquare) 소개

<3> 모델 학습 및 배포 자동화를 위한 EventBridge활용

<4> 활용 및 효과 

<5> 실 서비스에서의 팁





<1> Amazon SageMaker



1

Amazon SageMaker는 ML개발 및 배포의 모든 영역을 담당한다.

SageMaker에서는 데이터를 처리하고 모델을 학습, 튜닝, 평가하고 배포하는 일련의 과정들을 코드로 자동화하고 CI/CD를 구성할 수 있도록 SageMaker Popeline SDK를 제공하고 있다.



2

Amazon SageMaker > SageMaker Studio 사용한다.




3

추론 유형




<2> 튠스퀘어(Toonsquare) 소개



1

튠스퀘어(Toonsquare)의  text to image 서비스 알아보자.



2

튠스퀘어에서는 3가지 서비스를 제공한다.

이미지를 편집하거나 웹툰에 필요한 요소를 추가하는 튜닝에디터

사용될 이미지를 생성하는 튜닝 매직

이를 통해 만들어진 웹툰을 공유하는 튜닝 월드로 구성되어 있다.




웹툰 제작에 최적화되어 있다.

브라우저로 쉽게 이용가능한 서비스형 소프트웨어로 구축되어 있다.

웹툰에 주력하고 있다.

한 화를 일주일 내에 납품해야 하는 압박.

생성형 AI를 활용하여 웹툰 제작 효율성을 극대화하려고 하고 있다.




3

LoRA학습?

사전 훈련된 가중치를 고정하고, 일부 레이어에 학습 가능한 새로운 레이어 가중치를 주입하는 방식입니다.

이러한 방식으로 모델이 학습할 파라미터의 수가 크게 줄어들어 학습 속도가 매우 빠릅니다.

GPU요구사항이 매우 감소된다.

LoRA 학습물의 결과는 MB단위로 작다는 특징이 있다.

사용자에게 다양한 스타일을 제공하고 위해서는 반복적인 LoRA학습이 필수이다.

이 반복을 SageMaker를 이용한 자동화 파이프라인을 구축한 이유이다.



4

변경 전

담당자가 스텝 순서로 진행함.

데이터 준비 > 데이터 처리  > 트레이닝 > 모델준비 > 모델 배포



변경 후 

자동화함.





5

SageMaker에서의 ML 파이프 라인.


자동화 아키텍처.

데이터 준비 > 데이터 처리  > 트레이닝 > 모델준비 > 모델 배포





6

SageMaker에서의 ML 파이프라인 생성은?

SageMaker Studio 내 노트북에서 파이썬용 AWS SDK인 boto3와  SageMaker python SDK를 이용해 생성할 수 있다.

boto3로 AWS 다른 리소스를 사용한다. = S3로 데이터 셋을 업로드 등



7

ML파이프라인?

유효성 검사 - 조건이 맞지 않는지 확인. - 조건에 맞지 않는 것 수정가능.

트레이닝 - 인스턴스 타입, 인스턴스 수 등 파라미터 생성하여 트레이닝 잡을 생성 - 결과는 S3에 업로드됨.

모델 아티팩스 - 결과 파일 등으로 구성된다. -S3에 업로드된다.

모델 생성.

엔드포인트 생성.





모니터링은?






<3> 모델 학습 및 배포 자동화를 위한 EventBridge활용



1

이벤트 브리지는?

S3의 이벤트를 기반으로 자동화의 트리거 역할을 담당한다.


2

API Gateway는?

클라이언트로부터 들어온 이미지 생성요청을 각 SageMaker endpoint로 보내고 생성된 결과이미지를 다시 클라이언트로 반환합니다.




<4> 활용 및 효과 



1

개발 주기 60% 감축

자동화를 통해 인적 리소스 절감 - 모델 개선이나 아이디어에 할애 - 데이터 전처리등 시간 단축.

새로운 테스트 시간 줄어듦 - 자동화.





<5> 실 서비스에서의 팁


1

데이터 준비 과정의 자동화를 추천하지 않음.

결과물의 퀄리티와 직결되는 과정이라 명확할 필요가 있음.

초기 자동화 툴 사용 시, 사람 이미지의 경우 머리가 긴 남자를 여자로 인식하는 경우가 있음.



2

학습 파라미터 최적화는 테스트해서 확인해야 함

이에 따른 인스턴스 선정이 필요함.



3

필요에 따른 서비스 리밋 상향 검토 

예) 동시작업 필요시에 Training job 사용한도를 기본 1 -> 5로 변경 필요.


https://docs.aws.amazon.com/general/latest/gr/sagemaker.html



다음 AI

https://brunch.co.kr/@topasvga/3686


감사합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari