1
전통적인 ML 모델 수행은?
TASK 정의 하기 = 요약을 할지, 번역을 할지 준비
데이터 준비
레이블링
훈련
훈련 모델을 배포
특정 TASK에 맞춰 업무를
2
생성형 AI 는?
테라바이트를 미리 모델 훈련.
수십억개의 매개 변수를 보유 한다.
여러 TASK 를 한번에 수행 가능하다.
1
애플리케이션 레이어?
예) 아마존 알렉사 , chatgpt
2
모델 레이어 ?
독점 모델 = 아마존 타이탄, 클로드 = API 를 통해 접근
오픈 소스 파운데이션 모델, 스테이블 디퓨전 등 = 자체 호스팅, 관리 ----- 아마존 세이즈 메이커 /점프스타트 등을 통해 접근, 허깅페이스등 허브를 통해 접근
1
프롬프트 ?
잘 입력하면 모델로 부터 정확한 답변 준다.
2
파인 튜닝 ?
추가로 프리 트레이닝 한다.
모델 자체를 변경한다.
3
RAG ?
모델 자체는 유지한다.
외부 데이터 소스로 보강한다.
4
AI 코드 도움이 = Amazon Q Developer
5
아마존 베드락 ?
서버리스 서비스
사용하지 않으면 비용이 나가지 않는다.
아마존 베드락 사용법1
콘솔 - 플레이 그라운드에서 사용한다.
아마존 베드락 사용법2
파운데이션 모델을 커스터마이징 해본다.
외부 데이터 소스를 연결해 RAG 사용.
아마존 베드락 오케스트레이션을 사용 = 에이전트 사용
6
접근 방식 순서 ?
문서가 있다.
벡터로 변환 해야 한다.
임베딩 모델이 필요. 임베딩 모델은 사이즈 용량이 있다.
따라서 문서를 나눠줘야 한다. 정킹
벡터 데이터 베이스에 저장
벡터들 ~
1024차원의 데이터를 벡터 데이터 베이스에 저장.
7
랭체인은 베드락과 벡터데이터 베이스사이에서 오케스트레이션을 한다.
벡터 데이터베이스에서 질의를 한다. = 검색.
8
베드락에 검색하면 증강이 된다.
세이즈 메이커 노트북에서 확인한다.
9
동작은 ?
플레이 그라운드에서 확인한다.
10
동작 설명?
원하는 데이터가 있는 문서가 있다.
청킹을 했다.
타이탄 모델을 사용헤 벡터를 만들었다.
1024 차원의 벡터를 벡터 데이터베이스(파인콘)에 저장을 했다.
랭체인 사용
랭체인을 이용해 응답을 받아 보자.
1
Developer Experience - Amazon Q Developer - Deep Dive
https://catalog.workshops.aws/devexp-qbuilder/en-US
2
Amazon Bedrock Workshop
https://catalog.us-east-1.prod.workshops.aws/workshops/a4bdb007-5600-4368-81c5-ff5b4154f518/en-US
3
Generative AI on Amazon SageMaker - Workshop
https://catalog.us-east-1.prod.workshops.aws/workshops/972fd252-36e5-4eed-8608-743e84957f8e/en-US
다음
https://brunch.co.kr/@topasvga/3992
감사합니다.