brunch

You can make anything
by writing

C.S.Lewis

by delight Jun 17. 2023

AI와 블록체인이 만날 수 있는 4가지 교차로

학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 번역 과정에서 의미 전달이 애매한 일부 문장은 삭제했습니다. 이번 글은 멀티코인 캐피털 웹사이트에 올라온 글을 정리한 것 입니다.


암호화폐와 인공지능(AI)의 세계는 동시에 진화하고 있으며, 각 영역은 기술과 혁신의 경계를 넓혀가고 있다. 암호화폐와 AI가 계속 발전함에 따라 서로의 미래가 불가분의 관계에 있다는 것이 점점 더 분명해지고 있다. 이번 포스팅에서는 암호화폐와 AI의 교차점에 있는 네 가지 중요한 교차점을 살펴본다.


"그래픽 카드용 에어비앤비" 모델

AI와 머신러닝(ML) 워크로드 증가로 인해 Nvidia A100과 같은 고성능 GPU에 대한 수요가 급증하고 있다. 이에 대응해 "그래픽 카드용 에어비앤비"와 같은 새로운 시장이 등장했다. 이를 통해 개인과 조직들은 사용하지 않는 GPU 리소스를 대여해 AI 연구자 및 개발자 수요를 맞춰줄 수 있다.


이는 시장 역사상 정말 특별한 순간이다. ChatGPT가 출시되기 전 이미 GPU 공급은 부족했다. 그 이후 수요는 최소 10배에서 최대 100배까지 증가했을 것이다. 게다가 AI 모델들은 훈련 규모에 따라 향상되므로, 모델 품질에 대한 선형적 향상을 위해 GPU 컴퓨팅에 대한 수요가 기하급수적으로 증가하고 있다. 총공급이 수요를 크게 앞지르고 있음에도 상품에 대한 수요가 사용 가능한 공급량을 크게 앞지른 적은 거의 없었다. 오늘날 지구상에 있는 모든 GPU가 AI 추론 및 훈련에 사용 가능하다면, 공급 부족이 아니라 오히려 과잉 상태가 될 것이다.


그러나 "그래픽 카드용 에어비앤비" 개념을 탐구할 때 고려해야 할 몇 가지 주요 기술적 과제들이 있다. 


모든 그래픽 카드들이 모든 워크로드들을 지원할 수 있는 것은 아니다.: 그래픽 카드는 다양한 형태, 크기, 사양으로 제공된다. 따라서 일부 GPU들은 특정 AI 작업을 처리하지 못할 수도 있다. 이 모델이 성공하려면 적절한 GPU 리소스를 적절한 AI 워크로드와 매칭할 수 있는 방법이 필요하다. 시장이 성숙해짐에 따라 다양한 AI 작업에 대한 그래픽 카드 전문화 및 최적화가 더욱 가속화될 것으로 예상된다.


더 높은 지연 시간을 수용하도록 훈련 프로세스 조정: 오늘날 대부분 기본 모델( foundation models)들은 지연 시간이 매우 짧은 GPU 클러스터에서 학습된다. 분산 환경에서는 GPU가 여러 위치에 분산되어 있고 공용 인터넷을 통해 연결될 가능성이 높기 때문에 지연 시간이 몇 배로 증가한다. 이러한 문제를 극복하기 위해 지연 시간이 긴 연결을 가정한 새로운 트레이닝 프로세스를 개발할 수 있는 기회들이 있다. AI 모델을 훈련하는 방식을 재고함으로써 대규모 GPU로 구성된 분산형 클러스터를 더 잘 활용할 수 있다.


검증 문제: 신뢰할 수 없는 컴퓨터가 특정 코드를 실행했는지 여부를 알 수 없다. 따라서 신뢰할 수 없는 컴퓨터 출력을 신뢰하기 어려울 수 있다.그러나 이 문제는 암호자산 스테이킹과 결합된 평판 시스템을 통해 완화될 수 있으며, 경우에 따라서는 빠른 검증을 가능하게 하는 새로운 유형 모델을 통해 완화될 수도 있다.


이 분야에서 훈련과 추론을 연구하는 팀들이 꽤 많이 있다. 멀티코인 캐피털은 원래 3D 렌더링에 초점을 맞춘 렌더 네트워크( Render Network)에 투자했으며, 이후 GPU 네트워크를 개방해 AI 추론도 지원하고 있습니다.


렌더 네트워크 외에도 이 분야에서 활동하는 몇몇 기업들이 있다.: 아카시(Akash) 비트텐서(BitTensor), 젠슨( Gensyn), 프로디아(Prodia), 투게더( Together) 그리고 아직 베일에 가려져 있는 다른 프로젝트들도 있다.


토큰 인센티브화 인간 피드백 강화 학습(RLHF: Token-Incentivized Reinforcement Learning from Human Feedback)

토큰 인센티브화는 인간 피드백을 통한 강화 학습(RLHF) 모든 용도에 적용되지는 않을 것이다. 문제는 토큰 인센티브화가 RLHF에 적합한 경우와 현금 지급(예: USDC)을 대신 사용해야 하는 경우를 고려할 때 어떤 프레임워크를 사용할 수 있는가 하는 것이다.


토큰 인센티브화는 다음과 같은 사항들이 현실화될수록 RLHF를 개선할 가능성이 높다.


모델이 더 좁고 수직적인 모델이 될 경우(예: ChatGPT와 같이 일반적이고 수평적인 모델과 반대). RLHF를 주된 직업으로 삼고 있고, 따라서 대부분의 수입을 RLHF 제공을 통해 창출하는 사람이라면 집세와 식료품 구입을 위해 현금을 원할 가능성이 높다. 일반적인 질문에서 벗어나 보다 구체적인 도메인 영역으로 이동함에 따라 모델 개발자는 전체 비즈니스 기회의 장기적인 성공에 기득권을 가질 가능성이 더 높은 고도로 훈련된 인력의 참여가 필요할 것이다.


RLHF를 제공하는 인력들 소득이 높을수록 RLHF 업무 자체 수입도 높아진다. 도메인별 RLHF 모델에 의미 있는 시간을 투자하는 위험을 정당화할 만큼 충분한 소득이나 다른 노력으로 인한 저축이 있는 경우에만 현금 대신 동결/유동성 토큰을 보상으로 받을 수 있다. 성공 확률을 극대화하기 위해 모델 개발자는 도메인별 RLHF를 제공하는 작업자에게 잠금 해제된 토큰만 지급해서는 안 된다. 대신, 장기적인 의사 결정을 장려하기 위해 일정 기간 동안 토큰들 소유권을 부여해야 한다.


토큰 인센티브형 RLHF 모델이 적용될 수 있는 몇 가지 산업은 다음과 같다.


의료: 사람들은 경량, 응급 대응 진단뿐만 아니라 장기적인 예방 및 장수 중심 의학을 위해 LLM에 참여할 수 있어야 한다.

법률: 비즈니스 소유자와 개인은 다양한 이질적인 법률 시스템 복잡성을 보다 효과적이고 효율적으로 탐색하기 위해 LLM을 사용할 수 있어야 한다.

엔지니어링 및 건축: 설계 도구 또는 시뮬레이션 모델 향상.

금융 및 경제: 예측 모델, 위험 평가, 알고리즘 거래 시스템 개선.

과학 연구: 실험 시뮬레이션, 분자 상호 작용 예측, 복잡한 데이터 세트 분석을 위한 AI 모델 개선.

교육 및 훈련: 교육 콘텐츠 품질과 효과를 향상시키기 위해 AI 기반 학습 플랫폼에 기여해야 한다.

환경 과학 및 지속 가능성: 환경 동향을 예측하고 자원을 할당하며 지속 가능한 관행을 촉진하기 위해 AI 모델을 최적화한다.


토큰 인센티브형 RLHF가 이미 생산되고 있는 한 가지 분야가 있다: 지도. 하이브매퍼(Hivemapper)는 운전자 뿐만 아니라 매핑 데이터를 편집하고 큐레이팅하는 데 시간을 투자하는 지도 편집자에게도 보상을 제공한다. 하이브매퍼 지도 AI 트레이닝 도구를 사용해 직접 사용해 볼 수 있다.


영지식 머신러닝(zkML)

블록체인은 현실 세계에서 무슨 일이 일어나고 있는지 알지 못한다. 그러나 체인 외부에서 발생하는 이벤트를 알면 IRL(L: In Real Life) 상태에 기반해 프로그래밍적으로 가치를 움직일 수 있으므로 매우 유용할 수 있다.


오라클은 이 문제 일부를 해결한다. 하지만 오라클만으로는 충분치 않다. 단순히 IRL 데이터를 체인에 전달하는 것만으로는 부족하다. 체인에 전달되기 전에 많은 데이터를 계산해야 한다. 예를 들어, 더 많은 수익률을 얻기 위해 다양한 풀(Pool)들 간에 예치금을 이동해야 하는 수익률 애그리게이터를 생각해보자. 신뢰가 최소화되는 방식으로 예금을 이동하려면 애그리게이터는 사용 가능한 모든 풀들 현재 수익률과 리스크를 계산해야 한다. 이는 곧 최적화 문제로 바뀌며, 이것은 머신러닝에 적합하다.그러나 ML을 온체인에서 계산하기에는 비용이 너무 많이 들기 대문에, zkML에게 기회일 수 있다.


모듈러스 랩스와 같은 팀들이 현재 이 분야에 뛰어들고 있다. 우리는 더 많은 팀들이 리스크 제로(Risc Zero)와 러크(Lurk)와 같은 범용 ZKVM을 사용해 이 영역에서 구축에 나설 것으로 보고 있다.


딥 페이크 시대 진본성 확보

딥 페이크가 점점 더 정교해짐에 따라 디지털 미디어 진위 여부와 신뢰를 유지하는 것이 무엇보다 중요해졌다. 한 가지 해결책은 공개 키 암호화를 활용해 크리에이터들이 자신의 공개 키로 서명함으로써 콘텐츠 진위 여부에 자신의 평판을 걸 수 있도록 하는 것이다.


공개 키만으로는 진위 문제를 해결하기에 충분하지 않다. 공개 키를 실제 신원과 매핑해 검증하고 신뢰를 구축할 수 있는 공개 기록이 있어야 한다. 공개키를 검증된 신원과 연결하면 누군가가 딥페이크 이미지나 동영상에 서명하는 등 키를 오용하는 행위가 적발될 경우 피드백 및 처벌 시스템을 구축할 수 있다.


이 시스템이 효과적으로 작동하려면 공개 키 서명과 실제 신원 확인을 통합하는 것이 중요하다. 많은 암호화폐 시스템을 뒷받침하는 블록체인 기술은 탈중앙화된 위변조 방지 신원 레지스트리를 만드는 데 중요한 역할을 할 수 있다. 이 레지스트리는 공개 키를 실제 신원에 매핑해 신뢰를 구축하고 악의적인 행위자에게 책임을 묻는 것을 쉽게 할 수 있다.


이 레지스트리는 임베디드 하드웨어와 사용자 제어 소프트웨어 등 최소 두 가지로 구성된다.


임베디드 하드웨어: 스마트폰과 기타 디바이스들에 이미지, 동영상 및 기타 미디어를 위한 하드웨어 기반 서명 기능들이 곧 통합될 것으로 전망된다. 솔라나 랩스는 최근 솔라나 모바일 스택(SMS)으로 구동되는 사가 폰을 출시했다. 우리는 앞으로 몇 달 안에 모든 사진들이 SMS 시드 볼트(SMS seed vault) SDK를 사용해 서명돼 해당 사진이 AI에 의해 생성되지 않았음을 증명할 수 있게 SMS가 업데이트될 것으로 예상하고 있다.


사용자 제어 소프트웨어: 사람들은 포토샵, 옥테인과 같은 디자인 도구와 스테이블 디퓨전과 같은 이미지 생성 AI를 사용해 아트를 제작하게 될 것이다. 이들 소프트웨어 제공업체는 공개 키 암호화 메커니즘을 통합해 크리에이터들이 제작 과정에서 이들 도구를 썼음을 인정하면서 진위 여부를 입증할 수 있도록 할 것으로 전망된다.


결론

결론적으로, 암호화폐와 인공지능 기술의 융합은 여러 산업에서 시급한 과제들을 해결하고 혁신적인 솔루션을 실현할 수 있는 풍부한 기회를 제공한다. 이들 분야 교차점들을 살펴봄으로써 인공지능 훈련에서 리소스 할당을 최적화하고, 인간 피드백을 통한 도메인별 강화 학습에 토큰 인센티브를 활용하며, 딥페이크에 맞서 디지털 미디어 진위성을 유지할 수 있는 새로운 방법을 찾을 수 있다.


그래픽 카드용 에어비앤비 모델은 고성능 GPU에 대한 액세스를 분산하고 민주화해 더 많은 사람과 조직들이 AI 연구와 개발에 기여할 수 있는 잠재력을 제공한다. 토큰 인센티브 기반 RLHF는 엔지니어링과 금융에서 교육과 환경 과학에 이르기까지 다양한 산업에 적용될 수 있으며, 도메인 전문가들 지식을 활용해 AI 모델을 개선할 수 있게 해준다. ZKML은 현실 세계 복잡한 변화에 따라 체인 파이낸셜 상태를 업데이트할 수 있게 해준다. 마지막으로, 공개 키 암호화를 실제 신원 확인 및 블록체인 기술과 통합함으로써 딥 페이크가 제기하는 문제를 해결하고 디지털 미디어에 대한 신뢰를 유지할 수 있는 강력한 시스템을 구축할 수 있다.


크립토와 AI의 시너지 효과를 계속 발견해 나가면서 혁신을 주도하고 가치를 창출하며 오늘날 사회가 직면한 가장 시급한 문제들을 해결할 수 있는 더 많은 기회를 발견할 것입니다. AI와 블록체인의 교차점을 포용하면 기술 경계를 넓히고 더욱 연결되고 효율적인 미래를 설계하는데 도움이 될 것이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari