brunch

AI 시대의 데이터 혁명

DeepSeek 3FS가 바꾸는 분산 파일 시스템의 패러다임

by Dennis Kim

AI 시대의 데이터 혁명

- DeepSeek 3FS가 바꾸는 분산 파일 시스템의 패러다임


글로벌 AI 경쟁이 치열해지는 가운데, 데이터 처리 효율성은 성공의 핵심 열쇠로 부상했습니다. 이에 중국의 AI 기업 딥시크(DeepSeek)가 공개한 3FS(Fire-Flyer File System)는 AI 워크로드에 특화된 분산 파일 시스템으로 주목받으며, 기존 솔루션과의 차별화된 혁신을 선보이고 있습니다.


한 줄 요약: 초단타 매매 트레이딩 시스템 개발로 다져지고 효율을 위해 범용성이 떨어지는 노가다를 두려워하지 않는 중국 개발 인프라가 부러울 따름.


1. AI 최적화 아키텍처: 속도와 일관성의 균형

3FS는 RDMA 네트워크와 NVMe SSD를 활용해 초고속 데이터 전송을 실현합니다. 특히 AI 학습 시 필수적인 대규모 데이터 셔플링과 체크포인트 저장을 위해 설계된 CRAQ(Chain Replication with Apportioned Queries) 프로토콜은 강력한 일관성을 보장하면서도 읽기 처리량을 극대화합니다. 예를 들어, 180개 스토리지 노드에서 6.6TiB/s의 처리량을 기록하며, 이는 기존 시스템 대비 30% 이상의 비용 효율성을 자랑합니다.

또한, 메타데이터 관리를 FoundationDB 기반의 키-값 저장소로 분리해 스테이트리스 아키텍처를 구현함으로써 확장성과 장애 복구 능력을 높였습니다. 이는 전통적인 파일 시스템인 HDFS나 러스터와 달리, AI의 동적 데이터 요구에 유연하게 대응할 수 있는 구조입니다.


2. 하이브리드 클라이언트: 편의성과 성능의 양립

3FS는 FUSE 클라이언트를 통해 기존 애플리케이션과의 호환성을 유지하면서도, 성능-critical 작업을 위한 네이티브 클라이언트를 별도로 제공합니다. 네이티브 클라이언트는 Linux의 io_uring에서 영감을 받은 비동기 제로-카피 API를 사용해 FUSE의 메모리 복사 오버헤드를 제거하며, RDMA를 통해 데이터 접근 지연 시간을 최소화합니다. 이는 JuiceFS가 객체 스토리지에 의존하는 것과 달리, 로컬 SSD의 물리적 성능을 직접 활용하는 차별점입니다. 이런 저수준 접근은 성능을 우선시하는 초단타 매매 트레이딩 개발에서 얻은 기술 노하우와 경험을 활용한 것으로 보입니다.


3. 현실적 문제 해결: 데이터 불균형과 복제 관리

AI 학습 시 빈번히 발생하는 데이터 불균형 문제를 해결하기 위해 3FS는 라운드 로빈 방식의 체인 선택 전략과 랜덤 셔플링을 결합합니다. 파일 생성 시 체인을 순차적으로 할당하고 무작위로 재배치함으로써 스토리지 노드 간 부하를 균등하게 분산시킵니다. 또한, CRAQ의 체인 복제 방식을 통해 장애 발생 시 복구 트래픽을 자동으로 분산시키며, 전체 시스템의 안정성을 유지합니다.


4. 오픈소스 생태계: 유연성과 협업의 장

3FS는 완전한 오픈소스로 공개되어 개발자 커뮤니티의 참여를 유도합니다. 이는 AWS FSx for Lustre나 구글 Colossus 같은 독점 솔루션과 달리, 사용자가 시스템을 자유롭게 커스터마이징할 수 있다는 장점입니다. 특히, 메타데이터 서비스와 스토리지 계층의 분리 설계는 클라우드와 온프레미스 환경 모두에서 유연한 배포를 가능케 합니다.


5. 한계와 전망: AI 특화 시스템의 도전

3FS는 AI 워크로드에 최적화된 대신 범용성은 떨어집니다. 예를 들어, 작은 파일의 빈번한 수정이 발생하는 일반적인 엔터프라이즈 환경보다는 대용량 데이터의 일괄 처리에 적합합니다. 또한, RDMA와 고성능 SSD 인프라가 필수적이라 초기 구축 비용이 높을 수 있다는 점은 고려해야 할 과제입니다.


맺으며, AI 인프라의 새로운 기준

DeepSeek 3FS는 단순히 파일 시스템을 넘어 AI 생태계의 핵심 인프라로 자리매김하고 있습니다. Ceph, GlusterFS와 같은 기존 솔루션이 범용성에 초점을 둔다면, 3FS는 AI의 특수한 요구사항인 빠른 데이터 접근, 강력한 일관성, 대규모 확장성에 집중해 차별화된 가치를 창출합니다. AI 연구자와 데이터 엔지니어라면 3FS의 혁신적인 설계를 주목해야 할 시점입니다.


DeepSeek 3FS 공식 문서 (별칭 - 우리는 외계인 고문을 이렇게 했어요):

https://github.com/deepseek-ai/3FS


Hacker News 아키텍처 분석 (별칭 - 미친놈들아!!!!):

https://news.ycombinator.com/item?id=43716058


JuiceFS 비교 연구(별칭 - 인공지능 성능을 위해 중국 개발자들은 뭐든 다 한다):

https://juicefs.com/en/blog/engineering/deepseek-3fs-vs-juicefs-architecture-feature


keyword
작가의 이전글할 수 있다고