기후변화 대응과 도시 지속 가능성을 위하여
데이터 과학자이자 데이터 엔지니어로서 기후변화와 도시 지속 가능성 문제 해결에 기여하고 싶다면, 다양한 오픈소스 프로젝트에 참여하는 것이 큰 도움이 될 수 있다. 오픈소스(Open Source)는 누구나 자유롭게 사용, 수정, 배포할 수 있도록 공개된 소프트웨어의 소스 코드를 의미한다. 일반 소프트웨어와 달리 오픈소스는 코드가 공개되어 있어, 개발자나 사용자가 직접 코드에 접근하여 기능을 수정하거나 개선할 수 있다.
오픈소스 라이선스는 소프트웨어를 누구나 자유롭게 사용할 수 있도록 허용하며, 원하는 대로 배포할 수도 있다. 예를 들어, 한 사용자가 소프트웨어를 다운받아 개선한 후 이를 다시 공개하는 것도 가능하다. 보통 사이드 프로젝트는 혼자 하는 경우가 많아 다른 사람들과의 협업이 어려운데, 오픈소스 프로젝트는 보통 전 세계 개발자들이 협업을 통해 발전시켜 나가므로, 다양한 배경과 전문성을 가진 사람들이 참여해 프로젝트의 완성도를 높여가며, 누구나 버그 수정, 기능 추가 등 다양한 방식으로 기여할 수 있다. 그리고 보통 개발자 커뮤니티의 활동으로 유지되고 발전되므로, 커뮤니티를 통해 비단 코드 작성뿐 아니라, 문서화, 지원, 교육 자료 작성 등을 통해 프로젝트 발전에 기여하며 자연스럽게 비슷한 관심사를 가진 개발자분들과 교류할 수도 있다.
기후변화와 Urban Sustainability 관련 주목할 만한 최신 오픈소스 프로젝트들을 공유한다. 이 프로젝트들은 기후 데이터 처리, 지리공간 데이터 분석, 도시 시뮬레이션 등 다양한 분야에 걸쳐 있어 데이터 과학 및 데이터 엔지니어링 스킬을 적극 활용할 수 있다.
Google Earth Engine은 구글이 제공하는 대규모 환경 데이터 분석 플랫폼으로, 전 세계의 기후 및 지리공간 데이터를 수집하고 분석할 수 있는 기능을 제공한다. 연구자와 데이터 과학자들이 GEE를 활용해 기후 데이터와 지리 데이터를 시각화하고 분석할 수 있어, 환경 연구에 최적화된 플랫폼이다. 코드 스니펫, 분석 라이브러리 개선, 시각화 도구 개발 등에 기여할 수 있다. 환경 데이터를 쉽게 불러와 분석하는 작업에 기여하여, 기후변화 대응 연구와 관련된 실질적인 경험을 쌓을 수 있다.
OpenStreetMap은 전 세계 누구나 접근 가능한 지리 데이터를 제공하는 오픈소스 프로젝트로, 도로, 건물, 지형 정보 등을 포함한 지리 데이터를 제공한다. 이 데이터는 도시 교통, 환경 연구, 인프라 구축 등에 널리 활용된다. 특히 도시 지속 가능성과 관련된 분석이나 시뮬레이션에 필수적인 데이터라서 도시공학을 전공한 사람으로서는 매우 흥미로운 오픈소스다. 지리 정보 추가, 데이터 정교화, 또는 기후 모델링을 위한 확장 작업을 함으로써 기여할 수 있다. 도시 및 교통 관련 문제를 직접적으로 다루는 프로젝트에 기여함으로써, 데이터 엔지니어링 관점에서도 역시 도시 환경 개선을 위한 실무 경험을 쌓을 수 있다. OpenStreetMap과 관련된 수천개의 파생 Github repository들이 있다는 점도 흥미롭다. 그만큼 응용 가능성이 높다는 거니까.
MIT의 Climate Machine (CLIMA) 프로젝트는 고정밀 기후 모델링을 통해 기후 변화를 예측하고 대응하기 위한 프레임워크를 제공한다. 주로 물리적 모델링과 시뮬레이션에 중점을 두고 있어, 기후 변화의 영향을 데이터로 확인하고 분석할 수 있는 도구이다. 조금 더 이론적인 기여(e.g. 수학 모델링 개선, 데이터 최적화, 시각화 기능 확장 등)를 할 수 있고, 기후 변화 연구의 핵심인 시뮬레이션 모델을 다루면서 데이터 과학과 모델링 실력을 쌓을 수 있다. 가령, ClimaAtmos.jl은 대기 순환을 모델링하기 위한 Julia 언어 기반의 라이브러리고, 이 라이브러리는 데이터 동화(관측된 데이터와 모델 데이터를 결합해 예측 정확도를 높이는 기술)와 머신러닝 도구들을 효과적으로 사용할 수 있도록 설계되어 있으며, 누구나 프로젝트에 기여할 수 있다. 관심 있는 분들은 CLIMA Github 을 직접 클릭해보시길!
CityFlow는 도시 교통 시뮬레이션을 위한 오픈소스 엔진으로, 교통 혼잡 문제를 해결하고 효율성을 높이기 위해 도시 내 교통 흐름을 분석하는 도구이다. 스마트 시티와 도시 지속 가능성 연구에 최적화되어 있으며, 다양한 교통 시나리오를 모델링할 수 있다. 교통공학과 긴밀하게 연관되어 있는 오픈소스이다. 따라서 교통 데이터 분석 최적화, 새로운 시뮬레이션 시나리오 추가 및 성능 개선을 통해 기여할 수 있으며, 도시 교통 문제를 데이터 과학적으로 접근하여 기여할 수 있어, 실질적인 도시 문제 해결 경험을 쌓을 수 있다.
탄소 발자국 계산기 프로젝트는 개인 또는 기업의 탄소 배출량을 쉽게 계산하여 환경적인 책임감을 높일 수 있도록 돕는 도구이다. 이러한 오픈소스 프로젝트는 기업이나 개인이 탄소 배출량을 추적하고 감축할 수 있도록 한다. 데이터 수집 및 처리 최적화, 보고서 자동화, 대시보드 개발 등을 통해 기여할 수 있다. 탄소 배출량 측정을 보다 정밀하게 하려는 시도는 최근 다양한 산업군을 막론하고 큰 화두이며, 앞으로도 환경 보호 및 기후 변화 대응에 직접적이고 가시적으로 기여할 수 있는 주제이기도 하다. 95%의 언어가 Java로 되어 있다. 포럼도 정기적으로 열리고 네트워킹 활동도 활발하게 이루어지는 것 같다.
DataHub은 Linkedin이 개발한 데이터 검색과 메타데이터 관리에 특화된 오픈소스 프로젝트로, 데이터를 쉽게 관리하고 검색할 수 있다. 기후 데이터와 도시 데이터를 효율적으로 관리하고 공유하는 데 유용하며, 데이터 과학 및 엔지니어링 팀 간의 협업을 위한 도구로 각광받고 있다. 기후 및 도시 데이터 메타데이터 관리 기능 및 확장, 데이터 검색 최적화 등의 주제에 기여함으로써 대규모 데이터를 관리하는 실무 능력을 키우고, 기후 및 도시 연구에 필요한 데이터를 손쉽게 검색하고 관리하는 데 기여할 수 있다. Java, Python, TypeScript 등의 언어가 고루 사용되고 있다.
오늘 Open Climate Fix 라는 비영리 연구 단체의 오픈소스에 커밋을 했다! `good first issue`라고 라벨링된 issue들부터 해결해보자. 오픈소스에 어떻게 기여하는지에 관한 포스팅은 나중에 자세히 다뤄보겠다.