2020년 3월 25일(수) 구글 AI 리서치 블로그
높은 정확도로 몇 분에서 몇 주까지 날씨를 예측하는 것은 사회의 여러 측면에 광범위한 영향을 미칠 수 있는 근본적인 과학적 과제입니다. 수많은 기상청에서 채택한 현재 예측은 지난 수십 년 동안 실질적으로 개선 되었음에도 불구하고 본질적으로 계산 요구 사항에 의해 제약을 받으며 대기를 지배하는 물리 법칙의 근사치에 민감한 대기의 물리적 모델을 기반으로 합니다. 이러한 제약 조건 중 일부를 극복할 수 있는 기상 예측에 대한 대안은 심층 신경망(DNN, deep neural network)을 사용합니다. DNN은 명시적인 물리 법칙을 인코딩하는 대신 GPU 및 TPU와 같은 강력한 특수 하드웨어에서 병렬 계산을 사용하여 데이터의 패턴을 발견하고 입력에서 원하는 출력으로 복잡한 변환을 학습합니다.
우리는 현재 강수량 예보(nowcasting)에 대한 이전 연구를 바탕으로 “MetNet: 강수량 예측을 위한 날씨 신경망 모델(MetNet:A Neural Weather Model for Precipitation Forecasting)”을 제시합니다. DNN은 미래 최대 8시간의 시간 단위로 2분 간격으로 1km 해상도에서 미래의 강수를 예측할 수 있습니다. MetNet은 NOAA에서 현재 사용중인 최첨단 물리 기반 모델보다 7 ~ 8 시간 빠른 예측 시간을 능가하며 1시간이 아닌 몇 초 만에 미국 전체를 예측합니다. 네트워크에 대한 입력은 사람 어노테이터없이 레이더 스테이션과 위성 네트워크에서 자동으로 공급됩니다. 모델 출력은 각 지리적 지역에서 관련 불확실성과 강수량이 가장 많을 가능성을 유추하기 위해 사용하는 확률 분포입니다. 아래 그림은 미국 대륙에 대한 네트워크 예측의 예입니다.
[그림 1] 상세 설명 - NOAA 멀티 레이더/멀티 센서 시스템(MRMS)에 의해 측정된 실제(ground-truth)과 비교한 MetNet 모델 예측. MetNet 모델(상단)은 2분에서 480 분 전까지 예측된 1mm/hr 강수의 확률을 표시하는 반면 MRMS 데이터(하단)는 동일한 기간 동안 최소 1mm/hr의 강수를 수신하는 영역을 표시합니다.
날씨 신경망 모델
MetNet은 대기의 역학을 설명하는 명시적인 물리 법칙에 의존하지 않고 관측된 데이터에서 직접 날씨를 예측하기 위해 역전파를 통해 학습합니다. 이 네트워크는 다중 레이더/멀티 센서 시스템 (MRMS)으로 구성된 지상 기반 레이더 스테이션에서 도출된 강수량 추정치를 사용하고 대기에서 구름을 위에서 아래로 볼 수 있는 NOAA의 정지 운행 환경 위성(Geostationary Operational Environmental Satellite) 시스템의 측정값을 사용합니다. 두 데이터 소스 모두 미국 대륙을 다루며 네트워크에서 효율적으로 처리 할 수 있는 이미지와 같은 입력을 제공합니다.
이 모델은 64km x 64km의 모든 사각형에 대해 1km 해상도로 미국 전체를 포함합니다. 그러나 이들 출력 영역 각각에 대응하는 입력 데이터의 실제 물리적 커버리지는 예측이 이루어지는 기간에 걸쳐 구름 및 강수량 필드의 가능한 움직임을 고려해야하기 때문에 훨씬 더 큽니다. 예를 들어, 구름이 최대 60km/h로 이동한다고 가정할 때 대기의 시간적 역학을 최대 8시간 앞당기는 정보를 기반으로 예측하기 위해서는 모든 방향에서 60 x 8 = 480km의 공간적 맥락이 필요합니다. 따라서 이 수준의 컨텍스트를 달성하려면 64km x 64km 패치 중심에서 예측을 수행하려면 1024km x 1024km 영역의 정보가 필요합니다.
최대 해상도에서 1024km x 1024km 영역을 처리하려면 상당한 양의 메모리가 필요하므로 입력 패치의 공간 차원을 줄임으로써 메모리 소비를 줄이면서 공간 내 다운 샘플러를 사용하면서 입력에서 관련 날씨 패턴을 찾아 유지합니다. 그런 다음 시간 순서 인코더 (이미지 시퀀스에 특히 적합한 컨볼루션 LSTM으로 구현됨)가 다운 샘플링된 입력 데이터의 시간 차원을 따라 적용되며, 이전 90 분의 입력 데이터에서 7개의 스냅샷을 15분 세그먼트로 인코딩합니다. 그런 다음 임시 인코더의 출력은 스파셜 어그리게이터(spatial aggregator)로 전달됩니다. 이 인코더는 Axial self-attention를 사용하여 입력 대상 시간에 기반한 가변 컨텍스트 양을 사용하여 데이터의 장기적 공간 종속성을 효율적으로 캡처하여 64km x 64km 출력에 대한 예측을 수행합니다.
이 아키텍처의 결과는 미국 대륙의 각 제곱 킬로미터에 대해 주어진 강수량의 확률을 추정하는 이산 확률 분포입니다.
[그림 3] 상세 설명 - 날씨 신경망 모델인 MetNet의 아키텍처입니다. 입력 위성 및 레이더 이미지는 먼저 공간 다운 샘플러를 통과하여 메모리 소비를 줄입니다. 그런 다음 90분의 입력 데이터에 대해 15분 간격으로 컨볼루션 LSTM에 의해 처리됩니다. 그런 다음 axial attention layer를 사용하여 입력 이미지 전체를 네트워크에 표시합니다.
결과
MetNet을 강수량 예측 벤치마크로 평가하고 결과를 두 가지 기준선, 즉 현재 미국에서 작동 중인 물리적 기상 예측 모델인 NOAA HRRR(High Resolution Rapid Refresh) 시스템과 방법인 강수량 필드의 움직임을 추정하는 기준선(baseline) 모델(즉, 옵티컬 플로우)과 비교합니다. 예측 시간이 2시간 미만인 경우 성능이 좋은 것으로 알려져 있습니다.
날씨 신경망 모델의 중요한 장점은 밀도가 높고 병렬 계산에 최적화되어 있으며 특수 하드웨어 (예: TPU)에서 실행하기에 적합하다는 것입니다. 이를 통해 뉴욕시와 같은 특정 위치 또는 미국 전체에 대한 예측을 몇 초 만에 병렬로 수행 할 수 있지만 HRRR과 같은 실제 모델은 슈퍼 컴퓨터에서 약 1시간의 런타임을 갖습니다.
아래 그림에서 MetNet, HRRR 및 광학 흐름 기준선 모델 간의 성능 차이를 정량화합니다. 여기, 우리는 강수량이 1.0 mm/h 인 F1-점수를 사용하여 평가된 3가지 모델에 의해 달성된 성능을 보여줍니다. MetNet 날씨 신경망 모델은 8시간 미만의 타임라인에서 NOAA HRRR 시스템보다 성능이 우수하며 흐름 기반 모델보다 지속적으로 우수합니다.
[그림 4] 상세 설명 - 성능은 1.0 mm/h 강수량에서 F1- 점수로 평가되었습니다 (높을수록 좋습니다). 날씨 신경망 모델(MetNet)은 현재 미국에서 현재 운영중인 물리 기반 모델(HRRR)보다 최대 8시간 앞선 시간 척도를 능가합니다.
대기의 확률적 특성으로 인해 정확한 미래 기상 조건에 대한 불확실성은 예측 시간이 길수록 증가합니다. MetNet은 확률 모델이므로 예측 시간이 연장됨에 따라 예측의 부드러움이 증가함에 따라 예측의 불확실성이 시각화에 표시됩니다. 반대로 HRRR은 확률론적 예측을 직접 수행하는 것이 아니라 단일 잠재적 미래를 예측합니다. 아래 그림은 MetNet 모델의 출력과 HRRR 모델의 출력을 비교한 것입니다.
[그림 5] 상세 설명 - NOAA MRMS 시스템에서 검색된 MetNet (위) 및 HRRR (아래)의 출력과지면 진실 (중간)의 출력 비교 HRRR 모델은지면 진실의 구조와 더 유사한 것으로 보이는 구조를 예측하지만 예측 된 구조는 크게 틀릴 수 있습니다.
HRRR 물리적 모델의 예측은 MetNet 모델보다 더 날카롭고 구조화되어 있지만 구조, 특히 구조가 예측되는 정확한 시간과 위치는 모델의 초기 조건과 파라미터의 불확실성으로 인해 덜 정확합니다.
HRRR과 MetNet 모델 간의 보다 철저한 비교는 아래 비디오에서 확인할 수 있습니다.
향후 방향
우리는 특히 급격한 기후 변화의 영향이 가장 큰 지역에서 지구 일기 예보를 개선하는 방법을 적극적으로 연구하고 있습니다. 우리는 미국 대륙에 대한 현재 MetNet 모델을 보여 주지만, 적절한 레이더 및 광학 위성 데이터가 제공되는 모든 지역을 포함하도록 확장될 수 있습니다. 여기에 제시된 작업은이 노력에 있어 작은 디딤돌이며, 향후 기상 커뮤니티와의 협력을 통해 더 큰 발전을 이룰 수 있기를 바랍니다.
감사의 말
이 프로젝트는 Lasse Espeholt, Jonathan Heek, Mostafa Dehghani, Avital Oliver, Tim Salimans, Shreya Agrawal 및 Jason Hickey와 공동으로 수행되었습니다. 또한 시각화에 도움이 된 Manoj Kumar, Wendy Shang, Dick Weissenborn, Cenk Gazen, John Burge, Stephen Hoyer, Lak Lakshmanan, Rob Carver, Carla Bromberg 및 Aaron Bell에게 감사의 말씀을 전합니다.
원본 제목: 8시간 앞선 강수량 예측을 위한 날씨 신경망 모델(A Neural Weather Model for Eight-Hour Precipitation Forecasting)
게시자 : Nal Kalchbrenner 및 Casper Sønderby, 암스테르담의 Google Research 연구 과학자
원본 링크: https://ai.googleblog.com/2020/03/a-neural-weather-model-for-eight-hour.html
MetNet: A Neural Weather Model for Preciptation Forecasting 논문: https://arxiv.org/abs/2003.12140
Machine Learning for Precipitation Nowcasting from Radar Images 논문: https://arxiv.org/abs/1912.12132
GMD - Optical flow models as an open benchmark for radar-based precipitation 논문: https://www.geosci-model-dev.net/12/1387/2019/
이 블로그는 2020년 3월 25일(수), 구글 AI 리서치 블로그 기사를 영한 번역한 것입니다. 또한 이 번역 글은 정보 공유 목적으로만 작성했으므로 어떠한 상업용으로 사용할 수 없으며, 원본 저작물 모두 구글에게 저작권이 있음을 알려 드립니다. (First Draft Version)