Kako generativna AI brusi vremensku prognozu
Zamislite da gledate satelitsku sliku nekog područja, ali je razlučivost toliko gruba da jedva raspoznajete obrise otoka ili planina. Znate da negdje ispod te mutne slike postoji bogatstvo detalja — oštre obalne linije, planinski prijevoji, lokalne doline u kojima se skuplja hladan zrak. Upravo tako izgleda razlika između globalne vremenske prognoze rezolucije 25 km i regionalne prognoze na 2 km. A upravo tu razliku sada pokušava premostiti jedan od najzanimljivijih pristupa u suvremenoj numeričkoj meteorologiji — korektivni difuzijski model nazvan CorrDiff.
Problem: globalno je pregrubo, regionalno je preskupo
Suvremeni globalni vremenski modeli temeljeni na strojnom učenju — poput FourCastNeta, Panguea ili AIFS-a — revolucionirali su globalnu prognozu. Treniraju se na reanalizi ERA5 Europskog centra za srednjoročnu prognozu (ECMWF) i sposobni su proizvesti prognoze na razini cijelog planeta za djelić računalnog troška klasičnih numeričkih modela. No, njihova tipična prostorna razlučivost od oko 25 km jednostavno nije dovoljna za mnoge primjene: procjenu rizika od poplava, detaljno praćenje olujnih sustava ili predviđanje lokalnih učinaka topografije na vjetar i oborine.
Klasičan odgovor na ovaj problem je dinamičko spuštanje skale (dynamical downscaling) — pokretanje regionalnog numeričkog modela visoke rezolucije (npr. WRF) unutar okvira koji postavlja globalni model. Rezultati su izvrsni, ali cijena je visoka: ti regionalni modeli zahtijevaju enormne računalne resurse, što ograničava broj ansambalskih članova i duljinu simulacija. Upravo zato raste interes za statističko spuštanje skale (statistical downscaling), a posebice za njegove moderne varijante temeljene na dubokom učenju.
CorrDiff: dvostupanjski pristup s difuzijskim modelom
Tim istraživača iz NVIDIA-e i Tajvanske središnje meteorološke uprave (CWA) razvio je model nazvan CorrDiff (Corrective Diffusion), objavljen 2025. godine u časopisu Communications Earth & Environment. Ideja je elegantno jednostavna u konceptu, a sofisticirana u izvedbi.
Prvi korak je deterministički: regresijska neuronska mreža (arhitekture UNet) prima grubu sliku atmosfere — 12 kanala iz ERA5 reanalize na 25 km — i predviđa srednju vrijednost visoko rezolucijskog polja na 2 km za četiri izlazne varijable: temperaturu na 2 m, kinematičku energiju vjetra na 10 m, te sintetiziranu radarsku reflektivnost.
Drugi korak je generativni: difuzijski model uči distribuciju reziduala — razlike između stvarnog visoko rezolucijskog polja i predviđene srednje vrijednosti. Ovaj pristup inspiriran je Reynoldsovom dekompozicijom iz dinamike fluida, gdje se fizikalno polje rastavlja na srednji tok i fluktuacije. Difuzijski model tako ne mora naučiti cijelu složenost visoko rezolucijskog polja, već samo njegovu finiju strukturu — a to je bitno lakši zadatak.
Zašto baš difuzijski modeli?
Difuzijski modeli (engl. diffusion models) spadaju u obitelj generativnih modela koji su posljednjih godina postigli izvanredne rezultate u generiranju slika. Njihov princip rada temelji se na dva procesa: napredni (postupno dodavanje šuma podatcima dok ne postanu neraspoznatljivi od čistog šuma) i povratni (neuronska mreža uči obrnuti taj proces, korak po korak uklanjajući šum i rekonstruirajući realistične podatke). U kontekstu meteorologije, to znači da model može generirati ansambl fizikalno konzistentnih realizacija visoko rezolucijskog polja — a ne samo jednu determinističku prognozu.
Raniji pokušaji s generativnim suparničkim mrežama (GAN-ovima) pokazali su obećavajuće rezultate u spuštanju skale oborina, ali uz dobro poznate probleme: nestabilnost treninga, kolaps modova i poteškoće u hvatanju dugih repova distribucija — upravo onih ekstremnih vrijednosti koje su za meteorologiju najvažnije. Difuzijski modeli nude veću stabilnost treninga i bolju sposobnost reprodukcije punih distribucija.
Testiranje na Tajvanu: od hladnih fronti do tajfuna
CorrDiff je treniran na trogodišnjem skupu podataka (2018.–2020.) operativnog WRF modela tajvanskog CWA na rezoluciji od 2 km — dakle na podatcima koji su nastali klasičnim dinamičkim spuštanjem skale. Validacija je provedena na 205 nasumično odabranih termina iz 2021. godine, uz dodatne studije slučaja iz 2022. i 2023.
Rezultati su ohrabrujući na više razina:
Spektri i distribucije. CorrDiff uspješno reproducira energetske spektre po potenciji (power spectra) za sve varijable, uključujući i na malim prostornim skalama (ispod 50 km) gdje deterministički UNet značajno podcjenjuje varijabilnost. Posebno je impresivna sposobnost modela da sintetizira radarsku reflektivnost — varijablu koja uopće ne postoji u ulaznom ERA5 skupu podataka — uz realistične repove distribucije koji opisuju intenzivne oborine.
Hladne fronte. U studiji slučaja hladne fronte iz veljače 2022., CorrDiff je uspješno izoštrio horizontalne gradijente temperature i vjetra na frontalnoj granici, istodobno generirajući prostorno konzistentne oborine uz frontu. Ključno je da model održava fizikalnu konzistentnost između varijabli — tamo gdje temperatura naglo pada, vjetar mijenja smjer, a pojavljuje se i pojačana radarska reflektivnost.

Tajfun Haikui (2023). Ovo je bio posebno zahtjevan test. Tropski cikloni u ERA5 reanalizi na 25 km izgledaju kao razmazane, preširoke strukture s preslabim vjetrovima — srednji radijus maksimalnog vjetra u ERA5 iznosi oko 75 km, dok je u WRF-u samo 25 km. CorrDiff uspijeva suziti radijus na oko 50 km i pojačati maksimalne brzine vjetra s 22 m/s (ERA5) na 33 m/s, prema 45 m/s u WRF-u. Model također generira kvalitativno realistične strukture kišnih pojaseva tipične za tropske ciklone. Ipak, autori priznaju da CorrDiff pretjerano kontrahira horizontalnu strukturu ciklona i predviđa statistički premalen radijus maksimalnog vjetra — što je razumljivo s obzirom na to da su tajfuni izrazito rijetki događaji u trogodišnjem skupu za kvalitetan trening.
Brzina i učinkovitost
Jedan od najupečatljivijih rezultata je računalna učinkovitost. CorrDiff na jednom GPU-u radi 22 puta brže i troši 1300 puta manje energije nego operativni WRF model na 928 CPU jezgri. To otvara vrata generiranju velikih ansamblova — u ovom radu korišten je ansambl od 32 člana — što je za klasične regionalne modele gotovo nezamisliv luksuz.
Važno je naglasiti: CorrDiff nije zamjena za fizikalne modele. On je treniran na njihovim izlazima i bez njih ne može postojati. No, jednom naučen, može multiplicirati vrijednost tih skupih simulacija generiranjem probabilističkih prognoza uz zanemariv dodatni trošak.
Otvorena pitanja i budući smjerovi
Autori identificiraju nekoliko ključnih izazova:
Kalibracija nesigurnosti. Ansambli CorrDiff-a su trenutačno subdisperzivni — njihov raspon je preskučan u usporedbi sa stvarnom nesigurnošću. Opažene vrijednosti često padaju izvan raspona ansambla. Optimalna kalibracija stohastičke nesigurnosti ostaje otvoren problem.
Temporalna koherencija. Trenutačni model tretira svaki vremenski termin neovisno. Za praktičnu primjenu, prognoze na susjednim vremenskim koracima moraju biti fizikalno konzistentne — oluja se ne smije “teleportirati” između dva termina. Autori predlažu povezivanje s difuzijskim modelima za video ili autoregresivnom dinamikom na km-skali.
Generalizacija na druga područja. Model je demonstriran samo za Tajvan. Primjena na veće domene ili područja s manje dostupnih visoko rezolucijskih podataka za trening zahtijeva daljnje istraživanje skalabilnosti pristupa.
Klimatske projekcije. Posebno intrigantna je mogućnost korištenja CorrDiff-a za spuštanje skale klimatskih simulacija — no to otvara pitanje može li model treniran na sadašnjoj klimi vjerno reprezentirati buduće uvjete, osobito za ekstremne događaje.
Šira slika: prema globalnom regionalnom prognoziranju
CorrDiff je dio šireg trenda u atmosferskim znanostima koji bismo mogli nazvati hibridnim pristupom — spoj fizikalnih modela i strojnog učenja. Globalni AI modeli poput GenCast-a (DeepMind) ili NeuralGCM-a već pokazuju da strojno učenje može konkurirati klasičnim numeričkim modelima na globalnoj razini. CorrDiff dodaje sljedeću kariku u lanac: učinkovito spuštanje tih globalnih prognoza na regionalnu razinu s očuvanom fizikalnom konzistentnošću i probabilističkom informacijom.
Vizija je jasna — sustav u kojemu globalni AI model daje prognozu za cijeli planet, a regionalni difuzijski model potom tu prognozu “izoštruje” na razinu potrebnu za lokalne korisnike, sve uz kvantificiranu nesigurnost i uz zanemariv računalni trošak u usporedbi s klasičnim pristupom. Do pune realizacije te vizije preostaje još mnogo posla, ali CorrDiff pokazuje da smjer je obećavajući.
Izvori
- Mardani, M., Brenowitz, N., Cohen, Y. et al. Residual corrective diffusion modeling for km-scale atmospheric downscaling. Communications Earth & Environment 6, 124 (2025). https://doi.org/10.1038/s43247-025-02042-5
- Pathak, J. et al. FourCastNet: A global data-driven high-resolution weather model using adaptive fourier neural operators. arXiv preprint arXiv:2202.11214 (2022).
- Price, I. et al. Probabilistic weather forecasting with machine learning. Nature 637, 84–90 (2025).
- Leinonen, J. et al. Stochastic super-resolution for downscaling time-evolving atmospheric fields with a generative adversarial network. IEEE Transactions on Geoscience and Remote Sensing 59, 7211–7223 (2020).
- Ben-Bouallegue, Z. et al. The rise of data-driven weather forecasting. arXiv:2307.10128 (2023).
- Hersbach, H. et al. The ERA5 global reanalysis. Quarterly Journal of the Royal Meteorological Society 146(730), 1999–2049 (2020).
Ivan Toman