Machine Learning for Air Quality and CO2 Emissions: The Role of Data Understanding
Kratka vsebina
Strojno učenje za kakovost zraka in emisije CO2: vloga razumevanja podatkov. V zadnjih letih je pojav metod strojnega učenja omogočil vedno bolj sofisticirane pristope za okoljske napovedi. Vendar pa je relativno malo pozornosti namenjeno naravi, izvoru in metodološki konstrukciji naborov podatkov, ki so osnova teh modelov. Ta študija raziskuje vlogo podatkov v okoljskih aplikacijah, ki temeljijo na strojnem učenju, pri čemer se osredotoča na dve področji: emisije plinov, ki povzročajo učinek tople grede (GHG), zlasti ogljikov dioksid (CO2), in koncentracije trdnih delcev (PM2.5 in PM10). Za Poljsko in Slovaško je bil naučen model LightGBM za napoved emisij CO2 v vseh glavnih gospodarskih sektorjih: stanovanjskem, energetskem, transportnem, industrijskem in letalskem. Prediktivna zmogljivost je bila največja v sektorjih z rednimi sezonskimi vzorci emisij, medtem ko so sektorji z nizko variabilnostjo, kot je domači letalski sektor, predstavljali večje izzive. Za trdne delce so bile uporabljene meteorološke spremenljivke in časovno povezane značilnosti za napoved PM2.5 in PM10 med sezono ogrevanja. Modeli so zajeli splošne časovne vzorce, vključno s kratkoročnimi nihanji in sezonskimi vrhovi, čeprav so bili ekstremni dogodki delno podcenjeni. Na splošno rezultati poudarjajo, da je prediktivna natančnost močno odvisna od kakovosti, ločljivosti in strukture vhodnih naborov podatkov, pa tudi od rednosti emisij in okoljskih razmer. To poglavje poudarja pomembnost skrbnega načrtovanja in predobdelave naborov podatkov pri uporabi strojnega učenja za okoljski nadzor, saj ponuja smernice za izboljšanje zanesljivosti napovedi emisij in kakovosti zraka.






