Loading...
Emisión de Co2
Países que más contaminan a nivel mundial.
Concentración de Co2 en el ambiente
Porcentaje de países con respecto a la emisión


Machine Learning: Introducción

Los datos de series de tiempo son una serie de puntos de datos u observaciones registradas en intervalos de tiempo diferentes o regulares. En general, una serie de tiempo es una secuencia de puntos de datos tomados en intervalos de tiempo igualmente espaciados. La frecuencia de los puntos de datos registrados puede ser horaria, diaria, semanal, mensual, trimestral o anual. La predicción de series de tiempo es el proceso de utilizar un modelo estadístico para predecir valores futuros de una serie de tiempo en función de resultados pasados.

Autoregresivo (AR):
Un modelo autorregresivo (AR) predice el comportamiento futuro basado en el comportamiento pasado. Se utiliza para pronosticar cuando existe alguna correlación entre los valores de una serie de tiempo y los valores que los preceden y los suceden.

Media móvil integrada autorregresiva (ARIMA):
Los modelos de media móvil integrada autorregresiva, ARIMA, se encuentran entre los enfoques más utilizados para el pronóstico de series de tiempo. En realidad, es una clase de modelos que 'explica' una serie de tiempo dada basándose en sus propios valores pasados.

Media móvil integrada autorregresiva estacional (SARIMA):
Los modelos de media móvil integrada autorregresiva estacional (SARIMA) amplían los modelos ARIMA básicos y permiten la incorporación de patrones estacionales.



Description for image

En la Figura "Densidad en el dataset co2" podemos obsrvar como ha sido la distribución de los datos, y los que más se encuentran en tendencia.



Description for image

En la Figura "Promedio de datos de 1960 a 2022" tenemos la proyección de estos datos. El promedio en el uso de los datasets, nos permite analizar el crecimiento de la data.



Description for image

En la Figura "Pronóstico de SARIMA" podemos observar que para residuos estandarizados, los cuales muestran los valores que no han sido tomados en la regresión. No se muestra un patrón por lo tanto la data es correcta. Los residuos no estan correlacionados porque no hay un patrón concreto, como buen indicativo.

En el histograma podemos ver que la distribución de los errores tienen una distribución normal.

En cuanto a la muestra de quantiles, para el modelo, SARIMA se ajusta perfectamente a los datos.

Para finalizar con la figura podemos decir que en el correlograma, los valores son muy bajos mostrando que no hay correlación en un determinado punto.

Ahora es el momento de poner en práctica este modelo para hacer pronósticos futuros. Los científicos del clima nos dicen que tenemos hasta 2030 para reducir drásticamente nuestras emisiones de CO2 o enfrentaremos grandes desafíos sociales.

Description for image

En la regresión final basándonos en la relación entre emisión y concentración de Co2, podemos determinar que las partes por millón de Co2 van a continuar aumentando, hasta 441.1 para el año 2030. Dando pie al aumento de temperatura por el efecto invernadero, como algo tangible. Si no se toma en cuenta, el acuerdo de Paris a nivel mundial.

© Green Data Company, All Right Reserved.