La minería de datos (Data mining en inglés) es un proceso que permite extraer información útil e interesante a partir de bases de datos que describen algún fenómeno que se desea analizar.
Muchas veces estos fenómenos son fortuitos, violentos y los datos que representan el fenómeno que deseamos analizar no nos permite una respuesta oportuna. Por ejemplo, el fenómeno “El Niño Costero” del 2017 fue tan violento y devastador que aún no se tienen cifras exactas sobre todo el daño que causó en nuestro país. A finales de febrero del 2017, las noticias mostraban el efecto del fenómeno materializado en el desborde de los ríos Rímac y Huaycoloro donde los más afectados fuimos sin duda los ciudadanos.
Además de los indicadores que generalmente se mostraban en los medios - familias afectadas, personas desaparecidas, decesos, etc. - otros comportamientos cambiaban sutilmente durante el periodo en el que el “El Niño Costero” golpeaba nuestro territorio. En efecto, los ciudadanos que realizan transacciones bancarias o compras utilizando sus tarjetas de crédito y débito de forma regular, dejaron de hacerlo - o lo hacían con menos intensidad - durante el fenómeno. Este cambio de comportamiento se puede visualizar en las dos imágenes que muestran los montos de consumos realizados con tarjetas de crédito y débito en Lima y Pasco durante el período comprendido entre de junio 2016 y octubre 2017. En las mismas figuras, la franja roja representa los meses en los que el fenómeno impactó nuestro territorio.
Ambas figuras muestran algunos resultados que, si bien no son concluyentes, pueden darnos algunas luces de cómo el comportamiento de los ciudadanos cambió - en términos de gasto - durante “El Niño Costero” del 2017.
Algunas conclusiones que podemos obtener de las figuras son:
- Lima registra una mayor cantidad de monto gastado que Pasco.
- El comportamiento de consumo de los clientes en Lima se ve afectado por el fenómeno “El Niño Costero”, mientras que en Pasco no sucede lo mismo (o es imperceptible).
- La figura que representa Lima muestra dos caídas, las cuales están relacionadas con los dos impactos más importantes del fenómeno en el departamento de Lima.
Este es un ejemplo bastante simple, pero muy efectivo que muestra la utilidad del uso de las técnicas de minería de datos en la comprensión de fenómenos complejos. Otro mensaje que quiero dejar en esta nota es que los fenómenos complejos necesitan ser representados por datos de diferentes fuentes (meteorológicos, consumo, infraestructura, etc.) para poder ser analizados de manera global, considerando posibles efectos colaterales en diferentes aspectos del comportamiento humano. Finalmente, estoy convencido de que una alianza entre las entidades gubernamentales, empresas y academia es importante para lograr este propósito.
Comparte esta noticia