Everis ha puesto en marcha DatUne la plataforma que sustenta su nueva estrategia de big data para posicionarse, de lleno, en el ámbito de las administraciones públicas y los datos abiertos. Para testear la herramienta, la consultora está llevando a cabo el primer datathon open data de Madrid. En la competición participan trece equipos y finalizará el 11 de noviembre con la presentación de los proyectos ganadores.
Es mucha la experiencia de Everis en el ámbito de big data, tanto en el área de la pura tecnología como del business analytics. Ahora la consultora apuesta fuerte por una nueva estrategia, la de los portales de datos para las administraciones públicas. El datathon, MADdata, organizado junto con el Ayuntamiento de Madrid, es su primer proyecto.
La primera fase de la competición se desarrolló en las instalaciones de Medialab Prado, allí pude charlar con Javier Acosta y Alfonso Fernández, responsables de DatUne, la plataforma que hace posible esta nueva línea de negocio de Everis.
Javier me cuenta las razones de la estrategia:
“Creemos que todas las administraciones van a sacar proyectos de big data y queremos posicionarnos con una solución ya hecha, y con el valor añadido de que todos los datos puedan publicarse automáticamente en un portal de datos abiertos. Ahora todas las administraciones están yendo por esa línea, y el problema que están teniendo es, precisamente, el de capturar los datos, prepararlos y publicarlos en un portal de datos abiertos”.
Alfonso, por su parte, me detalla los pormenores del datathon y de la plataforma:
“Los equipos han trabajado con nuestra plataforma DatUne, un entorno que unifica los conceptos de datos abiertos del portal de datos del Ayuntamiento de Madrid y otras entidades públicas (por ejemplo de la EMT o de ministerios) con otro tipo de datos como tuits geolocalizados de la ciudad o de Bicimad, datos que hemos recopilados desde junio. También hemos incluido un data set con toda la bibliografía de las bibliotecas del Ayuntamiento así como su información geográfica y práctica (es decir, en qué biblioteca está cada libro). Todo esto es accesible tanto por Impala como por una API REST que hemos desarrollado nosotros. El portal está hecho sobre ckan y utilizamos Hadoop, pero estamos investigado Spark para usarlo en el futuro. Todos estos se ofrece de forma que la tecnología no suponga un problema”.
Esta competición supone el lanzamiento de DatUne, pero ya hay un proyecto en marcha con administraciones públicas:
“Estamos usando la aplicación en organismos públicos para la anonimizacion de información, explotación de datos no estructurados y clasificación de documentos”.
En DatUne hay, también, inteligencia.
“La parte de big data y open data la hemos integrado con R para obtener la parte de analítica. Esa capa de analítica no se ve en este datathon porque no está accesible a cualquiera, sólo para clientes. Hemos hechos varios casos prácticos, por ejemplo con la EMT lanzamos una demo para ver la optimización de todas las paradas de los autobuses. Se trataba de ver cuántas veces los autobuses pasan de largo y cuantas veces se paran realmente para que alguien baje o suba”.
Con respecto a los proyectos que se están desarrollando en el datathon, algunos son:
El datathon otorgará un total de 15.000 euros en premios repartidos en tres categorías: Innovación empresarial, Innovación social y Visualización de datos.