Hemeroteca

Política de Cookies

Este blog utiliza cookies propias y de terceros para mejorar su experiencia de navegación. Si continúa navegando, consideramos que acepta su uso. Puede obtener más información en nuestra página de: Política de Cookies.

Soy ….

Soraya Cronista compulsiva. Periodista por vocación y de formación. Consultora NTIC por experiencia. Mi pasión es mi hija. Me gusta el café. Más sobre mí.

Mi Time Line en Twitter

RSSTwitterLinkedin
10 agosto, 2014 Posted by sorayapa Publicado en Bigdata, Entrevistas Big Data
sin comentarios

Bidoop, data science con un simple drag and drop

Pedro Agudo, CEO de Pragsis

Pedro Agudo, CEO de Pragsis

Bidoop es un framework español que permite generar procesos analíticos y predictivos sobre grandes volúmenes de datos con un simple «drag and drop». Usar las tecnologías big data se está convirtiendo en algo tan sencillo que pronto será pura commodity, así se expresa Pedro Agudo fundador y CEO de Pragsis, la empresa que ha desarrollado esta herramienta.

En septiembre veremos la nueva versión 2.0 de Bidoop, que incorpora un interfaz de «arrastrar y pegar» así como una amplia librería de modelos analíticos. Estamos asistiendo al nacimiento de una nueva generación de herramientas de big data que permiten crear soluciones sin necesidad de conocimientos tecnológicos. Así es Bidoop y así me lo cuenta Pedro Agudo, su fundador.

«Con Bidoop te aíslas de la tecnología. Por ejemplo, un analista puede crear un clustering con los usuarios de su negocio y aplicar un modelo para predecir cuántos de ellos van a comprar un determinado producto o servicio. Y ese caso de uso se reduce, simplemente, a unir los módulos de ese proceso analítico. Es tan sencillo como arrastrar y pegar. Lo único que va a necesitar es conocer su ámbito de negocio. La versión 2.0 de Bidoop, además de ese sistema «drag and drop», incorpora una nueva librería de modelos analíticos. Estamos trabajando con R y migrando modelos que tienen aplicaciones como Mahout, y ese tipo de aplicaciones analíticas, para incorporarlos en MapReduce sobre Hadoop. Ese va ser el futuro, con nuestra tecnología o con otras. Al final el big data va a ser una commodity».

Pedro Agudo es un brillante empresario curtido en el negocio de Internet. Nació en Valdepeñas, se licenció en Informática y comenzó su carrera profesional vendiendo conectividad allá por 1995. En enero de 2004 fundó Pragsis y hoy da trabajo a 122 personas en España, México y Brasil.

«En el 2000, cuando se produce la explosión de Internet,  yo estaba trabajando en Axpe Consulting como analista. La empresa decidió crear una división especializada en servicios de Internet y se montó Planet on The Go, de la que me hicieron socio. La empresa creció muy rápido pero la burbuja estalló y se estrelló. Yo decidí seguir con la compañía y volvimos a generar negocio apoyándonos en grandes integradoras y consultoras como Indra o Capgemini. Además en enero de  2004 decidí lanzar Pragsis con el objetivo de crear productos. Desarrollamos soluciones de seguridad, juegos, las primeras Apps para Symbian o un sistema de pago por NFC que creamos en 2008 con Orange para dispositivos Philips.  En 2010 coincidimos con el ecosistema Hadoop. Vimos una gran oportunidad y comenzamos a invertir. Destiné un equipo a evaluar las posibilidades. En EEUU había una gran demanda. Veíamos que era una tecnología open source que estaba siendo utilizada en grandes compañías».

bidoop

Para impulsar la unidad de big data Pragsis incorporó como socio a David Millán; montó una unidad de negocio y generó una primera plataforma.

«Cuando vimos que Hadoop era una apuesta acertada, además de intentar venderlo fuera,  nosotros nos convertimos en nuestro propio cliente y vimos las limitaciones. Había un ecosistema tan diverso y tan cambiante que era inmanejable. Cada tres meses había una nueva versión. Lo primero que hicimos fue generar una plataforma utilizando versiones estables de cada una de las aplicaciones del ecosistema Hadoop. Luego nos dimos cuenta de que necesitábamos un interfaz para no tener que estar tocando continuamente los ficheros y desarrollamos Bidoop. Y, tras la primera versión de Bidoop lo que ha ocurrido es que hemos incrementado exponencialmente el equipo de data science porque ahora lo que necesitamos son modelos».


Con Bidoop ya no tienes que saber por qué pasan las cosas, sólo descubrir que realmente pasan.

 «Hasta ahora nosotros cogíamos un espacio muestral finito y sobre ese espacio, uno, dos o tres meses, generábamos unos modelos que nos permitían predecir lo que iba a pasar. Ahora el modelo es el contrario, ya no tengo que saber, ni tan siquiera, por qué pasan las cosas, yo lo que quiero es descubrir que realmente pasan. Por ejemplo, una compañía eléctrica nos pidió mejorar el ciclo combinado, es decir la cantidad de electricidad que se genera con un determinado volumen de gas. Nosotros no queríamos mejorar su modelo predictivo, queríamos saber cuándo pasaban determinado tipo de cosas. Les pedimos información de sus sensores y descubrimos que una pieza concreta producía más electricidad siendo nueva que cuando pasaban tres meses. Eso no lo sabe nadie a priori pero el hecho es que pasa. Tampoco tienes que saber que produces menos electricidad por esa pieza, lo único que tienes que saber es que pasa y a partir de ahí aplicas los modelos,  luego ya buscarás las causas».

Pedro Agudo, fundador de Bidoop

Pedro Agudo, fundador de Bidoop

Según Pedro en España hay tres empresas que son un claro referente en el mundo de big data, son Inditex, Telefonica y BBVA.

«Esas tres empresas son las que más cultura tienen en materia de big data. También es cierto que son compañías tan grandes que de un departamento a otro es como pasar de blanco al negro. Por otro lado, te puedo decir que todas las empresas de Ibex tienen en marcha alguna iniciativa big data, bien a nivel de piloto o de concepto. España, comparada con el mercado europeo, no está tan retrasada como podría parecer. No tenemos ni más ni menos casos de uso, ni más ni menos grandes clientes. Dicho esto, también quiero resaltar que en España ha habido mucha desinformación. Los grandes players, a los que se les presuponía fuente de conocimiento, muchas veces han lanzado mensajes muy contradictorios que han generado rechazo y resquemor en clientes. Yo lo he sentido».

Una de las mejores prácticas de Pragsis es la gestión de los logs en los sistemas de logística y distribución de Inditex. 

«Inditex tiene almacenes enormes por toda España (uno de ellos en Meco) gestionados mayoritariamente por dispositivos electrónicos. De vez en cuando se producían fallos en el sistema de distribución y numerosas cajas eran rechazadas; en estos casos era necesaria la intervención humana con el consiguiente coste y pérdida de tiempo. Nuestros trabajo consistió en analizar todas las fuentes de información para predecir los fallos y lanzar alertas en tiempo cercano al real. Generamos modelos que nos permitieron adivinar las causas y predecir qué dispositivos iban a dejar de funcionar y cuando. En marketing vemos que se está trabajando mucho en relacionar el comportamiento del cliente en la plataforma online con el comportamiento en las tiendas físicas. Todavía hay muchas compañías que se resisten y no quieren dar una oportunidad a big data pero todo va a llegar. Es como hace años con internet».

Por último, un comentario obligado: pensé que Hadoop estaba obsoleto.

«Hadoop no está obsoleto, ni mucho menos. Tiene una vida muy larga para determinada cosas, para otras es que nunca se debió  utilizar. En concreto me refiero a sistemas de tiempo real». 

Con respecto al futuro de Bidoop, la empresa quiere iniciar su andadura en EE.UU (donde tendrán presencia en Palo Alto antes de final de año) aprovechando su ventaja competitiva por experiencia y conocimiento en el mercado. 

Contestar

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


  • Responsable: Soraya Paniagua Amador
  • Fin del tratamiento: controlar el SPAM, gestión de comentarios.
  • Legitimación: tu consentimiento
  • Comunicación de datos: no se comunicarán los datos a terceros salvo por obligación legal.
  • Derechos: acceso, rectificación, portabilidad, olvido
  • Contacto: spamador@gmail.com
  • Información adicional: más información en nuestra Política de Privacidad.