Archivo

Amas de casa y estudiantes hacen negocio con Big Data

06 febrero 2014 6:57 Última actualización 01 diciembre 2013 5:5

[Los precios de alimentos de todo el mundo se pueden medir ahora en tiempo real. / NYT] 


New York Times News Service
 
David Soloff está reclutando a un ejército de recolectores de “híperdatos”.
 
La compañía que cofundó, Premise, creó una aplicación para smartphones usada ahora por 700 personas en 25 países en desarrollo. Siguiendo instrucciones de Soloff y sus compañeros de trabajo, estas personas, principalmente estudiantes universitarios y amas de casa, fotografían alimentos y productos en mercados públicos.
 
Al analizar las fotos de los precios y la colocación de artículos cotidianos como jitomates y botellas de champú y unir eso con otros datos, Premise está creando un índice de inflación en tiempo real que vende a compañías y operadores de Wall Street, que están ansiosos por datos reveladores.
 
“Dentro de cinco años, me gustaría tener entre 3 mil y 4 mil personas haciendo esto”, dijo Soloff, quien también es director ejecutivo de Premise. “Es un monitor inflacionario mundial útil, una forma de dar seguimiento a la seguridad alimentaria o una manera en que un fabricante puede juzgar qué tipo de espacio en estanterías está recibiendo”.
 
Recolectar datos de todo tipo en lugares dispares y analizarlos mucho más rápido de lo que era posible incluso hace un par de años se ha vuelto una de las áreas de más actividad en la industria de la tecnología. La idea es sencilla: con todo ese poder de procesamiento y un poco de creatividad, los investigadores pudieran encontrar relaciones y patrones novedosos entre diferentes tipos de información.
 
Durante los últimos años, los conocedores han estado llamando a este tipo de análisis Big Data. Ahora los Big Data están evolucionando, volviéndose más “híper” e incluyendo todo tipo de fuentes. Empresas incipientes como Premise y ClearStory Data, así como compañías más grandes como General Electric, están incorporándose a la acción.
 
Una fotografía de jitomates en Asia quizá no lleve a nadie a una conclusión grandiosa salvo lo deliciosos que esos jitomates pudieran parecer o no. Pero si se conectan las fotografías de pilas de alimentos en todo el mundo con los pronósticos del clima y los totales de precipitación, se tiene información significativa que pudieran usar personas como corredores bursátiles o compradores de grandes cadenas de abarrotes.
 
Y entre más rápidamente suceda, mejor, para que las personas puedan tomar decisiones inteligentes, y rápidas.
 
“Los híperdatos te llegan al momento, y pueden analizarlos y actuar con base en ellos de inmediato”, dijo Bernt Wahl, un conocedor de la industria en el Centro para Emprendedurismo y Tecnología en la Universidad de California en Berkeley. “Estará en las empresas comunes pronto y todos estarán prediciendo y actuando de la manera en que Amazon cambia instantáneamente sus precios”.
 
La intención de la gente que trabaja con sistemas de Big Data más nuevos es recolectar información al parecer no relacionada como el calor y la nubosidad de hoy y la victoria de un equipo local el fin de semana, para comparar eso con el clima pasado y los resultados deportivos, y determinar cuánto helado de chispas de menta comprarían las madres hoy.
 
Al menos, esa es la esperanza, y ya se están dando los primeros signos de que funcionaría. Premise afirma que ha detectado la inflación nacional amplia en India meses antes que el gobierno observando los precios de las cebollas en un par de mercados.
 
Los fotógrafos que trabajan para Premise son reclutados por gerentes por país, y reciben entre 8 y 10 centavos de dólar por fotografía. Premise también recopila la información de horario y ubicación de los teléfonos, más algunas notas sobre cosas como si el mercado estaba lleno. El verdadero conocimiento proviene de saber cómo mezclar todo, rápidamente.
 
Los datos de precios obtenidos con las fotos se mezclan con los precios que Premise recibe de 30 mil sitios web. La compañía luego crea índices inflacionarios nacionales y mapas de precios para mercados en lugares como Kolkata, India; Shanghái; y Río de Janeiro.
 
Los suscriptores de Premise incluyen a fondos compensatorios de Wall Street y Procter & Gamble, una compañía conocida por usar muchos datos. Ninguno de ellos hizo comentarios para este artículo.
 
Las suscripciones al servicio oscilan entre los mil 500 dólares hasta más de 15 mil dólares al mes, aunque también hay una versión que ofrece datos gratuitos a escuelas y grupos sin fines de lucro.


Las nuevas conexiones de los Big Data también se están beneficiando de la creciente cantidad de información pública que está disponible. Según investigación del Instituto Mundial McKinsey, 40 gobiernos nacionales ahora ofrecen datos sobre asuntos como población y uso de suelo. El gobierno de Estados Unidos tiene 90 mil conjuntos de datos abiertos.
 
Esos datos gubernamentales pueden cotejarse con sensores en los smartphones, motores de jets e incluso estaciones de bicicletas, que están subiendo datos de todo el mundo físico a las súpercomputadoras de los sistemas de computación en la nube.
 
Hasta hace unos años, muchos datos gubernamentales y privados no podían ser recolectados de manera particularmente rápida o correcta. Era costoso conseguirlos y difícil cargarlos en las computadoras. Sin embargo, eso ha cambiado conforme han descendido los precios de los sensores y opciones como el Wi-Fi han permitido la conectividad.
 
En el mundo del hardware computacional, la computación en memoria, un avance que permite que los datos sean procesados sin ser almacenados en una ubicación diferente, ha aumentado inmensamente las velocidades de computación. Eso ha permitido un análisis de datos en tiempo real.
 
General Electric, por ejemplo, que tiene más de 200 sensores en un solo motor de jet, ha trabajado con Accenture para crear un programa que analiza el desempeño del avión en el momento en que el jet aterriza. GE también tiene software que analiza los datos recopilados en 100 sitios en una turbina cada segundo, y los combina con la demanda de energía, los pronósticos del clima y los costos laborales para elaborar calendarios de mantenimiento.
 
IBM también anunció recientemente el despliegue comercial de software que aprende y predice el comportamiento de sistemas grandes y complejos para mejorar el desempeño en el momento en que están sucediendo las cosas.
 
Un cliente, una compañía de telecomunicaciones de Illinois llamada Consolidated Communications, usa el software para supervisar 80 mil elementos de su red, como velocidades de conectividad y desempeño televisivo, para cada uno de sus 500 mil clientes. IBM también anunció nuevos productos que dijo mejorarían el análisis y harían más fácil que los clientes trabajen con diferentes tipos de datos.
 
El análisis de datos tradicional se creó con base en analizar información común, como cheques de nómina, que pudieran ser cargados en las filas y columnas comunes de una hoja de cálculo. Con la explosión del Internet, sin embargo, compañías como Google, Facebook y Yahoo! se enfrentaron con volúmenes sin precedentes de datos “no estructurados”, como cómo navegan las personas en Internet o los comentarios que hacen a sus amigos.
 
También se ha creado nuevo hardware y software que reduce significativamente el tiempo que toma analizar esta información, recuperándola tan rápidamente como un iPhone recupera una canción.
 
En noviembre, los creadores del software de fuente abierta Spark, que acelera el análisis de datos en 100 veces comparado con los sistemas existentes, recibieron 14 millones de dólares para iniciar una compañía que pudiera ofrecer una versión comercial de ese software.
 
ClearStory Dara, una empresa incipiente basada en Palo Alto, California, ha introducido un producto que puede analizar los datos al vuelo procedentes de varias fuentes. Con ClearStory, los datos sobre las ventas de boletos para el cine, por ejemplo, pudieran mezclarse con la información sobre el clima, incluso con mensajes de Twitter, y ser presentados como una gráfica de barras cambiante o un mapa, dependiendo de lo que esté tratando de determinar el cliente. Hay incluso una función de “datos que le pudieran gustar”, que sugiere nuevas fuentes de información las cuales probar.
 
El truco, dijo Sharmila Shahani-Mulligan, cofundadora y directora ejecutiva de ClearStory, fue desarrollar una forma de encontrar rápidamente y con precisión todas las fuentes de datos disponibles. Otro fue determinar cómo presentar los datos sobre, digamos, el clima típico en una comunidad, de tal manera que fueran útiles.
 
“Así”, dijo Shahani-Mulligan, “una cafetería pudiera decir si los clientes beberán Red Bull o chocolate caliente”.