jueves, 20 de septiembre de 2018 |Hora: : :

Opinión


¿De qué hablamos cuando hablamos de big data?

Fecha Publicación: 08/05/2018  09:00 

Nota de opinión de Walter Sosa Escudero, Profesor de la Universidad de San Andrés - CONICET
 
El reciente escándalo de privacidad que involucra a Facebook pone a los algoritmos y a la idea de big data en el centro del debate. Uno de los enormes problemas de cualquier tecnología de moda es que viene acompañada de jerga; un catálogo de extraños términos, muchos en inglés e intraducibles. Jerga que sirve tanto a los efectos de denotar objetos nuevos e imposibles de referir con los viejos términos, como de crear una innecesaria barrera a la entrada, al solo efecto de impresionar a los novatos, como si realmente hiciese falta una nueva palabra para referir al agua tibia.
 
Y efectivamente “big data” es jerga. Cualquiera que haya pasado por no más de 15 minutos de una clase de inglés se da cuenta de que “big” es “grande” y que “data” son “datos”. Piense en lo que ha hecho en las últimas dos horas. Si caminó con su celular, muy posiblemente haya generado datos de su ubicación geográfica. Ni hablar de si activó el GPS para viajar en auto. Misma cosa si salió a correr con su reloj inteligente que le cuenta el ritmo cardiaco y los pasos. O si usó la tarjeta de crédito, si viajó en subte, si se entretuvo en Netflix mirando una serie, si puso “me gusta” a una foto de su tía en Facebook, si mandó o recibió un email, o si buscó un par de zapatos en una tienda online. Todo generó datos. Muchos datos.
 
Entonces, lo más obvio es decir que big data es datos masivos. Pero en realidad la idea refiere al volumen y tipo de datos provenientes de la interacción con dispositivos interconectados, como teléfonos celulares, tarjetas de crédito, cajeros automáticos, relojes inteligentes, computadoras personales, dispositivos de GPS o cualquier objeto capaz de producir información y enviarla electrónicamente a otra parte.
 
Pero el volumen (big) es solo una parte de la historia. A diferencia de una encuesta sistemática (como una encuesta política o esas que todavía funcionan por teléfonos de línea), los datos de big data son anárquicos y espontáneos. Toda vez que abrió su celular para que un app de Waze o Google Map lo guie a algún lugar, ha generado datos, no con el propósito de contribuir a ninguna encuesta ni estudio científico, sino con el de evitar el tráfico, o de no perderse. Es decir, los datos no fueron generados por el objetivo de crearlos (como en las respuestas a una encuesta tradicional) sino como resultado de otra acción, como ir a una reunión, pagar el almuerzo o buscar la dirección de un cine en internet.
 
Entonces, los datos de big data no son más de los mismos viejos datos (de encuestas, registros administrativos, etc.), sino un animal completamente distinto. En 2001, Doug Laney (analista de la consultora Gartner) escribió un influyente artículo, en donde resumió esta discusión diciendo que la revolución de big data tenía que ver con las ahora archifamosas “tres V de big data”: volumen, velocidad y variedad. La primera de las V hace referencia a “big” (mucho). La segunda, a que estos nuevos datos se generan a una velocidad que los hace disponibles casi instantáneamente. Y la tercera (variedad) remite a la naturaleza espontanea, anárquica y amorfa del objeto que ahora llamamos “dato”: un tuit, la posición geográfica de un GPS, una foto, todo constituye un dato, muy lejos de los datos tradicionales, esos que uno imagina prolijamente ordenados en una planilla de cálculo. El truco comunicacional de las tres V es efectivo en decir que big data es bastante más que muchos datos.
 
Y pronto fue necesario agregar una cuarta V: veracidad. Termino que refiere a que la naturaleza ruidosa y espontánea de los datos de big data contrasta con la de los datos burocráticos, contables o de encuestas tradicionales, usualmente sujetos a puntillosos ejercicios de validación.
 
Pero en algún momento lo de las V se desmadró, y añadir V a la lista original se transformó en otra nueva moda, como las cervecerías artesanales. En un jocoso artículo reciente, Tom Shafer habla de “Las 42 V de Big Data”: las tres iniciáticas propuestas por Laney, las dos o tres que juiciosamente se agregaron posteriormente (como “veracidad”) y la insólita lista que se añadió recientemente, incluyendo “vudú”, “vainilla” o “varifocal” (no, no le miento).
 
Chanzas aparte, una definición de big data que tenga que referir a 42 ideas es inoperante y oximorónica, como cuando un conocido peinador estilista se ufanaba de sus desfiles “con más de 200 top models”, como si “top” no se contradijese con “200”. Una definición que tenga que abarcar 42 conceptos es cualquier cosa menos una definición.
 
No, no hay ninguna definición precisa de qué es big data. Porque seguro que entre las tres V iniciales y las 42 del chiste de Shafer, hay dimensiones relevantes por abarcar, y nadie quiere pecar ni por omisión ni por inclusión innecesaria arriesgando una definición prematura de un fenómeno reciente.
 
Inquirido acerca de qué es la pornografía, Potter Stewart (ex juez de la corte suprema de los EE.UU.) dijo: “No sé, pero la reconozco cuando la veo”. En la misma línea, no hace falta una definición de big data, es algo que todos reconocemos aun cuando jamás lo hayamos visto, porque nos afecta a diario en todas las dimensiones de la vida cotidiana.
 




Fuente: (Walter Sosa Escudero- Universidad de San Andrés)

Compartir

Busqueda

Texto a buscar:



ir a Archivo [+]

Más Información

Link

- Acceso a link's de Interes.

Seguinos en twitter

Seguinos en twitter

     

Universidades HOY
E-mail: info@universidadeshoy.com.ar
prensa@universidadeshoy.com.ar
Buenos AIres - Buenos Aires
Argentina


NAVEGACION


REDES SOCIALES

Copyright ©2018 todos los derechos reservados Diseño Web Grandi y Asociados Diseño Web Grandi y Asociados