Llevo ya un cierto tiempo recopilando información sobre Big data e introduciendo nociones sobre el tema en algunos de mis cursos, pero hoy mientras preparaba una conferencia me he dado cuenta de que era un tema que aún no habíamos mencionado en la página, a pesar de ser una de las tendencias más señaladas actualmente en la industria.
Por Big data nos referimos exactamente a lo que su propio nombre indica: al tratamiento y análisis de enormes repositorios de datos, tan desproporcionadamente grandes que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales. La tendencia se encuadra en un entorno que no nos suena para nada extraño: la proliferación de páginas web, aplicaciones de imagen y vídeo, redes sociales, dispositivos móviles, apps, sensores, internet de las cosas, etc. capaces de generar, según IBM, más de 2.5 quintillones de bytes al día, hasta el punto de que el 90% de los datos del mundo han sido creados durante los últimos dos años. Hablamos de un entorno absolutamente relevante para muchos aspectos, desde el análisis de fenómenos naturales como el clima o de datos sismográficos, hasta entornos como salud, seguridad o, por supuesto, el ámbito empresarial. Y es precisamente en ese ámbito donde las empresas desarrollan su actividad donde está surgiendo un interés que convierte a Big data en algo así como “the next buzzword”, la palabra que sin duda escucharemos viniendo de todas partes: vendedores de tecnología, de herramientas, consultores, etc. En un momento en que la mayoría de los directivos nunca se han sentado delante de una simple página de Google Analytics y se sorprenden poderosamente cuando ven lo que es capaz de hacer, llega un panorama de herramientas diseñadas para que cosas inmensamente más grandes y complejas puedan tener sentido. Tenle miedo, mucho miedo.
¿Qué hay exactamente detrás del buzzword? Básicamente, la evidencia de que las herramientas de análisis no llegan para poder convertir en información útil para la gestión empresarial los datos generados. Si tu empresa no tiene un problema con la analítica de datos, es simplemente porque no está donde tiene que estar o no sabe cómo obtener información del entorno: en cuanto unimos a la operativa tradicional y a las transacciones cuestiones como una cada vez más intensa interacción bidireccional con los clientes y el movimiento de analítica web que generan las redes sociales de todo tipo, nos encontramos un panorama en el que no estar supone de partida una desventaja importante con respecto a quienes sí están. Se trata, simplemente, de que operar en el entorno con mayor capacidad de generación de datos de la historia conlleva la adaptación de herramientas y procesos. Bases de datos no estructuradas, no convencionales, que pueden alcanzar petabytes, exabytes o zetabytes, y que requieren tratamientos específicos por sus necesidades tanto de almacenamiento como de procesamiento o visualización.
Big data fue, por ejemplo, la estrella en el último Oracle OpenWorld: el posicionamiento adoptado es el de ofrecer máquinas enormes con capacidades descomunales, procesamiento multiparalelo, análisis visual sin límites, tratamiento de datos heterogéneos, etc. Desarrollos como Exadata y adquisiciones como Endeca soportan una oferta basada en el pensar a lo grande, que algunos no han dudado en discutir: frente a esa aproximación, la realidad es que algunas de las compañías más centradas en el tema, como Google, Yahoo! o Facebook o la práctica totalidad de las startups no utilizan herramientas de Oracle y optan, en su lugar, por una aproximación basada en lo distribuido, en la nube y en el código abierto. De código abierto son Hadoop, un framework sumamente popular en este campo que permite a las aplicaciones trabajar con enormes repositorios de datos y miles de nodos, creado originalmente por Doug Cutting (que le dio el mismo nombre que tenía el elefante de juguete de su hijo) e inspirado en herramientas de Google como MapReduce o Google File System, o NoSQL, sistemas de bases de datos no relacionales necesarios para albergar y procesar la enorme complejidad de datos de todo tipo generados, y que en muchos casos no siguen la lógica de garantías ACID (atomicity, consistency, isolation, durability) característica de las bases de datos convencionales.
En el futuro: un panorama de adopción cada vez mayor, y muchos, muchos interrogantes. Implicaciones de cara a los usuarios y su privacidad, o a las empresas y la fiabilidad o potencialidad real de los resultados obtenidos: como dice el MIT Technology Review, grandes responsabilidades. Por el momento, una cosa es segura en Big data: prepara tus oídos para escuchar el término.







08.11.2011 a las 18:43 Permalink
[...] es un nombre que vas a ver por muchos sitios en los próximos tiempos, al hilo del fenómeno Big data. Su logo es ese elefante amarillo, el juguete favorito del hijo de su creador original, Doug [...]
26.11.2011 a las 09:17 Permalink
[...] origen que habitualmente se cita para el análisis de Big data como tendencia es la intersección entre las tecnologías CRM, que permiten almacenar toda la [...]
28.11.2011 a las 13:17 Permalink
[...] más me está llamando la atención del análisis de la tendencia que está suponiendo el fenómeno Big data en los estamentos empresariales: la enorme dificultad para entenderlo sin bajar hasta la [...]
27.01.2012 a las 12:26 Permalink
[...] varias definiciones de Big Data, por ejemplo Enrique Dans dice: “se llama al tratamiento y análisis de enormes repositorios de datos, tan [...]
13.02.2012 a las 15:09 Permalink
[...] en su entorno puede ver mermada su capacidad competitiva. Pero como indica el profesor Enrique Dans en su blog, ante un panorama de adopción cada vez mayor de esta tecnología se plantean muchos interrogantes [...]
19.02.2012 a las 13:42 Permalink
[...] por ello que una de las tendencias de futuro en el mundo de la tecnología es lo que se llama Big Data, y que hace referencia al tratamiento y análisis de cantidades de datos descomunales que exceden [...]
05.03.2012 a las 12:17 Permalink
[...] tan grande que las técnicas analíticas tradicionales no sirven. El profesor Enrique Dans tiene un post en su blog donde explica brevemente la idea, pero es fácil entenderlo si tenemos en cuenta el volumen de [...]
16.03.2012 a las 11:54 Permalink
[...] y carecemos de teorías para analizarlas”, explicaba José Luis Vicente al hablar del ‘Big Data’. Pero hacer periodismo de datos no significa publicar todos los disponibles y pone de ejemplo el caso [...]
23.03.2012 a las 09:27 Permalink
[...] riesgo de una privatización “disimulada”. El Big Data que empiezan ya a recoger nuestras ciudades –gracias a una creciente apuesta institucional- puede [...]
26.03.2012 a las 15:36 Permalink
[...] os dejamos uno de los videos: Python in Big Data with an overview of NumPy & SciPy (Python en Big Data con un vistazo a Numpy y Scipy) por Travis Oliphant (creador de [...]
27.03.2012 a las 12:56 Permalink
[...] risco de uma privatização “dissimulada”. O Big Data que nossas cidades já começam a reunir – graças a uma crescente aposta institucional – [...]
31.03.2012 a las 00:58 Permalink
[...] Big Data al procesamiento y análisis de enormes volúmenes de datos que no pueden tratarse con las [...]
04.04.2012 a las 09:55 Permalink
[...] volumen creciente de datos (Big Data), en la actualidad, requiere nuevas tecnologías para el procesamiento paralelo masivo, [...]
04.04.2012 a las 22:21 Permalink
[...] call Big Data to process and analyze huge volumes of data can not be treated with the tools for managing [...]
27.05.2012 a las 23:33 Permalink
[...] dispone hoy día gracias a Internet, en este punto el término a tener en cuenta es “Big Data”, introducción y perspectiva en el blog de Enrique Dans, por poner un [...]
19.09.2012 a las 23:45 Permalink
[...] lo indicó el informe McKingsey, y recogió luego Enrique Dans, Big Data es sin duda un cambio hacia la innovación en el manejo del oro de nuestros tiempos: la [...]
06.10.2012 a las 19:02 Permalink
[...] tener una referencia sobre “Big Data”, podemos usar la entrada del blog de Enrique Dans, que la muestra como el tratamiento y análisis de enormes repositorios de datos, tan [...]
08.10.2012 a las 20:47 Permalink
[...] concepto de Big Data se refiere al almacenamiento y procesado de enormes cantidades de datos, tan desproporcionadamente grandes que resulta imposible tratarlos con las herramientas de bases de datos [...]
20.10.2012 a las 08:35 Permalink
[...] procesado y análisis de la organización. Como comenta Enrique Dans en su articulo Big Data: una pequeña introducción, si hasta ahora nos sorprendiamos con lo que es capaz de hacer Google Analitcs, ahora llegan un [...]
11.01.2013 a las 12:03 Permalink
[...] hacia dónde nos lleva esto tecnológicamente. Ya hay buenos puntos de entrada, como ”una pequeña introducción” del incansable Enrique [...]
24.04.2013 a las 10:26 Permalink
[...] la explosión del Big Data (según IBM, generamos más de 2.5 quintillones de bytes al día), las organizaciones necesitan [...]
24.04.2013 a las 23:47 Permalink
[...] Con la explosión del Big Data (según IBM, generamos más de 2.5 quintillones de bytes al día), las organizaciones necesitan convertir esa tendencia de los consumidores en una estrategia de transformación de sus procesos de negocio. El SoMoClo está aquí para quedarse. El mundo ya es social, móvil y cloud; las empresas no deberían tardar en serlo, entendiendo lo cloud como el modo de entrega, lo social como el servicio compartido y lo móvil como el acceso ubicuo. Los líderes de las organizaciones deberían repensar sus procesos porque el SoMoClo necesita ser integrado en la empresa y representará el próximo capítulo de la transformación de Internet, expandiendo la colaboración a nuevos niveles de productividad. [...]
27.04.2013 a las 20:09 Permalink
[...] la explosión del Big Data (según IBM, generamos más de 2.5 quintillones de bytes al día), las organizaciones necesitan [...]
29.04.2013 a las 09:02 Permalink
[...] a explosão do Big Data (segundo IBM, geramos mais de 2.5 quintilhões de bytes ao dia), as empresas precisam transformar [...]
06.05.2013 a las 09:00 Permalink
[...] Zuge von Datenexplosion und Big Data (laut IBM erzeugen wir mehr als 2,5 Quintillionen Bytes pro Tag) müssen Unternehmen diesen [...]