domingo, 4 de noviembre de 2012

How Big is Big Data?


Hoy en día la cantidad de información que manejamos a diario es muy grande, y eso sólo en nuestra vida diaria, ahora vayamos a nuestras organizaciones, la información que se maneja es mucha y muy variada aunque eso no quiere decir que toda sea útil y aprovechada. Anteriormente el enfoque de información en las organizaciones fue utilizar información estructurada y relacional lo que les daba la oportunidad de poder tener información histórica, poder hacer consultas a la misma y aprender de los resultados que habían tenido en el pasado pero actualmente las organizaciones están buscando un nuevo enfoque en el manejo de la información que les brindará ventajas sobre competidores y sobre todo, les permitirá tomar decisiones no solo basadas en información histórica si no que en información actual. Es de todo esto de donde proviene el término Big Data que no solo se refiere a grandes volúmenes de información, mas que nada se refiere a la posibilidad de tener información que permite su análisis para obtener un mayor conocimiento de la industria en la que estemos interesados, es para ello que se requiere información y sistemas de manejo de información que cumplan con las 4 v que son volumen, variedad, velocidad y veracidad todo esto da la posibilidad de realizar análisis de distintos tipos, sintaxicos, semánticos e inclusive sentimentales lo que brinda información valiosa como tendencias de consumo, intereses de usuarios, etc.

Investigando, encontré un ejemplo de como un post de facebook es manejado, en un formato estructurado llamado JSON que esta compuesto de la siguiente manera:

{
"data": [
{ "id": "53423432999_23423423_19898799",
"from": { "name": "Paul Zikopoulos", "id": "Z12" },
"message": "Thinking of surprising my wife with a quality time gift that
lets her know she's special, any ideas? I thought about taking her to
the driving range, perhaps play a round and caddie my game.",
"created_time": "2012-08-02T21:27:44+0000", "likes: 5,"
"comments": { "data": [ { "id": 2847923942_723423423",
"from": { "name": "MaryAnne Infanti", "id": "948574763" },
"message": "Paul! Purses and gold! Costco’s got a great Kate Spade purse
on sale this week that says I love you without having to lift a pen.
If you go with your idea, the only thing driving will be you: alone! ",
"created_time 2012-00-02T11:27:44+0000", "likes: 64 } }

A pesar de que la información es almacenada y manejada de una manera estructurada lo que brinda el potencial de beneficio es la información no estructurada contenida, en forma de un mensaje, la cuál es analizada por la empresa y le da la posibilidad de mostrarnos paginas, publicidad, usuarios, etc que pueden llegar a ser de nuestro interés.

Para todo ello tenemos otros conceptos como son el procesamiento en tiempo real, que aunque actualmente esta en boga no hay que confundirnos y debemos diferenciar cuando realmente lo necesitamos y cuando solo es un lujo más. Tomemos los ejemplos de las cajas negras de los aviones, estas, en un solo viaje generan y almacenan mas de 150 TB de datos, datos que en realidad no son información relevante a menos que suceda un accidente que es cuando suelen revisar y analizar toda esta información; en cambio, teniendo las herramientas de análisis y la infraestructura adecuada podríamos obtener mucha información en tiempo real lo que permitiría tomar decisiones en pleno vuelo que podrían ayudar a evitar infinidad de accidentes.

Hoy en día existen infinidad de herramientas de análisis y toda esta información, y no solo herramientas, existen ramas de las ciencias de la computación como son la Minería de Datos enfocadas totalmente al análisis y uso de grandes volúmenes de información para la toma de decisiones, lo que nos invita a reflexionar que tan importante puede llegar a ser el uso de las mismas para hacer que nuestras organizaciones obtengan ventajas frente a sus competidores.



Por último les dejaremos un pequeño pero muy interesante video explicando un poco más lo que es Big Data.


González Vallejo, Mario Alberto
Jimánez Palacios, Carlos Omar
Sánchez Hernández, Jose Alejandro 

1 comentario:

  1. Hola compañeros,

    No conocía la forma en la que Facebook estructura sus contenidos. De hecho es muy interesante y bastante apropiada. Incluso podríamos decir que es recursiva.

    Superado el reto de "estructurar" lo "no estructurado" viene el reto de analizar semánticamente el contenido. Y no sólo eso, hacerlo en tiempo real para que que Fb pueda publicitar marcas o soluciones que se estén mencionando en el mensaje. Es realmente impresionante la certeza con la que lo hacen.

    Como lo comentamos en clase, nada es gratis. Es curioso como nosotros solitos damos nuestra información y es a través de esta que empresas como Fb y Google obtienen monumentales ganancias.

    Saludos!
    Oscar Silva

    ResponderEliminar