Hoy
en día la cantidad de información que manejamos a diario es muy grande, y eso
sólo en nuestra vida diaria, ahora vayamos a nuestras organizaciones, la
información que se maneja es mucha y muy variada aunque eso no quiere decir que
toda sea útil y aprovechada. Anteriormente el enfoque de información en las
organizaciones fue utilizar información estructurada y relacional lo que les
daba la oportunidad de poder tener información histórica, poder hacer consultas
a la misma y aprender de los resultados que habían tenido en el pasado pero
actualmente las organizaciones están buscando un nuevo enfoque en el manejo de
la información que les brindará ventajas sobre competidores y sobre todo, les
permitirá tomar decisiones no solo basadas en información histórica si no que
en información actual. Es de todo esto de donde proviene el término Big Data
que no solo se refiere a grandes volúmenes de información, mas que nada se
refiere a la posibilidad de tener información que permite su análisis para
obtener un mayor conocimiento de la industria en la que estemos interesados, es
para ello que se requiere información y sistemas de manejo de información que
cumplan con las 4 v que son volumen, variedad, velocidad y veracidad todo esto da
la posibilidad de realizar análisis de distintos tipos, sintaxicos, semánticos
e inclusive sentimentales lo que brinda información valiosa como tendencias de
consumo, intereses de usuarios, etc.
Investigando,
encontré un ejemplo de como un post de facebook es manejado, en un formato estructurado
llamado JSON que esta compuesto de la siguiente manera:
{
"data": [
{ "id":
"53423432999_23423423_19898799",
"from": { "name": "Paul
Zikopoulos", "id": "Z12" },
"message": "Thinking of surprising
my wife with a quality time gift that
lets her know she's special, any ideas? I thought
about taking her to
the driving range, perhaps play a round and caddie
my game.",
"created_time":
"2012-08-02T21:27:44+0000", "likes: 5,"
"comments": { "data": [ {
"id": 2847923942_723423423",
"from": { "name": "MaryAnne
Infanti", "id": "948574763" },
"message": "Paul! Purses and gold!
Costco’s got a great Kate Spade purse
on sale this week that says I love you without
having to lift a pen.
If you go with your idea, the only thing driving
will be you: alone! ",
"created_time
2012-00-02T11:27:44+0000", "likes: 64 } }
A
pesar de que la información es almacenada y manejada de una manera estructurada
lo que brinda el potencial de beneficio es la información no estructurada
contenida, en forma de un mensaje, la cuál es analizada por la empresa y le da
la posibilidad de mostrarnos paginas, publicidad, usuarios, etc que pueden
llegar a ser de nuestro interés.
Para
todo ello tenemos otros conceptos como son el procesamiento en tiempo real, que
aunque actualmente esta en boga no hay que confundirnos y debemos diferenciar
cuando realmente lo necesitamos y cuando solo es un lujo más. Tomemos los
ejemplos de las cajas negras de los aviones, estas, en un solo viaje generan y
almacenan mas de 150 TB de datos, datos que en realidad no son información
relevante a menos que suceda un accidente que es cuando suelen revisar y analizar
toda esta información; en cambio, teniendo las herramientas de análisis y la infraestructura
adecuada podríamos obtener mucha información en tiempo real lo que permitiría
tomar decisiones en pleno vuelo que podrían ayudar a evitar infinidad de
accidentes.
Hoy
en día existen infinidad de herramientas de análisis y toda esta información, y
no solo herramientas, existen ramas de las ciencias de la computación como son
la Minería de Datos enfocadas totalmente al análisis y uso de grandes volúmenes
de información para la toma de decisiones, lo que nos invita a reflexionar que
tan importante puede llegar a ser el uso de las mismas para hacer que nuestras
organizaciones obtengan ventajas frente a sus competidores.
Por último les dejaremos un pequeño pero muy interesante video explicando un poco más lo que es Big Data.
González Vallejo, Mario Alberto
Jimánez Palacios, Carlos Omar
Sánchez Hernández, Jose Alejandro
Jimánez Palacios, Carlos Omar
Sánchez Hernández, Jose Alejandro
Hola compañeros,
ResponderEliminarNo conocía la forma en la que Facebook estructura sus contenidos. De hecho es muy interesante y bastante apropiada. Incluso podríamos decir que es recursiva.
Superado el reto de "estructurar" lo "no estructurado" viene el reto de analizar semánticamente el contenido. Y no sólo eso, hacerlo en tiempo real para que que Fb pueda publicitar marcas o soluciones que se estén mencionando en el mensaje. Es realmente impresionante la certeza con la que lo hacen.
Como lo comentamos en clase, nada es gratis. Es curioso como nosotros solitos damos nuestra información y es a través de esta que empresas como Fb y Google obtienen monumentales ganancias.
Saludos!
Oscar Silva