
El Big Data i les nostres dades
Big data es defineix com les “Dades massives al sector de les tecnologies de la informació i comunicació es diu del conjunt de dades que pel seu volum, la seva naturalesa i la velocitat a què han de ser processades ultrapassen la capacitat dels sistemes informàtics habituals”.
És un concepte i unes eines pensades inicialment per a grans empreses.
Algunes dades són força impactants;
- com utilitza dos magatzems de dades a 7,5 petabytes i 40PB així com un cluster Hadoop 40PB per a la cerca, les recomanacions de consum, i el marxandatge. Dins l’emmagatzematge de dades 90pb d’eBay.
- com maneja milions d’operacions de back-end de cada dia, així com les consultes de més de mig milió de venedors de terceres parts. La tecnologia central que manté Amazon funcionament està basat en Linux i en 2005 van tenir tres bases de dades més grans del món de Linux, amb capacitats de 7,8 TB, 18,5 TB i 24,7 TB.
- Walmart s’ocupa de més d’1 milió de transaccions dels clients cada hora, que s’importa en bases de dades que s’estima contenen més de 2,5 petabytes (2.560 terabytes) de dades – l’equivalent a 167 vegades la informació continguda en tots els llibres dels EUA Biblioteca del Congrés.
Deia inicialment perquè si ens hi parem a pensar cada empresa pot construir el seu propi big data.
Avui tecnològicament recollir molta informació sobre allò que fem, allò que produïm no és complicat; hi ha molts sistemes per a enregistrar dades i hi ha molts sistemes per a després poder-les centralitzar, normalitzar i analitzar.
El què és important és tenir la capacitat d’anàlisi de les dades i poder optimitzar recursos, processos i en definitiva fer les coses millor.
Nosaltres podem acompanyar-vos en aquest procés d’enregistrar, centralitzar i analitzar la vostra informació per a poder tenir el vostre big data.