Si fa presto a dire big data … (parte 1)

Oltre che ad essere il motto di questo blog, la frase “si fa presto a dire big data …” è stata ed è la miglior sintesi della maggior parte di convegni, webinar e  riunioni di lavoro a temache relative ai dati degli ultimi miei anni lavorativi. Purtroppo il termine “Big Data”, essendo una buzzword, è pronunciato spesso a sproposito sia per attirare l’attenzione che per giustificare qualunque tipo di progetto. Per questo oltre a far riferimento ad una delle migliori definizione e descrizioni del termine big data cioè la voce inglese di wikipedia proviamo ad entrare un po’ più in dettaglio in questo post per darne un’interpretazione più specifica e rigorosa.

LogoABDrev1

Il termine big data incomincia ad essere associato a progetti e a relativi prodotti a partire dalla seconda metà degli anni 2000 per differenziarli da quei progetti dati realizzabili con tecnologie mature già presenti sul mercato. Questo fenomeno si è espanso su più direttrici:
1) quella tecnologica. Cioè nella capacità di gestire grandi volumi dati e/o veloci volumi di dati. Le nuove tecnologie di memorizzazione dati di tipo NoSql rappresentano al meglio questa direttice.
2) quella algoritmica. Cioè la nascita o il grande miglioramento di metodologie che riescono ad estrarre valore da grandi moli di dati e che sono tipicamente definiti machine-learning.
3) quella relativa ai dati. Cioè l’aumentata disponibilità in termini sia di volumi che di frequenza di aggiornamento dei dati su cui possono fare leva progetti e analisi. Fenomeni come Open Data, il web stesso e Internet of Things hanno e stanno accelerando questa direttrice.
4) quella umano-organizzativa. Cioè l’evoluzione delle tradizionali figure di data-analyst verso le più poliedriche figure dei datascientist secondo la migliore definizione data nel 2010 da Drew Conway in un celebre post del suo blog. Queste figure riuscendo ad unire la capacità di usare nuovi algoritmi alle nuove tecnologie di elaborazione e memorizzazione dei dati, conoscendone la semantica e il contesto riescono a chiudere il cerchio del valore del progetto.

Esporeremo in dettaglio nel nostro viaggio tutte e quattro le direttrici ma quando almeno due sono presenti in misura importante all’interno di un progetto allora, secondo me, sì possiamo spendere l’aggettivo Big Data.
E’ chiaro che il numero di due è una scelta un poco arbitraria e che deriva dall’esperienza ma la presenza di una semantica “fumosa” non aiuta a sfruttare al meglio il fenomeno.  E poi non capita così spesso soprattutto in Italia che siano presenti anche due sole direttrici …

 

 

Annunci
Si fa presto a dire big data … (parte 1)

Un pensiero su “Si fa presto a dire big data … (parte 1)

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...