Si fa presto a dire big data … (parte 1)

Oltre che ad essere il motto di questo blog, la frase “si fa presto a dire big data …” è stata ed è la miglior sintesi della maggior parte di convegni, webinar e  riunioni di lavoro a temache relative ai dati degli ultimi miei anni lavorativi. Purtroppo il termine “Big Data”, essendo una buzzword, è pronunciato spesso a sproposito sia per attirare l’attenzione che per giustificare qualunque tipo di progetto. Per questo oltre a far riferimento ad una delle migliori definizione e descrizioni del termine big data cioè la voce inglese di wikipedia proviamo ad entrare un po’ più in dettaglio in questo post per darne un’interpretazione più specifica e rigorosa.

LogoABDrev1

Il termine big data incomincia ad essere associato a progetti e a relativi prodotti a partire dalla seconda metà degli anni 2000 per differenziarli da quei progetti dati realizzabili con tecnologie mature già presenti sul mercato. Questo fenomeno si è espanso su più direttrici:
1) quella tecnologica. Cioè nella capacità di gestire grandi volumi dati e/o veloci volumi di dati. Le nuove tecnologie di memorizzazione dati di tipo NoSql rappresentano al meglio questa direttice.
2) quella algoritmica. Cioè la nascita o il grande miglioramento di metodologie che riescono ad estrarre valore da grandi moli di dati e che sono tipicamente definiti machine-learning.
3) quella relativa ai dati. Cioè l’aumentata disponibilità in termini sia di volumi che di frequenza di aggiornamento dei dati su cui possono fare leva progetti e analisi. Fenomeni come Open Data, il web stesso e Internet of Things hanno e stanno accelerando questa direttrice.
4) quella umano-organizzativa. Cioè l’evoluzione delle tradizionali figure di data-analyst verso le più poliedriche figure dei datascientist secondo la migliore definizione data nel 2010 da Drew Conway in un celebre post del suo blog. Queste figure riuscendo ad unire la capacità di usare nuovi algoritmi alle nuove tecnologie di elaborazione e memorizzazione dei dati, conoscendone la semantica e il contesto riescono a chiudere il cerchio del valore del progetto.

Esporeremo in dettaglio nel nostro viaggio tutte e quattro le direttrici ma quando almeno due sono presenti in misura importante all’interno di un progetto allora, secondo me, sì possiamo spendere l’aggettivo Big Data.
E’ chiaro che il numero di due è una scelta un poco arbitraria e che deriva dall’esperienza ma la presenza di una semantica “fumosa” non aiuta a sfruttare al meglio il fenomeno.  E poi non capita così spesso soprattutto in Italia che siano presenti anche due sole direttrici …

 

 

Si fa presto a dire big data … (parte 1)

Perchè agile big data?

 

Ho sempre ritenuto importante dare una spiegazione al nome delle cose. Senza addentrarmi nella filosofia del linguaggio e nella diatriba che coinvolge secoli di pensatori ritengo fondamentale partire proprio da qui.

Agile vuole far riferimento a quelle metodologie che, partite da un nuovo modo di sviluppare software alla fine degli anni ’90 e dal metodo Lean Toyota, si sono sviluppate in maniera “virale” fino ad avere uno spazio importante  all’interno dell’innovazione, del Project Management e anche del Management in generale.

Big Data è sicuramente diventato un termine usato e abusato in differenti contesti, spesso senza conoscerne: il significato, le sue dinamiche e i suoi possibili impatti positivi e negativi sulla vita lavorativa e non di ognuno di noi. E’ comunque innegabile che il valore dei dati è cresciuto esponenzialmente negli ultimi anni. Scopo di questo blog è raccontare, in viaggio, questo cambiamento in maniera non esaustiva ma puntuale e passionale.

Il punto di vista, o meglio le istantanee di questo viaggio saranno quelle di un data-lover,  che si racconta abbia pronunciato come prima parola un numero e che ha fatto di questa passione una ragione di vita lavorativa e non.

Provare a rendere possibile questo ossimoro (agile e big data) nella quotidianità è una sfida che vivo tutti i giorni e raccontare questa sfida è un modo per affrontarla al meglio!

Perchè agile big data?