Quando usare tecnologie “big data”: le tre domande fondamentali …

Questo post prende spunto da una domanda a cui mi capita di rispondere quando si parla, in differenti contesti, di nuove tecnologie emergenti in area dati. La domanda sempre più frequente, anche alla luce di un mercato di vendor di tecnologia sempre più aggressivo, è relativa alla necessità di introdurre e di affiancare allo stack architetturale di dati tradizionale anche tecnologie cosiddette “big data” cioè che si sono evolute in contesti dove la numerosità dei dati, la loro diversità o la necessità di una veloce computazione di essi hanno fatto nascere nuovi paradigmi.
A mio parere la corretta risposta sta nel riuscire a capire, come in ogni progetto infrastrutturale, se la tecnologia abilita almeno uno dei tre miglioramenti che ho sintetizzato in questa immagine.

whybigdatatech

1) La prima domanda a cui rispondere è se la nuova tecnologia comporta in progetti esistenti o futuri una riduzione del “time to market” di un nuovo prodotto. Per fare un esempio concreto l’ecosistema hadoop sta avendo uno sviluppo esponenziale e la realizzazione di algoritmi all’interno del suo stack può facilitare, rispetto a soluzioni più tradizionali, l’integrazione nella fase progettuali dei team di datascientist con team di data-engineer incidendo notevolmente in maniera positiva nel tempo in cui un’idea raggiunge il mercato. Nella valutazione complessiva vanno però debitamente tenuti in conto i tempi di “acquisizione” o di “apprendimento” della nuova tecnologia e della presenza nei team di progetto di risorse che facilitino l’integrazione con i sistemi tradizionali.

2) La seconda domanda afferisce alla possibile riduzione di costi che la tecnologia può abilitare in terminini di progetti e processi all’interno delle organizzazioni. Per esempio l’utilizzo di graph-database per applicazioni e algoritmi che sfruttano i paradigmi della network analysis può portare a diversi ordini di grandezza di risparmio di costi rispetto all’utilizzo di database relazionali. Così come l’off-loading di sistemi costosi di archiviazione a favore di sistemi, come hadoop, che consentono comunque l’accesso agevole all’informazione può essere un modo intelligente, anche se meno affascinante di altri, per introdurre queste nuove tecnologie in azienda.

3) La terza domanda è forse quella più scontata e anche più facile da farsi ma non sempre la più agevole a cui rispondere. Infatti il valore in termini di nuovi prodotti che queste nuove tecnologie possono portare sul mercato ha un tempo di misurazione piuttosto lungo e che dipende spesso anche dalla capacità di capire il feed-back dei primi clienti in una logica iterativa di miglioramento continuo. In estrema sintesi la terza domanda è quella sicuramente più importante perchè incide più direttamente sul business dell’azienda ma è anche quella a più alto rischio di errore.

Proprio in questo senso, se l’introduzione di una tecnologia innovativa big data in area dati può essere giustificata da più di una delle tre logiche sopra descritte allora la probabilità che questa introduzione sia un successo aumenta insieme al consenso all’interno delle organizzazioni.
Ne consegue che il mio personale suggerimento è quello di non focalizzarsi solo e troppo sul riuscire a definire un chiaro business case ma anche di valutare l’importanza della tecnologia come possibile fattore abilitante a 360° sugli interi processi  organizzativi.
In questo senso due sono i consigli pratici che possono aiutare questa strategia: il primo è quello di portare fortemente a bordo del processo decisionali la parte a più alta conoscenza tecnologica dell’azienda e dall’altro di guardare come le aziende in giro per il mondo stanno usando la specifica tecnologia. Questo bellissimo libro “Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results” dell’esperto di tecnologie Big Data Bernard Marr può essere un buon punto di partenza …

 

 

 

 

 

 

 

 

 

 

 

 

Annunci
Quando usare tecnologie “big data”: le tre domande fondamentali …

Il Chief Data Officer e il suo Ecosistema

Il Chief Data Officer è sicuramente insieme ai datascientist una figura emergente all’interno delle organizzazioni. Per provare a fare luce su questa figura partirò da una sua definizione abbastanza condivisa per poi provare a descrivere, facendo riferimento agli studi recenti più autorevoli, il suo ecosistema cioè le aree aziendali che gestisce o con cui ha una relazione molto forte.

definzione

Secondo la definizione della voce inglese di Wikipedia il CDO (Chief Data Officer) ha in carico sia la governance dello strato dei dati (inteso come asset o valore aziendale) che la definizione strategica delle priorità in questa area cercando di spingersi a identificare nuove opportunità di business. In questo senso mi piace sottolineare, usando una terminologia più vicina al mondo agile, come il Chief Data Officer sia da una parte un  facilitatore e dall’altra un “disegnatore” di strategie aziendale. In questa ottica il ruolo viene proiettato nella parte più moderna dell’ambito manageriale dove plasmando il suo ecosistema il Chief Data Officer entra nel cuore delle decisioni aziendali sempre più guidate dall’analisi dei dati.

Tra i molti studi su questo delicato ruolo sicuramente quello che meglio descrive la molteplicità delle sue dimensioni è “A Cubic Framework for the Chief Data Officer: Succeeding in a World of Big Data” della Sloan School of Management – MIT Boston 2014. Nel lavoro sono descritte le tre direttrici principali in cui si muove il Chief Data Officer e cioè:

3dimensionicdo

1) La direzione collaborativa: più orientata verso l’interno dell’organizzazione piuttosto che verso l’esterno andando a braccetto con il business.
2) La direzione di impatto di valore che può essere più tattica focalizzata sul miglioramento dei servizi esistenti o più strategica orientata ad allargare il mercato dell’organizzazione.3) La direzione della tipologia dei dati e tecnologie: più focalizzata sull’uso dei dati tradizionali o, in maniera un poco più visionaria, spingersi più nell’area “Big data”

In questo spazio tridimensionale il posizionamento del CDO in una delle otto porzioni porta, secondo questo studio del MIT, a differenti categorizzazioni.
8cdo

Le otto tipologie che potete vedere nella figura sopra sono di fatto una differente interpretazione del ruolo del Chief Data Officer che è molto funzione sia del contesto organizzativo in cui si inserisce sia della caratteristiche personali. Pur non scendendo del dettaglio descrittivo delle otto tipologie, che potete trovare in dettaglio nel paper, bisogna comunque evidendenziare che si va da un ruolo più legato alla facilitazione e alla governance (Coordinatore) ad uno più ambizioso e strategico (Sperimentatore).

Passando a valutare l’ecosistema che sta attorno al Chief Data Officer occorre sicuramente far riferimento a questo ottimo articolo di Experian “The Chief Data Officer: Bridging the gap between data and decision-making”.
experiandataquality

Come si vede nella figura sopra, Experian nel suo studio  evidenzia quelle che sono le figure chiave del villaggio del Chief Data Officer. E’ sicuramente da sottolineare la graduale “traslazione” di queste figure dai Data owners che sono le persone responsabili di ogni singolo dataset presente in azienda fino ai Data analysts che cercano di usare i dati in ottica strettamente business. Oltre e tra queste due figure in organizzazioni ad alta complessità e dove il dato è un asset molto strategico possono o meglio dovrebbero esistere le altre figure di questo sempre più ampio villaggio.

Per provare a dare una vista il più possibile olistica di questo ruolo e per non dimenticare alcuni aspetti che spesso possono non emergere (l’aspetto legal in primis) ho provato a sintetizzare in questa figura quale potrebbe essere un suo buon ecosistema.

mycdoofficial

Nella sua sfera di competenza o comunque in stretta relazione con il suo operato ci deve essere:

1) L’aspetto legale perchè l’utilizzo di dati interni ed esterni all’azienda è sempre più influenzato da normative legate alla Privacy e al Copyright con una data protection law europea che porterà a breve uno tsunami in questa area.

2) La cura della qualità del dato. L’utilizzo di dati provenienti anche da fonti esterni spesso non strutturate aumenta sempre di più l’importanza di questo aspetto.

3) La governance del dato. In organizzazioni sempre più complesse con un livello di skill diversificato all’interno dei dipartimenti la gestione della distribuzione del dato e della sua conoscenza è un fattore strategico per poter sfuttare in maniera massiva il valore del petrolio del XXI secolo.

4) La tecnologia in ambito dati. L’esplosione cambriana delle tecnologie di gestione e dell’analisi dei dati fornisce sempre maggiore importanza strategica a questo aspetto: se il  poliglottismo è un valore certo questo va inquadrato comunque in una vista strategica.

5) L’innovazione. In un mondo sempre più data-driven  il dato si incrocia in maniera molto sinergica ed esponenziale con l’innovazione all’interno di qualunque organizzazione.

6) La datascience. Come più volte evidenziato la datascience si pone all’incrocio tra tecnologia (computer science), statistica e conoscenza del dominio dei dati: l’interazione con il villaggio del Chief Data Officer non può che essere fortissimo.

La definizione del ruolo e del dominio di influenza di questa nuova figura all’interno delle organizzazione è, ancora più di altre figure, liquida ma probabilmente con una crescita della sua componente strategica all’interno delle organizzazioni che vorranno diventare vere data-driven company di successo.

 

Il Chief Data Officer e il suo Ecosistema