La decentralizzazione è il cuore pulsante dei Big Data

Riflettendo su quali siano stati i passaggi tecnologici e non che hanno reso possibile il fenomeno  Big Data appare chiaro come la decentralizzazione sia la caratteristica che accomuna molti momenti importanti di questa evoluzione. Cerchiamo di fare un passo indietro andando a descrivere i passaggi più significativi e vedendo come, in questi, la decentralizzazione sia stato una chiave di successo.

P2P_Topology

L’inizio. Possiamo identificarlo nel 1991 con la definizione di Tim Berners-Lee del protocollo di comunicazione HTTP: questo momento sancisce la nascita del World Wide Web, che poggia anche sul protocollo di trasmissione TCP/IP, definito qualche anno prima nella realizzazione della rete Internet: l’insieme di reti pubbliche interconnesse su scala mondiale. La topologia della rete Internet e i sopra-citati protocolli di fatto rispondono alla logica di decentralizzazione massima tale da non rendere nessun nodo critico al funzionamento della rete e tale che anche i contenuti sulla rete siano distribuiti sui milioni di server tra loro connessi, in modo molte volte ridondato.

world-wide-web-341418_960_720

La prima crescita. La nascita e il grande sviluppo del Web fa comunque nascere servizi, e siamo a cavallo tra il vecchio e il nuovo millennio, quasi sempre free,  che raggiungono velocemente centinaia di milioni di utenti. Stiamo parlando di prodotti realizzati dalle più grandi aziende che dominano ancora oggi il web e cioè Google, Yahoo, Amazon e subito dopo  Facebook e Linkedin. La grandissima richiesta di computazione e di servizi real time mette in crisi l’approccio architetturale tradizionale, quello basato su database relazionali e su supercomputer posti in grandi datacenter proprietari. E anche in questo caso il paradigma della decentralizzazione viene in aiuto ispirando da un lato l’approccio computazionale distribuito alla base dell’ecosistema Hadoop e dall’altro il cloud computing che consente di distribuire i dati e le applicazioni su più datacenter, rendendo il tutto molto più robusto e resiliente in caso di criticità di singoli nodi o di una parte della rete stessa. E Hadoop e il Cloud, con la loro capacità di distribuire le elaborazione di dati e di conservarli in maniera efficiente, sono alla base ancora oggi del fenomeno Big Data.

hadoop-elephant-cloud

Per questo mi piace rappresentare il nostro mattoncino rosso (la parte tecnologica del nostro lego Big Data) costituito da molte componenti distribuite.

LegoRossoSpezzato

La crescita dirompente. Ma anche alla base della crescita dei dati è evidente l’importanza che ha avuto la decentralizzazione. Infatti nella seconda metà degli anni 2000 l’ondata “social” del web è stata possibile perchè si è passati da una generazione dei contenuti da parte di pochi (Web 1.0) alla generazione da parte di tutti (Web 2.0). Di fatto è stata decentralizzata la generazione di contenuti presenti nel web con una esplosione della numerosità dei dei dati disponibile on-line che è una delle direttrici in cui si è maggiormente sviluppato il fenomeno Big data, non a caso quella da cui ha preso il nome.

Web2.0

Per chi conosce i sistemi complessi tutto quello che ho scritto non apparirà assolutamente strano perchè nel mondo attuale diventato complesso nel suo pieno significato etimologico non è un caso che le topologie e i pattern che hanno il sopravvento sono quelli ad alto grado di  decentralizzazione e ridondanza.

La domanda che molti si pongono a questo punto è quale sarà il prossimo ambito dove la decentralizzazione manifesterà la sua forza creatrice . Forse si potrebbe scommettere sulla blockchain, cioè un archivio distribuito di transazioni applicabile in molti processi della vita reale. Finora è rimasta abbastanza ai margini di questa rivoluzione tecnologica in corso ma molte aziende e organizzazioni stanno pensando ad applicazioni concrete che possano migliorare la vita di tutti noi andando oltre alla attuale forma applicata più conosciuta: la moneta digitale  Bitcoin. Ma questa è un’altra storia che approfondiremo un po’ più avanti!

La decentralizzazione è il cuore pulsante dei Big Data