News / Innovazione e tecnologia / Big data: cosa sono, come usarli e perché sono importanti
big data analisi dei dati

Big data: cosa sono, come usarli e perché sono importanti

Ogni era umana nella storia ha avuto la sua materia prima: il bronzo, il ferro, l’oro o il petrolio. In un mondo che ormai sembra vivere essenzialmente nella sua dimensione dematerializzata, tuttavia, anche il principale bene della società contemporanea si è fatto virtuale. Oggi sono i dati la cosa più preziosa in circolazione e sono diventati così tanti e così complessi, da richiedere una nuova locuzione per identificarli: big data. In questo articolo vi spieghiamo cosa sono i big data e quali scenari aprono.

277.777 storie pubblicate su Instagram, 511.200 tweet, 4.500.000 video guardati su YouTube, 4.497.420 ricerche su Google, 18.100.000 messaggi di testo inviati, 188.000.000 email spedite. Quanto tempo ci vorrà per generare tutti questi dati? Solo un minuto. Non stiamo scherzando: è davvero quanto accade su internet ogni minuto che passa. Una mole di informazioni alla quale ognuno di noi contribuisce attivamente, a volte senza rendersene conto. Un singolo smartphone è in grado di generare 40 exabyte di dati ogni mese, vale a dire 1 milione di terabyte. Così tanti dati sono preziosi per chi lavora in settori come il marketing, la ricerca scientifica, le telecomunicazioni o le pubbliche amministrazioni, ed è necessario analizzarli per trarne fuori informazioni da utilizzare per generare valore.

Ma immaginare cifre come queste, soprattutto rapportandole al tempo impiegato per produrle, è un’operazione che a un cervello umano farebbe venire il capogiro: la nostra mente non è fatta per assimilare numeri del genere. E tuttavia, queste cifre sono solo la proverbiale punta dell’iceberg dell’immane mole di dati che la nostra società informatizzata produce in ogni istante. Ecco perché oggi si parla sempre più spesso di big data, letteralmente “grandi dati”. Vediamo di cosa si tratta esattamente e in che modo possono essere utilizzati per migliorare le nostre vite.

Cosa sono i Big Data e perché sono importanti?

Ogni attività umana – dalle più futili, a quelle strategiche per l’economia, fino a quelle utili alla stessa sopravvivenza – genera dei dati. Spesso senza che nemmeno ce ne accorgiamo. Hai lasciato un messaggio in segreteria a un tuo collega? Hai generato dati. Hai acquistato un volo per la tua prossima vacanza? Altri dati. Hai effettuato l’accettazione in ospedale per un’influenza più virulenta del solito? Dati, dati, dati. Talmente tanti che non li si può più semplicemente immagazzinare in un computer: è necessario che vengano in qualche modo elaborati, e non dalla mente umana. Gli stessi computer che raccolgono l’infinità di dati, anzi di big data, che produciamo sono la chiave per interpretarli e trarne persino delle conclusioni che vanno oltre le nostre capacità.

È proprio a causa della possibilità di sfruttare il potenziale di queste infinite sequenze di codice binario che oggi i big data sono al centro di un acceso dibattito: sia nel pubblico che nel privato, quell’immensa mole di codici è oro, e bisogna trovare il piccone adatto per estrarlo. Quella offerta dai big data è al momento l’occasione di crescita più ghiotta per chiunque, tanto che questi grandi dati ancora così sconosciuti ai più sono diventati il paradigma dell’epoca che stiamo vivendo. Agli albori dell’umanità ci fu l’età del ferro, poi la corsa all’oro e fino a pochi anni fa ci trovavamo nel pieno dell’era del petrolio. Quello che stiamo vivendo, invece, verrà probabilmente ricordato come il secolo dei big data.

I master in big data sono tra i corsi di formazione più ricercati date le possibilità di impiego che offrono. Il mondo del lavoro è attualmente sempre più in cerca di figure professionali specializzate, vista la possibilità di creare valore con i big data, un’opportunità che sempre più aziende e startup stanno cercando di cogliere. Ma vediamo esattamente in che modo i big data si presentano, vengono elaborati e infine utilizzati.

Una definizione di big data: la regola delle 5 V

Di cosa parliamo esattamente quando ci riferiamo ai big data? È immediatamente comprensibile che si tratta di enormi quantità di dati. Il modo in cui si presentano può variare: possono essere sia dati strutturati, e dunque talvolta persino ordinati in database, sia destrutturati, e quindi eterogenei per fonti, finalità della raccolta e formato. Però, appunto, le quantità sono talmente enormi, da essere difficilmente concepibili per la mente umana: gli ordini di grandezza possono raggiungere gli zettabyte, unità di misura pari a 1 miliardo di terabyte.

Ma è davvero tutta una questione di quantità? Non esattamente. Se è vero che la quantità è fondamentale per poter usare la definizione di big data, nel tempo sono stati sviluppati una serie di criteri di classificazione che oggi sono riassunti nella regola delle “5 V”: Volume, Velocità, Varietà, Veridicità e Valore.

Per volume si intendono precisamente le dimensioni dei dati a disposizione. Prendendo come esempio un ospedale, il volume di dati della struttura corrisponde all’insieme di tutte le cartelle cliniche, le registrazioni dei pazienti, i trattamenti e le cure che vengono erogati.

Con velocità, invece, ci riferiamo a quanto rapidamente i dati del genere vengono generati. Ricollegandoci al discorso di apertura, è ben evidente come in un singolo minuto vengano generati quantità inimmaginabili di dati.

Varietà, poi, è il modo di definire la quantità di diversi tipi di dati agglomerati insieme. In quest’ultima categoria troviamo un’ulteriore suddivisione dei dati. I dati strutturati sono quelli che vengono presentati con una qualche classificazione logica, ad esempio un file Excel contenente il database clienti di un negozio. Dati semi-strutturati, invece, sono quelli raggruppati ma non classificati, per esempio i file di log in cui sono registrate cronologicamente le azioni di un sistema informatico. I dati destrutturati, invece, si presentano senza alcun tipo di classificazione. Foto, video e audio rientrano generalmente in questa categoria.

Le ultime due V, veridicità e valore, nate più di recente, servono a definire ulteriormente la qualità dei big data. La veridicità fa riferimento alla precisione e all’affidabilità dei big data raccolti. Il valore indica quale utilità si può ricavare da un insieme di dati: potrebbe trattarsi di informazioni che permettono di mettere in atto strategie commerciali più efficaci, oppure dettagli che possono guidare la ricerca scientifica verso risultati più precisi.

Quali sono i settori in cui sono più utilizzati? Big data e marketing

È nel campo del marketing che i big data hanno creato il caso più emblematico – oltre che più inquietante – delle loro potenzialità. A una ragazza americana di 15 anni è capitato di ricevere per posta una pubblicità riguardante articoli per future mamme e neonati, prima ancora che lei comunicasse la gravidanza ai genitori. Il padre della ragazza, aprendo la posta prima della figlia, è venuto per caso a conoscenza della mail e la sua ira nei confronti della catena di supermercati responsabile ha portato la notizia all’attenzione delle cronache. Ma come aveva fatto il supermercato a identificare in maniera così precisa il target dell’annuncio? Nessun furto di identità. Non era accaduto assolutamente nulla di illegale: semplicemente, incrociando i dati anagrafici della ragazza con quelli relativi agli acquisti effettuati e con altri ancora, relativi alle abitudini di migliaia di donne di tutti gli Stati Uniti, il supermercato era stato in grado di giocare d’anticipo con la propria comunicazione.

A un’analisi superficiale verrebbe da pensare che, con un esempio simile, i big data dovrebbero essere soprattutto temuti. Niente di più sbagliato: le potenzialità maggiori riguardano il benessere della società tutta.

Sfruttando i big data in maniera corretta, sarebbe possibile rivoluzionare l’intera industria, dalla produzione alla vendita al dettaglio, riducendo drasticamente le inefficienze grazie a modelli previsionali precisissimi. Provate a immaginare i vantaggi economici, ambientali e sociali che deriverebbero da una produzione quasi completamente priva di sprechi: è questo l’obiettivo.

Secondo l’Osservatorio Big Data del Politecnico di Milano1, le imprese italiane nel 2016 hanno lavorato prevalentemente sui dati strutturati, che rappresentano ancora l’83% dei volumi legati ai sistemi di analisi. I dati destrutturati, con un +31% rispetto al 2015, crescono il doppio rispetto ai dati strutturati. Però sono proprio questi dati così “eterogenei” a rispecchiare meglio la realtà moderna, con i suoi contenuti che vengono continuamente caricati e condivisi sui social. Maggiore aderenza alla realtà vuol dire maggiore possibilità di trasformare i dati in conoscenza reale.

Per le aziende questo significa maggiori opportunità di agire per ottenere risparmio, ottimizzazione e produzione.

Intelligenza artificiale e big data? Dallo streaming all’influenza, esempi di utilizzo

Il fenomeno big data sta vivendo un’ascesa che lo porta al centro delle strategie pubbliche e aziendali. Ma i big data vanno di pari passo con lo sviluppo dell’intelligenza artificiale. Infatti, gli algoritmi di machine learning, e in particolare i più evoluti di deep learning, sono gli unici mezzi abbastanza potenti da essere in grado di effettuare una corretta analisi dei dati raccolti e dar loro un senso. Analizzare anche una sola raccolta classificabile come big data potrebbe richiedere anni di lavoro di decine di persone, senza necessariamente portare a risultati concreti. Al contrario, l’intelligenza artificiale ha il suo carburante proprio nei dati: senza di essi sarebbe completamente inutile, e lo stesso si può dire al contrario.

In quest’ottica potremmo dire che il ruolo degli esseri umani quando si tratta di analisi dei dati è soprattutto quello di progettare algoritmi in grado di elaborare questo genere e quantità di informazioni. Si tratta di un lavoro complesso che richiede competenze specifiche, ma una volta fatto si può dire che la gran parte del lavoro umano sia concluso, resta solo l’attività di gestione dell’algoritmo e di interpretazione dei risultati.

Ma in che modo i risultati vengono utilizzati? In questo senso il limite sta solo nella fantasia di chi maneggia dati e algoritmi. Vi siete mai chiesti come faccia Netflix a proporvi costantemente nuove serie TV che sembrano fatte su misura per i vostri gusti? È grazie all’utilizzo dei big data generati dalle abitudini e dalle preferenze degli utenti di tutto il mondo: incrociando il tutto, Netflix riesce a scegliere argomenti, cast e persino trama dei futuri sceneggiati.

Ma è decisamente in campo medico che i big data potranno esprimere al meglio, nonché nella maniera più utile, il loro enorme potenziale. Affidare all’Intelligenza Artificiale l’analisi incrociata delle cartelle cliniche di migliaia o magari milioni di pazienti permetterà di evidenziare correlazioni attualmente inimmaginabili e non alla portata del cervello umano. Questo permetterà di stilare piani terapeutici personalizzati ed efficaci e compilare di profili clinici molto più accurati rispetto a quelli elaborati con la semplice anamnesi a interrogazione.

Già oggi, per esempio, i big data vengono usati in campo medico per predire gli sviluppi di un’ondata influenzale con una precisione inaccessibile già solo qualche anno fa.

Big data e macchine a guida autonoma

Ma non finisce qui: l’analisi di dati trova applicazioni creative e di notevole utilità anche nei servizi offerti al cittadino. Un esempio lampante è quello delle macchine a guida autonoma di cui si sente parlare sempre più spesso. Le centrali di controllo di queste automobili sono in grado di elaborare in tempo reale non solo gli elementi accessibili all’attenzione umana, come ad esempio la presenza di pedoni sulla strada, ma anche dettagli che a noi sfuggirebbero, come l’umidità dell’aria e il suo effetto sul manto stradale.

Questa stessa capacità di analisi ed elaborazione delle condizioni ambientali da parte dell’Intelligenza Artificiale ha permesso in passato di predire l’evoluzione di uragani di notevole potenza, come l’uragano Sandy del 2012, e mettere in sicurezza le zone interessate dalla tempesta prima ancora che essa arrivasse.

Entro i prossimi dieci anni le macchine raggiungeranno la potenza di elaborazione del cervello umano, ma la applicheranno in modi che al cervello umano sono inaccessibili. Si stima, addirittura, che entro il 2026 le Intelligenze Artificiali potrebbero affiancare gli umani nei consigli direttivi delle imprese. Le decisioni che oggi sono affidate all’intuito e alla capacità di astrazione umana saranno prese sulla base dell’analisi di quantità immani di dati effettuate dai computer.

Chi è il data scientist e di cosa si occupa

Il data scientist è la figura chiave del mondo dei big data. È lui il collegamento tra il computer che elabora i dati e il cliente che li utilizza. Questa figura professionale ha il compito di seguire l’intero processo che va dalla raccolta dei dati all’estrapolazione di informazioni utili, in modo da aiutare il cliente a definire strategie e procedure per creare valore dai dati raccolti.

Si tratta di professionisti estremamente poliedrici, in grado non solo di interagire con software di data analytics ma anche di cogliere i dati interessanti dalle analisi e presentarli in maniera chiara ed efficace a chi dovrà utilizzarsi per le sue strategie.

Analisi dei dati e risultati imprevedibili

Quello che spesso salta all’occhio dei data scientist è il fatto che i big data possono portare a conclusioni non solo impossibili da ottenere in altro modo, ma spesso sostanzialmente imprevedibili per la nostra mente. Un caso piuttosto curioso, ma perfetto esempio di quanto dicevamo poco fa, è quello che è successo ad alcune società emettitrici di carte di credito. Tramite un’analisi dei dati eterogenei in loro possesso, hanno scoperto che le persone che acquistano i feltrini per i mobili sono i migliori debitori, in quanto più oculati nella gestione del patrimonio.

Un mondo stimolante e misterioso, questo dei big data, ma quali sono le sue zone oscure? Per il momento, alcuni utenti sembrano preoccuparsi prevalentemente per la sicurezza delle informazioni e per la privacy. Tuttavia, le potenzialità dei big data sono talmente alte e affascinanti, che vale certamente la pena di adoperarsi per trovare soluzioni adeguate a questo genere di ostacoli, senza lasciare che ci impediscano di sfruttare questo innovativo e promettente campo della conoscenza umana.


1“Big Data: Cosa sono, come utilizzarli, soluzioni ed esempi applicativi”.

Questo prodotto non è privo di rischi e fornisce nicotina che crea dipendenza. Solo per maggiorenni che altrimenti continuerebbero a fumare o ad usare altri prodotti con nicotina.
  • Italiano

Inserisci mese e anno di nascita per confermare di essere un maggiorenne fumatore o utilizzatore di altri prodotti contenenti nicotina.

Conferma

Questo sito è destinato solo a maggiorenni fumatori o utilizzatori di altri prodotti contenenti nicotina

We Care

Questo sito contiene informazioni sui nostri prodotti da utilizzare con tabacco e abbiamo bisogno della tua età per accertarci che tu sia un maggiorenne in Italia che continuerebbe a fumare o a usare prodotti contenenti nicotina. I nostri prodotti da usare con appositi stick di tabacco non sono un'alternativa allo smettere e non sono concepiti come strumenti di supporto alla cessazione. Non sono privi di rischi. Gli stick di tabacco contengono nicotina, sostanza che provoca dipendenza. Uso riservato a soli adulti. Per maggiori informazioni visita la sezione Cosa Sapere di questo sito.