Ma che cosa è la Data Science?
Forse non esiste una definizione assoluta, è sicuramente possibile identificarla come l’intersezione tra diversi campi tra scienza e tecnologia, come l’ingegneria informatica e la progettazione di sistemi complessi, la statistica, la matematica, l’analisi e la creazione modelli sintetici che replicano eventi/aspetti del mondo reale.
Un Data Scientist è colui che pratica la Data Science, è un ingegnere, uno statistico, un matematico ed anche un buon comunicatore.
Oggi la Data Science è universalmente riconosciuta come un fattore di vantaggio competitivo in quasi ogni campo, sono numerosi i casi in cui si è sentita l’esigenza di creare delle unità di Data Science nelle aziende, Team Sportivi, Organizzazioni Umanitarie, Enti Sociali e addirittura Governi.
Anche il governo degli Stati Uniti d’America ha colto l’importanza della Data Science tanto da nominare
DJ Patil “U.S. Chief Data Scientist at White House Office of Science and Technology Policy”.
I casi in cui l’impiego della Data Science si è rilevata un vantaggio competitivo sono davvero molti, uno dei casi di applicazione, a mio avviso, più curiosi e noti è fuori dal settore della tecnologia, non è stato nella Silicon Valley ma ad Oakland, dove la società degli Athletics militante nella Western Division della MLB, grazie ad un lungimirante General Manager Billie Bean, negli anni dal 2002 in poi con l’impiego della ancora non nata “Data Science” modificò il modo di fare mercato, dando un ruolo primario alle statistiche dei giocatori come componente per formare la squadra, riuscendo a garantire una squadra altamente competitiva nonostante un budget molto più basso delle altre squadre, la storia di Billie Bean e degli Oakland A’s è stata anche oggetto di un film: “Moneyball”.
Oggi molte tra le principali società della MLB, NBA, NFL hanno una unità di Data Science con l’obiettivo di trarre il massimo profitto dai dati (la Data Science nel settore sportivo ha un’accezione specifica: Sabermetrics)
Non vi è azienda della Silicon Valley che non utilizzi la Data Science per creare nuovi prodotti o migliorare quelli che ha, da Google nel suggerimento di una ricerca o la pubblicità che ti viene mostrata a Apple con Siri, tutti i social network hanno da anni una componente rilevante di Data Science, Linkedin ad esempio mostra quali sono le persone che potresti conoscere o che dovresti conoscere sulla base di sofisticate classificazioni dei dati forniti.
Altri esempi molto noti e rilevanti potrebbero essere quelli di Netflix con il suo motore di raccomandazioni basato su algoritmi molto evoluti, curiosamente questi algoritmi non sono stati sviluppati in casa da Netflix ma sono frutto di un concorso con un premio da 1 milione di dollari per chi avesse creato un algoritmo che incrementasse l’efficacia del 10% rispetto a quello che in quel momento stavano utilizzando.
Ci sono altre aziende in cui la Data Science dà un contributo primario al prodotto, ad esempio aziende di Dating e Matchmaking come eHarmony e okCupid utilizzano i dati per creare coppie sulla base di algoritmi di classificazione.
Oggi termini come Data Science, Machine Learning, Big Data sono le buzzword del momento, non vi è un prodotto oggi che nella sua brochure non contenga il termine Big Data, ma questo a mio avviso non è affatto una cosa negativa.
Il valore di queste tecnologie hanno creato un’esigenza ed un trend importante, molte università e i vari M.O.O.C. come Coursera, Udacity, edX hanno creato percorsi formativi dedicati ai Data Scientist.
Vorrei terminare il post con un link ad un articolo di Davenport e DJ Patil:
Data Scientist: The Sexiest Job of the 21st Century
(Alfredo Terrone)