Il valore dei dati
In un’economia digitale, i dati possono essere costosi da acquisire e strutturare. In definitiva, il suo valore è determinato dai vantaggi che derivano dalle previsioni basate sui dati.
In breve
-
-
-
-
-
-
-
-
-
- Qualità, uso e volume fanno dei dati una classe di beni dalle molteplici sfaccettature
- I dati possono svolgere ruoli diversi nell’economia digitale
- Il valore dei dati risiede nel modo in cui possono portare a un migliore processo decisionale
-
-
-
-
-
-
-
-
“I dati sono il nuovo petrolio”, si dice, ma è sbagliato. L’economia dei dati è complessa. Non è l’abbondanza di dati a determinare il valore, ma il beneficio che si può trarre dalle previsioni basate sui dati. I dati come bene sono multiformi. E lo è anche l’economia dei dati.
Base buona e complementare
Gran parte dell’economia digitale, in particolare l’intelligenza artificiale (IA), si basa sulla previsione. E la previsione si basa sui dati. Per gli economisti, i dati sono un complemento della previsione. I complementi sono beni che aggiungono valore a un altro. Di solito, il bene di base è relativamente economico e il bene complementare è relativamente costoso. Ad esempio, le stampanti sono un bene di base e le cartucce d’inchiostro sono il suo complemento; la stampante è economica e la cartuccia è costosa. Il produttore di stampanti si assicura i clienti con il bene di base, relativamente più conveniente, e realizza i suoi profitti con il costoso complemento. Nel mondo digitale, un’applicazione gratuita è un bene di base e i servizi in-app a pagamento sono il complemento.
La stessa economia si applica all’economia digitale in generale, soprattutto per l’IA. L’intelligenza artificiale che fa le previsioni, l’algoritmo, è relativamente a buon mercato e attira gli utenti. I dati utilizzati dall’algoritmo sono preziosi. Più l’algoritmo come bene di base diventa economico, più aumenta il valore dei dati come complemento. È probabile che questa tendenza continui. La programmazione dei calcoli matematici che compongono gli algoritmi diventerà più standardizzata, più semplice e, quindi, più economica. Ottenere i dati “giusti” nel modo “giusto” e utilizzarli “correttamente” diventerà sempre più il fattore di differenziazione e, quindi, di maggior valore.
Aspetti del valore dei dati
Se i dati possono essere un fattore di differenziazione e di valore, non tutti i dati sono uguali. La qualità, l’uso e il volume fanno dei dati un bene sfaccettato, o meglio, una classe di beni. L’economia dei big data postula che più dati ci sono, migliori sono i risultati, ad esempio le previsioni che un algoritmo può produrre. Tuttavia, la qualità dei dati è altrettanto importante. Migliori sono i dati, migliori sono le previsioni. Per quanto riguarda la qualità dei dati, l’architettura è fondamentale. I dati correttamente etichettati e strutturati sono più preziosi dei punti di dati sfusi il cui contenuto informativo deve essere scoperto e riconfezionato, spesso manualmente.
La quantità e la qualità ottimale dei dati dipendono dai benefici generati dalla previsione basata sull’IA
E poi c’è l’utilizzo dei dati. I dati possono svolgere tre ruoli diversi nell’economia digitale. Quando si parla di IA, i dati possono essere dati di input, cioè dati che vengono forniti a un algoritmo per fare una previsione. Quando un utente cerca indicazioni stradali da un luogo all’altro, l’IA utilizza le mappe come dati di input per calcolare il percorso. Ma i dati possono essere anche dati di addestramento, per rendere l’IA abbastanza brava da prevedere le complessità del mondo reale. Questo tipo di dati viene utilizzato per insegnare all’IA a selezionare i percorsi e a prevedere i tempi di arrivo.
Infine, i dati possono essere dati di feedback, utilizzati per migliorare le prestazioni dell’IA con l’esperienza. Quando qualcuno decide di prendere un percorso diverso da quello suggerito dall’algoritmo, questo fornisce preziosi dati di feedback che possono migliorare i calcoli futuri.
In alcune situazioni, esiste una notevole sovrapposizione tra questi usi dei dati, ad esempio quando lo stesso dato svolge tutti e tre i ruoli. Maggiore è la sovrapposizione, migliore è il dato, poiché la sua struttura e la sua etichettatura consentono all’IA di gestire più facilmente il suo utilizzo simultaneo, concentrandosi sull’apprendimento, la previsione e la reazione al feedback.
Intelligenza artificiale: Rivoluzione delle previsioni
Costo dei dati
L’acquisizione e la strutturazione dei dati può essere costosa. Pertanto, l’investimento comporta un compromesso tra il beneficio di dati più numerosi e migliori e il costo di acquisizione. La quantità e la qualità ottimale dei dati dipendono dai benefici generati dalla previsione basata sull’IA. Per prima cosa esaminiamo il costo.
I benefici che si possono estrarre dai dati sono il fattore di differenziazione dei modelli di business e dei driver di valore.
Dal punto di vista della teoria economica, i dati in quanto tali hanno rendimenti di scala decrescenti. Aggiungere un terzo punto di dati a un secondo è molto più prezioso che aggiungere un centesimo punto a un 99esimo. D’altra parte, l’aggiunta di dati sempre migliori fa aumentare i costi marginali. Incorporare l’ottavo milionesimo punto di dati è più difficile o costoso che aggiungere il quattordicesimo. È come imparare ad orientarsi in una nuova città: la prima e la seconda volta che si prende l’autobus, si impara molto sulla pianta della città e sul sistema di trasporto di massa. Al trecentesimo viaggio è diventata una routine. Si acquisiscono solo nuove informazioni vestigiali (rendimenti decrescenti). Oppure si dovrebbe prestare un’attenzione incommensurabile ai dettagli minori per imparare qualcosa di nuovo (aumento dei costi marginali).
I fattori di costo nell’acquisizione e nella strutturazione dei dati sono principalmente l’apertura di canali per la raccolta e lo scambio di dati, l’etichettatura, lo sviluppo di un’architettura flessibile per la valutazione e l’utilizzo dei diversi punti di dati, nonché la creazione, l’adattamento e l’espansione dell’infrastruttura fisica che consente queste attività. Anche se i singoli dati possono essere acquisiti gratuitamente, i processi per estrarre il loro valore informativo e sfruttarli non lo sono.
Vantaggi dei dati
I dati sono più di un fattore di costo nell’economia digitale in generale, soprattutto per l’IA. I benefici che si possono estrarre dai dati sono il fattore di differenziazione dei modelli di business e dei driver di valore. La concettualizzazione di questi benefici richiede uno spostamento del punto di vista. Il valore economico dei dati non può essere misurato in base agli investimenti necessari per acquisirli e mantenerli. Né può essere valutato in base a come i dati si adattano tecnicamente ai risultati dei calcoli. L’intuizione economica critica sui benefici dei dati è che il valore dei dati è una funzione del modo in cui migliorano il valore ottenuto dall’algoritmo che li utilizza. Per usare ancora una volta l’esempio delle previsioni: il valore di dati migliori non è dato dalla maggiore precisione di una previsione, ma dal modo in cui la previsione migliora le scelte dell’utente.
Prendiamo i motori di ricerca su Internet. La maggior parte di essi fornisce gli stessi risultati. Al momento in cui scriviamo, Google, DuckDuckGo e Bing producono più o meno gli stessi risultati per “Beethoven”. In questo contesto, i dati non sono un elemento di differenziazione. Tuttavia, in una ricerca meno convenzionale, come quella di “arbitraggio”, la differenziazione entra in gioco. Bing fornisce principalmente definizioni; DuckDuckGo mostra definizioni e link a siti finanziari, mentre Google fornisce definizioni, siti finanziari e alcuni riferimenti accademici.
L’integrazione di un maggior numero di dati e di dati meglio strutturati nella sua architettura offre a Google un vantaggio. Mostra risultati che aumentano le possibilità di scelta dell’utente. Questo maggiore vantaggio offerto da Google si traduce in modo sproporzionato nella quota di mercato dell’azienda. Gli economisti chiamano questo fenomeno aumento dei rendimenti della differenziazione dei dati.
La maggior parte degli utenti utilizza Google sia per ricerche rare che comuni. Essere anche solo un po’ migliori nei risultati di ricerca può portare a una grande differenza nella quota di mercato. Per “essere anche solo un po’ migliore”, l’azienda digitale deve prestare particolare attenzione all’acquisizione e alla qualità dei dati. Un ulteriore sforzo in queste aree porta a un fattore di differenziazione attraverso il miglioramento dei vantaggi per gli utenti. Ciò si traduce in un aumento sproporzionato della posizione di mercato, dei ricavi e del miglioramento del modello di business digitale.
Gianluca Tirozzi: “Così bitCorp conquisterà il metaspazio!”
Fatti e cifre
Sintesi
- I dati sono essenziali per le economie digitali e l’IA; tuttavia, si tratta di una classe di beni dalle molteplici sfaccettature.
- I dati si differenziano in base al volume, alla qualità e all’utilizzo.
- Se da un lato i dati possono essere costosi da ottenere e da strutturare, dall’altro solo dati leggermente migliori possono generare vantaggi sovraproporzionali per gli utenti, creando a loro volta un vantaggio di mercato per i modelli di business digitali che forniscono questo valore aggiunto.
- L’intuizione economica fondamentale sui dati è che il loro valore non è funzione del modo in cui migliorano un risultato, ma del modo in cui i dati aumentano i benefici per gli utenti.
- Spesso i rendimenti della differenziazione dei dati sono crescenti: il beneficio aggiuntivo che gli utenti traggono da dati migliori si traduce in modo sovraproporzionale in quote di mercato e ricavi.
Scenari
Esistono tre scenari di base per immaginare come i dati possano ulteriormente influenzare il valore delle economie digitali, in particolare l’IA.
Monopolizzazione del mercato
Nel primo scenario, il meno probabile, alcune aziende si specializzeranno ancora di più nell’acquisizione e nella strutturazione dei dati, acquisendo un vantaggio sempre maggiore nella generazione di vantaggi per gli utenti. Ciò consentirà loro di espandere la propria quota di mercato fino a diventare quasi-monopolisti in grado di raccogliere ancora più dati e di investire in un’architettura migliore che, a sua volta, solidificherà la loro posizione. Un simile ciclo di feedback si conclude con la monopolizzazione dei mercati. È lo scenario meno probabile a causa della natura multiforme e dinamica dei dati, che rende quasi impossibile la loro monopolizzazione.
Abbondanza di dati
In un secondo scenario, più probabile, i dati potrebbero perdere il loro potere differenziante. Questo processo può verificarsi se i canali di acquisizione dei dati e la loro strutturazione diventano abbondanti. Ciò può accadere se le norme sulla protezione dei dati e sulla proprietà intellettuale si allentano, se gli agenti si accordano per una diffusione dei dati completa e senza vincoli in tempo reale o con l’avvento di nuovi e più semplici paradigmi nell’architettura dei dati. In questo caso, sarà più facile acquisire e strutturare i dati. Tuttavia, è probabile che diminuisca anche il vantaggio specifico derivante dalla raccolta e dalla creazione di un fattore di differenziazione. Questo scenario dipende dalla convergenza di diversi elementi normativi, tecnologici e valoriali. Nel medio termine, tale convergenza è probabile solo in comunità di utenti più piccole.
Concorrenza libera
Il terzo scenario, il più probabile, è quello di un graduale miglioramento dell’acquisizione e dell’architettura dei dati unito a un’intensa concorrenza da parte degli operatori storici per aumentare i vantaggi per gli utenti. Inoltre, gli operatori storici saranno sfidati da nuove aziende che cercheranno di aumentare il valore aggiunto delle previsioni o di sbloccare più informazioni da meno dati per creare lo stesso valore degli altri ma con processi più economici. Questo caso è la continuazione della logica economica qui esposta e può migliorare significativamente l’esperienza degli utenti, aumentando al contempo i ricavi e i guadagni delle aziende digitali.
Autore: Henrique Schneider professor of economics
Fonte: