Siamo ormai nel pieno delle festività natalizie e, mai come in questi giorni, siamo impegnati a cercare regali, fare acquisti o trascorrere intere serate con un tè o una cioccolata calda, guardando l'ennesimo episodio di quella serie TV che abbiamo trovato tra i contenuti consigliati su Netflix. Dai social alle pubblicità, dai negozi online alle piattaforme di streaming, tutte queste realtà hanno infatti affinato i loro algoritmi negli anni, creando un rapporto con noi utenti estremamente personalizzato e in grado di proporci contenuti che rispecchiano perfettamente i nostri gusti. In questa puntata parliamo di questi algoritmi di raccomandazione, delle diverse tipologie e del loro funzionamento, nonché del modo in cui vengono utilizzati, rispettando i diritti alla privacy sanciti da normative come il GDPR.
Nella sezione delle notizie parliamo di una consultazione pubblica in Regno Unito che riguarda tra le altre cose l’utilizzo di opere coperte da diritto d’autore per addestrare le IA, della scoperta di un nuovo buco nero gigante grazie al James Webb e infine della costellazione europea per le telecomunicazioni che prenderà presto forma.
Brani
• Ecstasy by Rabbit Theft
• Capsized by Tollef
Salve a tutti, siete all'ascolto di INSiDER - Dentro la Tecnologia, un podcast di Digital People e io sono il vostro host Davide Fasoli.
Oggi parleremo di algoritmi di raccomandazione, ovvero di tutti quegli algoritmi in grado di raccogliere ed elaborare i dati degli utenti per prevederne le scelte e fornire loro un'esperienza d'uso su misura anche in questo periodo di festività.
Prima di passare alle notizie che più ci hanno colpito questa settimana, vi ricordo che potete seguirci su Instagram a @dentrolatecnologia, iscrivervi alla newsletter e ascoltare un nuovo episodio ogni sabato mattina su Spotify, Apple Podcasts e YouTube Music, oppure direttamente sul nostro sito.
Un esempio di come i governi stanno affrontando le sfide legate all'intelligenza artificiale proviene dal Regno Unito, dove il Governo ha avviato una consultazione pubblica su temi quali l'etichettatura delle opere generate dall'intelligenza artificiale, l'uso dell'IA nel settore educativo e l'impiego di opere protette da copyright per l'addestramento
dei modelli di intelligenza artificiale.
In merito a quest'ultimo aspetto, la proposta prevede un'eccezione per il "text" e "data" mining, che consentirebbe l'utilizzo di contenuti protetti lasciando però agli autori la possibilità di riservare i propri diritti.
Ciò potrebbe avvenire escludendo determinate opere o concedendone l'uso tramite licenze a pagamento.
Il governo mira quindi a una soluzione "win-win", ma dovrà affrontare sfide legate alla fiducia tra sviluppatori e titolari di diritti, alla regolamentazione internazionale e all'implementazione tecnica dell'opt-out per chi non desidera che i propri dati siano utilizzati per addestrare l'AI.
Questo sistema, ispirato a quello dell'Unione Europea con l'AI Act, mira a garantire maggior trasparenza da parte degli sviluppatori di IA sull'origine dei dati utilizzati e a offrire un compromesso tra innovazione tecnologica e tutela della creatività.
Il dibattito solleva questioni cruciali, come la gestione internazionale del copyright, la protezione degli autori e la necessità di tecnologie che permettano di esercitare facilmente il diritto di esclusione.
Da quando è stato lanciato, il telescopio spaziale James Webb ci ha permesso di vedere l'universo in un modo tutto nuovo, scoprendo dettagli che per secoli sono rimasti nascosti.
Recentemente, infatti, una ricerca pubblicata sulla rivista "Nature" ha annunciato la scoperta di un antico buco nero supermassiccio.
L'oggetto si stima essere nato circa 800 milioni di anni dopo il Big Bang, rendendolo uno degli oggetti più antichi mai osservati e permettendoci quindi di osservare meglio come era l'universo nelle sue fasi iniziali.
Questo buco nero, inoltre, ha diverse particolarità che lo rendono, per ora, unico.
La sua enorme massa, circa 400 milioni di volte più grande del nostro Sole, rappresenta circa il 40% della sua galassia ospitante, controllo 0,1 normalmente osservato, e attualmente è in una fase dormiente dove di fatto non sta più divorando la materia circostante.
Questa scoperta ha dunque aperto nuove teorie, dove si ipotizza che i buchi neri possono attraversare fasi in cui, superando i limiti fisici, riescano ad accrescere a dismisura la propria massa a ritmi elevati, per poi tornare ad uno stato di inattività, rendendoli quindi difficilmente osservabili.
Tuttavia questa ricerca rappresenta solo l'inizio di una nuova indagine, dove si cercherà di individuare altri oggetti simili e risolvere pian piano il grande enigma della nascita dell'Universo.
La Commissione Europea ha firmato un contratto di 12 anni con il consorzio "SpaceRISE" per la realizzazione del progetto Infrastructure for Resilience, Interconnectivity and Security by Satellite, o più semplicemente IRIS-2. Si tratta infatti di lanciare nei prossimi anni una costellazione di 290 satelliti volti a garantire servizi di telecomunicazioni trasparenti
e indipendenti per tutte le aziende e i privati cittadini residenti nell'Unione Europea.
Il programma verrà finanziato con 6 miliardi di euro dell'Unione Europea, 4 miliardi di aziende private e 550 milioni dall'Agenzia Spaziale Europea, che avrà anche il compito di monitorare lo sviluppo del progetto. Il primo lancio avverrà tra circa 4 anni, tuttavia con il costante invio di satelliti in orbita, si punta a fornire i primi servizi di connettività
già entro il 2030. Il programma sarà il terzo per importanza dopo Copernicus e Galileo e andrà a competere direttamente nello stesso settore di mercato con Starlink, l'analogo servizio satellitare di SpaceX che ad oggi ha lanciato nello spazio più di 6.000 satelliti.
Siamo ormai giunti nel vivo delle festività natalizie, e mai come in questi giorni siamo impegnati a cercare regali, fare acquisti, sia online che offline, o trascorrere delle intere serate davanti a un tè o a una cioccolata calda, guardando l'ennesimo episodio di quella serie TV che tanto stiamo amando e che abbiamo trovato tra i contenuti consigliati di Netflix.
Dai social alle pubblicità, dai negozi online alle piattaforme streaming, infatti tutte queste piattaforme negli anni hanno affinato sempre di più i loro algoritmi, per cercare un rapporto con noi utenti estremamente personalizzato, in grado di proporci contenuti, articoli, post o prodotti che rispecchiano alla perfezione i nostri gusti.
Riprendendo l'esempio delle serie TV, applicazioni come Netflix, Prime Video o Disney+, basano il loro successo proprio nel software che le alimentano, in grado di raccogliere ed elaborare i dati degli utenti per prevederne le scelte, fornire loro un'esperienza d'uso su misura e di conseguenza massimizzare i profitti.
Questi sistemi si chiamano in generale "algoritmi di raccomandazione", e il loro nome è sufficiente per spiegare di che cosa si occupano.
Tuttavia non esiste un solo algoritmo, tanto meno uno che funziona meglio o peggio di altri.
Al contrario, sotto questa categoria esistono diverse implementazioni, ognuna con le proprie caratteristiche, benefici e applicazioni d'uso.
E in questa puntata, dunque, parleremo proprio di questi algoritmi di raccomandazione, di come funzionano le diverse tipologie e di come vengono utilizzate, anche nel rispetto dei diritti alla privacy, sanciti dalle normative come il GDPR.
Vedremo, infine, come anche grazie alle nuove evoluzioni nel campo dell'intelligenza artificiale, questi sistemi evolveranno nel prossimo futuro, per essere ancora più performanti e precisi.
Iniziamo affrontando proprio le tipologie di algoritmi attualmente esistenti.
I software di raccomandazione, usati come abbiamo detto da social network, e-commerce o piattaforma streaming, si dividono in tre principali categorie, sistemi di filtraggio collaborativo, di filtraggio basato sui contenuti, e infine sistemi ibridi.
Il filtraggio collaborativo attualmente è uno dei sistemi più comuni, e permette di consigliare contenuti o articoli analizzando le scelte dei propri clienti.
Proviamo a spiegarlo meglio...
Questo approccio raggruppa tra loro gli utenti della piattaforma, basandosi sull'analisi delle loro interazioni con i singoli prodotti.
In questo modo si creano dei "cluster" di utenti con le stesse preferenze, o dai gusti, tra loro molto simili, e che si influenzeranno reciprocamente nelle raccomandazioni.
Facciamo un esempio.
Due utenti hanno ascoltato ciascuno dieci canzoni, di cui cinque sono in comune.
Il filtraggio collaborativo quindi ipotizza che i due ascoltatori abbiano le stesse preferenze, per cui propone a ciascuno dei due utenti le cinque canzoni rimanenti che sono piaciute all'altro.
Ovviamente poi le implementazioni sono molto più complesse di così, ma questo semplice esempio rende molto bene l'idea del funzionamento.
Questo algoritmo è quindi molto efficace, perché permette di adattarsi continuamente nel tempo e di proporre in modo molto preciso articoli o contenuti che il singolo utente non aveva considerato.
Inoltre, un nuovo cliente potrebbe rispondere ad alcune domande al primo log-in, per identificare il cluster di appartenenza e di conseguenza avere fin da subito proposte mirate in base ai suoi gusti e preferenze.
Di contro, questo approccio ha dei problemi significativi quando la piattaforma viene messa per la prima volta online, in quanto serve del tempo per raccogliere dati sufficienti e raggruppare tra loro gli utenti, capirne i gusti e identificare le informazioni più rilevanti da utilizzare nella clusterizzazione.
La seconda tipologia di algoritmi di raccomandazione che possiamo trovare è il filtraggio basato sui contenuti, che come suggerisce il nome si basa esclusivamente sulle caratteristiche dei singoli prodotti, come descrizione, tag, categorie, colori e così via.
Nel momento in cui vengono identificate le preferenze dell'utente, quindi, il sistema propone articoli o contenuti simili a quelli già visti o che è apprezzato.
Riproponendo l'esempio delle canzoni, se a un ascoltatore piace un brano jazz di un certo artista, è probabile che la piattaforma gli proponga altri brani jazz o dello stesso artista.
Anche in questo caso possiamo evidenziare dei punti di forza e dei punti di debolezza di questo approccio.
Innanzitutto, questo metodo è molto efficace quando si inseriscono spesso nuovi contenuti, che possono essere proposti in modo mirato agli utenti fin da subito.
Inoltre, questo algoritmo permette un maggior controllo da parte degli stessi utilizzatori, che possono eventualmente eliminare o modificare alcune preferenze per modificare le raccomandazioni, indipendentemente dalle scelte degli altri utenti.
Parlando invece delle controindicazioni nell'utilizzo di questo sistema, il rischio principale è che la scoperta di nuovi contenuti o generi diventi molto limitata, in quanto l'algoritmo proporrà sempre articoli molto simili tra loro, non considerandone altri che, magari, potrebbero essere interessanti per l'utente, e confinandolo di fatto in una sorta di "bolla".
Inoltre, questo approccio funziona estremamente bene solo quando i contenuti sono arricchiti con diversi metadati e informazioni dettagliate per fornire raccomandazioni accurate.
Per fare un esempio reale, Spotify analizza tutto il catalogo di canzoni, attribuendo ad ognuna non solo attributi base come titolo, descrizione, genere e così via, ma anche tutta una serie di informazioni estrapolate dal brano, come tonalità, velocità, durata, valori che indicano quanto una traccia trasmette emozioni come gioia o tristezza, e tanto altro.
Riportiamo questo esempio perché Spotify mette a disposizione pubblicamente queste informazioni attraverso le proprie API, permettendo a chiunque di fare delle analisi sui brani o scoprire nuove canzoni indicando i singoli parametri.
Infine, ultimo dei tre principali sistemi di raccomandazione è quello ibrido, che come suggerisce il nome, è un mix tra i due approcci che abbiamo appena spiegato.
Combinando i due metodi, infatti, si tengono in considerazione sia i comportamenti degli utenti che le caratteristiche dei singoli contenuti, superando le limitazioni dei due approcci e offrendo delle esperienze ancora più accurate.
Questo approccio, tuttavia, è chiaramente molto complesso da implementare e gestire, sia per la quantità di dati da raccogliere ed elaborare, sia per lo sviluppo dell'algoritmo in sé.
Per questo motivo è sia uno dei sistemi più utilizzati, ma spesso sono solo le grandi aziende che riescono a sfruttarlo veramente a pieno.
Netflix, ad esempio, che è una delle aziende che più ha investito nel suo algoritmo, utilizza proprio un sistema ibrido che analizza valutazioni degli utenti e informazioni su film o serie TV, per suggerire i contenuti più pertinenti.
Lo stesso vale per piattaforme come Amazon, che oltre a mostrarci gli articoli che potrebbero interessarci, ha un esempio molto esplicito sia di filtraggio basato sui contenuti che di filtraggio collaborativo.
La famosa dicitura «articoli spesso acquistati insieme» e «i clienti che hanno acquistato questo articolo hanno anche comprato» sono raccomandazioni derivanti proprio da questi algoritmi.
Esempi simili poi li troviamo anche su altre piattaforme come Spotify, YouTube o Disney+, ma anche sui social network, primi fra tutti TikTok e Instagram, che ormai hanno fatto del sistema di raccomandazione il loro elemento distintivo, investendo continuamente per creare ambienti che incollino l'utente allo schermo per quanto più tempo possibile.
Questi approcci più avanzati, infine, non solo tengono in considerazione le informazioni sui contenuti o sul comportamento degli utenti, ma anche altri fattori, tra virgolette, «ambientali», come l'ora del giorno, il periodo dell'anno, la presenza di importanti eventi nelle vicinanze e molto altro.
In queste giornate di festa, ad esempio, vediamo gli e-commerce popolarsi di suggerimenti di possibili regali di Natale, luci, decorazioni o giochi.
Le piattaforme di streaming invece tendono a proporre musiche festive o film ambientati proprio in questo periodo. Chiaramente tutti contenuti quanto più in linea con i gusti del singolo utente.
A questo punto, dunque, sorgono spontanei i dubbi in materia di privacy e su come i nostri dati vengono trattati o sfruttati.
Fortunatamente, sotto questo punto di vista, i cittadini dell'Unione Europea sono i più tutelati al mondo, con normative molto stringenti come il GDPR, a cui tutte le aziende devono sottostare.
Come risultato, negli anni, le multinazionali sono diventate molto più trasparenti in materia di trattamento dei dati, indicando quali informazioni vengono raccolte, analizzate e conservate e si sono adeguate per fornire ai propri utenti strumenti per avere un controllo quasi totale sul comportamento delle proprie piattaforme, partendo dalla possibilità di revocare il
consenso al trattamento dei dati personali.
Per fare un esempio, proprio Instagram, qualche giorno fa, ha rilasciato una nuova funzionalità che permette di "resettare" l'algoritmo, ossia di reimpostare il sistema di raccomandazione che con il tempo poi si riadatterà alle nuove preferenze.
Inoltre, il GDPR impone il principio della minimizzazione dei dati, che stabilisce che le aziende devono raccogliere solo i dati necessari per raggiungere quello scopo specifico.
Per i sistemi di raccomandazione questo significa che le piattaforme non dovrebbero raccogliere informazioni superflue o sensibili, se non strettamente necessarie per migliorare l'esperienza dell'utente.
E, in ogni caso, dovrebbe anonimizzare, crittografare e conservare tutte le informazioni in modo sicuro.
Ma questo non deve essere per forza una limitazione per le aziende.
Gli algoritmi di raccomandazione, infatti, hanno sicuramente un futuro prospero, soprattutto in un periodo in cui gli investimenti nel settore dell'intelligenza artificiale raggiungono cifre di decine se non di centinaia di miliardi di euro.
E unito all'uso di unità di calcolo sempre più potenti e una costante crescita nella disponibilità dei dati, questi sistemi diventeranno sempre più sofisticati e bravi nel capire cosa proporci.
Un approccio molto interessante, ad esempio, prevede l'utilizzo di intelligenze artificiali spiegabili, dove l'algoritmo riuscirà appunto a fornire una spiegazione su come è giunto una determinata decisione e permettendo alle aziende di instaurare con gli utenti dei rapporti di fiducia grazie a una maggior trasparenza.
Inoltre, una maggior collaborazione con i propri clienti - dove questi saranno parte attiva dei processi decisionali - non solo risolverà il tra virgolette "problema" del trattamento dei dati personali, ma perfezionerà ulteriormente gli algoritmi, riuscendo anche a suggerire contenuti o prodotti fuori dagli schemi, dalla famosa bolla di cui parlavamo precedentemente,
ma rimanendo comunque interessanti per l'utente e creando così un'esperienza più coinvolgente, trasparente e responsabile.
In conclusione, mentre ci avviciniamo al Natale, è affascinante riflettere su come questi algoritmi influenzino pesantemente ogni aspetto delle nostre vite, online ma anche offline.
Dalla scelta dei regali all'intrattenimento, i social, gli e-commerce o le piattaforme streaming riescono non solo ad adattarsi alle nostre esigenze, ma anche a plasmare le scelte degli utenti in modi sempre più sofisticati.
E con l'avvento di nuove tecnologie e l'aumento della consapevolezza sul tema della privacy, il futuro dei sistemi di raccomandazione promette di essere decisamente interessante.
E così si conclude questa puntata di INSiDER - Dentro la Tecnologia. Io ringrazio come sempre la redazione e in special modo Matteo Gallo e Luca Martinelli che ogni sabato mattina ci permettono di pubblicare un nuovo episodio. Per qualsiasi tipo di domanda o suggerimento scriveteci a redazione@dentrolatecnologia.it, seguiteci su Instagram a @dentrolatecnologia
dove durante la settimana pubblichiamo notizie e approfondimenti. In qualsiasi caso nella descrizione della puntata troverete tutti i nostri social. Se trovate interessante il podcast condividetelo che per noi è un ottimo modo per crescere e non dimenticate di farci pubblicità. Noi ci sentiamo la settimana prossima.