Skip to main content

Come funziona l’addestramento dei modelli di intelligenza artificiale?

Dan O'Keefe, Appian
January 24, 2024

Il cervello umano è una macchina di predizione. Vede degli schemi e fa delle previsioni in base alle esperienze precedenti. Questa parte dell’intelligenza umana è stata fondamentale per la nostra sopravvivenza. Ad esempio, molti anni fa, un cercatore potrebbe aver mangiato una particolare bacca, essersi ammalato e quindi aver capito cosa indica che una bacca è velenosa. Questo accade automaticamente: avremmo la nausea nel vedere di nuovo la bacca, il che ci farebbe stare alla larga. In altre parole, il nostro cervello e il nostro sistema nervoso fanno una previsione che detta i nostri risultati.

L’intelligenza artificiale funziona allo stesso modo. Segue un processo di formazione, impara per tentativi ed errori (anche se può utilizzare altre tecniche di deep learning) e poi predice i risultati. Proprio come impariamo a evitare le bacche velenose (o impariamo a far raffreddare il caffè prima di bruciarci la lingua), l’addestramento dei modelli di intelligenza artificiale insegna a un sistema di intelligenza artificiale come rispondere a una serie di condizioni. Questo permette alle organizzazioni di demandare le attività ripetitive all’intelligenza artificiale. Inoltre, se combinata con altri strumenti di automazione, l’IA può sostenere un’ampia gamma di processi aziendali, dal miglioramento del servizio clienti a un time to market più rapido per i prodotti.

Addestrare correttamente i modelli di intelligenza artificiale può rendere l’IA uno strumento trasformativo per la tua organizzazione. Questo post illustra le fasi principali dell’addestramento dei modelli di intelligenza artificiale e i diversi approcci all’utilizzo dell’intelligenza artificiale aziendale.

[La rivoluzione dell’IA deriva dalla proliferazione dell’IA generativa e dei modelli di linguaggio di grandi dimensioni. Impara la relazione tra le due tecnologie: IA generativa e modelli di linguaggio di grandi dimensioni (LLM): qual è la differenza?]

Come addestrare un modello di intelligenza artificiale.

I metodi di addestramento dei modelli di intelligenza artificiale dipendono da diversi fattori, come il caso d’uso e la portata e il tipo di dati coinvolti. Ma anche se le specifiche variano, le linee generali dell’addestramento dei modelli di intelligenza artificiale rimangono le stesse, sia che tu sia un hobbista che costruisce un modello personale, sia che tu sia un professionista che crea una trasformazione digitale profonda di livello enterprise, alimentata dall’intelligenza artificiale.

1. Acquisizione dei dati.

I dati sono la linfa vitale dell’IA. Dati solidi equivalgono a modelli solidi. La creazione di un solido modello di intelligenza artificiale inizia con la scelta delle fonti di dati e la loro raccolta in un unico luogo.

Consideriamo un esempio nel campo dei servizi finanziari: l’elaborazione dei rischi e dei prestiti. Le fonti di dati potrebbero includere:

  • Dati personali del richiedente (storia creditizia, indirizzi o livello di reddito, per citarne alcuni).

  • Comportamenti finanziari come transazioni bancarie, grandi prelievi di denaro o vincite.

  • Dati di mercato e fattori economici che potrebbero influire sulla capacità di rimborso di un prestito.

  • Altri documenti, come ad esempio le storie giudiziarie, le proprietà, gli avvisi di sfratto o i vincoli abitativi.

  • Database che includono nomi e pseudonimi di noti criminali e autori di frodi.

  • Dati aziendali sulla storia di rimborso dei prestiti per aiutarti a scoprire i tuoi indicatori di rischio.

Incorporare questi dati aiuta ad addestrare il modello a ponderare i singoli indicatori di rischio, in modo da poter dare suggerimenti e previsioni quando una persona richiede un prestito.

[Raccogliere dati da più fonti può diventare un’operazione complessa in poco tempo. Un data fabric può aiutare. Scopri come: Il vantaggio del data fabric: eliminare la compartimentazione dei dati per una rapida innovazione.]

2. Pre-elaborazione dei dati.

Il passo successivo consiste nel preparare i dati per la formazione. Se usiamo un’analogia culinaria, la prima fase consiste nel raccogliere gli ingredienti e la seconda nell’affettarli per prepararli alla cottura. La pre-elaborazione comprende:

  • Esaminare i dati per verificarne l’adeguatezza e la completezza.

  • Formattare i dati per la formazione (expound on this).

  • Pulire i dati (expound – not sure what this means).

La pre-elaborazione è fondamentale. I modelli di intelligenza artificiale richiedono molteplici fonti di dati, spesso in formati molto diversi tra loro. La pre-elaborazione facilita l’accesso, l’elaborazione e l’addestramento di questi dati da parte di un sistema di intelligenza artificiale.

Suggerimento: questo è il momento perfetto per prendere in considerazione i pregiudizi. In questa fase, rimuoviamo tutti gli elementi dei dati che potrebbero far sì che il modello faccia previsioni imprecise o, peggio, discrimini. Ad esempio, controlla che le fonti di dati non contengano informazioni che possano identificare qualcuno in base a un dato demografico protetto.

L’ultima cosa che vuoi è che un modello di intelligenza artificiale prenda decisioni sbagliate sulla base di questi fattori. Anche se i pregiudizi sono di solito involontari, le organizzazioni possono comunque incorrere in multe e danni alla reputazione. Evitare i pregiudizi è un processo continuo, ma questo passo costituisce una solida base.

3. Selezione del modello.

Le specifiche dell’addestramento dei modelli di intelligenza artificiale dipendono dal tuo caso d’uso. La selezione dei modelli di formazione per il Machine Learning è di competenza degli esperti di scienza dei dati. I tipi di modelli di addestramento dell’IA richiederebbero un articolo a sé stante, ma ecco un paio di esempi.

I modelli di apprendimento rinforzato eseguono una serie di simulazioni in cui l’intelligenza artificiale cerca di produrre un risultato o di raggiungere un obiettivo utilizzando prove ed errori. Il modello compie delle azioni e riceve un rinforzo positivo o negativo in base al raggiungimento del risultato.

I modelli di deep learning utilizzano le reti neurali per imparare dai dati. Possono ricevere informazioni e, ad ogni ripetizione, possono iniziare a classificarle e a fare distinzioni. Ad esempio, potresti dare in pasto a un modello di intelligenza artificiale di tipo deep learning delle immagini e questo potrebbe imparare alla prima ripetizione che un’immagine specifica contiene dei mobili. Poi, in un successivo ciclo di apprendimento, potrebbe iniziare a fare distinzioni tra i vari tipi di mobili, come ad esempio imparare la differenza tra una sedia con cuscini e un tavolo.

Ci sono diversi tipi di modelli di IA tra cui puoi scegliere. La scelta del modello giusto per un determinato compito dipenderà dal tuo obiettivo: nell’esempio precedente, l’apprendimento per rinforzo potrebbe avere più senso nella previsione degli obiettivi di business, mentre l’apprendimento profondo ha più senso per la costruzione di modelli che devono riconoscere cose come immagini, documenti o testi. Spesso un’attività può comportare l’utilizzo di più metodi.

4. Addestramento.

Infine, addestriamo il modello. Stiamo parlando di Machine Learning. Il modo in cui avviene l’addestramento dipende dal modello di Machine Learning che hai scelto nella fase precedente. In generale, però, l’IA esegue una serie di test o simulazioni, fa delle previsioni e poi le confronta con un obiettivo o un risultato previsto. Nel corso di più cicli di addestramento, il modello si adatta. Con il tempo, il delta tra la previsione e i risultati attesi dovrebbe ridursi, portando a previsioni più accurate.

5. Valutazione.

Dopo l’addestramento, verifica i risultati. Come in qualsiasi altro settore commerciale, anche per l’IA è necessario garantire la qualità. Prova a testare il modello su un piccolo gruppo di attività reali per assicurarti che funzioni bene. Se tutto sembra corretto, può essere implementata in un ambiente superiore; se non lo è, vale la pena di tornare indietro per riqualificarla.

Ma la valutazione del modello non è un evento una tantum. Le organizzazioni devono valutare continuamente i modelli di IA per assicurarsi che producano i risultati giusti. Ad esempio, diverse grandi compagnie di assicurazione sanitaria statunitensi sono finite nel mirino e hanno dovuto affrontare cause legali per l’eccessivo rifiuto di richieste di risarcimento. Avere una supervisione umana per garantire che questi modelli non prendano decisioni sbagliate è fondamentale per evitare prestazioni scadenti, danni alla reputazione, diminuzione della soddisfazione dei clienti o addirittura multe per la conformità alle norme.

Formazione sui modelli di intelligenza artificiale: l’approccio pubblico rispetto a quello privato.

Ho detto più volte che la costruzione di questi modelli richiede esperienza. Le imprese hanno tre metodi per ottenere le risorse necessarie a costruire questi modelli.

Metodo uno: crea tutto internamente. Questo approccio offre numerosi vantaggi. Ottieni il pieno controllo dei tuoi modelli. I modelli vengono addestrati sui tuoi dati, garantendo l’accuratezza. Puoi modificare facilmente i modelli in caso di errori. E soprattutto, i tuoi dati rimangono privati. Ma questo metodo è costoso. Avrai bisogno di un team di ingegneri dei dati, data scientist e sviluppatori software, oltre al budget per l’hardware, il software e l’infrastruttura. Questo rende il metodo fuori portata per le organizzazioni in cui l’IA non è mission-critical.

Metodo due: utilizza un grande provider di cloud pubblico (noto anche come hyperscaler). Queste aziende forniscono modelli di intelligenza artificiale preesistenti che puoi utilizzare per le tue attività. In questo modo si riducono i costi di un grande team di dati. Ma c’è un però. Hai poco controllo sui tuoi dati. Ciò significa che i modelli non saranno adattati alla tua organizzazione e, peggio ancora, il fornitore potrebbe utilizzare i tuoi dati per addestrare i propri algoritmi. Questo mette a rischio la privacy dei tuoi dati.

Metodo tre: usa un fornitore che enfatizza l’IA privata. Si tratta di grandi piattaforme di hyperautomation che adottano un approccio di IA privata. Puoi creare i tuoi modelli utilizzando strumenti low-code o no-code e integrarli in un processo end-to-end più ampio che trasformi la tua azienda. Ad esempio, puoi caricare un lotto di email o documenti e chiedere alla piattaforma di addestrare un modello per te. Da lì, puoi rivedere i risultati e passare alla produzione. E puoi anche modificare i modelli su base continuativa. In questo modo i dati rimangono privati senza dover assumere un team estremamente costoso e acquistare una quantità proibitiva di hardware e sistemi da mantenere.

Vuoi capire come funziona questo approccio privato all’intelligenza artificiale? Approfondisci questi tre metodi per capire qual è quello giusto per te e scopri di più su come funzionano le piattaforme di IA private, leggendo Implementare l’IA privata: una guida pratica.