Battaglia tra i titani dell'intelligenza artificiale parte 1: intelligenza artificiale di AWS

Chris Dunn, Regional Vice President - APAC
March 22, 2018

La promessa dell'intelligenza artificiale (IA) spesso stata fonte d'ispirazione per la realizzazione di film, societ‡ e persino professioni. Ma, finora, si trattato solo di aspettative pi˘ che di realt‡.

La buona notizia, perÚ, che la situazione cambiata. Infatti, dal punto di vista di un appassionato delle tecnologie, posso affermare che non si mai presentata un'opportunit‡ migliore di questa per sviluppare app che utilizzano l'AI.

Negli articoli precedenti, abbiamo avuto la possibilit‡ di tenere conversazioni con i luminari nel settore dell'IA. Abbiamo anche esaminato i casi d'uso e le librerie disponibili in diversi linguaggi di programmazione per sviluppare la funzione di AI. Questo blog, perÚ, diverso. Si concentra su un altro pezzo del puzzle: l'accelerazione dello sviluppo dell'AI con le piattaforme applicative cloud.

Analizzeremo tre mega fornitori del settore: Amazon AWS, Microsoft Azure e Google Cloud. Per via delle loro origini disparate, ciascuno di questi fornitori presenta sfumature diverse. Daremo un'occhiata anche al modo in cui ciÚ influenza i pi˘ ampi mercati del low-code e delle piattaforme applicative.

Amazon Web Services (AWS)

Cominciamo da uno dei pi˘ famosi provider IaaS al mondo: AWS. Amazon ha una lunga storia nella fornitura di potenti servizi agli sviluppatori, e l'intelligenza artificiale di AWS e le opzioni di machine learning continuano questa tradizione. Questi servizi sono raccolti sotto la linea di servizi di machine learning.

Amazon Deep Learning AMI

A livello base, AWS offre le Amazon Machine Instances (AMI) sintonizzate per il deep learning. Sono disponibili pi˘ variet‡: Le AMI per il deep learning sono dotate di strumenti e strutture come Apache MXNet, TensorFlow, PyTorch, Microsoft Cognitive Toolkit (CNTK), Caffe, Caffe2, Theano, Torch, Gluon e Keras.

SageMaker

Devo ammettere che si tratta di un servizio molto interessante. Mi ricorda il film Inception, ma con l'AI.

Ci torneremo pi˘ avanti.

Partiamo dal valore chiave. Un ambiente preimpostato con tutto il necessario per iniziare a sviluppare modelli di ML. Tutto qui? SÏ, tutto qui.

In primo luogo, per la collaborazione e lo sviluppo di modelli, Jupyter Notebooks integrato nell'ambiente Sagemaker. Jupyter Notebooks (ufficialmente noto come Python Notebooks), in caso non ne fossi al corrente, consente di unire testo RTF, codice e output del codice nella stessa pagina. Notebooks diventato il metodo di sviluppo e collaborazione preferito dagli specialisti di dati che trattano i problemi di ML.

In secondo luogo, AWS sviluppa algoritmi pronti all'uso all'interno della piattaforma (10 tra i pi˘ usati comunemente):

? K-Means Clustering

? Principal Component Analysis

? Neural Topic Modeling

? Factorization Machines

? Linear Learner - Regression

? XGBoost

? Latent Dirichlet Allocation

? Image Classification

? Seq2Seq

? Linear Learner - Classification

Inoltre, AWS installa i driver necessari per eseguire questi algoritmi e imposta le configurazioni adeguate, il che significa che puoi iniziare subito a lavorare. E non ancora tutto!

AWS assegna un team a ciascun algoritmo con l'obiettivo di renderlo pi˘ veloce. Questi team hanno lavorato per mesi per affinare gli algoritmi, tanto che, come sostiene Andy Jassy, otto algoritmi su dieci sono dieci volte pi˘ veloci e gli altri due sono tre volte pi˘ veloci.

https://www.youtube.com/watch?time_continue=1&v=lM4zhNO5Rbg

Sono stupito dall'impegno dimostrato da Amazon nei confronti dell'IA.

Se il modello standard non ti soddisfa, puoi sempre scegliere un framework a piacere. SageMaker gi‡ preconfigurato con TensorFlow e Apache MXNet. Inoltre puÚ supportare CAffe2, CNTK, PyTorch e Torch, ma ti servir‡ un docker container.

Con SageMaker, AWS sta introducendo il cosiddetto "addestramento con un clic". Tutto ciÚ che devi fare accedere al database S3 contenente i tuoi dati. Con un solo clic, Sagemaker:

    • configura un cluster isolato

    • fornisce un SDN separato

    • imposta il ridimensionamento automatico

    • configura i volumi EBS

    • crea pipeline di dati

    • inizia immediatamente l'addestramento con l'algoritmo che hai scelto

Notevole, non trovi? Ma non finisce qui: una volta terminato, SageMaker scompone di nuovo tutto.

Ti ricordi che avevo menzionato Inception? SageMaker fa anche una cosa che si chiama "ottimizzazione degli iperparametri", cio sintonizza automaticamente il tuo modello mentre operativo. Come ci riesce? Fa girare copie multiple del tuo modello e utilizza il machine learning per fornirgli informazioni. Machine learning all'interno del machine learning... non fa molto Inception?

Ecco quindi come avviene la creazione del modello. E l'implementazione? SageMaker si occupa anche di questo, permettendoti di farlo con un solo clic. A questo punto, SageMaker:

    • gestisce il ridimensionamento automatico

    • applica patch di sicurezza

    • esegue controlli dello stato di salute

    • effettua il ridimensionamento dei nodi

Infine, modulare. Con SageMaker puoi creare e addestrare il modello, per poi eseguirlo in un ambiente diverso. Se vuoi, puoi anche creare e addestrare il modello in un altro ambiente ed eseguirlo con SageMaker.

DeepLens

» l'ultimo arrivato tra i gadget per gli sviluppatori di AI. DeepLens una telecamera dotata di deep learning. Su di essa preinstallato Apache MXNet e include una libreria di modelli preformati. E il servizio Sagemaker di cui ho appena cantato le lodi? Si collega direttamente a DeepLens: `e molto semplice caricare i modelli da Sagemaker a DeepLens.

Qualora tu voglia automatizzare le azioni e programmare DeepLens nell'intero schema dell'applicazione, questo supporta l'uso di funzioni Lambda (ovviamente).

Ma non devi credermi sulla parola. Qui puoi vedere Andy Jassy durante la presentazione all'AWS re:Invent:

https://www.youtube.com/watch?time_continue=1&v=RhEVld4GwzU

Sto gi‡ pensando di farmelo regalare per la festa del pap‡ (spero che la mia cara mogliettina stia leggendo :)) » possibile preordinarlo a 249$.

Rekoginition

Questo servizio di machine learning si merita il premio di tecnologia pi˘ vicina a un programma televisivo. Ne parlerÚ tra un attimo, perchÈ prima bisogna capire le basi. Rekognition identifica oggetti, persone, testo, scene e attivit‡ sia in foto che in video.

Tutto ciÚ in cosa si traduce? Bella domanda... ed ecco la risposta:

    • Riconoscimento e analisi facciale: identifica una persona in foto o in video. Analizza anche i tratti facciali per determinare il sesso, se le persone sono sorridenti o accigliate, se gli occhi sono aperti, se sono felici e cosÏ via.

    • Persona di interesse: questa la funzione che rende Rekognition simile a un programma televisivo, poichÈ gli permette di tenere traccia delle persone presenti in un video, anche se escono dall'inquadratura e vi rientrano. Questa tecnologia si avvicina in maniera assurda a una delle mie serie TV preferite, "Person of interest" ed spettacolare per analizzare i filmati delle telecamere di sicurezza!

https://www.youtube.com/watch?v=WYDWSNMTauQ

    • Contenuti non sicuri: identifica i video e le immagini con attivit‡ o contenuti riservati a un pubblico adulto, oltre ad altri contenuti potenzialmente sgradevoli.

    • Dall'immagine al testo: come accennato nell'introduzione di questa sezione, Rekognition trasforma il testo contenuto in un'immagine in testo modificabile.

Lex

Se sei un sostenitore di Alexa, questo il servizio che fa per te. Amazon Lex offre agli sviluppatori la potenza di Alexa e le sue capacit‡ di riconoscimento e simulazione vocale.

All'inizio di questo blog ho affermato che ciascuna di queste piattaforme ha uno stile diverso a seconda della sua eredit‡. Alexa ne un chiaro esempio. Dal suo rilascio iniziale, Alexa stato utilizzato da centinaia di migliaia (se non addirittura milioni) di utenti. Tutto questo uso ha addestrato e perfezionato Alexa consentendo un migliore riconoscimento e risposta agli audio. Questo, per Amazon, un evidente valore aggiunto. Quindi che cosa offre il servizio Lex?

    • Bot di conversazione: con questo servizio puoi creare bot di conversazione tramite voce e testo e pubblicarli su Facebook Messenger, Slack, Kik e Twilio SMS.

    • Database di informazioni: Lex si collega a Lambda in modo da estrarre i dati dai tuoi database S3 e fornire risposte alle richieste di informazioni.

    • Collegamento di obiettivi: Lex in grado di compiere interazioni complesse che uniscono pi˘ obiettivi. Per esempio, possibile prenotare un volo attraverso un servizio audio e sentirsi chiedere se si vuole prenotare una camera d'albergo nel luogo di destinazione oppure ricevere suggerimenti sui ristoranti.

    • Telefonia: Lex non stato addestrato unicamente per la qualit‡ degli audio, ma anche per la qualit‡ della telefonia. Adesso puoi alimentare il tuo sistema personale di di Risposta Vocale Interattiva (IVR).

Come funziona Lex nell'ecosistema di servizi web di Amazon? Il diagramma sottostante, disponibile sulla pagina di Lex dei servizi web di Amazon, ne fornisce un esempio. Per visualizzare quest'immagine e altri esempi, fai clic qui.

[caption id="" align="alignnone" width="1116"]L'immagine mostra l'utilizzo di Amazon Lex per un'applicazione aziendale. Fonte: https://aws.amazon.com/lex/[/caption]

Comprehend

Simile a Lex, questo un altro servizio in cui Amazon fa uso di un naturale elemento di distinzione: le descrizioni e le recensioni dei suoi prodotti (con tutta probabilit‡, tra le pi˘ vaste del suo genere). Comprehend osserva un testo e identifica vari aspetti: il linguaggio usato, le espressioni chiave, i luoghi, le persone, le marche e gli eventi. Inoltre, effettua analisi del sentimento e cataloga automaticamente i testi per argomento.

Comprehend presenta alcuni usi interessanti, come la voce del cliente (VOC). Per la VOC, Comprehend raccoglie feedback sul tuo prodotto o servizio a partire da un'ampia gamma di risorse (e-mail, trascrizioni di chiamate, canali social, ecc). Un altro esempio la catalogazione e ricerca in un repository di conoscenza.

https://www.youtube.com/watch?time_continue=1&v=hdXvVyVjPLg

Translate

Come suggerito dal nome, questo servizio fornisce traduzioni in tempo reale. Attualmente disponibile in anteprima, quindi non ancora un prodotto in distribuzione, ma vale senz'altro la pena dargli un'occhiata. Oltre alla traduzione in tempo reale fornisce anche traduzioni in batch, in modo da non rallentare la navigazione con le applicazioni.

Transcribe

Ancora una volta un servizio che prende il nome da ciÚ che fa, cio la trascrizione della voce in testo scritto. Al momento le lingue supportate sono solo inglese e spagnolo. PoichÈ stato concepito come supporto per audio telefonici di bassa qualit‡, questo servizio perfetto per la trascrizione delle chiamate. » possibile espandere la lista di parole attualmente supportate con un lessico personalizzato e, in futuro, gestire pi˘ voci.

Polly

In base alla logica delle due funzionalit‡ precedenti, starai pensando che questa funziona come un pappagallo! Ci sei andato vicino. Polly ripete proprio "a pappagallo" le parole di un testo scritto, convertendo un file di testo in un file audio standard. PuÚ essere usato per leggere le e-mail a un dirigente impegnato oppure per riprendere la "lettura" del tuo blog mentre stai guidando verso casa dopo il lavoro.

Si tratta di un servizio veramente globale in quanto disponibile in 24 lingue. Supporta anche molte voci diverse, quindi puoi scegliere quella che ti sembra pi˘ rilassante.

_______________________________________________________________________________________

Questo il riassunto delle ultime offerte di AWS.

Come puoi vedere, ci sono un sacco di servizi che noi geek possiamo usare nelle nostre app. Nel prossimo blog di questa serie presenteremo la suite dei servizi di IA di Google. Rimani sintonizzato!

Vuoi vedere altri esempi concreti di utilizzo dell'intelligenza artificiale?

Non dimenticare di iscriverti al nostro webinar settimanale interamente dedicato all'intelligenza artificiale. » disponibile on demand!

Come aiutare la tua azienda a diventare una delle prime a utilizzare l'IA

Chris Dunn

Director, Product Marketing