Esta es la ˙ltima parte de una serie de cuatro sobre inteligencia artificial (IA). El primer art"culo de esta serie se centrÛ en los aspectos b·sicos de la IA. A continuaciÛn, publicamos art"culos sobre cada uno de los principales actores del sector: Google, Amazon y, hoy, Microsoft Azure.No se puede negar que Microsoft Azure se est· tomando en serio la inteligencia artificial. Por ejemplo, su grupo de servicios cognitivos incluye 28 servicios distintos, y es solo una parte de su cat·logo de IA global. Por tanto, tenemos mucho que comentar. °Empecemos!
Microsoft Azure divide sus servicios cognitivos (Cognitive Services) en 5 ·reas diferentes: visiÛn, voz, lenguaje, decisiÛn y search.
Este servicio identifica objetos y acciones dentro de im·genes y v"deos. A partir de esta funcionalidad b·sica, puede realizar muchas tareas diferentes. Estas son algunas de ellas:
Este servicio ofrece moderaciÛn de textos, im·genes y v"deos. En los textos, Content Moderator detecta palabras potencialmente malsonantes en m·s de 100 idiomas. TambiÈn puede aplicar listas personalizadas con los tÈrminos que el desarrollador considere inapropiados. En v"deos, Content Moderator identifica el contenido para adultos. TambiÈn incluye la capacidad de integrar revisiones hechas por humanos para supervisar las operaciones.
Este servicio se puede entrenar. Los usuarios pueden subir im·genes etiquetadas, o bien subirlas sin etiquetar y dejar que Custom Vision Service lo haga. Una vez que Custom Vision Service dispone de las im·genes etiquetadas, el usuario ´enseÒaª al servicio a reconocer aspectos de la im·genes, como una habitaciÛn o una comida concretas. Vea este v"deo para descubrir lo f·cil que es entrenar a Custom Vision Service:
https://www.youtube.com/watch?v=3sjInlJcpBs
La API de Face puede establecer la probabilidad de que dos im·genes contengan a la misma persona. TambiÈn puede obtener detalles de la persona a partir de la imagen, incluyendo la edad, el gÈnero, la postura, la sonrisa, las emociones y el vello facial. Detecta dÛnde est· un rasgo facial en funciÛn de sus coordenadas, por ejemplo, ´la ceja izquierda est· en las coordenadas X e Yª. Lo probÈ con una foto m"a y era tan preciso que daba miedo.
Eso s", lo m·s interesante es que cuando sub" una imagen de hace varios aÒos y una del aÒo pasado, el programa me dio la misma edad. As" que aparentemente, °llevo aÒos sin envejecer!
Este servicio va a retirarse, ya que su funcionalidad est· incluida en la API de Face. Como su nombre indica, detecta las emociones de las personas en las im·genes.
Uno de los mejores aspectos de los servicios de IA de Microsoft Azure es que a˙nan varias tecnolog"as de IA subyacentes para ofrecer un servicio m·s amplio. Video Indexer es un gran ejemplo de ello. Este simple servicio incluye funciones muy potentes como:
Este servicio es similar a Google Cloud Translate. Lo m·s destacable del servicio es que est· integrado en algunas de las aplicaciones populares de Microsoft, incluyendo Skype y PowerPoint. Volveremos sobre este tema en breve.
Como su nombre indica, la API de Translator Speech traduce voz a travÈs de 5 pasos:
La p·gina web de Microsoft incluye muchos casos de uso, que pueden consultarse aqu". Uno de los m·s interesantes incluye el uso de lo que Microsoft llama ´live featureª (´funciÛn en directoª).
Con esta funcionalidad, los desarrolladores pueden incluir traducciones autom·ticas en directo en sus aplicaciones. Cabe destacar que Microsoft emplea la API de Translator Speech tanto en Skype como en Powerpoint. Ahora, las personas que estÈn hablando por Skype en diferentes idiomas pueden traducir sus conversaciones en tiempo real con Speech API.
øTiene que dar una presentaciÛn a personas que no hablan su idioma nativo? °No hay problema! Los equipos de Microsoft han colaborado para aÒadir la API de Translator Speech a Powerpoint. Este plugin nuevo le permite ofrecer subt"tulos en otro idioma mientras realiza su presentaciÛn.
Si desea m·s informaciÛn sobre esta tecnolog"a, puede descargar la aplicaciÛn de Microsoft Translate en su telÈfono. Est· disponible en Android y iOS.
La aplicaciÛn se basa en la API de Translator Speech y ofrece una traducciÛn en directo durante una conversaciÛn entre dos personas. Tanto mi colega (hablante nativo de espaÒol) como yo (hablante nativo de inglÈs) probamos la aplicaciÛn y la encontramos sorprendentemente precisa. Adem·s, °nos divertimos un montÛn!
Este servicio tiene el nombre bien puesto, ya que identifica a los hablantes bas·ndose en la voz. øRecuerda Video Indexer, que mencionamos anteriormente? Este es el servicio que le proporciona la capacidad de reconocer quiÈn est· hablando y cu·ndo.
A nivel global, este servicio le permite crear su propio modelo de reconocimiento de voz. Profundizando un poco m·s, puede crear modelos de lenguaje y ac˙sticos personalizados. Aqu" puede encontrar una buena explicaciÛn de Microsoft sobre la diferencia entre ambos niveles. He incluido un extracto a continuaciÛn:
´El modelo ac˙stico es un clasificador que etiqueta fragmentos breves de audio como uno de los fonemas o unidades de sonido de un lenguaje espec"fico. Por ejemplo, la palabra ´hablaª est· compuesta de cuatro fonemas: ´'a ?laª. Estas clasificaciones se hacen a un ritmo de 100 veces por segundo.
El modelo de lenguaje es una distribuciÛn de probabilidades de secuencias de palabras. Ayuda al sistema a decidir entre secuencias de palabras que suenan parecidas, en funciÛn de la probabilidad de esas secuencias. Por ejemplo, en inglÈs, "recognize speech" ("reconocer voz") y "wreck a nice beach" ("destrozar una playa bonita") suenan parecido, pero es mucho m·s probable que se trate de la primera opciÛn, por lo que el modelo de lenguaje le asignar· una puntuaciÛn m·s altaª.
Custom Speech Service es genial para aplicaciones que cuentan con tÈrminos propios, as" que es una gran opciÛn para los que estamos buscando crear aplicaciones. Y eso nos lleva al siguiente bloque de servicios de AI de Microsoft Azure: lenguaje.
Si est· buscando incorporar acciones basadas en lenguaje en su aplicaciÛn, °este es el servicio para usted! Usa la API de Bing Speech (que veremos en m·s detalle a continuaciÛn) para traducir voz a texto. A continuaciÛn, este texto es procesado por LUIS. LUIS descifra las intenciones, esto es, las acciones que un usuario tiene intenciÛn de realizar, y las entidades sobre las que act˙an estos objetos.
DespuÈs, devuelve un archivo JSON con toda la informaciÛn que necesita para tomar acciones en sus aplicaciones. El servicio tambiÈn es compatible con Azure Bot Service, as" que puede crear bots para sus aplicaciones r·pidamente.
øY sabe lo que es realmente genial? Han adoptado un enfoque similar al de DialogFlow de Google y facilitan lo que llaman ´modelos de dominios creados previamenteª. Estos modelos vienen con intenciones, entidades y lo que Azure llama ´expresionesª. As", crear un bot o aÒadir comprensiÛn de lenguaje a las apps es mucho m·s r·pido. Ofrecen 21 modelos de dominios, una cifra impresionante.
Y por cierto, tengo que dar la enhorabuena a Microsoft por su impresionante trabajo de documentaciÛn. Todo lo que necesita para ponerse en marcha con sus servicios est· disponible y f·cilmente accesible, incluyendo una explicaciÛn de las intenciones, entidades y expresiones, en caso de que le interese.
La mayor"a de los servicios de IA de Microsoft Azure tienen nombres que se ajustan fielmente a su funciÛn, y este no es una excepciÛn. Bing Spell Check se asegura de que las palabras de los documentos y las b˙squedas web se escriban correctamente. Usted introduce un fragmento de texto en el servicio y este responde con un mensaje en formato JSON que destaca las palabras mal escritas y la puntuaciÛn de confianza del resultado.
Estaba diciendo lo bueno que es Microsoft a la hora de poner nombre a sus servicios, pero puede que este sea la excepciÛn a la regla :).
La API de Text Analytics hace 3 cosas: an·lisis de opiniÛn, extracciÛn de frases clave y detecciÛn de idioma. No es exactamente lo que hubiera adivinado a partir del nombre ´Text Analyticsª. La API devuelve una puntuaciÛn de opiniÛn de 0 a 1 (1 es la m·s positiva).
Adem·s del lenguaje detectado, la API ofrece una puntuaciÛn de confianza entre 0 y 1, en la que 1 es (°lo ha adivinado!) 100% seguro. Hasta ahora, la extracciÛn de frases clave de Microsoft solo es compatible con unos pocos idiomas, pero hay una lista impresionante disponible en la vista previa. Puede ver la lista completa aqu".
La API de Translator Text entra dentro de la misma categor"a que la API de Translator Speech y Microsoft Translator. Como probablemente haya adivinado, la diferencia es que este servicio solo trabaja con textos. Detecta el idioma del texto y despuÈs lleva a cabo la traducciÛn solicitada. En la actualidad, Microsoft emplea traducciÛn con m·quinas neuronales (NMT) para este servicio, lo que les pone a la altura de AWS y Google desde un punto de vista tÈcnico.
QnA Maker es el servicio de preguntas frecuentes de Azure. Con Èl, crear una secciÛn de preguntas frecuentes es sorprendentemente f·cil. Solo tiene que dirigirlo a una fuente de preguntas y respuestas en online o subir un documento (admite .tsv, .pdf, .doc, .docx, y .xlsx) que estÈ bien formateado y tenga una tabla de contenidos y ponerle nombre a su servicio. °Listo! Azure se encarga del resto.
Este servicio est· diseÒado para combinarse con Azure Bot Service y proporcionar respuestas para un bot.
Sugerir contenidos en funciÛn del historial de lectura de un usuario se ha vuelto cada vez m·s com˙n en diferentes sitios web y proveedores de contenido. Ahora, gracias a Custom Decision Service, esta funcionalidad est· disponible para los desarrolladores de a pie como yo a travÈs de una sencilla llamada a la API.
Custom Decision Service se esfuerza por entender el contexto de la informaciÛn que necesita. A medida que lo usa, va aprendiendo para ofrecer mejores sugerencias. TambiÈn va un paso m·s all· y experimenta con opciones nuevas, de manera que puede ajustarse a las tendencias emergentes.
Este servicio est· dirigido a acadÈmicos y se ubica dentro de lo que Microsoft llama Cognitive Services Labs. Toma una solicitud en lenguaje natural y la convierte en una expresiÛn de consulta estructurada para buscar en publicaciones acadÈmicas. TambiÈn tiene otras funcionalidades para ayudar a los investigadores, como el autocompletado.
Otro servicio ubicado en Cognitive Services Labs. A partir de una solicitud en lenguaje natural, averigua la intenciÛn acadÈmica y recupera la informaciÛn solicitada usando Microsoft Academic Graph (MAG). En un minuto volveremos sobre este tema.
Este servicio tambiÈn calcula el grado de similitud entre dos art"culos, no solo en funciÛn de las palabras que contienen sino tambiÈn de su intenciÛn.
Quiz· se estÈ preguntando en quÈ consiste MAG. Seguramente Microsoft sea el m·s capacitado para responderle:
´Microsoft Academic Graph es un gr·fico heterogÈneo que contiene los registros de publicaciones cient"ficas y las relaciones de citas entre esas publicaciones, as" como los autores, instituciones, revistas, conferencias y ·reas de estudio. El gr·fico se usa para alimentar experiencias en Bing, Cortana, Word y Microsoft Academic. En la actualidad, el gr·fico se actualiza de manera semanalª.
Este servicio es genial para dar contexto a la informaciÛn facilitada. Identifica ´entidadesª como la Tierra, EE.UU. o la Universidad de Florida (mi favorita :) ). DespuÈs, aÒade autom·ticamente un enlace a la p·gina de la entidad en Wikipedia para ofrecer contexto de manera autom·tica.
Este es simple: le permite ofrecer funcionalidades de escritura anticipada inteligentes en su aplicaciÛn. øA que ha sido f·cil de explicar?
Otro servicio relativamente simple. Esta API devuelve:
Otro servicio sencillo: busca la web y devuelve el n˙mero de art"culos disponibles que coinciden con el tema y un subconjunto de estos art"culos en funciÛn del t"tulo, el enlace y la ˙ltima fecha de rastreo. Puede modificar varios par·metros, incluyendo si la b˙squeda debe ser ´seguraª y quÈ contenido quiere obtener (p. ej. noticias, im·genes, etc.).
Este es otro servicio especializado, en l"nea con otras ofertas de Bing. Ofrece enlaces e informaciÛn sobre entidades (empresas, lugares, personas, libros, etc.) en lugar de enlaces a sitios web que mencionen las entidades.
La API de Bing Image Search obtiene im·genes en miniatura, URL, metadatos y m·s a partir de una solicitud.
Este servicio ofrece nombres y enlaces a los v"deos que coincidan con los tÈrminos de b˙squeda. La API de b˙squeda de v"deos de Bing tambiÈn permite ver vistas previas de los v"deos en los resultados y una gran cantidad de metadatos, como imagen, medio al que se atribuye, lugar donde fue grabado el v"deo, quiÈn lo publica, etc.
Este servicio pone el poder de Bing Search en manos de los desarrolladores. Hay dos maneras principales de usar Bing Custom Search: Site Search y Custom Vertical Search. En ambos casos, las b˙squedas se llevan a cabo a travÈs de la interfaz gr·fica de Custom Search.
Con ella, puede aÒadir una lista de los sitios web en los que quiere buscar y solo aparecer·n resultados de estos sitios. TambiÈn puede destacar un sitio web en concreto. De esta manera, se asegura de que los resultados de su sitio web destacado que coincidan con la palabra clave aparezcan en primer lugar y los del resto de sitios a continuaciÛn.
Para buscar dentro de un sitio, solo tiene que introducir la direcciÛn del sitio web y Bing Custom Search se encargar· del resto. Para hacer una b˙squeda vertical personalizada, solo tiene que aÒadir las p·ginas web concretas que quiere rastrear y, una vez m·s, Bing Custom Search se encargar· del resto.
Microsoft ofrece incluso una interfaz de usuario alojada para que la use una vez que haya creado su b˙squeda. Puede hacer algunos pequeÒos cambios de diseÒo para ajustarse mejor a su sitio web. Para m·s informaciÛn, vea este fant·stico v"deo de demostraciÛn de Mahesh Balachandran
https://www.youtube.com/watch?v=d5skeIApBo4
Workbench es la herramienta definitiva para los cient"ficos de datos. Es una aplicaciÛn de escritorio que permite a los cient"ficos de datos preparar datos, crear modelos de IA y revisar los resultados. Esta aplicaciÛn tambiÈn incluye varias visualizaciones ˙tiles de los datos. Incluye Jupyter Notebooks, una herramienta de uso obligado para los cient"ficos de datos.
Workbench tambiÈn admite lo que Azure llama ´By Example Transformationsª (´transformaciones a partir de ejemploª). Esta potente funcionalidad le permite visualizar una tabla con sus datos y, en una columna al lado de ellos, escribir cÛmo quiere que aparezca cada elemento de los mismos. Es m·s f·cil de entender viendo cÛmo funciona, as" que vea este v"deo. °Yo soy fan!
https://www.youtube.com/watch?v=9KG0Sc2B2KI
Para ver r·pidamente cÛmo funciona Workbench, eche un vistazo a este v"deo:
https://www.youtube.com/watch?v=tW1JV6bHXFA
Al combinar este servicio, Workbench y el servicio de gestiÛn de modelos (explicado en la secciÛn a continuaciÛn), puede obtener algo similar a SageMaker de AWS. Si este producto no le resulta familiar, consulte mi art"culo donde se resumen las funcionalidades de inteligencia artificial de AWS.
El servicio de experimentaciÛn funciona con Workbench y ofrece gestiÛn de proyectos, integraciÛn con Git, control de accesos, roaming y funciones para compartir. Le permite ejecutar sus modelos exactamente en el mismo entorno cada vez, solo que con diferentes algoritmos.
A continuaciÛn, registra el historial de ejecuciÛn y le ofrece la capacidad de ver el modelo que mejor se ajusta a sus necesidades. A la hora de hacer experimentos, es compatible con m·quinas nativas, Docker local, Docker en m·quinas virtuales y cl˙steres de Spark escalados (m·s sobre Spark a continuaciÛn).
Este servicio le permite implantar sus modelos en una amplia variedad de entornos. Requiere el uso de interfaces de l"nea de comandos, que almacenan sus modelos en im·genes de Docker. Una vez hecho esto, puede implantar sus modelos en m·quinas locales, servidores in situ, la nube y dispositivos perimetrales con internet de las cosas. Este servicio tiene mucho que ofrecer. Puede consultar m·s informaciÛn aqu".
Esta biblioteca incluye una integraciÛn de las canalizaciones de SparkML con Microsoft Cognitive Toolkit y OpenCV. Si est· usando Workbench y ejecutando sus experimentos en Docker, no necesita hacer nada m·s. Workbench emplea MMLSpark de manera autom·tica.
De la misma manera en que AWS cuenta con AMI de aprendizaje profundo prediseÒadas con componentes para realizar tareas de IA y aprendizaje autom·tico, los servicios de IA de Microsoft Azure incluyen m·quinas virtuales prediseÒadas listas para tareas de IA. Azure ofrece variedades para Linux y Windows con un n˙mero impresionante de aplicaciones preinstaladas, como Jupyter Notebooks, bases de datos (SQL y PostgreSQL), R, Python, etc. Puede ver la lista completa en su sitio web aqu".
Y lo mejor de todo, las DSVM de Azure ofrecen una variedad de ejemplos prediseÒados y Jupyter Notebooks de muestra para que pueda ponerse en marcha r·pidamente.
Este potente servicio automatiza la ejecuciÛn de algoritmos de aprendizaje autom·tico en m˙ltiples conjuntos de datos. Activa los recursos necesarios para ejecutar c·lculos en paralelo y los desactiva inmediatamente cuando la tarea ha finalizado.
Este es el servicio de referencia para cualquier programador que necesite ejecutar algoritmos de aprendizaje autom·tico con grandes cantidades de datos.
___________________________________________________________________________________
En resumen, estos son los servicios de IA de Microsoft Azure.
Si quiere aprender trucos y estrategias pr·cticos para sacar todo el partido a la IA, °eche un vistazo a nuestro webinar a demanda!Chris Dunn
Appian es una empresa de software que automatiza los procesos comerciales. La plataforma Appian incluye todo lo que necesitas para diseñar, automatizar y optimizar incluso los procesos más complejos, desde el principio hasta el final. Las organizaciones más innovadoras del mundo confían en Appian para mejorar sus flujos de trabajo, unificar los datos y optimizar las operaciones, lo que resulta en un mejor crecimiento y experiencias superiores para los clientes.