Últimas

AWS anuncia três novos serviços Amazon de inteligência artificial

Amazon Lex, tecnologia por trás do Amazon Alexa, permite que qualquer desenvolvedor crie experiências de usuário ricas e conversacionais para aplicativos Web, móveis e de dispositivos conectados; pré-lançamento aconteceu no re:Invent

Amazon Polly transforma textos escritos em fala realista para que aplicativos falem em 47 vozes realistas e 24 idiomas

Amazon Rekognition facilita a implementação de análise de imagem em aplicativos utilizando reconhecimento facial e de imagem avançado e baseado em aprendizagem profunda. Capital One, Motorola Solutions, SmugMug, American Heart Association, NASA, HubSpot, Redfin, Ohio Health, DuoLingo, Royal National Institute of Blind People, LingApps, GoAnimate e Coursera estão entre os muitos clientes dos serviços Amazon de IA 


São Paulo, 06 de dezembro de 2016 – A Amazon Web Services Inc. (AWS), uma empresa da Amazon.com (NASDAQ: AMZN), acaba de anunciar três serviços de inteligência artificial (IA) que permitem que qualquer desenvolvedor crie apps que entendam linguagens naturais, transformam textos escritos em fala realista, conversam usando voz ou texto, analisam imagens e reconhecem rostos, objetos e cenas. O Amazon Lex, Amazon Polly e Amazon Rekognition são baseados na mesma tecnologia comprovada, altamente escalável e desenvolvida por milhares de especialistas em aprendizagem profunda e automática da Amazon. Todos os serviços de IA da empresa oferecem recursos de alta qualidade, precisão, escalabilidade e economia. Eles são totalmente gerenciados, ou seja, não há necessidade de desenvolver algoritmos de aprendizagem profunda, treinar modelos de aprendizagem automática nem se comprometer com investimentos antecipados em infraestrutura. Assim, os desenvolvedores concentram-se na definição e criação de uma geração completamente nova de aplicativos, que podem ver, ouvir, falar, compreender e interagir com o mundo ao redor. Para saber mais sobre o Amazon Lex, Amazon Polly e Amazon Rekognition, acesse: https://aws.amazon.com/amazon-ai.

Até hoje, pouquíssimos desenvolvedores conseguiram desenvolver, implementar e escalar aplicativos com recursos de IA, visto que, para tanto, precisavam de enormes volumes de dados e especialistas em aprendizagem automática e redes neurais. A aplicação eficiente da IA envolve muito esforço manual para desenvolver e ajustar diversos tipos de aprendizagem automática e algoritmos de aprendizagem profunda (por exemplo, reconhecimento automático de fala, compreensão de linguagens naturais, classificação de imagem), assim como para reunir e excluir dados de treinamento e treinar e ajustar os modelos de aprendizagem automática. E esse processo deve ser repetido para cada recurso de objeto, rosto, voz e linguagem, para cada aplicativo. Os serviços Amazon de IA eliminam todo esse trabalho manual e tornam a IA amplamente acessível para todos os desenvolvedores de aplicativos, oferecendo algoritmos e tecnologias de aprendizagem automática profunda, comprovados e avançados, em forma de serviços totalmente gerenciados que qualquer desenvolvedor pode acessar com uma chamada de API ou alguns cliques no AWS Management Console. Os serviços Amazon de IA disponibilizam todo o poder das tecnologias Amazon de compreensão de linguagens naturais, reconhecimento de voz, texto para voz e análise de imagem, para qualquer aplicativo e em qualquer escala, dispositivo e lugar.

"A combinação de algoritmos melhores com acesso amplo a volumes enormes de dados e a capacidade computacional econômica fornecida pela nuvem está tornando a IA uma realidade para desenvolvedores de aplicativos. A AWS conta com alguns dos aplicativos de IA mais inovadores e criativos utilizados hoje", diz Raju Gulabani, vice-presidente de banco de dados e IA da AWS. "Em toda a Amazon, milhares de especialistas em aprendizagem automática e profunda vêm há anos desenvolvendo tecnologias de IA a fim de prever o que os clientes gostariam de ler, acrescentar eficiências aos nossos centros de satisfação com o uso de tecnologias robóticas e de visão computadorizada, bem como apresentar aos nossos clientes o Alexa, nosso assistente virtual movido a IA. Agora, estamos disponibilizando a tecnologia por trás dessas inovações para todos os desenvolvedores na forma de três serviços completamente gerenciados que são fáceis de usar, avançados e econômicos. Estamos ansiosos para ver como nossos clientes utilizarão o Amazon Lex, Amazon Polly e Amazon Rekognition para desenvolver uma nova geração de aplicativos que têm inteligência quase humana e que podem ver, ouvir, falar e interagir com as pessoas e seus ambientes".

Conversas inteligentes com o Amazon Lex
O Amazon Lex é um novo serviço para a criação de interfaces conversacionais que utiliza voz e texto desenvolvidos com as mesmas tecnologias de reconhecimento automático de voz (ASR, automatic speech recognition) e compreensão de linguagem natural (NLU, natural language understanding) utilizados no Amazon Alexa. Com o Amazon Lex, é fácil implementar recursos sofisticados de linguagem natural em praticamente qualquer aplicativo. Os desenvolvedores podem criar e testar bots (aplicativos conversacionais que realizam tarefas automatizadas, como verificar o clima ou agendar voos) diretamente do AWS Management Console, digitando algumas frases simples ("encontre um voo" ou "reserve um voo", por exemplo), além das instruções de como obter os parâmetros necessários para completar a tarefa (data e destino da viagem, por exemplo) e perguntas de esclarecimento a serem feitas ao usuário ("quando você deseja viajar?" e "aonde você deseja ir?", por exemplo). O Amazon Lex cuida do resto, criando um modelo de linguagem e fazendo as perguntas necessárias para completar a tarefa. Como ele está integrado ao AWS Lambda, ele pode ser configurado para solicitar o serviço de back-end apropriado (o serviço de reserva de voos, por exemplo) por meio de uma função do AWS Lambda. Os desenvolvedores podem também usar conectores corporativos pré-desenvolvidos para executar funções do AWS Lambda a fim de responder a perguntas como "quais são minhas 10 maiores contas no Salesforce.com" por meio da obtenção de dados dos sistemas corporativos como Salesforce, Microsfot Dynamics, Marketo, Zendesk QuickBooks e HubSpot.

Os bots desenvolvidos pelo Amazon Lex podem ser utilizados em qualquer lugar: de aplicativos da Web aos de mensagem e bate-papo, como o Slack e Facebook Messenger, ou por meio da voz em aplicativos de dispositivos móveis ou conectados. O Amazon Lex lida com a autenticação exigida por várias plataformas e simplifica o design da interface de usuário, já que não é necessário que os desenvolvedores escrevam códigos personalizados para cada plataforma. Além disso, os desenvolvedores não precisam se preocupar em escalar sua infraestrutura, uma vez que o Amazon Lex escala automaticamente de acordo com o aumento do tráfego direcionado a um bot e os desenvolvedores pagam apenas pelas chamadas realizadas ao API do Amazon Lex.

A Capital One oferece uma grande variedade de serviços e produtos financeiros a consumidores, pequenos negócios e clientes comerciais em diferentes canais. "Para empresas que utilizam muito a AWS, a integração perfeita do Amazon Lex a outros serviços da empresa, como o Lambda e Amazon DynamoDB, é muito atrativa", diz Firoze Lafeer, CTO da Capital One Labs, da Capital One. "Por ser altamente escalável, o Amazon Lex também possibilita acelerar o tempo de comercialização para uma nova geração de interações de voz e texto, tais como o recurso da Capital One lançado recentemente para o Alexa".

A OhioHealth é uma organização de saúde reconhecida nacionalmente nos EUA, com uma rede de mais de 11 hospitais em 47 cidades. "Estamos empolgados com a utilização de tecnologia evolutiva de reconhecimento de voz e processamento de linguagem natural para melhorar as vidas de nossos clientes. O Amazon Lex representa uma ótima oportunidade de entregarmos uma experiência nova aos nossos pacientes", diz Michael Krouse, vice-presidente sênior de suporte operacional e diretor de TI da OhioHealth. "Tudo que fazemos na OhioHealth é voltado ao fornecimento da assistência adequada aos nossos clientes, na hora certa e no lugar certo. A nova geração da tecnologia do Amazon Lex, bem como os aplicativos inovadores que estamos desenvolvendo com ele, ajudarão a proporcionar uma experiência aprimorada a eles. E esse é apenas o começo ".
A HubSpot é uma das líderes em entrega de software de publicidade e vendas. "O GrowthBot da HubSpot é um bot conversacional completo que ajuda a aumentar a produtividade de publicitários e vendedores oferecendo acesso a dados e serviços relevantes por meio de uma interface conversacional. Com o GrowthBot, os publicitários podem obter ajuda na criação de conteúdo, na pesquisa de concorrência e no monitoramento de sua lógica analítica. Com o Amazon Lex, acrescentamos recursos sofisticados de processamento de linguagem natural para que o GrowthBot possa fornecer uma interface mais intuitiva", diz Dharmesh Shah, CTO e fundador da HubSpot. "O Amazon Lex nos permite usar IA avançada e aprendizagem automática sem precisarmos codificar nós mesmos os algoritmos".

A Twilio ajuda empresas a oferecer comunicações relevantes e contextuais por meio da integração simplificada de recursos de autenticação e comunicação em tempo real diretamente nos aplicativos de software. "Desenvolvedores e empresas utilizam a Twilio para criar aplicativos que possam se comunicar com os clientes em praticamente qualquer lugar do mundo", diz Benjamin Stein, diretor de produtos de mensagens da Twilio. "O Amazon Lex fornecerá aos desenvolvedores uma arquitetura modular intuitiva e APIs abrangentes que permitam a criação e implementação de bots conversacionais em plataformas móveis. Estamos ansiosos para ver o que nossos clientes serão capazes de criar com a Twilio e o Amazon Lex".

Fala inteligente com o Amazon PollyO Amazon Polly possibilita a adição de recursos de fala realista a aplicativos já existentes, como leitores de notícias e plataformas de e-learning e a criação de categorias totalmente novas de produtos que tenham recursos de voz, de aplicativos móveis a eletrônicos e aparelhos domésticos. Ele é fácil de usar: os desenvolvedores enviam textos ao Amazon Polly usando SDK ou a partir do AWS Management Console, e o Polly responde imediatamente com um streaming de áudio que pode ser reproduzido diretamente ou armazenado em um formato de áudio padrão. Com 47 vozes realistas e suporte a 24 idiomas, os desenvolvedores podem escolher vozes masculinas ou femininas com diversos sotaques e desenvolver aplicativos para usuários em todo o mundo. E, como o Amazon Polly tem uma pronúncia fluída dos conteúdos de texto, os aplicativos oferecem output de voz de alta qualidade em diversos formatos de texto. O Amazon Polly é escalável e responde rapidamente com falas de alta qualidade, mesmo ao lidar com grandes volumes de conversão de texto em voz. Os desenvolvedores pagam apenas pelo texto convertido e podem converter as falas geradas em cache, a fim de reproduzi-las quantas vezes quiserem, sem restrições.

O The Washington Post é uma empresa de tecnologia e mídia vencedora do prêmio Pulitzer que publica mais de 1.200 histórias diariamente. "Alimentamos há tempos o interesse de fornecer versões em formato de áudio das nossas histórias, mas o custo-benefício oferecido pelas soluções de texto-para-voz existentes não era satisfatório em relação à qualidade que entregavam", diz Joseph Price, gerente sênior de produtos do The Washington Post. "Com o lançamento do Amazon Polly e suas vozes de alta qualidade, ofereceremos aos nossos leitores formas mais ricas e versáteis de conferir nosso conteúdo".

A GoAnimate é uma plataforma de criação de vídeos animados baseada na nuvem que possibilita a criação rápida e simples de vídeos animados para executivos sem experiência em animação. "O Amazon Polly permite que os usuários da GoAnimate deem voz instantaneamente aos personagens que criam com a nossa plataforma. Isso é muito útil, principalmente em situações onde a locução ao vivo é problemática em termos de tempo ou recursos; por exemplo, quando o vídeo é desenvolvido em vários idiomas, ou na pré-produção, quando há interesse de acelerar o processo de aprovação ", diz Alvin Hung, CEO e fundador da GoAnimate. "O recurso de fala do Amazon Polly é integrado perfeitamente ao nosso rico conjunto de ativos pré-animados, o que reforça a simplicidade da GoAnimate e proporciona eficiência e tempo de comercialização mais rápido aos nossos consumidores".

Análise inteligente de imagem com o Amazon RekognitionO Amazon Rekogntion permite a criação rápida e fácil de aplicativos de análise de imagens e de reconhecimento de rostos, objetos e cenas. Ele utiliza tecnologias de aprendizagem profunda para identificar automaticamente objetos e cenas, tais como veículos, animais de estimação ou móveis, e oferece uma pontuação de confiança que permite aos desenvolvedores inserir imagens que podem ser utilizadas na pesquisa de imagens específicas com palavras-chave. O Amazon Rekognition consegue localizar rostos dentro de imagens e detectar atributos, tais como o clima e se a pessoa está sorrindo ou está de olhos abertos. Ele também tem suporte para funcionalidades avançadas de análise facial, tais como pesquisa e comparação de rostos. Utilizando o Rekognition, os desenvolvedores podem criar um aplicativo que analisa a probabilidade de correspondência entre os rostos de duas imagens diferentes a fim de verificar um usuário mediante uma foto de referência quase que instantaneamente. De forma semelhante, os usuários podem criar coleções de milhões de rostos (detectados em imagens) e podem pesquisar correspondências para sua imagem de referência na coleção. O Amazon Rekognition remove a complexidade e a necessidade de uma equipe numerosa para que se crie e desenvolva linhas caras de processamento de imagem, disponibilizando recursos de classificação, detecção e gerenciamento em um só serviço AWS simples, econômico e confiável. Não há custos iniciais com o Amazon Rekognition; os desenvolvedores pagam apenas por imagem analisada e por vetor de feições faciais armazenado.

A Redfin é uma empresa de corretagem especializada que utiliza a tecnologia moderna para ajudar as pessoas a comprar e vender imóveis. "Nossos clientes adoram navegar pelas imagens de imóveis em nosso site e em nossos aplicativos móveis, e queremos que eles possam filtrar o que desejam entre centenas de milhões de catálogos e imagens facilmente", diz Yong Huang, diretor de Big Data e lógica analítica da Redfin. "O Amazon Rekognition gera um rico conjunto de marcadores diretamente das imagens dos imóveis. Isso simplifica a criação de um recurso de busca que ajude os clientes a encontrar casas com base em suas necessidades específicas, como uma lareira, um quintal ou uma piscina. E como o Rekognition é compatível com URLs do Amazon S3, ele poupa muito tempo ao detectar objetos, cenas e rostos sem a necessidade de mover imagens".

A SmugMug é um ambiente seguro que armazena diariamente bilhões de belas fotos para milhões de clientes incríveis. "Nossos clientes querem passar seu tempo criando mais memórias e não gerenciando sua coleção de fotos manualmente", diz Don MacAskill, cofundador, CEO e chief geek da SmugMug. "O Amazon Rekognition permitirá que identifiquemos automaticamente o conteúdo nas fotos dos clientes, apresentando uma variedade de recursos que permitirá que os cientes, bem como seus visitantes, tenham mais tempo para focar em curtir a vida e celebrar suas fotos".

Aprendizagem profunda e IA na AWSNo momento, o Amazon Polly e o Amazon Rekognition estão disponíveis nas regiões leste (Ohio e norte de Virginia) e oeste (Oregon) dos EUA e na Europa (Dublin) e chegarão a outras regiões nos próximos meses. Os clientes podem se inscrever para a versão de pré-lançamento do Amazon Lex.
Além desses serviços, a AWS anunciou recentemente que está investindo substancialmente, com a contribuição de códigos e melhorias na experiência dos desenvolvedores, no MXNet, um framework de aprendizagem profunda distribuído em código aberto, desenvolvido incialmente pela Canergie Mellon University e outras grandes universidades. O MXNet permitirá que especialistas em aprendizagem automática criem modelos escaláveis de aprendizagem profunda que podem reduzir significativamente o tempo necessário parar treinar seus aplicativos. Para mais informações sobre o suporte da AWS ao MXNet, acesse: http://www.allthingsdistributed.com/2016/11/mxnet-default-framework-deep-learning-aws.html.

A AWS também auxilia os desenvolvedores na execução de seus próprios fluxos de trabalho de aprendizagem profunda e aprendizagem automática para facilitar a criação de plataformas próprias de IA baseadas na AWS. O Amazon EC2 (Amazon Elastic Compute Cloud), com seu grupo abrangente de instâncias e placas gráficas com grandes volumes de memória, é ideal para treinamento de aprendizagem profunda. As instâncias P2, lançadas em setembro de 2016, foram projetadas para aprendizagem automática e profunda em larga escala, com até 8 aceleradores NVIDIA Tesla K80, cada um rodando duas placas gráficas NVIDIA GK210 com 12 GiB de memória e 2.496 núcleos de processamento paralelos. Os clientes também podem utilizar o AMI de aprendizagem profunda da AWS, que contém seis frameworks pré-configurados e pré-testados, incluindo todas as dependências, drivers Nvidia e ferramentas de ciência de dados, como o Jupyter e Anaconda. Além disso, os modelos da AWS CloudFormation estão disponíveis para treinar redes neurais profundas em escala em apenas alguns cliques.

Nenhum comentário