AWS lança o Redshift Spectrum
A nova capacidade permite que os clientes do Amazon Redshift executem consultas analíticas de forma rápida e econômica nos exabytes de dados armazenados no Amazon S3
O Amazon Redshift é um dos serviços de maior crescimento da AWS, porque permite que os clientes realizem, com um desempenho super-rápido, consultas complexas em petabytes de dados estruturados armazenados em discos locais de alto desempenho ─ tudo por um décimo do custo dos data warehouses tradicionais. No entanto, como o custo de armazenamento de dados continuou a cair, os clientes estão cada vez mais armazenando grandes quantidades de dados no “data lake” do Amazon S3, incluindo dados não estruturados que talvez poderão nunca serem enviados a um data warehouse. Agora, com o Redshift Spectrum, analisar todos esses dados é tão fácil quanto executar uma consulta SQL padrão com o Amazon Redshift. O Redshift Spectrum consulta diretamente os dados no Amazon S3, sem necessitar carregá-los ou transformá-los, mantendo os formatos de dados abertos que os clientes já utilizam, como CSV, TSV, Parquet, Sequence e RCFile. Como o Redshift Spectrum suporta a mesma sintaxe SQL do Amazon Redshift, os clientes podem executar consultas sofisticadas usando as mesmas ferramentas de Business Intelligence (BI) que utilizam hoje. Eles também podem executar consultas que abrangem os dados frequentemente acessados que estão armazenados localmente no Amazon Redshift e também os seus conjuntos de dados armazenados de forma econômica no Amazon S3. O Redshift Spectrum dimensiona automaticamente a capacidade de computação de consulta com base nos dados que estão sendo acessados, de modo que as consultas realizadas nos dados armazenados no Amazon S3 são executadas rapidamente, seja no processamento de apenas alguns terabytes, petabytes ou até mesmo de exabytes.
“Clientes como Amgen, Boingo Wireless, Electronic Arts, Hearst, Lyft, Nasdaq, Scholastic, TripAdvisor e Yahoo! estão migrando em massa para o Amazon Redshift porque ele aproveita a escala da AWS para analisar petabytes de dados com dez vezes o desempenho à um décimo do custo dos data warehouses da velha guarda. Muitos desses clientes nos pediram para estender a velocidade e a flexibilidade do Amazon Redshift para além do data warehouse, para analisar todos os dados que possuem no Amazon S3”, diz Raju Gulabani, Vice-Presidente de Bases de Dados, Análises e IA da AWS. “O Redshift Spectrum faz exatamente isso, oferecendo o melhor dos dois mundos, tornando incrivelmente fácil a consulta de exabytes de dados armazenados no Amazon S3 ─ diretamente do Amazon Redshift. Estamos entusiasmados por agora tornarmos as análises em escala de exabyte rápidas, simples e acessíveis para empresas de todos os tamanhos”.
O NTT DOCOMO, com sede em Tóquio, é o maior provedor de serviços móveis do Japão, atendendo a mais de 68 milhões de clientes. “A nossa plataforma de análise de dados coleta diariamente dezenas de terabytes de dados de registro de uma variedade de fontes internas e externas para nos ajudar a melhorar as nossas operações de logística e marketing. A migração para o Amazon Redshift há dois anos permitiu que escalássemos para mais de dez petabytes de dados descompactados, com uma melhora de desempenho de dez vezes em relação ao nosso sistema anterior que existia no local”, diz Mick Etoh, Vice-presidente Sênior e Gerente Geral do Departamento de Gestão de Inovação do NTT DOCOMO. “O Redshift Spectrum nos permitirá, com o tempo, expandir para centenas de petabytes o universo dos dados que analisamos. Esta é verdadeiramente uma mudança decisiva, e não conhecemos nenhum outro sistema do mundo que possa nos proporcionar isso”.
A Time Inc. é uma empresa líder em conteúdo que, engajando mais de 150 milhões de consumidores mensalmente por meio de seu portfólio de marcas premium em todas suas plataformas. “Como uma empresa de mídia, recebemos enormes quantidades de dados de log de publicidade vindas de vários provedores de veiculação de anúncios. Esses dados vêm em uma variedade de formatos e precisam ser unidos aos nossos próprios sistemas internos para analisarmos o comportamento do usuário, o engajamento com o conteúdo, o desempenho das campanhas e as oportunidades de otimização de receita”, diz Vladimir Barkov, Diretor de Arquitetura de Dados e Engenharia da Time Inc. “O Redshift Spectrum nos permite operar diretamente em nossos dados de log do servidor de anúncios em seu formato nativo no Amazon S3, sem necessitar qualquer pré-processamento ou transformação. O nosso pipeline de dados de log de servidor de anúncios está agora muito mais simples, reduzindo o custo operacional, eliminando pontos de falha e reduzindo, em uma ordem inteira de grandeza, o tempo de execução”.
A Edmunds oferece informações detalhadas e constantemente atualizadas sobre veículos para 20 milhões de visitantes mensais. “A escalabilidade do Amazon Redshift nos permite trabalhar com nossos volumes de dados cada vez maiores, ao contrário de nossa solução prévia de data warehouse local”, diz Ajit Zadgaonkar, Diretor Executivo de Operações e Infraestrutura da Edmunds. “Com o Redshift Spectrum, não precisamos mais decidir a respeito de quais dados devemos manter para análise e quais podemos descartar. Agora podemos executar consultas SQL reais diretamente em muitos anos de dados armazenados de forma econômica no Amazon S3. O rápido desempenho do Redshift Spectrum em grandes conjuntos de dados é inédito”.
A Redfin é a corretora imobiliária de última geração que une os seus próprios agentes de serviços completos com a moderna tecnologia para redefinir os negócios imobiliários a favor do consumidor em mais de 80 áreas metropolitanas dos EUA. “Com milhões de usuários e centenas de milhões de listagens de propriedades, o nosso site e sistemas internos geram uma grande quantidade de dados. A nossa plataforma de análise de dados foi construída do zero com base na AWS, usando o Amazon S3 para armazenamento, o Amazon Kinesis para streaming, o Amazon EMR para processamento de dados e aplicativos em tempo real, e o Amazon Redshift para data warehousing”, diz Yong Huang, Diretor de Big Data e Analytics da Redfin. “Adoramos o Redshift Spectrum porque ele nos permite consultar, de maneira direta e flexível, os nossos dados mais atualizados provenientes de muitos complexos pipelines diferentes em diversos formatos diferentes de arquivos. A nossa equipe de ciência de dados que utiliza o Amazon EMR pode agora colaborar com nossas equipes de marketing e produtos usando o Redshift Spectrum para analisar os mesmos conjuntos de dados que estão no Amazon S3”.
O Yelp conecta pessoas a grandes empresas locais e lhes fornece opiniões aprofundadas em 32 países. “O Yelp gera bilhões de eventos analíticos todos os dias em nossos 24 milhões em média de usuários únicos mensais de aplicativos móveis, 65 milhões em média de visitantes únicos mensais do site em dispositivos móveis e 73 milhões em média de visitantes únicos mensais em desktops em 31 de dezembro de 2016. A nossa migração para dispositivos móveis sobrecarregou a nossa infraestrutura de análise, já que nossos usuários de aplicativos para dispositivos móveis têm dez vezes mais engajamento do que os usuários do nosso site”, diz Justin Cunningham, Líder Técnico da Equipe de Engenharia de Software do Yelp. “O Redshift Spectrum desbloqueia o acesso analítico aos nossos dados que estão no Amazon S3, reduzindo para segundos o tempo de obtenção de insights de grandes conjuntos de dados. Isso possibilitará muitos mais casos de uso do que os que servimos hoje ─ várias equipes diferentes agora podem consultar os mesmos conjuntos de dados no Amazon S3 usando o Amazon Redshift e o Amazon EMR”.
A Recruit Technologies opera algumas das marcas de mídia e propriedades de publicidade mais populares do Japão. “As nossas propriedades web e mobile geram bilhões de eventos por dia que analisamos para melhorar os nossos negócios, incluindo marketing, planejamento de negócios e aprimoramentos de produtos. Migramos para o Amazon Redshift em 2015 para acompanhar a explosão dos dados em nossos negócios”, diz Satoshi Honmura, Gerente do Grupo de Gestão de Dados da Recruit Technologies. “O Redshift Spectrum nos ajudará a escalar ainda mais, ao mesmo tempo que também reduz os nossos custos. Agora, os nossos cientistas de dados podem executar consultas sofisticadas em muitos anos de dados históricos armazenados no Amazon S3 pagando apenas pelas consultas que executam, enquanto as nossas centenas de usuários de negócios podem continuar usando o armazenamento local do Redshift para oferecer um desempenho incrivelmente rápido com dados mais recentes”.
Os clientes podem começar a usar o Redshift Spectrum usando o AWS Management Console. O Amazon Redshift Spectrum está disponível nas regiões do Leste dos Estados Unidos (W. Virginia), do Leste dos Estados Unidos (Ohio) e do Oeste dos Estados Unidos (Oregon) e se expandirá para outras regiões ao longo dos próximos meses.
Nenhum comentário