Fornecedores de Hadoop que deve conhecer

Estudo da Forrester dá visão do mercado sobre uma tecnologia que está, ou vai estar, no radar das empresas.

Hadoop - Forrester

 

Antes reservado apenas às grandes empresas da Internet, como a Google e o Yahoo, o Hadoop – o mais conhecido e popular sistema para gestão de Big Data – começa agora a ser olhado por outras empresas.

Há duas grandes razões para isso: as empresas têm muito mais dados para gerir e o Hadoop é uma grande plataforma, especialmente por permitir combinar dados antigos legados com novos dados não estruturados. Um grande número de empresas está a oferecer serviços e suporte em torno do Hadoop, tornando-o portanto mais apetecível para as organizações.

Para mais, muitas empresas estimam que estão a analisar no máximo 12% de todos os seus dados, deixando os outros 88% sem aproveitamento, segundo o estudo “The Forrester Wave: Big Data Hadoop Solutions, Q1 2014”.

“A Forrester acredita que o Hadoop é uma plataforma que precisa de ser usada em grandes empresas, formando a pedra angular de qualquer futura plataforma flexível de gestão de dados. Se tem dados estruturados, não estruturados e binários, há espaço relevante para o Hadoop na sua empresa”, escrevem os analistas Mike Gualtieri e Noel Yuhanna, autores do estudo.

O Hadoop é um projecto open source cujas principais componentes podem ser transferidas gratuitamente por qualquer pessoa. Várias empresas, da IBM à Amazon Web Services, passando pela Microsoft e Teradata, trataram de “empacotar” o Hadoop em serviços ou pacotes de consumo mais simples. Cada empresa assumiu uma estratégia ligeiramente diferente, mas o elemento comum é o Hadoop ter a capacidade de distribuir uma carga de trabalho potencialmente para centenas de servidores, tornando o Big Data gerível.

Realizado no primeiro trimestre de 2014, o estudo da Forrester olhou para nove empresas e concluiu que não há ainda um claro líder de mercado.

A lista de empresas foi elaborada pela Forrester Wave e não representa a totalidade das plataformas e do mercado de gestão de Big Data. A lista de empresas está alinhada por ordem alfabética:

Amazon Web Services (AWS)
Os clientes à procura de uma plataforma Hadoop em nuvem pública podem recorrer a esta empresa, que a Forrester chama de “King of the cloud”. O produto Hadoop da AWS chama-se Elastic Map Reduce (EMR). Não é um Hadoop open source puro, já que foi ajustado para funcionar apenas na nuvem da Amazon.

A Forrester diz que o EMR tem hoje a maior adopção entre as plataformas Hadoop disponíveis no mercado. A AWS vai lançar um suporte mais robusto para o EMR para outros produtos e serviços, incluindo o RedShift, para “data warehouse” e o recém-lançado motor de processamento em tempo real Kenesis. E deverá incluir suporte adicional para bases de dados NoSQL e ferramentas de BI. O Hadoop da AWS funciona apenas em cloud.

Cloudera
A Cloudera tem uma distribuição Hadoop open source que usa muitos aspectos do projecto original Apache mas que agrega um grande número de melhorias, entre elas uma ferramenta de gestão e de monitorização chamada Cloudera Manager, bem como um motor SQL para dados relacionais no Hadoop, o Impala.

A empresa usa o Hadoop como base da sua distribuição, mas não é um produto open source puro. “A estratégia da Cloudera é manter a lealdade ao núcleo do Hadoop mas inovar com agressividade e velocidade para atender a procura dos consumidores e diferenciar a sua solução dos seus concorrentes”, diz a Forrester.

O resultado, segundo o relatório, é uma adopção firme da plataforma da Cloudera, que inclui uma lista de 200 clientes, alguns dos quais gerindo mais de um petabyte de dados.

Hortonworks
Como a Cloudera, a Hortonworks é uma empresa Hadoop “pure-play”. Mas, diferente da Cloudera, a Hortonworks tem a distribuição de Hadoop mais próxima do código open source original, talvez mais do que qualquer outro concorrente.

A meta da Hortonworks é desenvolver um ecossistema Hadoop e fazer evoluir o código open source. Ela diz que isso beneficia os utilizadores porque evita que fiquem presos a um fornecedor (se um cliente da Hortonworks quiser deixar a sua plataforma, pode facilmente portar as aplicações para o código open source).

A postura da Hortonworks acabou por lhe garantir fortes parcerias com fornecedores de peso como a Teradata, Microsoft, Red Hat e SAP.

IBM
Quando as organizações pensam em grandes projectos de TI, muitas pensam na IBM – e com razão. Por causa disso, a IBM tornou-se um grande “player” no mundo Hadoop.

Segundo a Forrester, a IBM tem actualmente mais de 100 instalações de Hadoop, com muitos dos seus clientes gerindo petabytes de dados. A empresa ganha vantagem da sua vasta experiência em computação, data center e implementação de projectos de Big Data.

“O ‘roadmap’ da IBM inclui continuar a integrar a solução BigInsights Hadoop a produtos como ‘analytics’, gestão de carga de trabalho em computação de alta performance, ferramentas de BI e ferramentas de modelagem e gestão de dados”, afirma a Forrester.

Intel
Como a Amazon, a Intel está a tirar vantagem e a optimizar a sua versão do Hadoop para o seu hardware – especificamente, processadores Xeon. Para clientes que procuram uma maior afinidade entre o software e o hardware, a distribuição de Hadoop da Intel é potencialmente a solução ideal.

A Forrester realça que a Intel libertou recentemente o seu produto, pelo que é esperado que a empresa inove um pouco mais sobre a versão actual.

MapR Technologies
A MapR Technologies é talvez a empresa com a melhor distribuição de Hadoop sobre a qual muitas pessoas nunca ouviram falar. No estudo da Forrester com utilizadores Hadoop, a MapR recebeu a maior nota pela sua oferta actual, devido à arquitectura e recursos de processamento.

O segredo da empresa é um conjunto de recursos únicos. O Hadoop da MapR suporta Network File Systems (NFS) e a empresa incluiu-o na sua plataforma de recursos de alto nível para recuperação de desastres e de alta disponibilidade de dados.

A Forrester diz que a MapR deve investir em marketing e em mais parcerias para ter o reconhecimento que empresas como a Cloudera e a Hortonworks já possuem no mercado.

Microsoft
A Microsoft está a avançar não só em capacitar o Hadoop para funcionar em ambiente Windows, como para estar mais próxima de todo o ecossistema Hadoop. Os resultados do trabalho podem ser vistos no produto HDInsight, na cloud pública Windows Azure. Trata-se de uma oferta de Hadoop como serviço baseada na distribuição da Hortonworks mas feita especificamente para funcionar no Azure.

“A presença significativa da Microsoft nos mercados das bases de dados, “data warehouse”, cloud, OLAP, BI, folhas de cálculo, colaboração e ferramentas de desenvolvimento, tem uma vantagem”, diz a Forrester.

Pivotal Software
No ano passado, a EMC e a VMware combinaram um conjunto dos seus produtos para criar a Pivotal. Um dos grandes aspectos da nova empresa é trabalhar na sua distribuição Hadoop com a Cloud Foundry PaaS.

Ao fazer isso, a Pivotal agregou algumas ferramentas sobre o código aberto, especificamente um motor SQL chamado HAWQ e uma “appliance” Hadoop feita especificamente para Big Data.

Até agora, a empresa tem menos de 100 instalações activas, a maioria entre pequenas e médias empresas, diz a Forrester.

Teradata
Uma empresa como a Teradata poderia ver o Hadoop como uma ameaça ou uma oportunidade. Para uma empresa especializada em gestão de dados – particularmente no segmento de bases de dados SQL e relacionais -, uma plataforma NoSQL como o Hadoop poderia ser uma ameaça.

Em vez disso, a Teradata abraçou o Hadoop. Ao fazer uma parceria com a Hortonworks, a Teradata oferece agora aos seus clientes a capacidade de usar a plataforma integrada com as suas ofertas SQL, dando aos clientes uma plataforma Hadoop pronta a funcionar, capaz de trabalhar sem problemas com dados já armazenados em “warehouses” da Teradata.


Tags


Deixe um comentário

O seu email não será publicado