IBM anuncia investimento em projeto de big data de código aberto
Assim como ocorreu em 1981, quando entrou no negócio de computadores pessoais, e no ano 2000, com o sistema operacional de código aberto Linux, a IBM tem agora uma outra pretensão: tornar o big data o mainstream ("corrente principal") do mercado. A gigante da tecnologia acredita no "efeito de endosso" e na força de sua marca para consolidar o big data como ferramenta estratégica nos mais variados setores, da identificação e a segmentação de clientes, passando pelo planejamento e análise financeiros, vendas e atendimento de pedidos, aos sistemas para controle de departamentos e processos (ERP, RH etc.).
Nesta segunda-feira, 15, a empresa anunciou que está realizando um grande investimento, envolvendo o apoio a desenvolvedores de software, desenvolvimento tecnológico e programas de treinamento, em um projeto open source para análise de dados em tempo real, chamado Apache Spark. Sem revelar cifra, o vice-presidente sênior de negócios de análise de dados da IBM, Robert Picciano, disse que o aporte no projeto será de "centenas de milhões de dólares" anuais.
Grande parte dos investimentos e das atenções no mercado de software de big data até agora tem sido voltados para o Apache Hadoop — plataforma de big data de código aberto, que roda em cima do servidor Apache em distribuições Linux — e empresas distribuidoras do software, tais como Cloudera, Hortonworks e MapR. O Hadoop é o software que torna possível manipular e analisar grandes volumes de todos os tipos de dados. A tecnologia foi desenvolvida por empresas nativas da internet como Google e Yahoo.
Hadoop "envenenado"
Mas se Hadoop é capaz de analisar grandes volumes de dados, o Spark promete acelerar essa análise, com processamento em tempo real de dados de sensores para transações de vendas online. A tecnologia do Spark foi desenvolvida pelo Laboratório de Algoritmos, Máquinas e Pessoas da Universidade de Berkeley, na Califórnia. "É uma tecnologia crucial que irá tornar realmente possível cumprir a promessa do big data", disse Picciano ao The New York Times. Essa promessa, segundo ele, é possibilitar rapidamente insights de dados para economizar tempo e custos, e identificar oportunidades em áreas como vendas e desenvolvimento de novos produtos.
A IBM diz que vai disponibilizar mais de 3,5 mil de seus desenvolvedores e pesquisadores para trabalhar em projetos relacionados ao Spark. Ela contribuirá com tecnologia de aprendizado de máquina e também o oferecerá como um serviço na sua plataforma de desenvolvimento de software em nuvem, Bluemix. Além disso, a empresa vai abrir um centro de tecnologia Spark em San Francisco, na Califórnia.
Analistas ouvidos pelo jornal americano disseram que, ao abraçar um projeto de código aberto, a IBM quer atrair desenvolvedores e reforçar a sua posição no mercado de big data, em rápida evolução. Ela também espera atrair mais engenheiros de software para usar suas grandes ferramentas de dados. "É antes de tudo uma estratégia para conquistar mentes — e os corações — de desenvolvedores", disse Dan Vesset, analista da IDC.
Esses analistas ressaltam que a IBM precisa de um ecossistema de tecnologias, pois é um grande player e tem influência no mercado, mesmo que não lucre imediatamente a partir do projeto. "A IBM levanta dinheiro com a construção de soluções para os clientes", disse Mike Gualtieri, analista da Forrester Research. "Isso, em última análise, é o que faz sentido para a IBM."