Obter dados para lhe dizer o que não sabe requer análise. E a análise requer cloud.

Por Matt Asay
Os dados por si só não são muito úteis – só são úteis quando são compreendidos e incorporados em experiências de aplicação.
Este desejo de pôr os dados a funcionar impulsionou um boom na análise baseada na cloud. Embora uma quantidade relativamente pequena de despesas em TI esteja atualmente a ir para a cloud – aproximadamente 6% de acordo com a IDC em 2020 – todo o ímpeto está a afastar-se das ferramentas de business intelligence on-premises e herdadas para opções mais modernas e nativas da cloud, tais como Google BigQuery, Amazon Redshift, Databricks ou Snowflake.
A popularidade de juntar dados e clouds é demonstrada pelo aumento meteórico de Snowflake no ranking de popularidade da base de dados DB-Engines, de número 170 em novembro de 2016 para número 11 em janeiro de 2023. Parte do sucesso de Snowflake deve-se sem dúvida ao desempenho, escalabilidade, separação de armazenamento e computação, e outras vantagens.
Mas, sem dúvida, uma vantagem ainda maior é simplesmente a cloud. A Snowflake nasceu na cloud e oferece um caminho natural para as empresas que a ela se queiram juntar. Sim, essa mesma cloud continua a impulsionar novas bases de dados sobre as alternativas herdadas. Essa mesma cloud promete continuar a revolucionar o mundo dos dados em 2023.
Tudo na cloud o tempo todo?
Embora não concorde inteiramente com o meu colega Ida nfoWorld, David Linthicum, que “2023 pode ser o ano da repatriação da cloud pública”, concordo que não devemos apaixonar-nos cegamente por uma tecnologia ou vê-la como um martelo e, portanto, tratar todos os problemas empresariais como um prego.
A cloud resolve muitos problemas, mas não todos. No entanto, em áreas relacionadas com aplicações avançadas baseadas em dados, a cloud é indispensável, como reconhece Linthicum: “Quando se trata de serviços avançados de computação (IA, análise profunda, escalas maciças, computação quântica, etc.), as clouds públicas são frequentemente mais baratas”.
Não só mais barato, mas também mais prático
Há anos atrás, o executivo da AWS Matt Wood fez-me este argumento, tão persuasivo hoje como em 2015: “As pessoas que saem e compram infraestruturas caras descobrem que o âmbito e domínio do problema muda muito rapidamente”, disse ele. “Na altura em que se deslocam para responder à pergunta original, o negócio já avançou”. Ele acrescentou: “Se investir muito dinheiro num centro de dados que esteja congelado no tempo”, as perguntas que podem ser feitas sobre os dados ficam retidas no tempo.
Mesmo em tempos económicos difíceis, a forma errada de pensar sobre a cloud é através de uma lente de custo reduzido. Uma infraestrutura elástica cria flexibilidade para dar sentido aos dados. Dólares de bom senso, por assim dizer, em vez de dólares e cêntimos. É disso que se tratam as ferramentas analíticas baseadas nas clouds.
As empresas parecem tê-lo. Numa recente conferência de analistas, o CFO da Snowflake, Mike Scarpelli, falou sobre a dinâmica competitiva no mercado de armazenamento de dados. “Nunca competimos com Teradata [uma empresa de análise de dados fundada na era do software local]. Quando um cliente tomou a decisão de sair do local, nunca é contra Teradata. Eles tomaram a decisão de partir.
Se a empresa já está a olhar para a cloud quando passa por um exercício de transformação digital, para onde olha? “De acordo com Scarpelli, “quando competimos por uma migração no local, é sempre [contra] Google, Microsoft, [e] AWS [mas AWS] tende a associar-se mais [cedo] a nós”.
Por outras palavras, é provável que o cliente tenha passado anos com o seu armazém de dados no local ou solução BI, mas não é aí que está a apostar o seu futuro. O seu futuro é a cloud. Se estiverem a considerar um próximo passo, não é provável que seja Oracle, a não ser que estejam tão profundamente envolvidos em Oracle a ponto de fazer parecer difícil a introdução de um novo sistema.
A maior parte do tempo, as empresas procurarão uma base de dados baseada na cloud, um armazém de dados, ou um sistema de aprendizagem de máquinas ou de IA. Por outras palavras, mais Google BigQuery e menos SAP BusinessObjects.
Democratizar dados
Outra razão para o sucesso da cloud é a simplicidade, ou pode ser. A cloud, claro, não é inerentemente mais fácil de usar, mas muitos sistemas de clouds têm enfatizado uma abordagem SaaS que coloca um prémio na experiência do utilizador.
Tome, por exemplo, este comentário de um fórum Reddit, descrevendo a sua experiência com o Snowflake: “Se precisa de um doutoramento em física para utilizar a sua ferramenta SaaS, a sua ferramenta é inútil. Os utilizadores do MySQL adoram-no (analistas), o C-suite adora-o, as únicas pessoas que acham difícil de conquistar são engenheiros nerds como eu que foram arrogantes o suficiente para pensar que poderiam fazer tudo sozinhos e que todos iriam aprender PySpark um dia”.
Escrevi recentemente sobre a democratização dos dados, sobre como as empresas estão a tentar dar aos seus empregados acesso e capacidade de trabalhar com mais e diferentes dados. Salientei que se as empresas quiserem verdadeiramente democratizar os dados, terão de ensinar aos empregados como utilizar eficazmente ferramentas baseadas na cloud para sondar dados baseados na cloud.
Felizmente, a cloud também permite que os sistemas de aprendizagem de máquinas assumam parte do levantamento pesado. Como o meu colega da MongoDB Adam Hughes escreve, “A combinação de análises em tempo real, operacionais e incorporadas – o que alguns chamam de análises translacionais, HTAP ou bases de dados de transações aumentadas – permite agora que as análises conduzidas por dados de aplicação ajudem a determinar, influenciar e automatizar a tomada de decisões de aplicação e fornecer feedback em tempo real ao utilizador”.
Isto não significa que as máquinas façam o pensamento por nós, mas sim que removem a burla e o trabalho indiferenciado de processamento de dados através de cálculos, deixando ao utilizador o trabalho mais ponderado de compreender o que esses dados significam para uma aplicação e, em última análise, para o negócio.
Tudo isto não é inteiramente impulsionado pela cloud, mas é absolutamente reforçado e acelerado por ela. Os dados nunca foram tão importantes, e o seu acesso e compreensão nunca foram tão fáceis graças à computação em cloud. Se tivéssemos de escolher uma previsão quase certa para 2023, seria que esta tendência iria continuar e acelerar.