Porque está a Microsoft a combinar todos os seus produtos de análise de dados no Fabric

A integração dos seus produtos existentes, como o Synapse e o Power BI, ajudará as empresas a combinar cargas de trabalho, reduzindo as despesas gerais, a complexidade e o custo da integração de TI.

Por Anirban Ghoshal

A Microsoft está a combinar os seus atuais produtos de armazenamento de dados, business intelligence (BI) e análise de dados numa única oferta, denominada Microsoft Fabric, anunciou a empresa.

De acordo com os analistas, esta medida poderá ajudar as empresas a combinar cargas de trabalho, reduzindo simultaneamente as despesas gerais, a complexidade e os custos da integração de TI.

De acordo com Sanjeev Mohan, analista principal da SanjMo, o lançamento de uma plataforma unificada de análise de dados sob a forma de Microsoft Fabric pode ser visto como uma “resposta” à proliferação maciça de produtos na pilha de dados moderna de uma empresa.

“A Microsoft está ciente de que os seus clientes estavam a tentar reduzir a sobrecarga e a complexidade da integração. Não é que os clientes não gastem, mas estão à procura de um melhor valor para o seu investimento em TI”, disse Mohan, acrescentando que, se o Fabric puder fornecer os resultados certos, poderá ser a estratégia “certa” para o fornecedor de serviços de nuvem pública.

Além de reduzir a complexidade de TI, o Fabric também pode ajudar a reduzir os custos, disse Mohan.

“Uma solução integrada deve custar menos do que um conjunto das melhores soluções especializadas. O Fabric pré-integrado também reduz os custos de integração e as competências necessárias para aprender diferentes ferramentas”, explicou o analista principal.

A Microsoft também afirma que comprar e gerir recursos com o Fabric é mais fácil.

“Os clientes podem comprar um único pool de computação que alimenta todas as cargas de trabalho do Fabric. As capacidades de computação universal reduzem significativamente os custos, uma vez que qualquer capacidade de computação não utilizada numa carga de trabalho pode ser utilizada por qualquer uma das cargas de trabalho”, afirmou a empresa em comunicado.

Segundo Boris Evelson, analista principal da Forrester, os dados brutos, sejam eles transacionais, operacionais ou outros, têm de passar por fases como a recolha, a extração, a movimentação, a integração, a limpeza, a modelação e a catalogação antes de se tornarem informações valiosas.

“Normalmente, algumas das tecnologias que suportam cada uma das etapas são provenientes de diferentes fornecedores e os profissionais de dados ou de análise têm de perder tempo a integrá-las”, afirma Evelson, que acrescenta que, embora o Fabric não elimine completamente a necessidade de integrar componentes, reduz o tempo e o esforço de integração, permitindo que os utilizadores de dados e de análise se concentrem mais na resolução de problemas e na abordagem de oportunidades de negócio.

Microsoft Fabric oferece sete serviços e ferramentas principais

O Microsoft Fabric, de acordo com a empresa, utiliza uma arquitetura unificada para fornecer uma experiência de software como serviço (SaaS) aos programadores, ajudando-os a extrair informações de dados brutos e a apresentá-las aos utilizadores empresariais.

A nova suite analítica inclui sete módulos e conjuntos de ferramentas principais, como conectores de dados, ferramentas de engenharia de dados, fluxos de trabalho de dados para ciência de dados e ferramentas analíticas, entre outros.

Um dos módulos atualmente em pré-visualização pública, o Data Factory, fornece mais de 150 conectores para fontes de dados na nuvem e no local, permitindo uma experiência de arrastar e largar para a transformação de dados, juntamente com a capacidade de orquestrar pipelines de dados, disse a empresa.

A Microsoft também incluiu o módulo Synapse Data Engineering, também em pré-visualização pública, que ajuda na criação de modelos no Apache Spark, disse.

O Fabric também inclui o Synapse Data Science, um fluxo de trabalho de ponta a ponta para cientistas de dados construírem modelos sofisticados de inteligência artificial (IA), e o Synapse Data Warehousing, que combina ferramentas de armazenamento de dados e lakehouse com a capacidade de executar SQL em formatos de dados abertos, disse a empresa. Ambos estão em fase de pré-visualização pública.

Outro módulo ainda em fase de pré-visualização pública é o Synapse Real-Time Analytics, que permitirá aos programadores trabalhar com dados em fluxo contínuo e analisar grandes volumes de dados semiestruturados, segundo a Microsoft.

Além disso, a empresa também está a integrar um módulo Power BI no Fabric para ajudar os analistas e utilizadores empresariais numa empresa a gerar insights a partir de dados com o apoio de ferramentas baseadas em IA.

A experiência do Power BI também está profundamente integrada ao Microsoft 365, disse ele.

Para o analista principal da Amalgam Insights, Hyoun Park, a adição do Power BI ao Fabric colmata uma série de lacunas no Power BI que o faziam parecer menos preparado para as empresas em comparação com plataformas analíticas como a Qlik, a TIBCO ou a SAS.

A Microsoft disse que o Fabric virá com um módulo Data Activator destinado à descoberta e monitorização de dados em tempo real. Será capaz de ativar notificações e ações quando encontrar padrões específicos nos dados, disse a empresa, acrescentando que o módulo estava atualmente em pré-visualização privada.

Todos os sete módulos, segundo a empresa, podem ser experimentados no portal da empresa.

Serviço Azure OpenAI a ser adicionado ao Microsoft Fabric, Copilot em breve

A Microsoft está a adicionar o seu serviço Azure OpenAI ao Fabric e em breve integrará o Copilot, desenvolvido pela GPT, à plataforma de análise, disse a empresa.

“Com o Copilot no Microsoft Fabric, os utilizadores podem usar a linguagem de conversação para criar fluxos de dados e pipelines de dados, gerar código e funções completas, construir modelos de aprendizagem de máquina ou visualizar resultados”, acrescentou.

A adição do serviço Azure OpenAI e do Copilot irá simplificar muito o trabalho realizado por profissionais de dados experientes no Microsoft Azure, quebrando muitas das barreiras entre as soluções, disse Bradley Shimmin, analista-chefe da Omdia.

“Também deve acelerar a adoção dos modelos fundamentais da Microsoft e, francamente, de todo o portfólio de ferramentas de aprendizagem automática da empresa”, acrescentou Shimmin.

A mudança também pode ser vista como um esforço contínuo da Microsoft para integrar as API do Large Language Model (LLM) da OpenAI em todo o seu portfólio de produtos, de acordo com Mohan.

As empresas também podem combinar os LLM do serviço Azure OpenAI com os seus próprios dados para criar as suas próprias experiências de linguagem de conversação, disse a empresa, acrescentando que o Copilot não foi treinado nos dados de inquilinos de uma empresa.

Fabric é compatível com OneLake e adota formato de tabela Databricks Delta

Todos os dados e cargas de trabalho do Fabric, de acordo com a Microsoft, são armazenados num centro de dados SaaS e multicloud chamado OneLake, semelhante aos dados do aplicativo 365 armazenados no OneDrive.

“Os dados são organizados num centro de dados e indexados automaticamente para descoberta, partilha, gestão e conformidade. Fornece um sistema de armazenamento unificado único para todos os programadores, onde a descoberta e a partilha de dados são fáceis e as definições de política e segurança são aplicadas de forma centralizada”, afirmou a empresa num comunicado.

Isto ajuda a evitar silos de dados devido ao facto de diferentes programadores provisionarem e configurarem as suas próprias contas de armazenamento isoladas, explicou a empresa, acrescentando que o OneLake permite às empresas virtualizar o armazenamento do lago de dados no ADLS Gen2, AWS S3 e Google Storage.

A introdução do OneLake, de acordo com Evelson da Forrester, tornará mais fácil para as empresas criarem o seu próprio mini-lago de dados numa questão de minutos, em vez de dias ou semanas.

“É verdade que preparar esse lago de dados para aplicações de missão crítica ainda levará tempo, mas a prototipagem, a prova de conceito e o desenvolvimento ágil serão mais fáceis”, diz o analista.

Além disso, o Fabric trata os ficheiros Delta on Parquet como um formato de dados nativo que é o padrão para todas as cargas de trabalho.

“Este compromisso profundo com um formato de dados aberto e comum significa que os clientes só têm de carregar os dados para o lago de dados uma vez e todas as cargas de trabalho podem funcionar com os mesmos dados, sem terem de os ingerir separadamente”, disse a empresa, acrescentando que isto significa que o OneLake suporta dados estruturados de qualquer formato e dados não estruturados.

A adoção do formato de código aberto, segundo Evelson, pode levar a enormes poupanças de tempo, esforço e armazenamento.

“Embora o OneLake em si não seja de código aberto, a estrutura de dados é baseada num formato de código aberto chamado Parquet, um formato de dados otimizado para análise. Isto significa que um lago de dados, um armazém de dados e uma plataforma de BI (neste caso, o Power BI) utilizarão exatamente o mesmo formato e, mais importante ainda, a mesma instância/versão dos dados”, afirmou Evelson.

Além disso, a Microsoft disse que está a planear introduzir um modelo de segurança universal para o tecido que é gerido no OneLake para ajudar as empresas a gerir a segurança dos dados em diferentes motores de dados, módulos ou ferramentas.

De acordo com a empresa, o modelo irá garantir que todos os motores ou módulos de dados aplicam o modelo de segurança ao processar consultas ou outras tarefas.

Poderá a Microsoft tirar partido do Fabric?

O lançamento do Microsoft Fabric, dizem os analistas, pode ser muito positivo em termos de adoção e popularidade.

“Se todos os utilizadores empresariais do Office 365 receberem uma cópia do Fabric, tal como recebem hoje uma cópia do Power BI com a licença do Office 365 E5, terá o mesmo efeito viral que o Power BI”, disse Evelson.

No entanto, o analista principal da Constellation Research, Doug Henschen, alertou para o facto de o sucesso do Fabric poder não surgir da noite para o dia.

“Tenha em conta que tudo o que foi anunciado ainda está em fase de pré-visualização e que a Microsoft tem um historial misto no que diz respeito ao sucesso em áreas como o armazenamento de dados. O Azure Synapse, o mais recente, não foi amplamente adotado ou aclamado pelos clientes como uma plataforma de armazenamento de dados”, diz Henschen, que acrescenta que as empresas tendem a não mudar rapidamente de plataforma de dados. 

De acordo com os analistas, o Microsoft Fabric pode ser comparado ao Google DataPlex, SAP DataSphere e IBM Data Fabric.




Deixe um comentário

O seu email não será publicado