O entusiasmo pela simplicidade é lícito, mas isso costuma conduzir até a uma negligência da necessidade de respeitar uma série de processos, diz Manuel del Pino, gestor de pré-vendas da Information Builders
Uma das tendências que mais se destacou no universo do BI durante os últimos quatro anos foi o “self-service data discovery”. Foi apresentado à indústria como a solução para um amplo número de problemas: desde a análise de grandes volumes de dados, até a forma de aliviar a saturação experimentada pelos departamentos de TI.
Ainda que o fenómeno do “data discovery” em modo self-service pareça apelativo, nem tudo o que reluz é ouro. E, sob o nosso ponto de vista, sofre de três inconvenientes principais:
O debate sobre o especialista versus o coleccionador de tendências
Conforme a bolha do Big Data começa a crescer, numerosos especialistas estão-se a perguntar se a indústria está a dispensar os especialistas do mundo dos dados para apostar, em troca, em ferramentas muito básicas de “data discovery” que exigem muito pouca qualificação. É certo que progressivamente tem aumentado o número de utilizadores que, dentro de uma organização, contam com acesso à informação e até mesmo realizam certas tarefas de análise com ela.
Mas é fundamental que essas empresas tenham a noção clara da formação necessária a dar aos seus funcionários para que desenvolvam atividades de analítica, seja qual for o seu grau, antes de apostar no “self-service data discovery”. A par disso, felizmente no mundo empresarial está a emergir uma nova cultura onde as decisões baseadas em dados, em factos, têm cada vez mais importância.
No entanto, estas decisões têm a sua origem no analista que, nos últimos anos, não se está a reciclar, já que as novas ferramentas de “data discovery” não o exigem. E isso é um perigo.
O caso dos dados enganosos
A nova era da BI e da analítica junta-se com o conhecido “storytelling” dos dados. E conforme os “storyboards” começam a substituir paulatinamente os dashboards e os relatórios tradicionais, as empresas passam a ter dificuldades na hora de encontrarem narradores com talento.
As histórias oferecem uma fórmula mais simples para que as empresas possam compreender a informação que sustentam e explicar cenários de uma maneira coerente. No entanto, os dados também podem transmitir explicações enganosas, através de duas vias.
Por um lado, quando as correlações são entendidas como causas. No que se refere aos hábitos do consumidor, os falsos motivos e as inferências de efeito geram confusão em torno do comportamento do consumidor e acabam por incidir no desenho erróneo de incentivos e promoções.
O resultado? Um investimento em marketing desperdiçado.
O segundo caminho acontece quando o utilizador só tem acesso à informação de maneira limitada, mas externamente a organização afirma estar a oferecer toda a informação necessária para tomar decisões com garantias.
Como utilizadores, geralmente nos esquecemos (consciente ou inconscientemente) da informação limitada com que podemos contar e ignoramos outras possíveis opções.
Existe uma teoria equivocada que afirma que quanto mais dados tenhamos, maior a nossa probabilidade de êxito. Um conjunto muito extenso de dados pode conter apenas informações parciais que não nos permitirá explicar o problema e que nos conduzirá até a uma única teoria, isolando outras possibilidades.
A batalha entre dados mistos e dados puros
Misturar pode ser benéfico nalguns aspetos. Habitualmente esta ação diminui o valor do produto original para obter um resultado mais económico.
Mas quando todo mundo tende a misturar dados e se acaba por ignorar a origem e a fiabilidade das misturas, o resultado costuma incidir numa redução do conhecimento.
Os estadistas que normalmente combinam diferentes ativos de dados para as suas análises sabem que deve ser utilizada uma estrita documentação relativa a todas as fases do processo, que facilite a sua verificação e reprodução conforme vão surgindo novos dados.
Contudo, o preço deste procedimento é elevado! Os utilizadores que pretendam usar ou mesmo analisar os dados terão de conhecer a história completa para os interpretar corretamente.
Em geral, a maioria dos inconvenientes do “self-service data discovery” provém de erro humano. O entusiasmo pela simplicidade é lícito, mas isso costuma conduzir, por um lado, a uma falta de formação palpável na hora de enfrentar os problemas na sua complexidade; e, por outro, até a uma negligência da necessidade de respeitar uma série de processos.
A aproximação ao ”data discovery” baseada na individualidade gera silos analíticos. Para alcançar
uma analítica mais rápida e eficiente, as organizações tem de conseguir que as suas plataformas e ferramentas ultrapassem todos estes obstáculos através de estratégias de “self- service data discovery” governadas e colaborativas.