A rápida disseminação do uso da análise de vídeo em sistemas de vigilância deve-se a uma conjunção de fatores tecnológicos e operacionais que favorecem esta tendência já consolidada no mercado de segurança.

Por Alberto Alonso, Solutions engineer Southern Europe na Axis Communications
Em primeiro lugar, numa resposta dupla às necessidades do mercado, as câmaras melhoraram a resolução e qualidade das imagens que fornecem e, simultaneamente, registam uma redução de preços, o que agora permite que os sistemas sejam concebidos com muito mais dispositivos, aumentando a eficiência e controlando os custos.
Em segundo lugar, o mercado hoje oferece a possibilidade de executar algoritmos complexos com dispositivos de hardware de tamanho e preço muito reduzidos. Isto favorece o terceiro factor, a evolução e disponibilidade de algoritmos avançados de análise de vídeo baseados em Inteligência Artificial (IA).
Da mesma forma, temos de considerar como fatores impulsionadores para a utilização de análises aqueles que derivam de necessidades operacionais e de negócio. Num contexto onde o número de câmaras aumentou exponencialmente, as gravações de vídeo geram enormes arquivos de imagens, os recursos humanos são escassos e dispendiosos, e como tal a automatização do processo é crucial para a otimização da segurança e das operações comerciais. Além disso, há uma voracidade crescente de dados de todos os tipos para ajudar a melhorar as aplicações de business intelligence e as iniciativas de cidades inteligentes (smart cities).
O resultado é, como vivemos diariamente, um enorme aumento no interesse, oferta e promoção de uma infinidade de análises de vídeo baseadas em IA.
Agora, estamos certamente no limiar de outra geração de sistemas de vídeo, onde a análise começa a ser o elemento substancial e o hardware apenas a infra-estrutura necessária para a sua utilização. Para onde leva esta nova abordagem aos sistemas de vídeo?
A análise baseada na IA centra-se basicamente em dois pilares: a utilização de redes neurais e a formação específica e contínua de modelos. O primeiro é bastante universal, disponível para quase todos os grandes e pequenos intervenientes no sector. A segunda é mais seletiva, pois requer um grande poder de processamento e, sobretudo, uma enorme quantidade de dados (imagens) para conseguir algoritmos precisos e eficientes. Isto está cada vez mais nas mãos dos grandes atores da área tecnológica e não seria insensato pensar que no futuro serão estes a fornecer as melhores análises, começando, sem dúvida, pelas de uso empresarial, mas chegando também ao campo da segurança.
A lei de Moore diz-nos que se produzirá processadores cada vez mais poderosos que são cada vez mais reduzidos em tamanho, custo e consumo de energia. Isto significa que a maioria dos dispositivos será capaz de executar estes eficientes algoritmos de Inteligência Artificial.
Se os algoritmos forem facilmente acessíveis, a sua eficiência será muito semelhante entre si, e os dispositivos de recolha e gestão serão todos capazes de os executar, onde estarão as diferenças nos sistemas evoluídos no futuro?
Antes de mais, é necessário não esquecer que nenhuma análise de vídeo pode oferecer bons resultados se o vídeo a ser analisado não tiver a qualidade necessária. Portanto, a premissa de oferecer uma qualidade de imagem ótima em quaisquer condições de iluminação é de vital importância e pode definitivamente condicionar qualquer tentativa de utilização de analíticas, mesmo que se baseiam em técnicas de IA.
Agora estamos fascinados com as capacidades de deteção e classificação destes algoritmos, e não prestamos muita atenção às exigências que irão surgir da sua utilização massiva. Alguns deles já surgiram, tais como a integração. Assim que a analítica tenha feito o seu trabalho e detetado o que queríamos encontrar e classificado o que consideramos interessante de categorizar, como tornamos esta informação utilizável pelos nossos sistemas e subsistemas de segurança, controlo e otimização de negócio e processo? É certamente aqui que entram em jogo standards e interfaces abertas.
Das três possibilidades de alojamento das nossas analíticas – na câmara, num servidor local ou na nuvem – nenhuma delas é perfeita para todos os casos de utilização. De facto, é muito provável que encontremos soluções que tirem partido das virtudes das três opções, para as quais será essencial ter plataformas universais de desenvolvimento que permitam a execução tanto na nuvem, nos sistemas operativos dos servidores, como no interior dos dispositivos de segurança (câmaras).
Não há nada como a utilização diária de sistemas para experimentar a necessidade de ferramentas de manutenção. E a manutenção destas soluções de IA envolve várias tarefas. A primeira é a formação contínua. O fornecedor irá apresentar versões renovadas que teremos de atualizar no equipamento. Vamos precisar destas ferramentas para permitir a distribuição das aplicações e a referida atualização de forma ágil e segura, mas também a monitorização da operação, ou seja, a informação de que estas aplicações estão a funcionar corretamente e, se não estiverem, para a corrigir.
Embora a primeira utilização da análise de vídeo na segurança tenha sido para detetar incidentes e situações de risco, cedo apercebemo-nos que o seu maior impacto nos sistemas de vigilância por vídeo é facilitar a procura de provas e incidentes. Cada vez mais, os sistemas estão a ser utilizados como registo de eventos, para posterior investigação e análise forense. Nessa tarefa, ter a capacidade de filtrar pesquisas com base em atributos (tipo, cor, direção, etc.) previamente etiquetados através da analítica muda substancialmente a forma como utilizamos os nossos sistemas de vídeo de segurança. Esta nova tecnologia leva-nos inexoravelmente à gravação massiva e contínua de tudo o que acontece para análise posterior, se necessário, pois estas novas ferramentas permitem-nos aceder a qualquer incidente em poucos minutos ou segundos, por muito volumoso que seja o nosso vídeo gravado.
Por último, não podemos esquecer que muitas destas analíticas se destinam a fornecer dados. Para facilitar as pesquisas ou para alimentar estatísticas e análises. Os chamados metadados, ou seja, a contribuição para o conceito de “Big Data”. O retorno do investimento terá muito a ver com a utilização “inteligente” destes dados para oferecer melhorias nas operações ou análises. Por conseguinte, vale a pena pensar muito sobre a forma como os dados serão utilizados e os processos que devem acompanhar a implementação deste tipo de solução.
São estes fatores que acredito que farão a diferença na exploração de novos sistemas de vídeo utilizando a analítica baseada em Inteligência Artificial. Qualquer um compreende que estas diferenças se traduzem rapidamente em custos e competitividade. Façamos portanto o exercício de escrutínio para além do brilho e dos sinos e apitos dos algoritmos que resolvem processos mais ou menos complexos. Não esqueçamos que a Inteligência Artificial irá requerer ainda mais Inteligência Humana (AI+IH).