Glossário

Os Text Miners utilizam diversas abordagens para extrair e apresentar informações relevantes. As definições de métodos comuns são:

Classificação


Apresentar os resultados da busca em categorias, em vez de uma massa indiferenciada.


 


Clustering


Agrupar documentos similares com base no seu conteúdo.


 


Extracção


Extrair informação relevante de um documento – por exemplo, extrair todos os nomes da empresa de um conjunto de dados.


 


Procura por palavra-chave


Pesquisar documentos conforme a ocorrência de uma palavra ou conjunto de palavras em especial.


 


Processamento de linguagem natural


Determinar o significado de palavras escritas tendo em conta o seu contexto, gramática, e assim por diante.


 


Taxonomia


Classificar dados de acordo com uma estrutura predefinida, seja padrão da indústria ou personalizada. Algumas ferramentas podem gerar automaticamente uma taxonomia baseada em análise do data store.


 


Visualização


Apresentar graficamente os dados extraídos para que fique mais fácil descobrir e entender as relações.


 


Ferramentas de Texto


As ferramentas de Text Mining são produtos autónomos ou embutidos num sistema de software de maior dimensão.


Fornecedores de bases de dados como IBM e a Oracle estão a incorporar algoritmos de correspondência de modelo aos produtos de bases de dados e de gestão de conteúdos como a SAP e usam taxonomias e classificação de texto para a gestão do ciclo de vida da informação.


Fornecedores de Data Mining como a SAS Institute, SPSS e Science Applications International começam a acrescentar text mining aos seus portfólios, além de terem surgido empresas especializadas em Text Mining como Inxight Software e Stratify.


 




Deixe um comentário

O seu email não será publicado