ÁREA: Visão Computacional
ÁREAS CORRELATAS: INTELIGÊNCIA ARTIFICIAL, RECONHECIMENTO DE PADRÕES DE IMAGENS, DATA MINING, COMPUTAÇÃO GRÁFICA, REDES COMPLEXAS
Título: Análise Automática de Imagens Naturais
Resumo: Segmentação Automática de Imagens é o processo de separar uma cena em suas partes constituintes. A Figura 1 (lado esquerdo) a seguir é um exemplo de uma cena natural, tirada por uma camêra comum, e a Figura 1 (lado direito) é um exemplo de sua segmentação com um algoritmo baseado em Visão Computacional.
Figura 1: (lado esquerdo) exemplo de uma cena natural; (lado direito): exemplo de um processo automático de segmentação.
A segmentação automática de imagens é uma área de pesquisa com várias aplicações praticas. Por ser um processo que geralmente acontece no início dos sistemas de visão, tem um impacto em todas as demais etapas posteriores. Uma falha no módulo de segmentação pode se propagar em "efeito dominó" para muito além das etapas iniciais.
a) Navegação Robótica: esta aplicação visa a instalação de câmeras em robôs autônomos que se locomovem a partir da interpretação de sinais que podem ir além da visão de máquina. Um exemplo conhecido é o robô Spirit, utilizado pela NASA para explorar a superfície do Planeta Marte (Figura 2).
Figura 2
b) Robótica Colaborativa: neste tipo de aplicação, a navegação de robô deve ser,além de autônoma, relacional, considerando um grupo de robôs que devem colaborar e tomar decisões com objetivos comuns (Figura 3) ou metas de grupos, como é o caso de futebol de robôs (Figura 4).
Figura 3: Robótica colaborativa, utilizada em aplicações que requerem intercâmbio entre indivíduos robóticos.
Figura 4: Futebol de Robôs é um exemplo de colaboração para atingir metas de grupos (ou equipes).
c) Recuperação de Informação Visual. Também chamada de Recuperação de Imagem com Base no Conteúdo (RIBC), é uma das aplicações mais antigas, ambiciosas e desafiadoras da área de Visão Computacional, por lidar com a interpretação de cenas naturais. Seu objetivo é amplo, pois vai desde a recuperação de imagens na web (as chamadas Máquinas de Busca) até a classificação de banco de dados de imagens ou vídeos.
Figura 5: Interface de uma Máquina de Busca de Imagens com base no conteúdo visual de informação.
d) Análise de Imagens Médicas. Esta é uma área de maior demanda em Visão Computacional, podendo gerar aplicações para diagnóstico automático (Figura 6) ou reconstrução e visualização de superfícies doentes (Figura 7).
Figura 6: Interface para Análise Automática de Imagens Médicas.
Figura 7: Interface para Reconstrução de Próteses Craniofaciais
e) Análise de Caracteres. Aqui trata-se de uma aplicação que envolve o reconhecimento de placas e escrita humana.
Figura 8: Reconhecimento de Placas
f) Reconhecimento Facial. Este tipo de aplicação visa a detecção de rostos humanos, não somente para o entretenimento e segurança, mas também objetivando encontrar pessoas desaparecidas.
Figura 9: Exemplo de Reconhecimento facial a partir da segmentação de imagens. Inicialmente, são definidas áreas candidatas com um processo de segmentação; depois, as regiões-alvo são classificadas como sendo um rosto.
g) Rastreamento (Tracking) de Pessoas: Trata-se de uma área já estudada há bastante tempo, mas que ainda demanda muito trabalho de pesquisa. A Figura 10 mostra um exemplo de rastreamento de várias pessoas ao mesmo tempo, em ambiente de fundo heretogêneo e aberto. Nesse caso, tanto as regiões a serem rastreadas quanto o ambiente em que se encontram movem-se no tempo, o que aumenta o grau de complexidade da aplicação. Entre as demandas estão: segurança, contagem de pedestres, localização de pessoas e atividades, entre muitas outras.
Figura 10: Tracking de várias pessoas em ambiente aberto.
Prof. Dr. Paulo S. Rodrigues
Grupo de Processamento de Sinais
Centro Universitário da FEI
São Bernardo do Campo, SP
Nenhum comentário:
Postar um comentário