Analisar cenas de imagens out-door é um dos maiores desafios em Visão Computacional, especialmente cenas de cidades, onde uma grande quantidade de ruído visual geralmente está presente. Entre as aplicações mais requeridas estão a reconstrução virtual de fachadas de prédios, seu volume, detecção de logo marcas, ruas e vias, e geração de informações históricas ou turísticas, além da reconstrução virtual de espaços 3D e até mesmo inferência do espaço interno das construções.
As dificuldades são várias, mas, entre as mais óbvias estão o fato das cenas serem em duas dimensões (não possuem informação de profundidade), oclusão parcial ou total dos objetos, além de resolução e remoção de regiões espúrias (aquelas que geralmente não têm interesse, tais como pessoas, carros e pequenos objetos).
Pesquisadores de Ciência da Computação da Universidade de Carnegie Mellon University acabaram de divulgar um método para inferência da estrutura3D de prédios a partir de cenas 2D.
O sistema, segundo eu entendi na reportagem ScienceDaily, inicia com uma segmentação em blocos da cena. Em seguida, analisa cada região encontrada e substitui uma ou um conjunto de regiões por blocos 3D, levando em consideração consistências como peso e densidade. O resultado se assemelha a uma imitação em bloquinhos aproximada do lugar.
Um avanço pra área! Quando esta técnica estiver aperfeiçoada, será possível inferir até o tamanho do espaço interno das construções, e muitas das aplicações que eu citei acima serão triviais. É esperar pra ver..
[[]]'s
Paulo Sérgio
Inferir estruturas de Cenas 3D é um dos temas mais recorrentes de TCC na FEI. Vira-e-mexe, os alunos estão tentando propor algo parecido, geralmente com Realidade Aumentada. Por esse artigo dos caras, dá pra se ter uma ideia do estado da arte da coisa, bem como, da tranquera que é trabalhar com isso. Só pros f
ResponderExcluirrsrsr... O assunto é interessante. Espero que novos trabalhos apareçam com o tema em questão.
ResponderExcluir