esta semana terminamos os testes para o Mouse 3D. Encomendei 30 para as aulas de Lab de CG. Isso significa que cada aluno vai ter um. As aulas serão quinta e sexta. Os créditos são do Guilherme, o mestrando da FEI que eu oriento na área de Redes Complexas. Ele fez toda a programação e colocou o mouse pra funcionar. Vocês nem imaginam o trampo que deu.
Àqueles que estiverem interessados em aplicações como essas e não estão fazendo laboratório, falem comigo.
Isso significa um grande "improvement" nas aulas de CG. Terminamos umas aplicações-exemplo que os alunos farão em sala. Por enquanto, só pode ser feito em C#. Mas estamos tentando compilar pra C++.
O Mouse é da Cadritech, e o video de demonstraçào é esse aí:
Serão duas aulas com Mouse 3D, e serão dadas pelo Guilherme.
Tudo isso faz parte do meu esforço para que os alunos da FEI tenham realmente um curso de CG que valha a pena e possam aproveitar nas suas vidas profissionais. A cada semestre o curso fica melhor. No futuro, espero contar com Monitores e óculos 3D, sistemas hapticos, headmounted, e muito mais. Como diz o Plínio, vai ficar "Show de Bola".
Espero que gostem e possam aproveitar não somente para passar na disciplina, mas para projetos de IC, TCC e projetos Institucionais.
Analisar cenas de imagens out-door é um dos maiores desafios em Visão Computacional, especialmente cenas de cidades, onde uma grande quantidade de ruído visual geralmente está presente. Entre as aplicações mais requeridas estão a reconstrução virtual de fachadas de prédios, seu volume, detecção de logo marcas, ruas e vias, e geração de informações históricas ou turísticas, além da reconstrução virtual de espaços 3D e até mesmo inferência do espaço interno das construções.
As dificuldades são várias, mas, entre as mais óbvias estão o fato das cenas serem em duas dimensões (não possuem informação de profundidade), oclusão parcial ou total dos objetos, além de resolução e remoção de regiões espúrias (aquelas que geralmente não têm interesse, tais como pessoas, carros e pequenos objetos).
Pesquisadores de Ciência da Computação da Universidade de Carnegie Mellon University acabaram de divulgar um método para inferência da estrutura3D de prédios a partir de cenas 2D.
O sistema, segundo eu entendi na reportagem ScienceDaily, inicia com uma segmentação em blocos da cena. Em seguida, analisa cada região encontrada e substitui uma ou um conjunto de regiões por blocos 3D, levando em consideração consistências como peso e densidade. O resultado se assemelha a uma imitação em bloquinhos aproximada do lugar.
Um avanço pra área! Quando esta técnica estiver aperfeiçoada, será possível inferir até o tamanho do espaço interno das construções, e muitas das aplicações que eu citei acima serão triviais. É esperar pra ver..
Uma das maiores guerras da ciência parece estar perto do fim de mais uma batalha: a guerra contra o Mal de Alzheimer, o triste fim de pessoas que têm afetadas áreas cerebrais importantes relacionadas à memória. Nesta quarta-feira, o site TechnologyReview anunciou uma pesquisa pioneira que envolve Imageamento Médico e Análise Clínica do sangue para desenvolver o diagnóstico precoce quase 10 ou 20 anos antes do paciente apresentar os sintomas mais devastadores da doença. O Dr. Randall Bateman, um neurologista da Washington University School of Medicina e colaboradores observaram mutações genéticas específicas associadas a um aumento da proteína amyloid beta no sangue, bem como um aumento do CSF (cerebral spinal fluid) no cérebro de pacientes jovens cujos parentes mais velhos desenvolveram a doença. A descoberta abre caminho não somente para prevenir a doença em quem ainda vai ser acometido por ela, mas também para aqueles que já começaram a desenvolver os sintomas mais conhecidos. Mais detalhes podem ser encontrados no site: http://www.technologyreview.com/biomedicine/38089/page1/
A área de Imageamento Médico é uma das mais desafiadoras da Ciência da Computação, tendo recebido grande entusiasmo nos últimos anos. Trata-se de criar modelos matemáticos e computacionais para desenvolver algoritmos capazes de realizar análise automática de imagens de ultra-som, ressonância magnética e tomografia computadorizada, principalmente. Na FEI, além de mim, ainda contamos com a ajuda dos professores Carlos Thomaz e Paulo Eduardo Santos, no desenvolvimento de pesquisas nessa área. Todos ligados ao Mestrado em Inteligência Artificial aqui da FEI. Detalhes sobre os nossos trabalhos podem ser encontrados nas páginas da pós-graduação da FEI: Mestrado em IA na FEI
Imagine um dia você disse a sua noiva ou noivo que estava em uma festa com os amigos e afirma que pode provar, que as fotos e os vídeos estão no facebook. De repente, você acessa o material e reconhece o lugar e o momento, mas não se encontra de jeito nenhum no conteúdo. Está ferrado! Apagaram você!!
Devido as maldades que sua sogra ou rival agora podem fazer com você, acho melhor tomar cuidado porque isso já é possível de ser feito hoje em vídeos caseiros .. e com muita agilidade. Trata-se do conceito de “Realidade Diminuída”, ou RD. O melhor aplicativo que eu conheço no mundo é de uma empresa alemã, cujo vídeo pode ser visto abaixo:
Apesar das cenas impressionantes mostradas no vídeo, ainda estou um pouco cético com as limitações do programa. Imagino que eles devam ter mostrado os melhores resultados. Também, não podemos ter certeza se tudo foi feito em tempo real. Mesmo assim, estão de parabéns.
Mais tecnicamente falando, como eu imagino que isso ocorre de uma forma geral:
1)inicialmente são aplicados filtros passa-baixa (que removem detalhes da cena) de maneira que a imagem fique parecendo um borrão;
2)em seguida, o objeto de interesse (aquele que queremos remover), que foi demarcado manualmente, pode ser removido dentro da área demarcada;
3)Em seguida, técnicas de reposição de textura reconstroem a área e o lugar, agora sem o objeto que foi apagado;
4)O processo é repetido para os demais frames.
Todos esse passos podem ser feitos com OpenCV, uma biblioteca freeware da Intel, em C++, para aplicações em Visão Computacional.
No entanto, o que a empresa mostrou foi apenas uma maneira de apagar objetos-alvos das cenas; portanto não se trata de RD, estritamente falando. Isso porque o objeto-alvo foi apenas removido e não reconstruído e modificado. Para ser RD, o objeto-alvo deve ser reconhecido e reconstruído de outra forma. Inicialmente, após a detecção e remoção (passos 1 a 3 acima), o passo 4 deve criar um modelo sintético (com OpenGL, por exemplo) do objeto reconhecido, e reposicionar o modelo sintético sobre o local onde anteriormente se encontrava o objeto-alvo (cena original). O resultado final é a imagem do objeto-alvo se alterando, deformando, aumentado ou diminuindo, como se fosse 3D ou editado previamente. Isso sim é RD, mas eu gostaria mais de chamar Realidade Distorcida.
Uma equipe de Projeto de formatura aqui da FEI, do sétimo ciclo de Ciência da Computação, está iniciando um projeto de RD urbana (RDU) comigo, para manipular em tempo real logo-marcas ou objetos em cenas out-door. Estou animado com o projeto e acho que estou iniciando mais um daqueles TCCs na FEI que vou gostar de orientar. Boa sorte a eles!!!
Caros, meu último artigo acabou de ser publicado na revista Patterns Analysis and Applications, pela Springer. Trata-se de um artigo sobre segmentação de imagens médicas, mas eu incluo, por questões de comparação, uma análise sobre o K-means, o que o torna interessante para quem quer mexer com clusterização de dados e às vezes não entende o porquê o k-means não funciona muito bem.O artigo já pode ser visto no link: http://www.springerlink.com/content/m8608l43171467k0/
Por questões de contrato e direitos autorais da Srpinger, eu não posso disponibilizá-lo para download, por isso estou disponibilizando aqui somente as duas primeiras páginas.Mas, os amigos que estiverem interessados em utilizar as ideias, sem fins comerciais, me mandem um email que eu passo uma cópia completa.Será um prazer.