sexta-feira, 9 de novembro de 2012

AS INTERFACES DE BUSCA NA WEB: O PRESENTE, O PASSADO ... E O FUTURO?





Desde tempos imemoriais, o homem civilizado tenta organizar sua cultura e informações acumuladas ao longo de séculos. Bem antes da invenção da imprensa já havia a preocupação de armazenamento e recuperação rápida do conhecimento produzido em sociedades que começavam a se formar. Antes, a produção e o controle de todo o intelecto humano era privilégio apenas de poucos monges, sacerdotes, reis e aristocratas, indo desde a concepção das ideias, passando pela escrita, pelo armazenamento e até a recuperação daquilo que se produzia. Não demorou muito para alguém relacionar o desenvolvimento das sociedades e a riqueza das nações, não somente ao legado deixado em forma de textos, mas também à capacidade de guardá-lo e buscá-lo rapidamente. Os benefícios do conhecimento passado pelo que se produz em forma de linguagem impressa supera em muito aquele produzido de pais para filhos na forma da linguagem falada, transmitida culturalmente, e é uma das principais razões do desenvolvimento da civilização, tal como a conhecemos hoje.

Desde a sociedade como embrião, o ser humano parece ter uma necessidade instintiva de guardar suas ideias, talvez mesmo com o intuito de transmiti-las a outros indivíduos presentes, ou para futuras gerações, ou talvez com o desejo de compreender-se melhor. Ao armazenar a informação dominada, o homem prova um de seus instintos mais primitivos, sendo como um cão que guarda seu alimento para garantir uma melhor sobrevivência futura. Mais do que guardá-las, parece desejar organizá-las e recuperá-las sempre da maneira eficiente, no menor espaço e tendo acesso o mais rapidamente possível.

Essa relação íntima com a informação, não somente de textos escritos, mas também de pinturas, partituras musicais, e projetos de engenharia, estimulou monarcas visionários à construção de bibliotecas, universidades e escolas para ensinar seus súditos, além de financiarem talentos como poetas, escritores e músicos, impulsionando o desenvolvimento, a organização e o fortalecimento da cultura e do reino. Foram as nações que mais atentaram para o controle da informação escrita que primeiro prosperaram e nos legaram o mundo moderno como o vemos hoje.

O tipo de informação pode se modernizar, passando desde os desenhos rupestres nas paredes de cavernas feitos pelos Neardentais, os papiros do Egito antigo, a imprensa de Gutenberg e, finalmente, à informação digital dos dias de hoje; mas o que sempre será o mesmo é a vontade incontrolável do homem de produzir conhecimento que possa ser armazenado, recuperado e compreendido por seus pares, pelo máximo de gerações futuras possíveis. E o poder de alcance desse conhecimento deixado, depende não somente da importância que virá a ter para a maioria dos indivíduos, mas também de como ele foi guardado, e como pode ser facilmente encontrado, transmitido e usado por quem o acessa e o compreende.

A era digital inaugurou apenas mais um capítulo da nossa história íntima entre a produção do conhecimento humano com o legado das nações a seus indivíduos, dando oportunidades jamais imaginadas a pessoas comuns, anônimas em sua maioria, de darem vazão àquilo que todos os serem humanos, desde a concepção, parece trazer, mesmo sem nunca darem-se conta disto, escritos em seu DNA: a vontade de produzir informações, armazená-las em algum meio externo para que consiga se comunicar com seus pares pelo máximo de tempo possível após a sua morte. Não importa se a informação a ser produzida e manipulada é de cunho familiar, cultural, governamental, científica ou artística, todas as sociedades, modernas ou não, trazem consigo o desejo simples de se expressar.

A era digital que vivemos hoje é então nada mais do que consequência do conhecimento acumulado e transmitido por gerações passadas. Esses novos tempos possuem várias fases, uma consequência da outra. A primeira foi a própria invenção do computador, concebido inicialmente para agilizar cálculos científicos e de engenharia. A velocidade com que transmitia dados internamente através de circuitos logo foi aproveitada para transmitir pacotes externamente entre máquinas. Assim, em 1969, dois computadores na Universidade da Califórnia começaram a comutar pacotes, nascia assim a segunda fase da era digital: a internet.

O crescimento surpreendente da internet em níveis mundiais trouxe a necessidade de interfaces mais amigáveis para conectar usuários menos familiarizados com a rede. Então, em 6 de agosto de 1991, Tim Berner-Lee postou um resumo do uso de ferramentas para usar um sistema de navegação na internet, que ele mesmo havia escrito, e deixou armazenado num computador NeXTcube, usado por ele no CERN-Organização Europeia para Investigação Nuclear (Suíça). Esse fato marcou o nascimento do primeiro servidor da World Wide Web, e o mundo testemunhou a inauguração da terceira fase da era digital: a plena democratização da informação produzida pela humanidade, a WWW.

De repente, a WWW conectou o mundo inteiro, encurtou fronteiras, aproximou culturas, criou novos mundos sem donos e sem governos, universos sem regras e sem censuras, espaços livres onde seres humanos, não importando a distância geográfica, se encontram e trocam informações. Parece que o mundo utópico e compartilhado por todos, idealizado por John Lennon na canção imagine, tomou forma, se concretizou e agora tem nome: internet. Ainda pode-se dizer que esse mundo é ainda muito virtual, que ainda não há o “contato físico” no sentido strictu da frase, tão necessário à essência dos conceitos das palavras humano e sociedade. Mas será que aqueles que compartilham esse mundo de pacotes digitais, que nasceram com seu nascimento, aceitarão o nosso mundo físico atual do jeito que ele é, tão arraigado de todo tipo de preconceito, censura e regras incompreensíveis, quando em suas mãos tiverem o poder de modificá-lo, deixando-o mais parecido ao seu mundo virtual e livre de hoje? Quando isso ocorrer, o contato físico estará então presente em sua plenitude, materializando o melhor dos dois mundos: o virtual e o real.

Na mesma década do nascimento da WWW, nasceu também quem hoje está provocando o nascimento da quarta fase da era digital: A geração da conectividade, que leva a internet para casa, trabalho, ruas, salas de aula, e está gostando cada vez mais de produzir, armazenar, divulgar e compartilhar conhecimento. No entanto, podemos dizer que essa geração está apenas exercitando o que, como falei antes, está escrito em seu DNA: a vontade de se expressar. Vale dizer que o crescimento incomensurável do número de blogueiros gravitando na blogosfera, produzindo informação, lendo, querendo ser lido e divulgado seus pares, é um fenômeno inesperado. Atualmente, é grande o número de empresas criadas visando somente esse tipo de ambiente. Um movimento tão forte que forçou o aparecimento de nomes específicos para a geração de jovens que estão altamente conectados, a chamada geração Z.

Com o advento da era da informática, seguida da internet e logo depois da WWW e agora a era da plena conectividade, o potencial de conhecimento humano, tanto produzido quanto acumulado cresce exponencialmente minuto a minuto. As informações hoje não se resumem somente a textos, mas incluem também dados multimídia. A todo momento temos à nossa disposição um tsunami de novos textos, imagens, sons e vídeos, produzidos por pessoas comuns. Um conhecimento tão importante quanto os dados governamentais e de todas as áreas, tais como produzidos por médicos, engenheiros, advogados, filósofos, ou tantas quantas forem as profissões que surgem a cada momento.

A quantidade de informação presente na Web passou a ter uma importância fundamental, obrigando governos a debaterem e criarem, ou pelo menos tentarem criar, leis específicas para esse meio. Interessante notar é que a Web é um ambiente tão imprevisto quanto necessário hoje em dia. Uma demanda que nem o mais visionário estudioso das tendências humanas poderia prever. Uma necessidade que, ao mesmo tempo é vital para qualquer sociedade moderna, nunca foi encontrada em nenhuma lista de demanda em tempos mesmo que recentes.

Na esteira da necessidade de organização e recuperação das informações produzidas a cada dia, foi em meados dos anos 90 que se popularizaram as chamas Máquinas de Buscas, ou sites especializados na Recuperação das Informações postadas na rede. O próprio termo Máquina de Busca foi cunhado para representar os sites cujo objetivo era produzir a informação que alguém deseja, simplesmente escrevendo uma ou mais palavras relacionadas com um assunto, os chamados “Termos de Busca”.

O Yahoo foi a Máquina de Busca mais popular nos anos 90. A filosofia por de trás do seu mecanismo era, inicialmente, guardar cada página na rede como um conjunto das palavras que mais apareciam no texto. Assim, uma página/site era quebrada em suas unidades individuais, as palavras, e cada palavra era armazenada ao lado do número de vezes que ela era citada na página/site. Assim, se a palavra escola era a que mais aparecia em uma página web, assumia-se que essa página/site falava de assuntos relacionados à escola. Quando um usuário desejava então recuperar páginas tratando desse assunto, conseguia recuperar a página armazenada; mas, quando desejava recuperar páginas de assuntos relacionados, tais como livros, professores ou estudos, poderia ficar frustrado com o resultado, caso as palavras usadas na busca não tivessem sido justamente aquelas guardadas pela Máquina de Busca.

Esse processo de armazenamento é chamado pelos Cientistas da Computação de indexação baseada em frequência de palavras, e cada página armazenada é chamada de Documento. Um documento que interessa a quem faz a busca é chamado de Documento Relevante. Hoje em dia, o conceito de documento se expandiu para qualquer tipo de informação multimídia que se queira buscar. Assim, um arquivo de música mp3, por exemplo, é um documento, e, quando você requisita uma música e a Máquina de Busca fornece a você exatamente as músicas que deseja, diz-se que os documentos recuperados foram relevantes. Quanto mais documentos relevantes a Máquina traz o mais rapidamente possível, mais eficiente ela é, e consequentemente mais popular se torna.

No final da década de 90, uma empresa na Califórnia percebeu as dificuldades que os usuários tinham para encontrar documentos relevantes, ficando muitas vezes frustrados com os resultados. Uma das razões para essas frustrações estava na complexidade das Interfaces de Buscas, muitas vezes complicadas e com informações excessivas e irrelevantes, o que dificultava a comunicação homem-computador. Essa empresa, batizada de Google, teve a ideia de fazer uma interface de busca rápida e simples, onde aparece apenas uma caixa de texto, onde o usuário mais leigo poderia digitar o termo de busca sem se preocupar com mais nada. O resultado foi a migração em massa de usuários da Web para o Google, que hoje domina o mercado de Recuperação de Informação na internet.

Mas a interface com o usuário ainda é o gargalo das Máquinas de Busca mais modernas. Mesmo com o desenvolvimento de interfaces consideradas inteligentes, que tentam até “adivinhar” as necessidades dos usuários, é incrível que ainda é pequeno, em relação à população mundial, o número de pessoas que conseguem lidar com as interfaces do Google e que ficam plenamente satisfeitas com suas buscas. Pense em quantas vezes você digitou uma palavra no Google e o gigante da internet no mundo de hoje não conseguiu deixá-lo satisfeito em relação ao que você esperava que viesse como resposta. Com certeza não foram poucas as vezes, mesmo para usuários experientes. Infelizmente, o número de documentos relevantes ainda é uma quantidade proporcional às habilidades de se lidar com a máquina. Em outras palavras, ainda falta muito para que uma Máquina de Busca consiga realmente “entender” as necessidades de seus milhões de usuários cada vez mais exigentes e menos pacientes no mundo todo.

Uma das razões que fazem com que as Máquinas respondam com documentos não-relevantes é que, por de trás da interação homem-máquina, o mecanismo de busca é, na verdade, relativamente simples comparado com a complexidade do problema, e não leva em conta estruturas linguísticas importantes da linguagem humana. Por exemplo, ao digitar um termo de busca como a palavra América, o que a Máquina tem que devolver depende do contexto em que essa palavra ocorre. No contexto geográfico, por exemplo, um documento retornado poderia ser O Mapa da América, mas no contexto futebolístico, poderia ser O Time do América. Então, um resultado plenamente satisfatório depende do contexto e, atualmente, o usuário deve fornecer também o contexto correto, caso contrário, poderá ficar frustrado com o resultado.

Informações linguísticas são a chave para o sucesso das Máquinas de Busca futuras, e estão relacionadas às informações semânticas de nossa linguagem. O significado semântico de uma palavra, dependendo do contexto em que ela aparece, pode mudar radicalmente, e a Máquina ainda é incapaz atualmente de lidar plenamente com informações semânticas.

Quando se fala em semântica, uma palavra exaustivamente repetida na nossa infância por nossas professoras de língua portuguesa, podemos relacionar com significado, compreensão, eloquência, transmissão de ideias, o que o texto quer transmitir como verdadeira informação. É algo puramente subjetivo, que tem a ver com as experiências de cada um. Dois indivíduos diferentes podem ter compreensões semânticas de um texto ou palavra completamente diferentes e corretos, dependendo do contexto que cada indivíduo enxerga a palavra ou frase. Então, a compreensão da informação escrita (ou semântica de um texto) vai muito além das palavras que ali estão contidas, e depende também de muitas outras informações, possivelmente imagens, sons, cheiros, e muitos outros sentidos humanos relacionados às palavras que os descrevem e usados finalmente para a compreensão. Então, uma Máquina de Busca conseguirá trazer um documento relevante para seu usuário caso considere o contexto correto da informação passada do usuário para máquina. A máquina deve conseguir manipular as diversas informações contextuias, muitas delas ainda incipientes em forma de pesquisas científicas, como reconhecimento de imagens. Estas, particularmente, quase sempre profundamente relacionadas a textos.

Mas guardar informações contextuais não é uma questão somente de entender esse processo cognitivo humano, mas também é uma questão de espaço físico de mídia e criação de um complicado modelo matemático de maneira que consigamos prever e simular as reações na máquina. Um campo de pesquisa atual que tenta desenvolver esses modelos é o chamado Teoria das Redes Complexas, que propõe o estudo de grandes sistemas através da representação do inter-relacionamento entre os elementos fundamentais desses sistemas. Por exemplo, a WWW é uma Rede Complexa, onde os sites são os elementos fundamentais e os sites para onde eles apontam, os chamados links, indicam relacionamentos. Na linguagem científica, um elemento fundamental é chamado de nó e um relacionamento é chamado de aresta. Assim, na WWW, uma página ou site é um nó e os links são as suas arestas, formando uma rede complexa gigantesca, difícil de armazenar em um só computador e consequentemente difícil de estudar. Mesmo assim, várias teorias são propostas e a cada dia é maior o número de Cientistas da Computação que acreditam que as informações contextuais representadas, não só por páginas de textos, mas também por qualquer tipo de mídia, podem ser representadas e estudadas como um conjunto de nós e arestas em uma grande Rede Complexa. Entender esse relacionamento é a base para a construção de máquinas que realmente saibam lidar com contextos.

Um tipo de informação importante nesse tipo de estudo são os chamados clusters, que são conjuntos de nós com características similares entre si, tais como as redes sociais. Estudar como os clusters se formam e se inter-relacionam é um dos maiores desafios das pesquisas em Redes Complexas. Um tipo de estudo que consome recursos de tempo, espaço em disco, memória computacional, processamento e muitas, muitas aspirinas para os pesquisadores.

O futuro então do gerenciamento das informações humanas depende do controle pleno de todas as características que envolvem a semântica de um documento, seja ele uma simples página web de textos, sons, imagens ou vídeos. Para manipular toda essa informação, é fácil ver que não pode ser somente através de teclado e mouse; devem ser envolvidas também informações multimídia e dispositivos avançados para uma maior interação homem-máquina. Um ambiente onde possamos não somente mergulhar para ler, escrever, ouvir e ver imagens e vídeos, mas também sentir o toque em objetos e, melhor seria, o toque entre as pessoas envolvidas, através de dispositivos que atualmente são chamados de sistemas hapticos, os quais permitem a sensação de interação física com o ambiente. Tais sistemas, ainda em fase embrionária de desenvolvimento, anunciam talvez uma quinta fase da era digital: a fase dos sistemas hapticos.

Hoje, ao abrirmos um site de relacionamentos, somos os homens de Neardental de nosso tempo “tentando” nos comunicar com nossos pares e deixando legados primitivos para as gerações futuras. Nossas cavernas são os sites, as paredes onde postamos informações são as páginas da Web, e a ferramenta de expressão se chama computador.

domingo, 17 de junho de 2012

Projetos de TCC 2012-II



Pezados, faz tempo que eu não posto nada aqui. É que eu não tinha nenhuma "grande" novidade pra apresentar a vocês. Hoje vale a pena mostrar como ficaram os três trabalhos de TCC que eu orientei esse semestre. Ficaram Show!! Assim, estou postando os três vídeos de divulgação. Todos eles serão apresentados pelos alunos AO VIVO na próxima quinta-feira, dia 21/06/2012, durante a XX EXPOCOM no Ginásio de Esportes da FEI, de 19:00 às 22:00 hs. Lá, vocês terão a oportunidade de conhecer meus alunos e perguntar diretamente a eles como fizeram o projeto. Tem também um Coquetel na faixa e podem levar familiares. Vale a pena conferir. A seguir, mostro os videos de cada trabalho:


1) Reconhecimento de Gestos. Esse trrabalho tem o mérito de se basear em um teoria inédita: Linguagens Regulares para reconhecimento de movimentos, proposto pelo meu aluno de Doutorado do ITA (e amigo e colega de trabalho) Monael. Foi a primeira vez que vi uma Tese de Doutorado, antes mesmo de ser defendida, dar origem a uma aplicação. Me deixou muito orgulhoso.



2) Reconhecimento de Logo Marcas: Esse aqui faz o reconhecimento de logo marcas em jogos de futebol. O resultado foi melhor do que o esperado. Os alunos fizeram em tempo recorde. Há mais de um mês da apresentação estava pronto. 




3) Realidade Diminuida: Por fim, este projeto apresenta um novo conceito: Realidade Diminuida. Ao contrário da Realidade Aumentada, que inclui elementos na cena, aqui os alunos mostram que conseguem eliminar conteudo. Também, o Johonnie, que fez o video, mostrou que sabe apresentar seu trabalho: ótima musica, excelentes exemplos.



Tenho muito orgulho de ter orientado esses três projetos, os alunos são excelentes. Espero vê-los todos na XX EXPOCOM

Paulo Sérgio



sábado, 31 de março de 2012

domingo, 25 de março de 2012



Caros, como prometido, ai vão os tópicos para a P1


1) Tranformações Gráficas (Translação, Rotação, Escala); Provas de Teoremas sobre Transformações, Transformadas Homogêneas

2) Sistemas de Referências

3) Curvas e Superfícies: Hermite, Bezier, Splines, Curvas Racionais, Caracteírsticas, utilidades, vantagens, desvantagens, Algoritmo de Casteljau, Descontinuidades, Convexidade, Não-Convexidade, Curvas n-dimensionais, Utilidades de Curvas e Superfícies Racionais, NURBS.

4) Cores, Sistemas de Cores RGB e HSV, aplicabilidades, limitações, vantagens, Histogramas de intensidades, Distribuição de Cores, Cálculo de Índices de entradas;

6) Câmeras, Calibração em um Sistema ideal, Calibração em um Sistema Real, Três maneiras de encontrar o valor da coordenada Z, Matrizes de projeção Perspectiva, aplicabilidade, Ambiguidade Colinear, Estereoscopia, como calcular a coordenada Z. 



abraços,
Paulo Sérgio