Desde tempos imemoriais, o homem civilizado tenta organizar sua
cultura e informações acumuladas ao longo de séculos. Bem antes da invenção da
imprensa já havia a preocupação de armazenamento e recuperação rápida do
conhecimento produzido em sociedades que começavam a se formar. Antes, a
produção e o controle de todo o intelecto humano era privilégio apenas de
poucos monges, sacerdotes, reis e aristocratas, indo desde a concepção das ideias,
passando pela escrita, pelo armazenamento e até a recuperação daquilo que se
produzia. Não demorou muito para alguém relacionar o desenvolvimento das
sociedades e a riqueza das nações, não somente ao legado deixado em forma de
textos, mas também à capacidade de guardá-lo e buscá-lo rapidamente. Os
benefícios do conhecimento passado pelo que se produz em forma de linguagem
impressa supera em muito aquele produzido de pais para filhos na forma da
linguagem falada, transmitida culturalmente, e é uma das principais razões do
desenvolvimento da civilização, tal como a conhecemos hoje.
Desde a sociedade como embrião, o ser humano parece ter uma
necessidade instintiva de guardar suas ideias, talvez mesmo com o intuito de
transmiti-las a outros indivíduos presentes, ou para futuras gerações, ou
talvez com o desejo de compreender-se melhor. Ao armazenar a informação
dominada, o homem prova um de seus instintos mais primitivos, sendo como um cão
que guarda seu alimento para garantir uma melhor sobrevivência futura. Mais do
que guardá-las, parece desejar organizá-las e recuperá-las sempre da maneira
eficiente, no menor espaço e tendo acesso o mais rapidamente possível.
Essa relação íntima com a informação, não somente de textos
escritos, mas também de pinturas, partituras musicais, e projetos de
engenharia, estimulou monarcas visionários à construção de bibliotecas,
universidades e escolas para ensinar seus súditos, além de financiarem talentos
como poetas, escritores e músicos, impulsionando o desenvolvimento, a organização
e o fortalecimento da cultura e do reino. Foram as nações que mais atentaram
para o controle da informação escrita que primeiro prosperaram e nos legaram o
mundo moderno como o vemos hoje.
O tipo de informação pode se modernizar, passando desde os desenhos
rupestres nas paredes de cavernas feitos pelos Neardentais, os papiros do Egito
antigo, a imprensa de Gutenberg e, finalmente, à informação digital dos dias de
hoje; mas o que sempre será o mesmo é a vontade incontrolável do homem de
produzir conhecimento que possa ser armazenado, recuperado e compreendido por
seus pares, pelo máximo de gerações futuras possíveis. E o poder de alcance
desse conhecimento deixado, depende não somente da importância que virá a ter
para a maioria dos indivíduos, mas também de como ele foi guardado, e como pode
ser facilmente encontrado, transmitido e usado por quem o acessa e o
compreende.
A era digital inaugurou apenas mais um capítulo da nossa história
íntima entre a produção do conhecimento humano com o legado das nações a seus
indivíduos, dando oportunidades jamais imaginadas a pessoas comuns, anônimas em
sua maioria, de darem vazão àquilo que todos os serem humanos, desde a
concepção, parece trazer, mesmo sem nunca darem-se conta disto, escritos em seu
DNA: a vontade de produzir informações, armazená-las em algum meio externo para
que consiga se comunicar com seus pares pelo máximo de tempo possível após a
sua morte. Não importa se a informação a ser produzida e manipulada é de cunho
familiar, cultural, governamental, científica ou artística, todas as
sociedades, modernas ou não, trazem consigo o desejo simples de se expressar.
A era digital que vivemos hoje é então nada mais do que
consequência do conhecimento acumulado e transmitido por gerações passadas.
Esses novos tempos possuem várias fases, uma consequência da outra. A primeira
foi a própria invenção do computador, concebido inicialmente para agilizar
cálculos científicos e de engenharia. A velocidade com que transmitia dados
internamente através de circuitos logo foi aproveitada para transmitir pacotes
externamente entre máquinas. Assim, em 1969, dois computadores na Universidade
da Califórnia começaram a comutar pacotes, nascia assim a segunda fase da era
digital: a internet.
O crescimento surpreendente da internet em níveis mundiais trouxe
a necessidade de interfaces mais amigáveis para conectar usuários menos
familiarizados com a rede. Então, em 6 de agosto de 1991, Tim Berner-Lee postou
um resumo do uso de ferramentas para usar um sistema de navegação na internet,
que ele mesmo havia escrito, e deixou armazenado num computador NeXTcube, usado
por ele no CERN-Organização Europeia para Investigação Nuclear (Suíça). Esse
fato marcou o nascimento do primeiro servidor da World Wide Web, e o mundo
testemunhou a inauguração da terceira fase da era digital: a plena
democratização da informação produzida pela humanidade, a WWW.
De repente, a WWW conectou o mundo inteiro, encurtou fronteiras,
aproximou culturas, criou novos mundos sem donos e sem governos, universos sem
regras e sem censuras, espaços livres onde seres humanos, não importando a
distância geográfica, se encontram e trocam informações. Parece que o mundo
utópico e compartilhado por todos, idealizado por John Lennon na canção
imagine, tomou forma, se concretizou e agora tem nome: internet. Ainda pode-se
dizer que esse mundo é ainda muito virtual, que ainda não há o “contato físico”
no sentido strictu da frase, tão necessário à essência dos conceitos das
palavras humano e sociedade. Mas será que aqueles que compartilham esse mundo
de pacotes digitais, que nasceram com seu nascimento, aceitarão o nosso mundo
físico atual do jeito que ele é, tão arraigado de todo tipo de preconceito,
censura e regras incompreensíveis, quando em suas mãos tiverem o poder de modificá-lo,
deixando-o mais parecido ao seu mundo virtual e livre de hoje? Quando isso
ocorrer, o contato físico estará então presente em sua plenitude,
materializando o melhor dos dois mundos: o virtual e o real.
Na mesma década do nascimento da WWW, nasceu também quem hoje está
provocando o nascimento da quarta fase da era digital: A geração da
conectividade, que leva a internet para casa, trabalho, ruas, salas de aula, e
está gostando cada vez mais de produzir, armazenar, divulgar e compartilhar
conhecimento. No entanto, podemos dizer que essa geração está apenas
exercitando o que, como falei antes, está escrito em seu DNA: a vontade de se
expressar. Vale dizer que o crescimento incomensurável do número de blogueiros
gravitando na blogosfera, produzindo informação, lendo, querendo ser lido e
divulgado seus pares, é um fenômeno inesperado. Atualmente, é grande o número
de empresas criadas visando somente esse tipo de ambiente. Um movimento tão
forte que forçou o aparecimento de nomes específicos para a geração de jovens
que estão altamente conectados, a chamada geração Z.
Com o advento da era da informática, seguida da internet e logo
depois da WWW e agora a era da plena conectividade, o potencial de conhecimento
humano, tanto produzido quanto acumulado cresce exponencialmente minuto a
minuto. As informações hoje não se resumem somente a textos, mas incluem também
dados multimídia. A todo momento temos à nossa disposição um tsunami de novos
textos, imagens, sons e vídeos, produzidos por pessoas comuns. Um conhecimento
tão importante quanto os dados governamentais e de todas as áreas, tais como
produzidos por médicos, engenheiros, advogados, filósofos, ou tantas quantas
forem as profissões que surgem a cada momento.
A quantidade de informação presente na Web passou a ter uma
importância fundamental, obrigando governos a debaterem e criarem, ou pelo
menos tentarem criar, leis específicas para esse meio. Interessante notar é que
a Web é um ambiente tão imprevisto quanto necessário hoje em dia. Uma demanda
que nem o mais visionário estudioso das tendências humanas poderia prever. Uma
necessidade que, ao mesmo tempo é vital para qualquer sociedade moderna, nunca
foi encontrada em nenhuma lista de demanda em tempos mesmo que recentes.
Na esteira da necessidade de organização e recuperação das
informações produzidas a cada dia, foi em meados dos anos 90 que se
popularizaram as chamas Máquinas de Buscas, ou sites especializados na
Recuperação das Informações postadas na rede. O próprio termo Máquina de Busca
foi cunhado para representar os sites cujo objetivo era produzir a informação
que alguém deseja, simplesmente escrevendo uma ou mais palavras relacionadas
com um assunto, os chamados “Termos de Busca”.
O Yahoo foi a Máquina de Busca mais popular nos anos 90. A filosofia
por de trás do seu mecanismo era, inicialmente, guardar cada página na rede
como um conjunto das palavras que mais apareciam no texto. Assim, uma
página/site era quebrada em suas unidades individuais, as palavras, e cada
palavra era armazenada ao lado do número de vezes que ela era citada na
página/site. Assim, se a palavra escola era a que mais aparecia em uma página
web, assumia-se que essa página/site falava de assuntos relacionados à escola.
Quando um usuário desejava então recuperar páginas tratando desse assunto,
conseguia recuperar a página armazenada; mas, quando desejava recuperar páginas
de assuntos relacionados, tais como livros, professores ou estudos, poderia
ficar frustrado com o resultado, caso as palavras usadas na busca não tivessem
sido justamente aquelas guardadas pela Máquina de Busca.
Esse processo de armazenamento é chamado pelos Cientistas da
Computação de indexação baseada em frequência de palavras, e cada página
armazenada é chamada de Documento. Um documento que interessa a quem faz a
busca é chamado de Documento Relevante. Hoje em dia, o conceito de documento se
expandiu para qualquer tipo de informação multimídia que se queira buscar.
Assim, um arquivo de música mp3, por exemplo, é um documento, e, quando você
requisita uma música e a Máquina de Busca fornece a você exatamente as músicas
que deseja, diz-se que os documentos recuperados foram relevantes. Quanto mais
documentos relevantes a Máquina traz o mais rapidamente possível, mais
eficiente ela é, e consequentemente mais popular se torna.
No final da década de 90, uma empresa na Califórnia percebeu as
dificuldades que os usuários tinham para encontrar documentos relevantes,
ficando muitas vezes frustrados com os resultados. Uma das razões para essas
frustrações estava na complexidade das Interfaces de Buscas, muitas vezes
complicadas e com informações excessivas e irrelevantes, o que dificultava a
comunicação homem-computador. Essa empresa, batizada de Google, teve a ideia de
fazer uma interface de busca rápida e simples, onde aparece apenas uma caixa de
texto, onde o usuário mais leigo poderia digitar o termo de busca sem se
preocupar com mais nada. O resultado foi a migração em massa de usuários da Web
para o Google, que hoje domina o mercado de Recuperação de Informação na internet.
Mas a interface com o usuário ainda é o gargalo das Máquinas de
Busca mais modernas. Mesmo com o desenvolvimento de interfaces consideradas
inteligentes, que tentam até “adivinhar” as necessidades dos usuários, é
incrível que ainda é pequeno, em relação à população mundial, o número de
pessoas que conseguem lidar com as interfaces do Google e que ficam plenamente
satisfeitas com suas buscas. Pense em quantas vezes você digitou uma palavra no
Google e o gigante da internet no mundo de hoje não conseguiu deixá-lo
satisfeito em relação ao que você esperava que viesse como resposta. Com
certeza não foram poucas as vezes, mesmo para usuários experientes.
Infelizmente, o número de documentos relevantes ainda é uma quantidade
proporcional às habilidades de se lidar com a máquina. Em outras palavras,
ainda falta muito para que uma Máquina de Busca consiga realmente “entender” as
necessidades de seus milhões de usuários cada vez mais exigentes e menos
pacientes no mundo todo.
Uma das razões que fazem com que as Máquinas respondam com
documentos não-relevantes é que, por de trás da interação homem-máquina, o
mecanismo de busca é, na verdade, relativamente simples comparado com a
complexidade do problema, e não leva em conta estruturas linguísticas
importantes da linguagem humana. Por exemplo, ao digitar um termo de busca como
a palavra América, o que a Máquina tem que devolver depende do contexto em que
essa palavra ocorre. No contexto geográfico, por exemplo, um documento
retornado poderia ser O Mapa da América, mas no contexto futebolístico, poderia
ser O Time do América. Então, um resultado plenamente satisfatório depende do
contexto e, atualmente, o usuário deve fornecer também o contexto correto, caso
contrário, poderá ficar frustrado com o resultado.
Informações linguísticas são a chave para o sucesso das Máquinas
de Busca futuras, e estão relacionadas às informações semânticas de nossa
linguagem. O significado semântico de uma palavra, dependendo do contexto em
que ela aparece, pode mudar radicalmente, e a Máquina ainda é incapaz
atualmente de lidar plenamente com informações semânticas.
Quando se fala em semântica, uma palavra exaustivamente repetida
na nossa infância por nossas professoras de língua portuguesa, podemos
relacionar com significado, compreensão, eloquência, transmissão de ideias, o
que o texto quer transmitir como verdadeira informação. É algo puramente
subjetivo, que tem a ver com as experiências de cada um. Dois indivíduos
diferentes podem ter compreensões semânticas de um texto ou palavra
completamente diferentes e corretos, dependendo do contexto que cada indivíduo
enxerga a palavra ou frase. Então, a compreensão da informação escrita (ou
semântica de um texto) vai muito além das palavras que ali estão contidas, e
depende também de muitas outras informações, possivelmente imagens, sons,
cheiros, e muitos outros sentidos humanos relacionados às palavras que os
descrevem e usados finalmente para a compreensão. Então, uma Máquina de Busca
conseguirá trazer um documento relevante para seu usuário caso considere o
contexto correto da informação passada do usuário para máquina. A máquina deve
conseguir manipular as diversas informações contextuias, muitas delas ainda
incipientes em forma de pesquisas científicas, como reconhecimento de imagens.
Estas, particularmente, quase sempre profundamente relacionadas a textos.
Mas guardar informações contextuais não é uma questão somente de
entender esse processo cognitivo humano, mas também é uma questão de espaço
físico de mídia e criação de um complicado modelo matemático de maneira que
consigamos prever e simular as reações na máquina. Um campo de pesquisa atual
que tenta desenvolver esses modelos é o chamado Teoria das Redes Complexas, que
propõe o estudo de grandes sistemas através da representação do
inter-relacionamento entre os elementos fundamentais desses sistemas. Por
exemplo, a WWW é uma Rede Complexa, onde os sites são os elementos fundamentais
e os sites para onde eles apontam, os chamados links, indicam relacionamentos.
Na linguagem científica, um elemento fundamental é chamado de nó e um
relacionamento é chamado de aresta. Assim, na WWW, uma página ou site é um nó e
os links são as suas arestas, formando uma rede complexa gigantesca, difícil de
armazenar em um só computador e consequentemente difícil de estudar. Mesmo
assim, várias teorias são propostas e a cada dia é maior o número de Cientistas
da Computação que acreditam que as informações contextuais representadas, não
só por páginas de textos, mas também por qualquer tipo de mídia, podem ser
representadas e estudadas como um conjunto de nós e arestas em uma grande Rede
Complexa. Entender esse relacionamento é a base para a construção de máquinas
que realmente saibam lidar com contextos.
Um tipo de informação importante nesse tipo de estudo são os
chamados clusters, que são conjuntos de nós com características similares entre
si, tais como as redes sociais. Estudar como os clusters se formam e se
inter-relacionam é um dos maiores desafios das pesquisas em Redes Complexas. Um
tipo de estudo que consome recursos de tempo, espaço em disco, memória
computacional, processamento e muitas, muitas aspirinas para os pesquisadores.
O futuro então do gerenciamento das informações humanas depende do
controle pleno de todas as características que envolvem a semântica de um
documento, seja ele uma simples página web de textos, sons, imagens ou vídeos.
Para manipular toda essa informação, é fácil ver que não pode ser somente
através de teclado e mouse; devem ser envolvidas também informações multimídia
e dispositivos avançados para uma maior interação homem-máquina. Um ambiente
onde possamos não somente mergulhar para ler, escrever, ouvir e ver imagens e
vídeos, mas também sentir o toque em objetos e, melhor seria, o toque entre as
pessoas envolvidas, através de dispositivos que atualmente são chamados de
sistemas hapticos, os quais permitem a sensação de interação física com o
ambiente. Tais sistemas, ainda em fase embrionária de desenvolvimento, anunciam
talvez uma quinta fase da era digital: a fase dos sistemas hapticos.
Hoje, ao abrirmos um site de relacionamentos, somos os homens de Neardental
de nosso tempo “tentando” nos comunicar com nossos pares e deixando legados
primitivos para as gerações futuras. Nossas cavernas são os sites, as paredes
onde postamos informações são as páginas da Web, e a ferramenta de expressão se
chama computador.
Nenhum comentário:
Postar um comentário