No último episódio, encontramos o UNIX e os newsgroups, um dos precursores do blogue. O fio da meada da história até então foi a necessidade de se comunicar, informar e compartilhar. Quanto mais o mundo se voltou ao plano de idéias, mais forte se tornou este desejo... Neste capítulo da série, iremos do surgimento da WWW aos blogues, mais uma vez atraídos pela necessidade de comunicar, compartilhar e informar.
Informações Desestruturadas
"One of the things computers have not done for an organization is to be able to store random associations between disparate things, although this is something the brain has always done relatively well."
Tim Berners-Lee, o criador do WWW
Imaginem um lugar, em território neutro, onde pessoas de 80 países falam em cinco línguas oficiais e, no intervalo de suas intensas atividades intelectuais, dividem receitas, intinerários de viagem e opiniões bem humoradas sobre as últimas novidades de seus países de origem. Algumas vezes, compartilham as mesmas mesas no único café dentro do campus, outras vezes compartilham mesas virtuais em continentes diferentes. Este lugar é o CERN, ou Conseil Européen pour la Recherche Nucléaire, o laboratório internacional de Física localizado em Genebra, que envolve cerca de 10 mil cientistas ao redor do mundo trabalhando em experimentos para investigar e descobrir os menores componentes da matéria. Nada mais natural que fosse também o lugar onde começou a World Wide Web, ou web.
Se os blogues são um marco na nossa eterna jornada para criar, acessar e compartilhar informações e idéias, o tipo de pesquisa conduzida no CERN não seria possível se não fossem inventados conceitos revolucionários que mais tarde foram incorporados em blogues. Um simples experimento em Física de partículas, durante alguns poucos segundos, gera terabytes de informação e dados, que precisam ser analisados, selecionados e divulgados para milhares de especialistas ao redor do mundo. Novos modelos teóricos e explicações sobre o que foi observado precisam ser propostos e discutidos por pessoas separadas por barreiras geográficas e culturais. A própria montagem dos experimentos requer equipamentos cujos milhares de subcomponentes são feitos por grupos em diferentes países e continentes. Esta complexidade e ausência de estrutura exigiu a criação de uma nova linguagem para impor alguma coesão e o mínimo de organização na troca de informações que permitissem esta colaboração ter sucesso.
Num primeiro momento, os bancos de dados relacionais organizaram a informação de maneira estruturada, permitindo o crescimento e amadurecimento de várias tecnologias e até conceitos que se conformassem com a estrutura. A estrutura, se por uma lado pode ser uma necessidade para a eficiência, por outro pode ser extremamente limitante. Ela exige um agente central que controle, mantenha e organize a informação. Além disso, exige a centralização dos recursos necessários para montar e manter o sistema de controle. E talvez o maior obstáculo, a estrutura exige que idéias e conceitos se conformem à estrutura e, raramente, o contrário. Um ambiente multicultural, em que muitas idéias diferentes precisam se comunicar e encontrar termos em comum, em que conceitos estão sendo inventados e esquecidos, modificados a todo instante, e onde não existe muita possibilidade de agregar os recursos numa só unidade, exige que a informação seja gerida e mantida de uma maneira menos estruturada. Mas estruturada o suficiente, para ainda ser útil, acessível e parcialmente confiável.
Tim Berners-Lee resolveu isso no gigantesco laboratório CERN criando uma linguagem: o HyperText Markup Language (HTML). O HTML, criado em 1989, permitiu que o grande repositório de idéias e conhecimento do CERN fosse mantido vivo por cientistas ao redor do mundo, cada qual usando sua própria forma de apresentar idéias, mas ao mesmo tempo lincando e criando uma semi-estrutura que permite às pessoas indexar a (e navegar pela) informação. Se a linguagem dos bancos de dados tradicionais (SQL) pode ser visualizada como a linguagem da organização de um batalhão, onde cada homem é uma unidade de informação, e todos estão organizados em filas e colunas, o HTML é o equivalente da linguagem de um grupo de dança livre, onde pequenos fios de organização ligam um indivíduo ao outro, mas cada um tem independência suficiente para decidir seus movimentos dentro de alguns limites bem definidos.
Em todos os campos de conhecimento humano se observa a necessidade para experimentar com mudanças na forma estruturada de pensar e representar. Me parecem ser os exemplos mais óbvios, o Cubismo em 1907 com Picasso e seus colegas experimentando modificar estruturalmente a representação visual, Joyce em 1922, com Ulisses, radicalmente experimentando alterar a comunicação e as estruturas no contexto de uma linguagem e o Free Jazz que começou em 1960, e teve em um de seus expoentes Ornette Coleman, que experimentou modificar as estruturas sonoras do que se entendia por Jazz até então. No entanto, em nenhum destes casos a idéia se massificou. Com informação foi completamente diferente. O homem utiliza e pensa sobre informação de maneira desestruturada, e é natural que ao encontrarmos ferramentas que permitam se expressar assim, elas sejam rapidamente adotadas.
Tostões que valem bilhões
"We started putting together a 'hotlist' of favorite sites from David and myself, and we called it 'Jerry's Guide to the World Wide Web'. Before we knew it, people from all over the world were using this database that we created."
Jerry Yang, fundador do Yahoo!
Em 1993, havia cerca de 623 websites, e a internet tinha cerca de 800 mil hosts. Um índice manual para web, o vlib, com linques para sites ao redor do mundo era mantido por Tim Berners-Lee, e as páginas na web, fora do CERN, raramente continham alguma coisa além de uma foto da instituição ou pessoas compartilhando informações sobre seu trabalho e linques para programas freeware disponíveis em sites de FTP ou manuais de linguagens de programação disponíveis no UNIX.
Eu lembro de um site que comecei a usar em 1994. Chamava-se Yahoo!, e era um índice atualizado semanalmente por dois alunos de Stanford. O mais legal do site era que os linques eram comentados, e uma seção no final da página trazia uma lista dos favoritos dos autores. Semanalmente, quando encontravam alguma pepita pela internet, os autores lincavam e faziam comentários bem humorados sobre a página. O Yahoo! foi o primeiro exemplo de blogue, atualizado semanalmente, e com uma perspectiva pessoal de uma coleção de linques comentados. Um blogue que mudou um pouco sua filosofia, se tornou um índice, e vale hoje cerca de 50 bilhões de dólares e gera um bilhão de dólares por ano para seus donos.
Na época, os índices, como vlib e Yahoo!, eram mantidos para que todos estivessem a par de novas páginas aparecendo na teia, e para que todos tivessem a possibilidade de ser acessados. No site do CERN, que usávamos muito nos nossos projetos para aquela instituição, havia uma pequena caixa de busca que permitia procurar informação de maneira bem rudimentar. Os linques eram os únicos guias na web.
Era natural então que com a explosão da web, em 1995 já haviam 6 milhões de hosts e 100 mil websites, a necessidade para organizar linques se tornasse muito importante e fosse automatizada. Vários portais surgiram e, junto com eles, as primeiras máquinas de busca que indexavam e organizavam a informação desestruturada com o objetivo de facilitar o acesso dos web-leitores. Os sites de busca passaram a ser os bibliotecários da web. Uma reminiscência da época: um amigo me perguntou no início de 95 se não seria interessante vender produtos pela web, para depois ele mesmo complementar com "...mas quem iria comprar pela rede?".
Quando encontramos informação e conhecimento sem muita estrutura, e com confiabilidade duvidosa, as perguntas naturais são: "o que é importante nesta pilha de coisas?" e "quem sancionou estas informações?". Uma idéia é somente tão importante quanto ela é acessível. Este é o lema da web, e está incorporado nos blogues e seus linques de favoritos. No fim de 95, um sistema de buscas chamado Google encontrou uma maneira de avaliar os vários sites da web, usando a sanção por sites importantes, justamente, como a medida de importância de cada resultado de uma pesquisa. Os sites mais importantes eram lincados por muitos sites, e formavam "autoridades". Os sites lincados por "autoridades" ganhavam mais pontos por isto.
Os blogues adotaram os conceitos de autoridade e popularização por linque com naturalidade. Os blogues mais populares são aqueles lincados por um grande número de outros blogues. E blogues que aparecem listados ou mencionados em blogues populares ganham uma visibilidade, um peso muito maior. Com o acesso da massa de leitores, a informação que em tese não é hierarquizada se torna hierárquica e dependente de agentes centralizadores como nas organizações de informação tradicionais. Quando visitarmos as "vilas de informação" mais adiante, este conceito será determinante para a evolução dos blogues.
Os sitemas eficientes de busca também popularizaram uma noção pouco usual sobre a confiabilidade de uma informação: em vez da necessidade de ser sancionada por um especialista, uma informação é tão confiável quanto o número de vezes em que ela é repetida por indivíduos. Informações confiáveis aparecerão repetidamente em muitos sites diferentes e, por este simples processo, se qualificam como tal. A lei de grandes números da probabilidade, usada por Shannon para avaliar a confiabilidade de bits e bytes, passa a ser válida também para pacotes de informação. A idéia de uma verdade jornalística se baseia agora tanto em provas quanto em estatística (o número de vezes que tal verdade aparece na cultura popular). Um retorno talvez à Era dos mitos gregos e as verdades sobre Deuses e homens.