Inteligência Coletiva – Uma visão geral
A pouco dias atrás, numa visita a livraria, acabei comprando, sem grande pretensões, o livro “Programando Inteligência Coletiva” (Editora O’REILLY /Altas BOOKS, autor Toby Segaran). Confesso que após as primeira palavras lidas, não consegui mais largar… “devorei-o”. O assunto da edição é super atual e, acredito, que todos que gostariam ou trabalharam com internet hoje deveriam ao menos folheá-lo, pois este é um conhecimento básico para saber entender e aproveitar o fenômeno que é a grande rede.
Antes de mais nada é interessante conceituar oque é “Inteligência Coletiva“
Muitos podem pensar que trata de algo paranormal ou de cunho psicológico, mas quando falamos dentro de um contexto tecnológico, inteligência coletiva é um conjunto de dados, comportamentos, preferências, etc. Isso não é algo que só tenha surgido com a internet; o conceito é anterior a isso, a questão que isso era feito ou disponibilizado de outras formas (censos, bibliotecas, etc).
Restringindo ainda mais o conceito, podemos dizer que ela representa os dados disponíveis na grande rede em diversos formatos ou mídias: blogs, sites de social, menseger, wikis, etc.

Teras e mais Teras de dados a espera de uso…
Se pensarmos, atualmente, dentro da esfera da internet, temos uma quantidade absurda, até então inimaginável, de conteúdo “bruto” (por analisar) disponível. Esses dados se trabalhados por meio de algorítmicos ( que se apóiam em estatística básica e avançada) podem levar a conclusões, no mínimo, são geniais e interessantes. Não é a toa que diversos grandes “jogadores” (empresas) da WWW vem aos poucos trabalhando nessa questão. Quando digo “trabalhando” quero dizer milhões de dólares e.
Sistemas ditos inexpressivos, podem se tornar, em instantes, excelentes fontes de dados para definir padrões de comportamento de compradores, criar bases para sugestão de temas afins, etc. Ex: delicios, zebo, etc

Como trabalhar essa massa colossal de dados?
Como a promessa de uma web semântica (web 3.0) ainda está em fase embrionária, os recursos para “interligar” os conhecimentos (conteúdos) ainda é escasso. Com isso, precisamos contar com manipulações estatísticas, algoritmos baseados em inteligência artificial, etc.
Alguns poderiam dizer que poderíamos usar a questão das tags (meta tags que podem ser adicionadas ao html), mas só isso não é suficiente para categorizarmos, agruparmos, fazer inferências, entre outras coisas, de forma eficaz e eficiente.
Por meio de aplicações de modelos estatisticos (distribuição gaussianas, entropias, etc) é possível agrupar os dados em grupos de semelhantes e com isso tirar conclusões de tendências, comportamentos, etc. Além disso, se ainda utilizarmos recursos como redes neurais, algoritmos genéticos., etc é possível detectar padrões e por eles fazer inferências e tornar essa massa de dados um grande conjunto ativo de inteligência.
Quais são as possibilidades?
As possibilidades são infinitas e suas aplicações também. Podemos citar, apenas como exemplo, utilidades como: sugestão de produtos em sites de compras; determinar a melhor oferta para um determinado perfil de visitante do site; bases de conhecimentos; buscas semânticas; etc.
Quem são os jogadores(players) disso?
O maior de todos e mais conhecido é o Google. Alguns garantem que seu sucesso, inclusive, se deve a invenção do algoritmo PageRank (homenagem a Larry Page).
Conclusões
Em próximos post irei mostrar algumas aplicações práticas que fiz extrapolando os exemplos passados pelo livro. Posso adiantar que já tenho um prontinha quase “saindo do forno”.
Leia mais
http://www.readwriteweb.com/archives/linked_data_is_blooming_why_you_should_care.php
http://www.readwriteweb.com/archives/understanding_the_new_web_era_web_30_linked_data_s.php