Meio Bit » Baú » Hardware » Não, meu caro Watson não é nada elementar

Não, meu caro Watson não é nada elementar

17/02/2011 às 18:53

Os intertubos estão animados nos últimos dias com a notícia de que o Watson, um Cluster da IBM ganhou o Jeopardy!, aquele programa de trívia chato pra caramba que é febre nos EUA desde a estréia na TV, em 1784.

Composto de 90 servidores IBM Power750, cada um com 4 CPUs de oito núcleos, cada um com 4 threads em hardware e clock de 3,55GHz, o Watson acessa a uma velocidade assombrosa os 4 Terabytes de dados em disco e os 16 Terabytes de RAM que compõe seu sistema principal.

Só que isso não é o suficiente para que ele vença o jogo. Isso tudo é hardware, é simples. Basta sair adicionando mais e mais equipamento, você pode fazer até um cluster Beowulf de Watsons.

Não é isso que o faz ganhar o jogo, e sim a inteligência do DeepQA, o projeto de inteligência artifical e linguagem natural da IBM que não por coincidência cita Star Trek em sua página oficial.

Linguagem natural é algo muito, muito complexo. Este vídeo de 30 Rock demonstra perfeitamente como um sistema de reconhecimento de voz que não reconheça contexto pode ser danoso:

Um exemplo simples: Em Star Trek as portas automáticas reconhecem a INTENÇÃO da pessoa em sair do cômodo. As de verdade ainda estão longe disso, então há uma Zona Proibida onde você não pode pisar sem ser o chato do escritório ou do aeroporto.

Watson por sua vez é capaz de determinar contexto e relações entre as prováveis respostas às várias partes de uma pergunta.

Nota: O Jeopardy! tem um formato idiota onde você responde uma resposta com uma pergunta, assim uma pergunta, assim “Atriz futura ganhadora do Oscar e primeira a ser replicada em forma robótica por um indivíduo” seria respondido com “quem é Luciana Vendramini?”.

Isso complica a vida do pobre Watson, mesmo assim ele se virou com perguntas como:

“Procurado por assassinar Sir Danvers Carew; aparência: pálido e meio anão; parece ter personalidade dividida” – resposta? “quem é Mr Hyde?”

Outra: “Harriet Boyd Hawes foi a primeira mulher a descobrir e escavar uma comunidade minoana nesta ilha”. A resposta (correta) de Watson foi “O que é Creta?”. Note que ele teve que deduzir que a pergunta era sobre o nome da Ilha, não da comunidade.

Acumular conhecimento é fácil. Watson já faz mágica com meros 4 Terabytes de dados. O incrível é buscar conhecimento (sim, foi proposital) associando os dados existentes. O banco de Watson não é uma coleção de perguntas e respostas prontas, mas um repositório de informação, interpretada em tempo real.

Claro, nem tudo são flores. As gravações do programa, que em geral levam duas horas se estenderam por 4, Watson travou várias vezes, mas felizmente a escola Bill Gates/Roy Trenneman de manutenção e suporte em TI continua valendo, e era só rebutar. Como? Watson roda SUSE® Linux Enterprise Server 11, achou que fosse outra coisa?

Como a IBM não é a Palm, os trocados que ganhou no programa não serão tão importantes, o foco aqui é testar Watson em condições reais e mostrar que ele pode ser útil no dia-a-dia, mesmo estando longe dos computadores da série HAL-900, que nunca cometeram um engano ou distorceram informações, sendo por todas as definições práticas dos termos, à prova de falhas e incapazes de errar.

A capacidade de entendimento de Watson pode ser aplicada na área médica, pesquisando todo o conhecimento humano acumulado sobre medicina, em busca de diagnósticos obscuros (exceto Lupus) ou na área jurídica, por exemplo. Imagine a quantidade de jurisprudência que ele é capaz de desenterrar.

Agora vamos extrapolar mais um pouco. Quando você usa o Google você quer uma dúzia de páginas ou quer uma informação? Normalmente queremos uma dúzia de página pois só assim conseguimos compilar a informação desejada.

Um dia, em um futuro distante, talvez meados de 2012 um sistema muito parecido com o Watson será colocado como front-end de um Google da vida, ou um Bing (se bem que aí ainda será front-end de um Google da vida) e do dia para a noite nosso conceito de busca mudará para sempre.

Uma questão que leva horas para ser respondida, como “quais o percentual de Steves comandando as 1000 maiores empresas de tecnologia nos EUA” seria respondida em segundos.

O Google hoje já nos dá a resposta para a Vida, o Universo e Tudo Mais. Um dia um descendente do Watson poderá nos dizer qual é a pergunta.

Leia mais sobre: , .

relacionados


Comentários