Meio Bit » Arquivo » Mobile » iPhone 4S — Lamento informar mas por enquanto será Siri na Toca

iPhone 4S — Lamento informar mas por enquanto será Siri na Toca

iPhone 4S surge com a assistente virtual Siri, app recentemente comprado pela Apple. Do que ela será capaz ou não de fazer?

12 anos atrás

A maior novidade e surpresa anunciada do iPhone 4S lançado algumas horas atrás é o Assistente de Voz, utilizando tecnologia da Siri, um app adquirido pela Apple que é capaz de alguns truques MUITO legais em termos de reconhecimento de voz e interpretação de texto -mais até que muitos usuários de Twitter, mas a maioria dos fungos também supera essa categoria.

Veja como funciona a Siri:

SiriVid — Siri - The Personal Assistant on your Phone

O reconhecimento com grande precisão já é um feito, por décadas foi o santo graal da área, mas identificar as palavras é só o começo. O software reconhece algo bem mais complexo: CONTEXTO.

“Mostre-me um restaurante italiano romântico perto do bairro tal”

As palavras-chave são RESTAURANTE e PERTO. É evidente o algoritmo, ele entende o primeiro termo como um modificador forte, o segundo como um modificador fraco "italiano romântico" e o PERTO indica que virá uma informação geográfica.

A Siri é um programa que funciona em uma sandbox, você parece que é livre, mas não é (igual ao Android). Ele tem várias categorias e trabalha dentro delas. Boa parte do processamento do Assistente de Voz do iPhone será voltado para identificar o contexto da consulta,

A grande revolução aqui é que ele memoriza (não arrisco a dizer “aprende”) com as consultas anteriores, formando um contexto. Assim “mostre fotos da Scarlett Johansson pelada” retornará as fotos (YEAH) e em um mundo ideal “mostre somente as com ela ruiva” mostraria o strip com Uniforme da Viúva Negra.

Isso dará uma ilusão de inteligência bem convincente, mas nem de longe suficiente para passar em um Teste de Turing. Ainda estamos muito longe de IA Forte, de máquinas que efetivamente sejam criativas e tenham consciência do que estão dizendo. Alguns prevêem 20 anos, outros 100, outros como Roger Penrose dizem que a Inteligência Artificial é simplesmente impossível.

Mesmo que não seja, não aparecerá primeiro em um telefone.

A outra má-notícia é que talvez a Apple pela primeira vez seja forçada a fragmentar os recursos oferecidos em seus aparelhos. Montar sistemas de análise contextual não é NADA simples. Idiomas são diferentes entre si, desde em pequenas nuances até em sua forma mais básica. O Chinês é uma língua baseada em entonações, já o Japonês tem toneladas de modificadores e variações que se aplicam de acordo com idade e gênero do interlocutor E do emissor.

Aqui? Bem, a diferença entre “Obrigada, eu não vou” e “Obrigada eu não vou” é uma vírgula, que some em meio a qualquer mudança de ritmo do texto falado, mas as duas frases tem significado bem diferente.

O português é uma das línguas mais difíceis do mundo, tem mais exceções que regras e o inconveniente de só ser falado no Brasil (em Portugal eles falam praticamente outra coisa, mas sofrem do mesmo problema).

Nenhum outro país do mundo fala o NOSSO português. Todo investimento visando o idioma terá que ser amortizado aqui. Nossa realidade econômica nega o tamanho continental, a quantidade de gente que "compra" é muito menor do que o país tem em habitantes.

Por isso que até hoje, desde o lançamento do Windows 7 ele não “fala” português. O sistema de ditado e controle de voz do sistema operacional, que é excelente não toma conhecimento da Última Flor do Lácio. Não compensa o custo envolvido em criar uma versão de um recurso pouco utilizado em mercados maiores, mesmo que fosse deixar alguns poucos milhares de usuários satisfeitos.

O Kinect foi prometido que entenderia português. Reza a lenda que a equipe que fez o controle de voz dele está cuidando disso, mas até agora nada. Acontecerá? Provavelmente, mas deve estar no fim da fila, no finalzinho de uma longa página do MS Project colada na parede, com prioridade de exame de próstata em agenda de homofóbico.

Irá a Apple eventualmente colocar o Assistente de Voz em português? Acredito que sim, mas esperaremos bastante, pois verdade seja dita não somos prioridade. Mesmo com fábrica no Brasil o iPhone 4S é anunciado até para a Miserábia Setentrional, e nós aqui não ganhamos uma data.

EU ACHO, e estou brincando de tech pundit aqui, que a Apple irá unificar o Assistente de Voz em todos os países que suporta quando a tecnologia for migrada para o MacOS.

É um filão muito bom, computadores de verdade têm muito mais capacidade de processamento e podem produzir resultados bem mais precisos e comandar tarefas é muito mais “Sci-Fi” do que comandar comandos, tipo “abra janela, selecione menu tal”.

“HAL, cate uma foto da Luciana Vendramini, jogue no Photoshop e redimensione para a tela do iPhone” é um comando viável. “HAL, já saiu o torrent do The Big Bang Theory novo? Se saiu, baixe” — isso é algo que eu gostaria de perguntar ao computador, pois não quebraria meu ritmo de trabalho.

Acontecerá? O Siri está bem próximo disso. Meses, eu diria. Mas em inglês. Sorry.

relacionados


Comentários