Meio Bit » Baú » Software » Seu próprio motor de buscas

Seu próprio motor de buscas

18/12/2006 às 13:44

[img_assist|nid=9801|link=none|align=right|width=300|height=400]
Lendo o artigo do Leo sobre digitalização de documentos, me lembrei que procurei, há alguns anos, uma solução semelhante e o caro, na época, era o software para indexar toda a informação.

Por exemplo: uma nota fiscal, digitalizada em formato jpg, seria armazenada. E depois, como poderia recuperá-la? Seria preciso um arquivo de índice, ok. E para procurar? Estão vendo? A coisa se complica exponencialmente com o tamanho da base de dados ( ou seja: da empresa ).

Eis que li uma notícia no DailyTech, falando que a IBM e a Yahoo! estavam disponibilizando, gratuitamente, um software que faz exatamente isso: o OmniFind. Com capacidade de até 500 mil documentos por servidor e procurando em 200 tipos diferentes de arquivos, pareceu uma ótima pedida.

Disponível para a turma de Redmond e para o pessoal do pinguim, exige muito da máquina. No meu Pentium 4 HT com 1GB de RAM e HD SATA, demorou mais de 5 minutos para indexar 85 documentos. Além disso, gerou uma base de dados de 521MB!

Pode parecer que não compensa, mas fez a alegria do pessoal aqui... conseguiraram achar coisas que havia muito tempo, imaginavam já terem ido pro lixo.

relacionados


Comentários