Vorrei porre all'attenzione del forum il seguente problema.
Vorrei utilizzare lucene del jakarta project. Mi è stato suggerito perchè pare che sia un ottimo indicizzatore. Il problema è che può creare un index solo da file .txt. Per i formati .doc,.xls,.ppt,etc, richiede invece un parser che da questi estragga il testo e poi può creare l'index; utilizzare ogni volta il parser specifico per ogni formato è improponibile, l'ideale sarebbe una applicazione specifica.
Ho trovato una applicazione java (
http://java2.5341.com/msg/3602.html ) che risolve questo problema nel caso di windows (xp,2000,98), ma non nel caso in cui si utilizzi linux. Potete aiutarmi, conoscete qualche applicazione simile?
Grazie jp