[Linux-bruxelles] Mnogosearch Re: Indexation de site web
Alexandre Dulaunoy
alexandre.dulaunoy at ael.be
Jeu 9 Oct 15:31:24 CEST 2003
On 09/Oct/03 11:30 +0200, Frédérick Amorison wrote:
>
> Bonjour,
>
> Je recherche un outil permettant d'indexer un site web (pas énorme).
>
> Après mes recherches, j'ai trouvés plusieurs solutions qui pourraient me
> convenir. J'aimerais donc demander si parmi vous certains ont
> expérimenté l'une ou l'autre des possibilités suivantes:
>
> htdig (semble ne plus être maintenu)
> swish-e
> swishc++
> ...?
>
> Le serveur (apache 1.3.26) tourne sous Debian GNU/Linux Woody et
> j'aimerais, dans la mesure du possible utiliser des packets Debian.
> Le programme doit bien évidemment indexer de l'html mais aussi du pdf et
> des documents MS office pour la plupart dans les deux langues (NL-FR).
>
Mnogosearch[1] est la référence. Il fonctionne très bien et l'indexing
PDF, ppt, word ou autre est super facile à installer.
Il peut aussi faire du caching (à la google). Cela fonctionne très
bien pour les sites multi-langues.
http://www.mnogosearch.org/
adulau
--
-- Alexandre Dulaunoy (adulau) -- http://www.foo.be/
-- http://pgp.ael.be:11371/pks/lookup?op=get&search=0x44E6CBCD
-- "Knowledge can create problems, it is not through ignorance
-- that we can solve them" Isaac Asimov
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: non disponible
Type: application/pgp-signature
Taille: 189 octets
Desc: non disponible
URL: </pipermail/linux-bruxelles/attachments/20031009/b1bbd3fb/attachment-0001.sig>
Plus d'informations sur la liste de diffusion Linux-bruxelles