Méthode de recherche utilisée

La recherche ainsi que les règles de classification adoptées sont assez complexes, ceci est une tentative pour décrire en termes généraux le déroulement des opérations de recherche.

Une liste de mots clés est obtenue à partir du formulaire de recherche (voir champ "Rechercher").

Selon la valeur du champ "Conditions" du formulaire de recherche :
- Si la recherche est faite à partir d'une expression avec opérateurs logiques (appelée par la suite expression booléenne) :
Un rapide contrôle de validité syntaxique est exécuté. En cas d'erreurs de syntaxe, un message d'erreur est présenté.
- Dans le cas contraire, le programme de recherche convertit la liste de mots clés en une expression booléenne  ("and", "or") :
A titre d'exemple, si le champ "Rechercher" contient les mots "chat" et "chien", et que le champ "Conditions" est à "Tous les mots", la recherche s'effectuera sur l'expression "chat and chien" (les documents sélectionnés seront ceux possédant les deux   mots).
Si le champ "Rechercher" contient les mots "chat" et "chien", et que le champ "Conditions" est à "au moins un des mots", la     recherche s'effectuera sur l'expression "chat or chien" (les documents sélectionnés seront ceux possédant au moins l'un des deux mots).
- dans les deux cas, chacun des mots génère une liste de mots étendue. Par exemple, le mot "personne" générera l'expression "personne and personnes". Les synonymes appartiennent également à cette liste étendue.

Examen de la base de données des index
L'expression booléenne est évaluée par rapport à la base de données des index (cette base de données est l'ensemble des mots obtenus par une recherche plein texte (un prétraitement passe en revue tous les documents du site pour générer cette base).
Suite à cette évaluation, une classification est faite. Cette classification correspond au poids des mots et au poids du programme de génération des mots. Le poids des mots est généralement calculé en fonction de l'importance du mot dans le document. Par exemple, les mots appartenant au titre du document ont un plus grand poids que les mots en fin de document.

Remarques :
- Le programme de recherche ne distingue pas les minuscules des majuscules ("haut" est la même chose que "HAUT" et que "hAuT").
- Il n'y a pas de recherche sur mots tronqués.
- Les accents sont pris en compte.