|
![](/web/20061209011617im_/http://cap-pac.ic.gc.ca/clf/images/spacer14px.gif)
|
Aide sur la recherche
Le moteur de recherche de la DGAAI utilise Lucene de la Apache Software
Foundation. La syntaxe de recherche de Lucene est la suivante (ces
renseignements sont adaptés de la documentation fournie avec Lucene):
Modificateurs de terme |
Lucene supporte la modification des termes de recherche afin de fournir un grand nombre d'options de recherche.
Recherche par caractères génériques
|
Lucene supporte les recherches par caractère générique portant sur un ou plusieurs caractères.
Pour effectuer une recherche par caractère générique portant sur un seul caractère, utiliser le symbole « ? ».
Pour effectuer une recherche par caractère générique portant sur plusieurs caractères, utiliser le symbole « * ».
La recherche de caractère générique portant sur un seul caractère cherche les termes comportant le seul caractère remplacé. Par exemple, pour chercher « text » ou « test », vous pouvez faire une recherche ayant la forme suivante :
Les recherches par caractère générique portant sur plusieurs caractères cherchent 0 ou plusieurs caractères. Par exemple, pour chercher « test », « tests » ou « tester », vous pouvez faire une recherche ayant la forme suivante :
On peut aussi utiliser la recherches de caractère générique au milieu d'un terme.
Nota : On ne peut pas utiliser le symbole * ou ? comme premier caractère d'une recherche.
|
|
Recherches floues
|
Lucene supporte les recherches floues basées sur l'algorithme de calcul de la distance de Levenshtein ou de la distance d'édition. Pour effectuer une recherche floue, utiliser le symbole tilde, « ~ », à la fin d'un terme comportant un seul mot. Par exemple, pour chercher dont la forme est semblable à « itinérance », utiliser la recherche floue :
Cette recherche trouvera les termes comme itinérant et itinéraire.
Nota : Le degré de pertinence augmentera automatiquement de 0,2 si on effectue une recherche floue.
|
|
Recherches de proximité |
Lucene supporte la recherche de mots qui se trouvent éloignés les uns des autres d'une distance spécifique. Pour effectuer une telle recherche, utiliser le symbole tilde, « ~ », à la fin d'une expression. Par exemple, pour chercher une occurrence des mots « apache » et « jakarta » se trouvant à 10 mots ou moins l'un de l'autre dans un document, utiliser la syntaxe suivante :
|
|
|
|
Opérateurs booléens |
Les opérateurs booléens permettent de combiner des termes au moyen d'opérateurs logiques. Lucene supporte AND, « + », OR, NOT et « - » comme opérateurs booléens (nota : les opérateurs booléens doivent être entièrement en MAJUSCULES).
+ |
Le symbole « + », ou opérateur requis, exige que le terme suivant le symbole « + » existe dans un champ d'un document.
Pour chercher des documents qui doivent contenir « jakarta » et peuvent contenir « lucene », on utilise la forme suivante :
|
|
|
|
Caractères spéciaux ignorés
|
Lucene permet d'ignorer des caractères spéciaux qui font partie de la syntaxe de recherche. Ces caractères spéciaux sont actuellement :
+ - && || ! ( ) { } [ ] ^ " ~ * ? : \
Pour ignorer un caractère, utiliser le symbole « \ » avant ce caractère. Par exemple, pour chercher (1+1) :2, utiliser la forme suivante :
|
|