|


| |
Modification du thésaurus :
Le thésaurus est une fonction de recherche d'expansion d'interrogations. Il permet à l'utilisateur de taper une expression dans une interrogation de recherche pour obtenir les mots apparentés dans les résultats. Par
exemple, l'utilisateur peut effectuer une recherche sur « IE » et obtenir les résultats correspondant à « Internet Explorer ». Le thésaurus permet également à l'administrateur de modifier le classement de recherche en affectant un poids
aux mots. SharePoint Portal Server fournit les fichiers de thésaurus dans les langues suivantes :
Chinois simplifié (tschs.xml)
Chinois traditionnel (tscht.xml)
Hollandais (tsnld.xmll)
Anglais international (tseng.xml)
Anglais américain (tsenu.xml)
Français (tsfra.xml)
Allemand (tsdeu.xml)
Italien (tsita.xml)
Japonais (tsjpn.xml)
Coréen (tskor.xml)
Espagnol (tsesn.xml)
Suédois (tssve.xml)
Thaï (tstha.xml)
Les fichiers de thésaurus renferment des exemples inactifs. Le fichier neutre de thésaurus (tsneu.xml) s'applique aux interrogations auxquelles aucun fichier de thésaurus n'est associé pour la langue de l'interrogation.
SharePoint Portal Server stocke les fichiers de thésaurus dans le répertoire suivant sur le serveur :
\Data\FTData\SharePointPortalServer\Config
Par défaut, le répertoire Données est situé sous
Program Files\SharePoint Portal Server. Si vous avez choisi d'installer les fichiers de données dans un autre répertoire pendant le processus d'installation du serveur, le répertoire Données est situé dans un endroit différent. Important Il existe un fichier supplémentaire appelé tsschema.xml. Ne modifiez pas ce fichier.
Vous pouvez modifier les entrées du thésaurus en modifiant le fichier XML dans
un éditeur de texte. Le fichier doit être au format XML (balises ouvrantes et fermantes correspondantes autour de chaque entrée) afin de se charger correctement. Si le format n'est pas correct, SharePoint Portal Server consigne une
erreur dans le journal des événements de Windows 2000 en précisant le fichier et la ligne concernés.
Remarque Ne changez pas la casse des balises dans le fichier XML. Seule la balise XML est en
majuscules. Toutes les autres balises sont en minuscules. Par exemple, la balise de <remplacement> doit rester en minuscules.
Vous pouvez créer des entrées de thésaurus comme suit :
Ensemble de remplacement. Vous pouvez spécifier un modèle à remplacer par un ensemble de substitution. Par exemple, vous pouvez remplacer les interrogations de « W2K » (modèle) par « Windows
2000 » ou « NT » (substitutions). Si vous effectuez une interrogation sur « W2K » par la suite, SharePoint Portal Server renvoie uniquement les résultats de recherche contenant « Windows 2000 » ou « NT ». Il ne renvoie
pas de résultats contenant « W2K ».
Chaque ensemble de remplacement est entouré de balises de <remplacement>. Au sein de cette balise, vous pouvez spécifier un ou plusieurs modèles entourés
d'une balise <pat>. Spécifiez une ou plusieurs substitutions entourées de la balise <sub>. Les modèles et les substitutions peuvent contenir un ou plusieurs mots. Dans l'exemple ci-dessus, vous ajouterez les lignes
suivantes :
<replacement>
<pat>W2K</pat>
<sub>Windows 2000</sub>
<sub>NT</sub>
</replacement>
Remarque Les modèles sont sensibles à la casse. Par exemple, votre modèle est « w2k » et possède les mêmes substitutions que ci-dessus. Votre interrogation est « W2K ».
SharePoint Portal Server ne renvoie pas de résultats contenant « Windows 2000 » ou « NT » car le modèle « w2k » est introuvable.
Une interrogation avec le thésaurus CONTAINS FORMSOF fonctionne
selon la description ci-dessus. Pour plus d'informations sur la syntaxe CONTAINS FORMSOF, voir le Kit de développement du logiciel.
Les interrogations FREETEXT activent automatiquement
le thésaurus. FREETEXT est l'interrogation générale par défaut utilisée sur le site du tableau de bord et comprend différentes variantes des termes d'interrogation. Si vous tapez le ou les termes de votre recherche entre
doubles guillemets, SharePoint Portal Server désactive l'interrogation FREETEXT et ne consulte pas le thésaurus, comme le montre l'exemple suivant. Dans une interrogation FREETEXT, toute l'expression recherchée est
ajoutée à l'interrogation, que le thésaurus l'ait ou non remplacée totalement ou partiellement.
En ce qui concerne l'ensemble de remplacement illustré plus haut, le tableau suivant présente
les résultats en fonction des différentes entrées utilisateur tapées dans l'interface de recherche sur le site du tableau de bord :
Entrée utilisateur |
MSSearch consulte-t-il le thésaurus ? |
SharePoint Portal Server renvoie les résultats pour les documents contenant |
|
w2k |
Oui (interrogation FREETEXT) |
W2k ou W2K ou W2k ou w2K
Aucun résultat n'est renvoyé pour Windows 2000
ou NT car le modèle est en majuscule dans le thésaurus W2K |
|
« w2k » |
Non |
W2k ou W2K ou W2k ou w2K |
|
W2K |
Oui (interrogation FREETEXT) |
Windows 2000 ou windows 2000 ou combinaison majuscule/minuscule (par exemple wInDows 2000) ou
NT ou Nt ou nt ou nT ou
w2k ou W2k ou w2K
Aucun résultat n'est renvoyé pour W2K |
|
« W2K » |
Non |
W2K ou w2k ou W2k ou w2K |
|
W2K Server |
Oui (interrogation FREETEXT) |
Windows 2000 (et combinaison majuscule/minuscule comme illustré plus haut) ou
NT (et
combinaison majuscule/minuscule comme illustré plus haut) ou
Server (et combinaison majuscule/minuscule comme server ou
SeRvEr) ou
W2K Server (et combinaison majuscule/minuscule)
Aucun résultat n'est
renvoyé pour W2K operating system |
|
« W2K Server » |
Non |
W2K Server ou w2k Server ou W2k Server ou w2K Server ou
W2K server ou w2k server ou W2k server ou w2K server |
Si deux ensembles de remplacement dotés de modèles similaires sont renvoyés comme résultat, le plus long des deux a la priorité. Par exemple, si vous disposez des deux ensembles de remplacement suivants,
« Internet Explorer » a la priorité sur « Internet » :
<replacement>
<pat>Internet</pat>
<sub>intranet</sub>
</replacement>
et
<replacement>
<pat>Internet Explorer</pat>
<sub>IE</sub>
<sub>IE 5</sub>
</replacement>
En ce qui concerne l'ensemble de remplacement illustré plus haut, le tableau suivant présente les résultats en fonction des différentes entrées utilisateur tapées dans l'interface de recherche
sur le site du tableau de bord :
Entrée utilisateur |
MSSearch consulte-t-il le thésaurus ? |
SharePoint Portal Server renvoie les résultats pour les documents contenant |
|
Internet |
Oui (interrogation FREETEXT) |
Intranet ou Intranet ou combinaison majuscule/minuscule (par exemple iNtranEt)
Aucun résultat n'est renvoyé pour IE ou IE 5 |
|
Internet Explorer |
Oui (interrogation FREETEXT) |
IE ou IE 5 (et combinaison majuscule/minuscule comme iE ou Ie 5)
Aucun
résultat n'est renvoyé pour Internet ou Internet Explorer |
Ensemble d'extension. Vous pouvez spécifier un groupe de substitutions synonymes les unes des autres. Les interrogations contenant des correspondances dans une substitution sont également
étendues aux autres substitutions de l'ensemble. Supposons, par exemple, que les termes « écrivain », « auteur » et « journaliste » (substitutions) doivent être traités en tant que synonymes dans les interrogations de
recherche. La prochaine fois que vous lancerez une interrogation basée sur « auteur », SharePoint Portal Server renverra également les résultats de recherche contenant « écrivain » ou « journaliste ».
Chaque ensemble d'extension est entouré de balises d'<extension>. Au sein de cette balise, vous pouvez spécifier un ou plusieurs modèles entourés d'une balise <sub>. Dans l'exemple ci-dessus, vous ajouterez
les lignes suivantes :
<expansion>
<sub>writer</sub>
<sub>author</sub>
<sub>journalist</sub>
</expansion>
Les deux options suivantes peuvent également être configurées :
Pondération. Les entrées de substitution prennent en charge la pondération. Cette dernière vous permet d'affecter un poids plus élevé (dans le classement des résultats de la recherche) à
certains mots en spécifiant une valeur plus élevée relative aux autres mots de l'ensemble de substitution. Vous pouvez spécifier une valeur comprise entre 0 et 1. Par exemple, la pondération des substitutions ci-après
peut être la suivante :
<expansion>
<sub weight="0.8">Internet Explorer</sub>
<sub weight="0.2">IE</sub>
<sub weight="0.9">IE5</sub>
</expansion>
Recherche de déclinaisons. Vous pouvez spécifier la recherche de déclinaisons dans les entrées de modèles et de substitutions. La recherche de déclinaisons concernant les mots mappe une
recherche de déclinaisons linguistique à tous les mots correspondants. Par exemple, en français, la recherche de déclinaisons « acheter » correspond à « acheté », « achetant » et « achats ».
Vous pouvez spécifier la recherche de déclinaisons en ajoutant “**” à la fin de la chaîne. SharePoint Portal Server renvoie les correspondances des chaînes lorsque votre interrogation porte sur les variations du mot et
vous obtenez ensuite les résultats associés à ce mot.
Par exemple, supposons que vous souhaitez que vos interrogations sur « courir » renvoient également « courant », « trotter » et
« trottant ». Vous devez modifier l'ensemble d'extension comme suit :
<expansion>
<sub weight="0.5">run**</sub>
<sub weight="0.5">jog**</sub>
</expansion>
Si votre interrogation porte sur « courir » ou « courant », vos résultats engloberont « trotter », « trottant » et ainsi de suite. Si votre interrogation porte sur « courant », vos résultats
seront identiques à ceux de « courir ».
Si vous disposez du modèle <pat> Stefan ran to the store** </pat> ou de la substitution <sub> Stefan ran to the store**</sub>,
le résultat correspond aux chaînes suivantes ou ces dernières sont ajoutées à l'interrogation :
Stéphane court vers le magasin
Stéphane courant vers le magasin
Stéphane courut vers le magasin
Stéphane court vers les magasins
Stéphane courant vers les magasins
Stéphane courut vers les magasins
Pour modifier un fichier de thésaurus
Ouvrez le fichier dans le Bloc-notes de Microsoft. Si les caractères d'un jeu à deux octets (DBCS) sont utilisés, vous devez enregistrer les fichiers au format Unicode.
Si vous modifiez le fichier de thésaurus pour la première fois, supprimez les deux lignes de commentaires suivantes au début et à la fin du fichier :
Ajoutez, modifiez ou supprimez un ensemble de remplacement, un ensemble d'extension, une pondération ou une recherche de déclinaisons.
Remarque Les
entrées ajoutées au thésaurus ne peuvent être vides, contenir uniquement des caractères spéciaux ni être constituées de mots parasites.
Enregistrez le fichier et fermez le Bloc-Notes.
© 2001 Microsoft Corporation. Tous droits réservés.
Ce document préliminaire pourra être
modifié de façon substantielle avant sa diffusion commerciale. Il est fourni uniquement à titre d’information et Microsoft ainsi que EROL n’apportent aucune garantie, explicite ou implicite, le concernant. Les informations présentées dans
le présent document peuvent être modifiées sans préavis. L’utilisateur reconnaît assumer tous les risques liés à l'utilisation ou aux résultats de l’utilisation de ce document. Les exemples de sociétés, d’organisations, de produits, de
personnes et d’événements décrits dans ce document sont fictifs. Aucune association avec une société, une organisation, un produit, une personne ou un événement réel n’a été voulue ou ne doit être déduite. L’utilisateur est tenu de
respecter toutes les lois applicables en matière de droits d’auteur. Sans restriction des droits dérivés des droits d’auteur, aucune partie de ce document ne peut être reproduite, stockée ou introduite dans un système de récupération de
données ou transmise à quelque fin ou par quelque moyen que ce soit (électronique, mécanique, photocopie, enregistrement ou autre) ou dans quelque but que ce soit sans la permission expresse et écrite de Microsoft Corporation d'EROL.
Les produits mentionnés dans ce document peuvent être couverts par des brevets, des dépôts de brevets en cours, des marques, des droits d’auteur ou d’autres droits de propriété intellectuelle et industrielle de Microsoft. Sauf indication
expresse figurant dans un contrat de licence écrit émanant de Microsoft, la fourniture de ce document ne vous concède aucune licence sur ces brevets, marques, droits d’auteur ou autres droits de propriété intellectuelle.
Microsoft, Windows, ActiveX, FrontPage, Visual Basic et Visual InterDev sont soit des marques de Microsoft Corporation, soit des marques déposées de Microsoft Corporation aux États-Unis d’Amérique et/ou dans d’autres pays.
Les noms de sociétés et de produits mentionnés sont des marques de leurs propriétaires respectifs.
|