|
|
|
|
Descriptions des fonctions de traitement du japonais :
Indexation sur les motsMSSearch intègre un séparateur de mots sophistiqué qui est utilisé pour l'indexation et les interrogations. Ce composant est plus élaboré que le séparateur anglais parce que les délimitations des mots sont plus ambiguës en japonais qu'elles ne le sont en anglais. Cela signifie que MSSearch indexe les mots et pas seulement les caractères dans les documents en japonais. L'indexation sur les mots améliore la précision des recherches, réduit la taille d'index et prend en charge les techniques de normalisation qui améliorent la portée des recherches.
MSSearch n'extrait pas le document (à raison) parce que les caractères
MSSearch ne renvoit pas le document (à raison) parce que Ce type de requête pose problème pour les systèmes d'indexation sur les caractères parce que le terme Recherche de déclinaisonsMSSearch décline toutes les variantes d'un mot lorsqu'il indexe le document ainsi qu'au moment de l'interrogation. Ceci diffère de la version anglaise qui ne décline pas le mot lorsqu'elle indexe le document, mais seulement lors de l'exécution d'une interrogation. De ce fait, les correspondances exactes en japonais ne fonctionnent pas exactement comme prévu, étant donné que le séparateur de mots peut changer la forme du mot en forme de base et supprimer un caractère qui ne fait pas partie de la signification de base du mot. Les exemples suivants présentent des termes qui sont équivalents pour les besoins de la recherche :
Normalisation du Hankaku/ZenkakuTous les caractères numériques et en Katakana à un seul octet ( Les exemples suivants présentent des termes qui sont équivalents pour les besoins de la recherche :
Normalisation des nombresLes chiffres arabes à un seul octet ( Les exemples suivants présentent des termes qui sont équivalents pour les besoins de la recherche :
Variante KatakanaLes interrogations contenant des termes en Katakana peuvent retrouver des documents comportant des variantes de ces mots. Toutefois, MSSearch ne renvoie pas des termes en Katakana qui sont différents même s'ils ressemblent à des variantes. Les exemples suivants présentent des termes qui sont équivalents pour les besoins de la recherche :
Toutefois, une interrogation de recherche du terme Contraction NakaguroMSSearch retrouve des termes en Katakana contractés même lorsqu'un séparateur Nakaguro ou un autre type de séparateur est utilisé dans l'interrogation. En outre, les termes d'interrogation en Katakana contractés peuvent également trouver des formes du caractère Nakaguro dans les documents. Les exemples suivants présentent des termes qui sont équivalents pour les besoins de la recherche :
Voir la suite : 3 © 2001 Microsoft Corporation. Tous droits réservés. EROL / TRUC 5 : 13-août-2004 12:44:14 +0200
|
|
|