participation
Désigne, en ATO, un ensemble de procédures ou d'opérations permettant de mesurer le pourcentage d'utilisation (ou le taux de participation) d'une catégorie donnée de mots dans un texte ou sous-ensemble d'un texte (dit aussi sous-texte). En d'autres termes, il s'agit d'apprécier l'importance d'utilisation d'un vocabulaire donné dans un texte ou une partie d'un texte, et ce, à des fins d'interprétation d'ordre linguistique, sociologique, informationnel, ou autres. Voir aussi distance.
Statut : terme spécifique Désigne, en ATO, un mot ou un symbole (par exemple, une suite de caractères symbolisant le nom donné à une catégorie de mots; on parle aussi de nom de propriété) représentant un modèle de mots ou de signes (par exemple, les signes typographiques), permettant d'extraire une ou des portions de textes contenant les mots (dits mots pôles) ou les signes désignés. En d'autres termes, il s'agit de la représentation simplifiée d'une catégorie de mots ou de signes, ne s'appliquant que sur du texte, permettant de repérer les segments de texte (on parle aussi de contextes) dans lesquels se trouvent les mots ou signes visés. Dans sa plus simple expression, le patron de concordance peut représenter la forme d'édition exacte des mots ou signes désignés ou le nom exact qui catégorise ces mots. Terme générique : patron de fouille des caractères, patron de fouille de propriété. Voir aussi concordance, contexte.
Voir patron de fouille de propriété.
Statut : terme générique Désigne, en ATO, un mot ou un symbole (par exemple, une suite de caractères dont certains sont spécialement reservés à cet effet) représentant un modèle permettant le repérage et l'extraction de mots ou de groupes de mots, d'un texte ou d'une liste de mots (dit lexique). En d'autres termes, il s'agit d'une représentation simplifiées à partir de laquelle sont extraits des mots (ou des groupes de mots ayant une structure donnée) correspondant au modèle défini. Ainsi, un patron de fouille sert à rechercher une classe de mots ayant une forme donnée (par exemple, selon la forme d'édition) ou une suite de mots ayant une structure syntaxique donnée dans un texte ou dans un lexique. On parle également de filtre. Termes spécifiques : patron de fouille des caractères, patron de fouille de propriété.
patron de fouille des caractères Statut : terme spécifique Désigne, en ATO, un caractère ou une suite de caractères alphanumériques (ou lettres de l'alphabet et chiffres) représentant un ou des modèles à partir desquels sont repérés les mots ou signes (par exemple, les signes typographiques) correspondants dans un texte ou dans une liste de mots (dit lexique). Le modèle représente généralement la forme d'édition (ou la forme telle qu'épelée) du ou des mots recherchés. Ainsi, dans sa plus simple expression, le patron de fouille des caractères se ramème à la forme exacte du mot ou du signe recherché dans le texte ou dans le lexique. Les catégories ou classes de mots sont quant à elles repérées par le biais d'une méthodologie utilisant certes la forme d'édition des mots visés, mais aussi un certains nombres de caractères spécialement reservés à cette fin. Terme générique : patron de fouille. V. aussi patron de concordance, patron de fouille de propriété.
patron de fouille de propriété Statut : terme spécifique Désigne, en ATO, un symbole (par exemple, un mot) représentant un catégorie ou une classe de référence (dite propriété) à partir de laquelle sont repérés les mots (ou groupes de mots) ou les signes (par exemple, les signes typographiques) appartenant à cette catégorie, et ce, dans un texte ou dans une liste de mots (dit lexique). Ainsi, le patron de fouille de propriété permet de repérer dans un texte ou dans un lexique, par exemple, tous les mots désignés ou référencés comme étant des noms communs. De la même manière, une suite de patrons de fouille de propriété formant un algorithme sert à dépister des groupes de mots ayant structure donnée; par exemple, le modèle suivant : 'Nom + Adjectif' sert à repérer des groupes de mots comme 'gaz carbonique', 'abri antiatomique', etc. dans un texte. On parle aussi de patron catégoriel. Terme générique : patron de fouille. Voir aussi catégorisation, patron de fouille des caractères, patron de concordance, propriété.
Désigne le fait qu'un même mot possède plusieurs significations ou s'applique à plusieurs concepts ou objets de la réalité. De fait, la présence de mots polysémiques dans un texte (par exemple, dans une phrase) est souvent une source de confusion dans l'interprétation du texte (on parle aussi d'ambiguïté). Voir aussi ambiguïté, homonymie.
Se dit d'un programme ou d'un ensemble de programmes informatiques qui contient à la fois les règles de description ou de fonctionnement des données à analyser et les codes informatiques qui analysent ces données. En somme, dans un système procédural, règles et codes informatiques proprement dits (ou procédures informatiques) forment un tout exécutable, par exemple, sur un texte. V. aussi déclaratif.
Désigne, en ATO, la description systématique des méthodologies et des opérations à effectuer, à l'aide d'un programme informatique d'analyse de texte, devant permettre l'obtention des résultats attendus. Il s'agit en somme des procédures documentées pour divers objectifs d'analyse de texte, et cela, à fins de réutilisation par d'autres utilisateurs ou à des fins pédagogiques. Ainsi, on trouve différents procéduriers décrivant les étapes des traitements en vue d'obtenir des résultats relatifs aux domaines de la documentation ou des sciences de l'information (par exemple, l'indexation), de la linguistique (par exemple, l'identification de syntagmes), etc. Voir aussi chaîne de traitement, scénario.
Désigne, en ATO, un ensemble ou système de valeurs permettant de catégoriser les objets ou éléments constitutifs d'un texte (par exemple, les mots ou groupes de mots, segments de texte, signes typographiques, caractères spéciaux). En d'autres termes, il s'agit d'un système d'annotation, pouvant être libre, c'est-à-dire créé par l'utilisateur, ou obtenu automatiquement à partir d'un système de valeurs déjà existant, servant à la classification des objets relevant ou pouvant relever d'un texte (on parle d'objets textuels). Par exemple, d'un point de vue linguistique, les mots d'un texte peuvent être classés selon qu'ils soient nom, verbe, ou adjectif; en somme, à partir de leur propriété grammaticale. Voir aussi catégorisation, valeur de propriété.
Désigne, en ATO, l'ensemble des valeurs ou informations d'ordre linguistique (dites informations lexicales) permettant de catégoriser les mots ou groupes de mots et signes typographiques (soit, les formes lexicales ou lexèmes). Dans sa plus simple expression, la propriété lexicale se réduit à la catégorie grammaticale. Voir aussi information lexicale, propriété.
© Service ATO (UQAM) et EBSI (Université de Montréal) - Commentaires: visib@corpus.ato.uqam.ca - |