déclaratif
Se dit d'un programme ou d'un ensemble de programmes informatiques où les règles de description ou de fonctionnement des données à analyser sont séparées des codes informatiques qui analysent ces données. Autrement dit, les deux modules, c'est-à-dire les règles où sont déclarées les connaissances sur les données et les codes informatiques proprement dits (ou procédures informatiques) qui interprètent ces connaissances, évoluent séparément. De fait, dans un système déclaratif, les règles ne constituent pas le programme informatique, mais plutôt des données (dites données déclaratives, ou connaissances déclaratives) sur lesquelles on exécute les programmes informatiques, et cela, dans le but d'analyser, par exemple, un texte. Voir aussi procédural.
Procédure permettant de traiter ou de lever les ambiguïtés sur un mot ou groupe de mots en fonction de sa signification dans une phrase donnée. En d'autres termes, il s'agit, dans une phrase donnée, d'identifier le groupe d'appartenance des mots en leur attribant les informations (informations essentiellement d'ordre linguistique; par exemple, la catégorie grammaticale) devant permettre la mise en évidence de la structure syntaxique et le sens de la phrase. Voir aussi ambiguïté.
Voir catégorisation.
Désigne un mot ou groupe de mots (dit aussi mot-clé) choisi dans une liste fermée de mots reconnus comme étant le vocabulaire technique d'un domaine de spécialité donné (on parle de vocabulaire contrôlé ou lexique contrôlé), servant à représenter ou à caractériser sans ambiguïté le contenu d'un texte (ou partie d'un texte) ou d'un document (ou partie d'un document) afin d'en faciliter la classification et la recherche. Voir aussi mot-clé, terme, vocabulaire contrôlé.
Statut : terme générique Termes spécifiques : dictionnaire indexé, dictionnaire séquentiel. Voir base de données lexicales.
Statut : terme spécifique Ensemble de mots ou groupes de mots (dits entrées lexicales ou données lexicales) catégorisés et organisés dans différents champs correspondant à des classes d'informations pouvant être de différente nature. En d'autres termes, chaque mot constituant l'entrée du dictionnaire indexé est associé à plusieurs types d'informations (informations d'ordre linguistique, sociologique, psychologique, etc.) structurées en différents champs. Un dictionnaire indexé sert généralement de source de références et d'informations lors des prodédures de catégorisation des mots d'un texte donné. On parle également de dictionnaire à champs multiples. Terme générique : dictionnaire électronique (base de données lexicales) Voir aussi dictionnaire séquentiel.
Statut : terme spécifique Ensemble de mots ou groupes de mots (dits entrées lexicales ou données lexicales) catégorisés selon une seule classe d'information. En d'autres termes, chaque mot constituant l'entrée du dictionnaire séquentiel n'est associé qu'à un seul champ; ce dernier ne contenant également qu'un type d'informations (par exemple, de informations d'ordre linguistique). Un dictionnaire séquentiel sert généralement de source de références et d'informations lors des prodédures de catégorisation des mots d'un texte donné. On parle également de dictionnaire à champ unique. Terme générique : dictionnaire électronique (base de données lexicales) Voir aussi dictionnaire indexé.
Désigne, en ATO, un ensemble de procédures ou d'opérations permettant de comparer, à l'aide d'indices numériques, deux textes, ou deux segments de texte (dit aussi sous-textes), afin d'en découvrir les différences et les ressemblances lexicales pouvant servir à des interprétations d'ordre linguistique, sociologique, informationnel, ou autres. En d'autres termes, il s'agit de distinguer les mots ou groupes de mots qui marquent davantage l'originalité ou la singularité d'un texte par rapport à un autre texte (par exemple, un discours par rapport à un autre), ou d'un segment de texte par rapport à un autre. On parle aussi de distance intertextuelle. Voir aussi participation.
Désigne une entité identifiée et structurée contenant, entre autres, textes, tableaux, images et sons, pouvant être un objet d'étude, de traitement manuel ou électronique (par exemple, l'archivage), et d'échange entre des utilisateurs. C'est donc une entité constituée d'un contenant et d'un contenu; ce dernier ayant surtout la caractéristique d'être communicatif au niveau social. Ainsi, par exemple, une pierre en soi ne peut constituer un document; par contre, une pierre gravée d'écriture peut en constituer un. De même, du texte, de l'image ou encore du son sur un support électronique peut constituer un document. Dans ce cas, on parle de document électronique.
Voir document.
Désigne, en ATO, le résultat d'une série d'opérations visant à isoler une partie ou des parties d'un texte qui, en l'occurrence, constituent une autre zone ou domaine de travail. Ainsi, la création d'un domaine sert à ne concenter les analyses et les opérations que sur une partie ou sous-ensemble du texte original. Voir aussi sous-texte.
Désigne, en ATO, tous les éléments constitutifs d'un texte (lettres de l'alphabet, accents, signes de ponctuation, chiffres, caractères spéciaux) en ce qu'ils sont lisibles et traitables par un ordinateur. Ainsi, pour un ordinateur, les données textuelles ne sont que des objets sans signification pouvant êtres découpés en groupes de lettres, en mots, en phrases, en paragraphes, en segments, ou autres, et ce, à des fins d'analyses diverses (par exemple, pour des analyses linguistiques, documentaires, sociologiques, statistiques, ou autres). On parle également d'objet textuel. Voir aussi information textuelle.
© Service ATO (UQAM) et EBSI (Université de Montréal) - Commentaires: visib@corpus.ato.uqam.ca - |