Une mesure de similarité sémantique pour la classification de documents par le contenu

Rim Al Hulou; Amedeo Napoli; Emmanuel Nauer

首页> 外文期刊>RSTI >Une mesure de similarité sémantique pour la classification de documents par le contenu

【24h】

Une mesure de similarité sémantique pour la classification de documents par le contenu

机译：用于按内容分类文档的语义相似性度量

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Dans cet article, nous proposons une approche pour classifier des documents à partir de leur contenu. Le contenu des documents est exprimé par des annotations représentées sous forme d'arbres. Étant donnée une hiérarchie d'annotations g╚ériques, notre approche vise à rattacher une annotation spécifique à une ou plusieurs classes possibles dans la hiérarchie. Ce processus de classification repose sur une mesure de similarité qui permet de mesurer l'écart entre une annotation spécifique et une annotation générique. Un schéma d'algorithme de classification de documents est proposé à partir de cette mesure de similarité.%In this paper, we propose an approach for content-based classification of textual documents. The annotation related to the content of a document is represented as a tree. Then we define classes of annotations that are organized within a hierarchy (of trees). The objective of our approach is to recognize for a given annotation the classes of annotations to which it can be attached. This classification process is based on a similarity measure, allowing the comparison of the tree structure of annotations. A schema of algorithm for this similarity-based process of classification of documents is proposed.

机译：在本文中，我们提出了一种根据文档内容对文档进行分类的方法。文档的内容由以树形式表示的注释表示。给定通用注释的层次结构，我们的方法旨在将特定注释附加到层次结构中的一个或多个可能的类上。该分类过程基于相似性度量，该相似性度量测量特定注释和通用注释之间的差异。通过这种相似性度量，提出了一种文档分类算法的方案。％本文提出了一种基于内容的文本文档分类方法。与文档内容有关的注释表示为树。然后，我们定义在（树的）层次结构内组织的注释类。我们方法的目的是为给定注释识别可以附加到注释的注释类别。该分类过程基于相似性度量，从而可以比较注释的树结构。针对这种基于相似度的文档分类过程，提出了一种算法模式。

著录项

来源
《RSTI》 |2004年第3期|p.217-230|共14页
作者
Rim Al Hulou; Amedeo Napoli; Emmanuel Nauer;
展开▼
作者单位

LORIA, Campus Scientifique, B.P. 239, F-54506 Vandœuvre-les-Nancy cedex;

展开▼
收录信息
原文格式 PDF
正文语种 fre
中图分类控制论、信息论（数学理论）;
关键词
mesure de similarité sémantique; arbre de similarité; classification; hiérarchie de classes; annotation de documents;

机译：语义相似度度量;相似度树;分类;类层次结构;文档注释;

相似文献

外文文献
中文文献
专利

1. Document et modèle pour l'action, une méthode pour le web socio-sémantique [J] . Jean-Pierre Cahier, LHédi Zaher, Gilbert Isoard Document Numerique . 2010,第2期

机译：行动文件和模型，一种社会语义网的方法
2. DETERMINATION PAR MESURES DIELECTRIQUES EN HYPERFREQUENCE DU POURCENTAGE D'HUILE CONTENU DANS UNE PHASE DISPERSEE D'EAU D'UNE EMULSION DE TYPE EAU DANS L'HUILE ENTRETENUE MECANIQUEMENT [J] . N. Haine, A. Deschamps Entropie . 2002,第243期

机译：用电超高频测定机械保持油包水乳液分散水相中所含油的百分比
3. Identification de relations sémantiques portées par les structures énumératives paradigmatiques: Une approche symbolique et une approche par apprentissage supervisé [J] . Mouna Kamel, Bernard Rothenburger, Jean-Philippe Fauconnier Revue d'Intelligence Artificielle . 2014,第2a3期

机译：范式枚举结构所承载的语义关系的识别：一种符号方法和一种监督学习方法
4. Similarités induites par mesure de comparabilité: signification et utilité pour le clustering et l'alignement de textes comparables [C] . Pierre-Francois Marteau, Gildas Ménier Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues . 2013

机译：可比性度量引起的相似性：可比文本的聚类和对齐的意义和效用
5. Approche numerique et experimentale pour l'amelioration d'une methode de mesure de la force d'adherence de la glace par l'utilisation de films piezoelectriques. [D] . Akitegetse, Cleophace. 2007

机译：用于改进通过使用压电膜测量冰的粘附强度的方法的数值和实验方法。
6. Evaluation des performances du cytomètre « MUSE AUTO CD4/CD4 » vs « GUAVA AUTO CD4/CD4 » pour la mesure du taux de lymphocytes CD4 chez des patients infectés par le VIH au Cameroun [O] . Ginette Claude Mireille Kalla, Esther Voundi Voundi, Florence Mimo Tanghu, 2019

机译：评估 MUSE AUTO CD4 / CD4％与 GUAVA AUTO CD4 / CD4％细胞仪在喀麦隆感染艾滋病毒的患者中测量CD4淋巴细胞计数的性能
7. Contrat de rivière. /Installations classées soumises à déclaration. /Prescriptions spéciales supplémentaires imposées par le préfet. Prise en compte de la qualité, de la vocation et de l'utilisation des milieux environnants. Article 17, alinéa 2 du décret du 21 septembre 1977. Normes de rejets dans les eaux définies par référence aux circulaires du 8 août 1974 et du 6 juin 1953. Documents n'ayant pas de contenu réglementaire et ne liant pas l'administration. /Déversements d'une distillerie à proximité de plages et d'une réserve naturelle sur l'Ardèche. Contrat de rivière « Ardèche claire ». Document ayant le caractère de directive pour l'administration. Obligation de tenir compte de cette situation particulière. /Expertise ordonnée. Mission de l'expert. Contenu des prescriptions. Examen de l'installation. Propositions de mesures. Tribunal administratif de Lyon, 10 décembre 1989 FRAPNA (Req. 88-39586). Avec conclusions [O] . Gérard Fontbonne 1990

机译：河流合同。 /分类安装须声明。 /县长提出的其他特殊要求。考虑到周围环境的质量，用途和用途。 1977年9月21日法令第17条第2款。参照1974年8月8日和1953年6月6日的通知，对排入水域的标准进行了定义。这些文件不具有法规上的内容，对政府无约束力。 /海滩附近的酿酒厂和Ardèche的自然保护区漏出的水。河牌“Ardècheclaire”。具有行政指示性的文件。有义务考虑到这种特殊情况。 /订购专业知识。专家的使命。处方内容。安装审查。措施建议里昂行政法庭，1989年12月10日FRAPNA（要求88-39586）。有结论

Une mesure de similarité sémantique pour la classification de documents par le contenu

摘要

著录项

相似文献

相关主题

期刊订阅