Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique

机译：结合词法衔接和词法破裂的概率分割模型进行主题分割

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

L'identification d'une structure thématique dans des données textuelles quelconques est une tâche difficile. La plupart des techniques existantes reposent soit sur la maximisation d'une mesure de cohésion lexicale au sein d'un segment, soit sur la détection de ruptures lexicales. Nous proposons une nouvelle technique combinant ces deux critères de manière à obtenir le meilleur compromis entre cohésion et rupture. Nous définissons un nouveau modèle probabiliste, fondé sur l'approche proposée par Utiyama et Isahara (2001), en préservant les propriétés d'indépendance au domaine et de faible a priori de cette dernière. Des évaluations sont menées sur des textes écrits et sur des transcriptions automatiques de la parole à la télévision, transcriptions qui ne respectent pas les normes des textes écrits, ce qui accroît la difficulté. Les résultats expérimentaux obtenus démontrent la pertinence de la combinaison des critères de cohésion et de rupture.

机译：在任何文本数据中识别主题结构是一项艰巨的任务。大多数现有技术可以在最大化段内的词汇内凝聚量或在词汇中的检测中休息。我们提出了一种结合这两个标准的新技术，以便在内聚力和破裂之间获得最佳折衷。我们根据Utiyama和Isahara（2001）提出的方法，定义了一个新的概率模型，保护了现场的独立性和低价。评估是关于书面文本和电视上的言语的自动转录，转录物不符合书面文本标准的成绩单，这增加了困难。获得的实验结果证明了内聚力和破裂标准的组合的相关性。

著录项

来源
《Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues》|2013年|202-214|共13页
会议地点
作者
Anca Simon; Guillaume Gravier; Pascale Sébillot;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
segmentation thématique; cohésion lexicale; rupture de cohésion; journaux télévisés;

机译：主题细分;词汇衔接;内聚力破裂;电视新闻;

相似文献

外文文献
中文文献
专利

1. La cohésion territoriale: Un enjeu spécifique pour les zones de montagne [J] . Anne Bourges Chambres d Agriculture . 2010,第990期

机译：区域凝聚力：山区的一个特定问题
2. LE SYTRAL DÉPLOIE UN PLAN D'INVESTISSEMENT MULTIMODAL AMBITIEUX AU SERVICE DE LA COHÉSION DES TERRITOIRES ET DE LA TRANSITION ÉCOLOGIQUE [J] . BRUNO BERNARD Travaux . 2021,第969期

机译：该SYTRAL在领土凝聚力和生态转型的服务下部署了一个雄心勃勃的多媒体投资计划
3. La nouvelle politique de cohésion Un moteur de croissance et de compétitivité pour l'UE [J] . Chambres d Agriculture . 2011,第1007期

机译：新的凝聚力政策是欧盟增长和竞争力的引擎
4. Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique [C] . Anca Simon, Guillaume Gravier, Pascale Sébillot Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues . 2013

机译：词汇凝聚力与词汇破裂进行主题分割的概率分段模型
5. La "Lexicologie explicative et combinatoire" dans le traitement des unites lexicales specialisees. [D] . Valente, Renata Stela. 2002

机译：“解释和组合词汇学”在专业词汇单位的治疗中。
6. Efficacité et innocuité des corticostéroïdes dans le traitement de la COVID-19 selon des données pour la COVID-19 d’autres infections aux coronavirus l’influenza la pneumonie extrahospitalière et le syndrome de détresse respiratoire aiguë : revue systématique et méta-analyse [O] . Zhikang Ye, Ying Wang, Luis Enrique Colunga-Lozano, 2020

机译：Covid-19治疗Covid-19的疗效和安全性根据Covid-19其他冠状病毒感染流感医院肺炎和急性呼吸窘迫综合征：系统审查和荟萃分析
7. Détection de la cohésion lexicale par voisinage distributionnel : application à la segmentation thématique [O] . Adam Clémentine, Morlane-Hondère François 2009

机译：分布邻域的词汇衔接检测：在主题分割中的应用

Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique

摘要

著录项

相似文献

相关主题

期刊订阅