Segmentation thématique: processus itératif de pondération intra-contenu

机译：主题细分：内容内加权的迭代过程

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Dans cet article, nous nous intéressons à la segmentation thématique d'émissions télévisées exploitant la cohésion lexicale. Le but est d'étudier une approche générique, reposant uniquement sur la transcription automatique sans aucune information externe ni aucune information structurelle sur le contenu traité. L'étude porte plus particulièrement sur le mécanisme de pondération des mots utilisés lors du calcul de la cohésion lexicale. Les poids TF-IDF sont estimés à partir du contenu lui-même, qui est considéré comme une collection de documents mono-thème. Nous proposons une approche itérative, intégrée à un algorithme de segmentation, visant à raffiner la partition du contenu en documents pour l'estimation de la pondération. La segmentation obtenue à une itération donnée fournit un ensemble de documents à partir desquels les poids TF-IDF sont ré-estimés pour la prochaine itération. Des expériences menées sur un corpus couvrant différents formats des journaux télévisés issus de 8 chaînes françaises montrent une amélioration du processus global de segmentation.

机译：在本文中，我们对利用词汇衔接的电视节目主题分割感兴趣。目的是研究一种仅基于自动转录而无需任何外部信息或有关处理内容的任何结构信息的通用方法。该研究更具体地涉及在词汇衔接的计算过程中所使用的单词的加权机制。 TF-IDF权重是根据内容本身估算的，该内容被视为单个主题文档的集合。我们提出了一种与分段算法集成的迭代方法，旨在将内容的划分细化为文档，以估计权重。在给定迭代中获得的分段提供了一组文档，可从中重新估计TF-IDF权重以进行下一个迭代。对涵盖来自8个法国频道的不同格式电视新闻的语料库进行的实验表明，在全球细分过程中有所改善。

著录项

来源
《Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues》|2013年|739-746|共8页
会议地点
作者
Abdessalam Bouchekif; Géraldine Damnati; Delphine Charlet;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Segmentation thématique; pondération TF-IDF; cohésion lexicale; TextTiling;

机译：主题细分; TF-IDF加权;词汇衔接;文字平铺;

相似文献

外文文献
中文文献
专利

1. DEUX MÉTHODES COMPLÉMENTAIRES AU KRIGEAGE ORDINAIRE, POUR L'ESTIMATION D'UN PROCESSUS SPATIAL STATIONNAIRE DE MOYENNE INCONNUE: LA RÉGRESSION PLS ET LA PONDÉRATION PAR LA COVARIANCE [J] . Y. ELKETTANI Revue de Statistique Appliquee . 2005,第4期

机译：普通Krigerage的两种附加方法，用于估计未知平均的静止空间过程：PLS回归和权重加权
2. Bases cellulaires des processus neurodégénératifs [J] . A. Nieoullon Therapie . 1998,第1期

机译：神经变性过程的细胞基础
3. Qualité De La Connaissance Dans Un Processus Délibératif [J] . Jeroen van der Sluijs, Jean-Marc Douguet, Martin OConnor, Natures Sciences Societes . 2008,第3期

机译：协商过程中的知识质量
4. Segmentation thématique: processus itératif de pondération intra-contenu [C] . Abdessalam Bouchekif, Géraldine Damnati, Delphine Charlet Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues . 2013

机译：主题分割：内容内加权过程
5. Contribution à la résolution des programmes mathématiques avec contraintes d'équilibre et des programmes mathématiques à deux niveaux à contraintes linéaires [D] . Etoa Etoa, Jean Bosco 2006

机译：有助于求解具有平衡约束的数学程序和具有线性约束的两级数学程序
6. Pratiques de pondération des résultats d’enquêtes à grande échelle aux notes scolaires en mathématiques : Cas de l’Ontario français [O] . Simon, Marielle, Nadon, Catherine, van Barneveld, Christine, 2013

机译：数学等级注释中大规模调查结果的加权实践：法国安大略省的案例

Segmentation thématique: processus itératif de pondération intra-contenu

摘要

著录项

相似文献

相关主题

期刊订阅