首页> 外文OA文献 >Affinités syntaxiques et sémantiques entre mots : apports mutuels de la linguistique et du TAL
【2h】

Affinités syntaxiques et sémantiques entre mots : apports mutuels de la linguistique et du TAL

机译:词之间的句法和语义亲和度:语言学和TAL的共同贡献

摘要

Je présente un bilan des travaux que j'ai menés depuis mon recrutement à l'Université de Toulouse 2 - Le Mirail (1997) dans le domaine de la linguistique et du Traitement Automatique des Langues (TAL). J'ai exploré le lien entre ces deux disciplines de deux façons que j'estime complémentaires : tout d'abord, je considère le champ applicatif du TAL comme un terrain d'investigation important pour la linguistique. Le TAL, et de façon générale, les applications relevant du domaine de l'ingénierie des langues, sollicitent un renouvellement des objets d'étude de la linguistique et élargissent le champ de ses questionnements. En retour, la linguistique gagne à s'appuyer sur des procédures de découverte issues du TAL, basées sur le traitement de corpus numérisés et annotés et sur le recours à des techniques de quantification adaptées aux besoins de la description linguistique. Au sein de ce cadre général, les travaux que j'ai menés ont porté principalement sur deux thématiques de recherche que j'ai résumées sous les termes d'affinités sémantiques et syntaxiques. Le premier concerne la question du repérage des rapports de proximité sémantique entre différents types d'unités (mots, termes, structures prédicatives). Identifier sous la diversité des formulations des éléments de contenu similaire est un objectif crucial pour de nombreuses applications qui visent l'accès à l'information dans les textes. Dans cette perspective, j'ai cherché à considérer sur le plan linguistique cette question de la proximité sémantique, en faisant en particulier appel à des techniques d'analyse distributionnelle automatique qui visent à calculer les rapprochements sémantiques entre mots sur la base de la similarité de leur comportement syntaxique dans les corpus. Cette approche inductive des relations de sens déborde largement les limites des relations classiquement décrites en linguistique et sollicite des procédures nouvelles de description et de validation. Le second volet concerne la question des affinités syntaxiques entre mots : impliquée dans le projet de développement et d'exploitation d'un analyseur syntaxique automatique, syntex, je me suis intéressée à une question qui est au coeur des problèmes d'ambiguïté syntaxique, à savoir le rattachement des groupes prépositionnels. J'ai travaillé en particulier à la mise au point d'une méthode permettant de distinguer des types différents de rattachement prépositionnel, de nature argumentale ou adjonctive. Dans ce cas également, mon travail est guidé par un objectif qui relève du TAL (améliorer les performances d'un analyseur), et ce projet m'a amenée en retour à retravailler une question linguistique centrale en syntaxe, la distinction entre arguments et circonstants, et à développer des méthodes d'analyse de corpus qui permettent de substituer à une conception binaire de ces notions une appréciation plus graduelle de l'autonomie du groupe prépositionnel par rapport au verbe. Je propose donc de montrer comment les outils de TAL appliqués aux corpus offrent à la linguistique des instruments d'observation et d'expérimentation qui permettent d'aborder les faits langagiers par le biais de l'observation des usages et sous l'angle de la quantification. Ma conviction est que la linguistique ainsi outillée peut jouer un rôle plus important sur les nombreux terrains applicatifs qui nécessitent l'analyse de données langagières.
机译:我对自从我在图卢兹2大学(Le Mirail)(1997)入职以来在语言学和自动语言处理(TAL)领域所做的工作进行了回顾。我以两种我认为是互补的方式探索了这两个学科之间的联系:首先,我认为NLP的范围是语言学研究的重要领域。 TAL,通常是语言工程领域的应用程序,要求更新语言学的研究对象,并扩大其问题领域。作为回报,语言学得益于依靠来自NLP的发现程序,基于数字化和带注释的语料库的处理以及基于语言描述需求的量化技术的使用。在这个总体框架内,我所做的工作主要集中在我根据语义和句法亲和力的术语总结的两个研究主题上。第一个问题涉及在不同类型的单位(单词,术语,谓语结构)之间定位语义接近关系的问题。在多种表达形式下,识别相似内容的元素是许多针对获取文本信息的应用程序的关键目标。从这个角度来看,我试图在语言学层面上通过特别是使用自动分布分析技术来考虑语义相似性这个问题,该技术旨在根据词的相似性来计算单词之间的语义和解。他们在语料库中的句法行为。这种意义关系的归纳方法远远超出了语言学中经典描述的关系范围,并要求进行新的描述和验证程序。第二部分涉及单词之间的句法亲和力问题:参与了自动句法分析器syntex的开发和开发项目,我对一个语法歧义问题的核心问题感到兴趣,了解介词组的依恋关系。我特别致力于一种方法的开发,该方法可以区分论证性或辅助性的介词依附的不同类型。在这种情况下,我的工作也要遵循TAL(改善分析仪的性能)范围内的目标,而这个项目使我得到回报,重新处理语法,论据和环境之间的区别等核心语言问题,并开发语料库分析方法,从而使这些概念的二元概念可以比介词动词更逐步地理解介词组的自治性。因此,我建议展示应用于语料库的NLP工具如何提供观察和实验的语言学工具,这些工具可以通过观察使用和从语言角度来接近语言事实。量化。我坚信,如此配备的语言学可以在许多需要分析语言数据的应用领域中发挥更重要的作用。

著录项

  • 作者

    Fabre Cécile;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 fr
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号