首页> 外文OA文献 >Magyar nyelvű kötött, közép szótáras, folyamatos beszédfelismerő rendszer megvalósítási megoldásainak kutatása = Research on the construction of continuous speech recognizer for a Hungarian middle sized vocabulary
【2h】

Magyar nyelvű kötött, közép szótáras, folyamatos beszédfelismerő rendszer megvalósítási megoldásainak kutatása = Research on the construction of continuous speech recognizer for a Hungarian middle sized vocabulary

机译:在匈牙利实施固定的中央词典连续语音识别系统的研究=在匈牙利中型词汇中构建连续语音识别器的研究

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A 3 év alatt a tervnek megfelelően az alábbi feladatokat végeztük el: 1. Létrehoztunk egy általános, olvasott szövegű, magyar nyelvű beszédadatbázist, amely irodai környezetben használható beszédfelismerők akusztikai-fonetikai modelljeinek személyfüggetlen betanítására alkalmas. 2. Kifejlesztettünk egy középszótáras, statisztikai alapokra épülő folyamatos beszédfelismerő fejlesztői rendszert, amely lehetőséget ad különböző, kötött témájú, folyamatos beszédfelismerési feladat végrehajtására. 3. Kísérleteket végeztünk a beszédfelismerő fejlesztői rendszerrel az akusztikai-fonetikai modellek optimalizálására, továbbá a nyelvi modellépítés valamint az akusztikai, nyelvi adaptáció területén. Új megoldásokat vezettünk be az akusztikai-fonetikai modellépítésben, és bevezettük a bigram morphéma modelleket amelyeket összehasonlítottunk a hagyományos szóalak bigram modellekkel. 4. Létrehoztunk egy kórházi leletezésre alkalmas folyamatos, személyfüggetlen, 1000-20000 szavas beszédfelismerő rendszert, konkrétan a gasztroszkópia és a hasi ultrahang vizsgálat területén. 5. A létrehozott renszert valós körülmények között teszteltük, a SOTE 2. számú Belklinikáján. Az orvosok tapasztalatait mind a két tématerületen a részletes leírásban adjuk meg. | 1. A Hungarian read speech database was constructed in office circumstances. This database gives possibility for training and testing acoustic-phonetic models of speaker independent continuous speech recognizers. 2. A development tool for constructing continuous speech recognizers has been created under Windows XP. The tool is able to construct middle-sized continuous speech recognizer with a vocabulary of 1000-20000 words. New solutions have been developed for the acoustical preprocessing, for the statistical model building of phonemes and in syntactic level. 3. Research was done with the speech recognition development tool, for the optimalization of the acoustic phonetic models and for the linguistic models too. Hungarian is a strongly agglutinative language, in which the number of the word forms is very high. This is the reason, why two forms of bigram language model were constructed: One is the traditional word-form based, and the other is the morpheme-based model in which the vocabulary is much smaller. 4. We have developed a continuous speech recognizer for preparing medical reports, actually gastroscopy and abdominal ultrasonography records. 5. The speech recognizer was tested at the Medical Semmelweis University of Budapest. Opinion of doctors at the Endoscopy and Radiology Laboratories are attached to the detailed description of the project.
机译:在这三年中,我们根据计划执行了以下任务:1.我们创建了一个通用的匈牙利语只读语音数据库,该数据库适用于可在办公环境中使用的语音识别器语音模型的个人培训。 2.我们开发了一种基于中字典,基于统计的连续语音识别开发系统,该系统提供了执行各种固定主题的连续语音识别任务的机会。 3.我们使用语音识别开发系统进行了实验,以优化声学模型以及语言模型构建以及声学和语言适应领域。我们在声学模型构建中引入了新的解决方案,并引入了与传统单词形式的bigram模型进行比较的bigram词素模型。 4.我们建立了一个连续的,独立于人的语音识别系统,该系统适合于1000到20万个单词的医院检查结果,特别是在胃镜检查和腹部超声检查领域。 5.生成的系统在2号SOTE内部诊所的真实条件下进行了测试。详细说明中介绍了这两个领域的医师经验。 | 1.匈牙利阅读语音数据库是在办公环境中建立的。该数据库为训练和测试独立于说话者的连续语音识别器的声学模型提供了可能性。 2.在Windows XP下创建了用于构建连续语音识别器的开发工具。该工具能够构建具有1000-20000个单词的词汇表的中型连续语音识别器。已经为声学预处理,音素的统计模型构建和句法级别开发了新的解决方案。 3.使用语音识别开发工具进行了研究,以优化声学语音模型和语言模型。匈牙利语是一种高度凝集的语言,其中的单词形式数量非常多。这就是为什么构造两种形式的bigram语言模型的原因:一种是传统的基于单词形式的形式,另一种是基于词素的模型,其词汇量要小得多。 4.我们开发了一种连续语音识别器,用于准备医疗报告,胃镜检查和腹部超声检查记录。 5.语音识别器已经在布达佩斯的Semmelweis大学进行了测试。内窥镜和放射学实验室的医生意见附在该项目的详细说明中。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号