首页> 外文期刊>Jurnal Terapan Teknologi Informasi: JUTEI >SILABIFIKASI KATA BAHASA KOREA DALAM AKSARA LATIN BERBASIS ATURAN DAN MODEL DETERMINISTIC FINITE AUTOMATA
【24h】

SILABIFIKASI KATA BAHASA KOREA DALAM AKSARA LATIN BERBASIS ATURAN DAN MODEL DETERMINISTIC FINITE AUTOMATA

机译:基于自动确定性规则和模型的拉丁语中的韩语同化

获取原文
获取外文期刊封面目录资料

摘要

Transliterasi atau alih aksara otomatis masih menjadi topik penelitian yang menarik. Transliterasi aksara Korea telah menjadi topik penelitian dalam otomasi konversi antara aksara Hangul menuju aksara Latin. Penelitian-penelitian yang telah dilakukan memberikan hasil akurasi 72,2% dengan pendekatan statistik dan 54,9% menggunakan pendekatan Extended Markov Models untuk transliterasi dari Hangul ke Latin. Penelitian ini mengenai transliterasi kata bahasa Korea yang dituliskan menggunakan aksara Latin (romanisasi) untuk dialih aksarakan ke dalam aksara Hangul. Topik ini dipilih untuk membantu para pembelajar bahasa, karena sebagian besar pembelajar bahasa Korea memulai dengan aksara Latin terlebih dahulu. Pendekatan yang dipilih adalah membangun model kemungkinan sekuens vokal dan konsonan sebagai penyusun kata, dan membangun model sekuens suku kata yang memungkinkan. Model ini akan dibangun menggunakan prinsip Finite State Automata (FSA) agar tidak ememrlukan pelatihan. 100 kata acak dalam bahasa Korea digunakan sebagai data uji. Hasil pengujian awal menunjukkan keberhasilan hanya sebesar 40% karena sejumlah kekurangan dalam metode pelabelan konsonan, sehingga terdapat konsonan yang tidak telabeli sebagai intial atau final. Serangkaian aturan kemudian ditambahkan untuk mengatasi hal ini dan menghasilkan tingkat keberhasilan segmentasi dan transliterasi sebesar 92%. Hasil ini kemudian dianalisis kembali dan ditemukan bahwa rangkaian konsonan tertentu dapat menyebabkan kesalahan silabifikasi pada posisi tertentu dalam kata. Aturan tambahan berikutnya dapat memperbaiki hal ini dan menghasilkan tingkat akurasi 99% dalam mentransliterasikan kata bahasa Korea dalam aksara Latin ke dalam bentuk suku kata aksara Hangul.
机译:音译或自动识字仍然是一个有趣的研究主题。韩文文字音译已成为韩文文字到拉丁文字之间自动转换的研究主题。使用统计方法进行的研究提供了72.2%的准确度,使用扩展马尔科夫模型方法进行的从韩语到拉丁语音译的准确度为54.9%。这项研究是关于使用拉丁文字(罗马化)书写的韩语单词的音译,然后将其翻译成韩文文字的。选择该主题是为了帮助语言学习者,因为大多数韩国学习者首先以拉丁字母开始。选择的方法是建立元音和辅音作为单词成分的可能序列的模型,并建立可能的音节序列的模型。该模型将使用有限状态自动机(FSA)原理构建,因此不需要培训。使用100个韩语随机词作为测试数据。初步测试结果表明,由于辅音标记方法存在许多缺陷,因此成功率仅为40%,因此,有些辅音没有被标记为核心或最终标记。添加了一系列规则来克服此问题,从而使分割和音译成功率达到92%。然后对这些结果进行重新分析,发现某些辅音序列可能导致单词中某些位置的音节错误。随后的其他规则可以纠正此问题,从而将拉丁文字中的韩语单词翻译成韩文音节形式的正确率达到99%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号