首页> 中国专利> 汉柯电子辞典及其自动转译汉柯语的方法

汉柯电子辞典及其自动转译汉柯语的方法

摘要

本发明公开了一种汉柯电子辞典及其自动转译汉柯语的方法,具有语种识别模块、检索模块、检索组合输出模块、显示模块、语音识别模块和语音输出模块;所输入的文字被识别出语言种类后,由检索模块对所输入文字与基础语料库中的单词进行匹配,然后根据检索模块从基础语料库中所检索出的待翻译的单词,语音识别模块再对由检索组合输出模块获取的与所述待翻译的单词意思相对应的汉语解释语句和柯语解释语句(经音节切分环节)进行有效识别,再调用真人语音库或合成柯语语音库,语音识别模块读取上述所输入的文字,并通过语音识别模块的扬声器依次发出所输入文字的语音。本发明的电子词典结构合理,其方法改变原先汉柯语互译的辞典技术,提高汉柯语相互转译效率,改进对汉柯语文字进行语音放送的性能。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-23

    授权

    授权

  • 2014-10-29

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20111219

    实质审查的生效

  • 2013-06-19

    公开

    公开

说明书

技术领域

本发明属于机器翻译语言技术领域,涉及利用计算机软硬件使汉语和柯尔克孜语相互转译的语言转换技术,特别是汉柯电子辞典及其自动转译汉柯语的方法。

背景技术

在社会信息化的当代,人们对各类语种信息获取、查询、翻译提出了更快、更高的要求,随之而研制开发了各类电子辞典产品,大到含几十万词条、上万个媒体素材的电子多媒体百科全书,小到含几千词条的掌上快译通,受到广大用户欢迎,电子辞典被作为学习语言、翻译和快速查询的辅助工具。在国外机器翻译系统和自然语言处理系统的实用化进程中,机器辞典已俨然成为开发的焦点,越来越多的语言翻译技术专家把机器辞典的规模和质量看作是决定机器翻译系统和自然语言处理系统成败的关键,早在1986年日本通产省就出资1亿美元支持电子辞典(EDR)的一个9年的开发计划,欧共体也资助多项机器辞典的研究课题,其中包括ACQUILEX(The Acquisition of Lexical Knowledge)课题,其目标是通过多部机器可读辞典MRD(Machine Reading Dictionary)来自动获取词汇知识,以便建立支持自然语言处理的多语种词汇知识库LKB(Lexical Knowledge Base),在此基础上所开发的各语种的多部大型机器辞典,其种类包括基本辞典、术语辞典、搭配辞典、概念分类辞典、概念描写辞典、语法辞典等。目前,产品化的电子辞典种类繁多,如不列颠百科全书、柯普顿百科全书、ENCARTA等。 

在我国,涉及机器翻译辞典方面的研究则始于二十世纪50、60年代,在改革开放之后得到了充分重视,二十世纪80年代后期,中文信息处理领域的专家开始了对机器辞典的研究,二十世纪90年代初,面向信息处理的机器辞典的研究正式列入国家七五、八五、九五计划,开展了诸如《信息处理用现代汉语词汇研究》、《基于配价的汉语语义辞典》、《现代汉语语法信息辞典》等基础性研究课题,在此基础上开发了《中国大百科全书》、《金山词霸》、《东方大典》等较成熟的信息产品,受到了广大用户的欢迎。

近年来,随着少数民族文字信息化领域的持续快速发展,在我国新疆,有关少数民族语言的电子辞典也有了比较大的发展,但大多数以现有普通的汉维电子辞典为主,并没有满足更广大用户的实际需求,更多支持少数民族语言翻译技术的水平存在着较大的缺陷。

发明内容

本发明的目的在于提供一种汉柯电子辞典,其结构合理,通用性强。

本发明的目的是这样实现的:一种汉柯电子辞典,由语种识别模块、检索模块、检索组合输出模块、显示模块、语音识别模块和语音输出模块组成,语种识别模块通过其相应接口连接显示模块的接口和检索模块的接口,检索模块通过其输出端接口对应连接检索组合输出模块的输入端接口,检索组合输出模块的输出端接口对应连接语音识别模块的输入端接口,语音识别模块通过其输出端接口连接语音输出模块的输入端接口。

本发明的目的还在于提供一种汉柯电子辞典自动转译汉柯语的方法,改变原先传统、普通汉语与柯尔克孜语互译的辞典技术,提高汉语和柯尔克孜语相互转译的效率,改进对汉语文字、柯尔克孜语文字进行语音放送的性能(柯尔克孜语简称为柯语或柯文)。

本发明的目的是这样实现的:一种汉柯电子辞典自动转译汉柯语的方法,其按序处理的步骤如下:

(Ⅰ)由显示模块显示所输入的文字,构建取词窗口,语种识别模块利用取词窗口通过屏幕取词的方法,获取与显示模块显示的所输入文字相对应的输入字符编码区域,将所输入的文字与被存储的UNICODE标准编码字符集(通用字符集:Universal Multiple-Octet Coded Character Set)中的编码字符相比对,判断所输入文字的语种是汉语或柯语,再把已被识别出语种的所输入文字传至检索模块;

(Ⅱ)检索模块获取检索方式将被识别出语种的所输入文字与在寄存于存储器的基础语料库中并列存储的汉-柯语料库和柯-汉语料库中所存储的字符进行比对,以从基础语料库中检索出与被识别出语种的所输入文字的字符相同或相对应的字符组合,确认被识别出语种的所输入文字是已被存储在基础语料库中的已知单字或单词,或进一步主动完整汉语单字组合或单词字母组合,若不能从汉-柯语料库和柯-汉语料库中检索出与所输入文字相同或相对应的字符组合-汉语单字或柯语单词,则检索模块判断被识别出语种的所输入文字是未知的,不能被语种识别模块确认、接收;

(Ⅲ)语种识别模块接收检索模块所检索出的字符组合,并从基础语料库所存储的汉-柯语料库和柯-汉语料库中调出与由检索模块所检索出的字符组合意思对应的且不同于所输入文字语种的另一语种字符组合-转译成汉语单字、汉语单词或柯语单词,再把所输入文字和/或由语种识别模块从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合通过检索模块或直接传至检索组合输出模块;

(Ⅳ)检索组合输出模块根据所输入文字和/或由语种识别模块从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合,从基础语料库中并列存储的汉-汉语料库和柯-柯语料库中获取用于解释被检索模块检索出的字符组合的意思的汉语解释语句,根据斯拉夫文柯语文字与阿拉伯文柯语文字映射表,获取与上述另一语种字符组合意思对应的以斯拉夫字母或阿拉伯字母表达的柯语解释语句,相应对由语种识别模块从基础语料库中所调出的字符组合的意思进行解释,检索组合输出模块再将其所检索出的解释语句输出至语音识别模块; 

(Ⅴ)当语音识别模块判断其所接收的解释语句为汉语解释语句时,语音识别模块用寄存于存储器内的语音数据库所存储的真人汉语语音库,相应逐一对其所接收的汉语解释语句中的每一汉语单字按照汉语发音语序进行语音匹配,再将暂存有与其所接收汉语解释语句中的汉语单字按序相匹配的汉语发音信号依次传至语音输出模块,对应于汉语解释语句中每一汉语单字的汉语发音信号被语音输出模块逐一按序检测、读取后,由语音输出模块中的扬声器依次发出与其所接收汉语解释语句中的每一汉语单字对应的汉语语音;

当语音识别模块判断其所接收的解释语句为柯语解释语句且其所接收的柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语单词时,语音识别模块用语音数据库中所存储的真人柯语语音库,相应逐一对其所接收的柯语解释语句的每一柯语单词按照柯语发音语序进行语音匹配,再将暂存有与其所接收柯语解释语句中的柯语单词按序相匹配的柯语发音信号依次传至语音输出模块,对应于其所接收柯语解释语句中每一柯语单词的柯语发音信号被语音输出模块逐一按序检测、读取后,由语音输出模块中的扬声器依次发出与柯语解释语句中每一柯语单词相匹配的柯语语音;若语音识别模块判断其所接收的解释语句为柯语解释语句,但不能对该柯语解释语句进行语音匹配时,则推定该柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语文本,并调用语音数据库中所存储的合成柯语语音库对柯语文本进行基于音节的语音合成,通过柯语语句单词与音节切分法相应将柯语文本切分成已知存储于合成语音库中的柯语单词,再用真人柯语语音库和/或合成柯语语音库,相应逐一对该柯语文本的每一柯语单词按照柯语发音语序进行语音匹配,将暂存有与柯语文本被按序所切分成的柯语单词相匹配的柯语发音信号依次传至语音输出模块,柯语发音信号被语音输出模块逐一按序检测、读取后,由语音输出模块中的扬声器依次发出与柯语文本中每一柯语单词相匹配的柯语语音。

本发明是基于计算语言学、人类文化学、社会学、语用学、翻译学及计算机信息处理科学技术的汉柯语双向多媒体电子辞典,基于UNICODE国际标准的汉柯双语编码格式,以实现汉柯、柯汉双向单词输入功能、汉柯单词与文本朗读功能,具有在不同操作系统下利用屏幕取词法获取汉柯字符的功能和对国内外柯尔克孜(语)文字编码进行转换的功能,也具有汉柯语言的多语种界面,对汉柯单词快速检索、模糊检索,可直接输入柯尔克孜文,对辞典词库进行管理,附带辞典设置、辞典工具、辞典附录、在线升级等功能。

本发明提供柯尔克孜语阿拉伯文字输入法,但不依赖其它柯尔克孜文输入法,提高了可用性,提供屏幕取词汉柯双向实时翻译,为使用汉语、柯尔克孜语的用户带来了方便,提供汉柯单词和短语的标准朗诵,是学习汉语、柯尔克孜语的有力工具,具有海量柯尔克孜文语料库和单词、短语解释功能以及柯尔克孜语斯拉夫文字(吉尔吉斯斯坦)和柯尔克孜语阿拉伯文字(中国新疆)之间的转换显示功能,方便其它讲非柯尔克孜语的人员学习柯尔克孜族语言、柯尔克孜民族历史、风俗习惯,为其它讲非柯尔克孜语的人员了解新疆和吉尔吉斯斯坦地理信息和区域、风貌提供了大量实例。

本发明解决了所有以柯尔克孜语言为母语的国内外柯尔克孜人民难于获取现代知识和日常生活中的语言障碍问题,使国内外柯尔克孜语学习者能快速翻译进而获取各种信息,不仅方便柯尔克孜人民学习汉语,而且方便汉族同志和外国人学习柯尔克孜语,是柯尔克孜语、汉语使用者学习汉语、柯语翻译工具,对提高柯尔克孜人民的汉语说写水平有着深远的意义;另一方面对将来汉柯(语)机器翻译辞典库建设,对乌(乌孜别克文)汉、土(土耳其文)汉双向电子辞典及辅助机器翻译系统的开发打下了坚实的基础。

本发明的技术特点是:①提供汉语、柯尔克孜语之间的双向单词翻译服务,在本发明的汉柯电子辞典中输入上述任意一种语言单词可以获得其在另外一种语言中的释义;②提供支持国际UNICODE标准的柯尔克孜文组件式输入法,即用户没有安装任何柯语输入法时,本辞典仍然可以正确输入标准的柯语单词;③在当前主流的Windows系列操作系统(Windows XP\Windows Server\Windows Vista\Windows 7)中,可实现对柯语进行屏幕取词的功能;④使用统计学和语音学以实现对柯语单词和文本的朗读功能,语音朗读标准、清晰,具有较先进的技术特色;⑤提供辞典在线升级、辞典设置、辞典工具、辞典附录等附加功能,可根据用户的需要进行设置;⑥提供友好的多语种辞典界面,通过人性化的设置获得不同语言的辞典界面和方向;⑦实现对输入文字语言自动识别的功能,分析所输入文字,自动对所输入文字进行语种判断,并对其进行单词翻译;⑧汉柯词库内收集有近10万条词汇,同时建立了真人语音库和基于音节切分技术的语音朗读合成库;⑨实现柯尔克孜语斯拉夫文字(中亚-吉尔吉斯斯坦)和柯尔克孜语阿拉伯文字(中国新疆)之间的转换显示功能,即在释义窗口中同时显示上述两种文字形式,从而有效地拓宽本发明的使用范围。本发明的电子词典其结构合理,通用性强,其方法改变原先传统、普通汉语与柯尔克孜语互译的辞典技术,提高汉语和柯尔克孜语相互转译的效率,改进对汉语文字、柯尔克孜语文字进行语音放送的性能。

附图说明

附图是本发明的模块连接示意图及其自动转译汉柯语的方法的总流程示意图。

具体实施方式

一种汉柯电子辞典,如附图所示,由语种识别模块2、检索模块3、检索组合输出模块4、显示模块1、语音识别模块5和语音输出模块6组成,语种识别模块2通过其相应接口连接显示模块1的接口和检索模块3的接口,检索模块3通过其输出端接口对应连接检索组合输出模块4的输入端接口,检索组合输出模块4的输出端接口对应连接语音识别模块5的输入端接口,语音识别模块5通过其输出端接口连接语音输出模块6的输入端接口。

一种汉柯电子辞典自动转译汉柯语的方法,如附图所示,其按序处理的步骤如下:

(Ⅰ)由显示模块1显示(由键盘)所输入的文字,依次使所输入文字混合编排和图文混合排版,构建取词窗口,语种识别模块2利用取词窗口通过屏幕取词的方法,获取与显示模块1显示的所输入文字相对应的输入字符编码区域,将所输入的文字与被存储的UNICODE标准编码字符集(通用字符集:Universal Multiple-Octet Coded Character Set)中的编码字符相比对,判断所输入文字的语种是汉语或柯语,再把已被识别出语种的所输入文字传至检索模块3;注:若语种识别模块2判断出其接收到的所输入文字是汉语拼音文字,则先将所输入汉语拼音文字的字母组合与寄存于存储器内的基础语料库(取词数据库)中的拼音语料库的所有字母组合逐一比对(若所输入汉语拼音文字的字母组合与拼音语料库所存储的所有字母组合不相同或不对应,则不能从拼音语料库中获取与所输入汉语拼音文字发音相同的汉语单字,若所输入汉语拼音文字的字母组合与拼音语料库所存储的某一字母组合相同或相对应,则能从拼音语料库中获取与所输入汉语拼音发音文字对应的汉语单字),以获取与所输入汉语拼音文字发音相同的汉语单字,即从拼音语料库中调出罗列有与上述汉语拼音文字发音相同的候选汉语单字的列表,用户从该列表中选择某一候选汉语单字,将与汉语拼音文字发音相同的某一候选汉语单字传输至显示模块1,由显示模块1显示该某一候选汉语单字,再将与汉语拼音文字发音相同的汉语单字传送至检索模块3,所述的拼音语料库存储有与各个汉语拼音组合字符发音相同的汉语单字(索引)、汉语单词(索引),若语种识别模块2判断出其直接接收到的所输入文字是汉语文字,则直接将该汉语文字传输至检索模块3;

(Ⅱ)检索模块3获取检索方式将被识别出语种的所输入文字与在寄存于存储器的基础语料库中并列存储的汉-柯语料库和柯-汉语料库中所存储的字符进行比对(所述的字符为汉语单字或柯语单词),以从基础语料库中检索出与被识别出语种的所输入文字的字符相同或相对应的字符组合,确认被识别出语种的所输入文字是已被存储在基础语料库中的已知单字或单词,或进一步主动完整汉语单字组合或单词字母组合,若不能从汉-柯语料库和柯-汉语料库中检索出与所输入文字相同或相对应的字符组合-汉语单字或柯语单词,则检索模块3判断被识别出语种的所输入文字是未知的,不能被语种识别模块2确认、接收,所述的汉-柯语料库存储有与各个汉语单字或汉语单词汇所对应的柯语单词,所述的柯-汉语料库存储有与各个柯语单词所对应的汉语单字或汉语单词;

(Ⅲ)语种识别模块2接收检索模块3所检索出的字符组合,并从基础语料库所存储的汉-柯语料库和柯-汉语料库中调出与由检索模块3所检索出的字符组合意思对应的且不同于所输入文字语种的另一语种字符组合-转译成汉语单字、汉语单词或柯语单词,即将柯语单词转译成汉语单字或汉语单词,或将汉语单字或汉语单词转译成柯语单词,再把所输入文字和/或由语种识别模块2从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合通过检索模块3或直接传至检索组合输出模块4;

(Ⅳ)检索组合输出模块4根据所输入文字和/或由语种识别模块2从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合,从基础语料库中并列存储的汉-汉语料库和柯-柯语料库中获取用于解释被检索模块3检索出的字符组合的意思的汉语解释语句,根据斯拉夫文柯语文字与阿拉伯文柯语文字映射表,获取与上述另一语种字符组合意思对应的以斯拉夫字母或阿拉伯字母表达的柯语解释语句(进行文本转换处理),用上述某一语种文字所作出的解释语句必是用所输入文字所属语种的文字作出的解释语句,相应对由语种识别模块2从基础语料库中所调出的字符组合的意思进行解释(如对某一柯语单词用与其意思对应的汉语解释语句进行解释,或者对某一汉语单字或单词用与其意思对应的以阿拉伯字母或斯拉夫字母表达的柯语解释语句进行解释,或者对某一柯语单词用与其意思对应的以阿拉伯字母或斯拉夫字母表达的柯语解释语句进行解释,或者对某一汉语单字或单词用与其意思对应的汉语解释语句进行解释),检索组合输出模块4再将其所检索出的解释语句(汉语解释语句和柯语解释语句)输出至语音识别模块5;例如,所述的汉-汉语料库存储有对每个汉语单字或单词作出解释的汉语词句,所述的柯-柯语料库存储有对每个柯语单词作出解释的柯语词句; 

(Ⅴ)当语音识别模块5判断其所接收的解释语句为汉语解释语句时,语音识别模块5用寄存于存储器内的语音数据库所存储的真人汉语语音库,相应逐一对其所接收的汉语解释语句中的每一汉语单字按照汉语发音语序进行语音匹配,再将暂存有与其所接收汉语解释语句中的汉语单字按序相匹配的汉语发音信号依次传至语音输出模块6,对应于汉语解释语句中每一汉语单字的汉语发音信号被语音输出模块6逐一按序检测、读取后,由语音输出模块6中的扬声器依次发出与其所接收汉语解释语句中的每一汉语单字对应的汉语语音;

当语音识别模块5判断其所接收的解释语句为柯语解释语句且其所接收的柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语单词时,语音识别模块5用语音数据库中所存储的真人柯语语音库,相应逐一对其所接收的柯语解释语句的每一柯语单词按照柯语发音语序进行语音匹配,再将暂存有与其所接收柯语解释语句中的柯语单词按序相匹配的柯语发音信号依次传至语音输出模块6,对应于其所接收柯语解释语句中每一柯语单词的柯语发音信号被语音输出模块6逐一按序检测、读取后,由语音输出模块6中的扬声器依次发出与柯语解释语句中每一柯语单词相匹配的柯语语音;若语音识别模块5判断其所接收的解释语句为柯语解释语句,但不能对该柯语解释语句进行语音匹配时,则推定该柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语文本(即转入文本处理),并调用语音数据库中所存储的合成柯语语音库对柯语文本进行基于音节的语音合成,通过柯语语句单词与音节切分法相应将柯语文本切分成已知存储于合成语音库中的柯语单词,再用真人柯语语音库和/或合成柯语语音库,相应逐一对该柯语文本的每一柯语单词按照柯语发音语序进行语音匹配,将暂存有与柯语文本被按序所切分成的柯语单词相匹配的柯语发音信号依次传至语音输出模块6,柯语发音信号被语音输出模块6逐一按序检测、读取后,由语音输出模块6中的扬声器依次发出与柯语文本中每一柯语单词相匹配的柯语语音。

所述的检索方式为首部检索方式、尾部检索方式或包含检索方式;首部检索方式为:A、检索模块3从左向右按序逐一录入所输入文字中的每个字符,B、将基础语料库(汉-柯语料库和柯-汉语语料库)中所存储的字符组合数据与被录入的所输入文字字符组合相比对,若能从基础语料库中搜索出与被录入的文字字符组合相同的字符,则停止检索,即完成精确匹配出所输入文字的工作;若不能通过首部检索方式从基础语料库中搜索出与所输入文字相同的字符组合,则采用如下的尾部检索方式继续检索所输入的文字;

尾部检索方式为:①检索模块3从右向左(按照人面对的左边、右边)按序逐一录入所输入文字中的每个字符,②同上述首部检索方式的步骤B;若不能通过首部检索方式从基础语料库中搜索出与所输入文字相同的字符,则采用如下的包含检索方式继续检索所输入的文字;

包含检索方式为从任意方向匹配所输入文字的字符组合的检索方式,包括上述首部检索方式与尾部检索方式,检索模块3通过该包含检索方式从基础语料库中搜索出与所输入文字相同的字符,最终完成精确匹配所输入文字的工作。

本发明的检索流程涉及语种识别模块2、检索模块3、检索组合输出模块4和基础语料库,其主要流程为:1)首先,用户通过汉语或柯语输入法输入汉语文字或柯语文字,输入所需要查询的文字,通过输入数据的UNICODE编码,判断所输入文字(源语言单词或文本)的语种(汉语或柯尔克孜语);2)根据用户设置的检索方式判断所输入文字的语种,检索模块3检索出与所输入文字(源语言单词或文本)匹配的汉语和/或柯语单词、文本;3)根据检索模块3对所输入文字检索的结果,从基础语料库中匹配出与所输入文字相同或相应的汉语单词和/或柯语单词意思相同的汉语解释例句和柯语解释例句,并组合生成需要输出的数据。

本发明屏幕取词、翻译流程涉及语种识别模块2、显示模块1、检索模块3和取词数据库(基础语料库),其主要流程为:1)用户输入文字(需要翻译的单词、文本);2) 语种识别模块2通过输入数据的UNICODE编码判断上述所输入文字(源语言单词或文本)的语种(汉语或柯尔克孜语);3)根据语种识别模块2对所输入文字判断出的不同语种,检索模块3从取词汉语库或取词柯语词库(汉-柯语料库和/或柯-汉语料库)中获取与所输入文字相匹配的单词、文本;4)依据检索模块3对所输入文字最终匹配的结果,显示模块1通过文本混合排版技术和图文混合排版技术,构建屏幕取词翻译界面,显示最终翻译结果(汉语词句或柯语词句)。

本发明语音朗诵的流程涉及语种识别模块2、语音输出模块6、检索组合输出模块4和语音数据库,其主要流程为:1)语种识别模块2对其接收到检索组合输出模块4所发出的汉语、柯语解释语句(在屏幕取词环节中所输入的文字)进行语种判断,如果所输入的解释语句是汉语词句,则从真人汉语语音库匹配所输入的汉语单字,如果所输入的解释语句是柯语词句,则继续判断语种识别模块2所接收的柯语解释语句是否为柯语单词,若是所输入的文字为柯语单词,则直接从真人柯语语音库匹配出相同或相应的柯语单词,若语音输出模块6找不到匹配的柯语单词,则将其转入文本处理过程,即如果所输入的解释语句是柯语文本,则利用柯语语句音节切分技术,将柯语文本按照柯语语言特点切分为柯语单词,并将柯语文本中的柯语单词按照柯语的特点切分为音节,从合成柯语语音库匹配出柯语文本每一柯语单词的所有音节,最终组成完整的柯语语音文本;2)通过计算机语音设备检测,对上述柯语文本进行读取并输出、播放。

使用者通过键盘输入方式在屏幕显示的输入框中输入待查询的文字(源语言单词或文本),所输入的文字经过语种识别环节被识别出语言种类(汉语或柯语)后,由检索模块3利用拼音检索法、首部检索法、尾部检索法、包含检索法和精确匹配检索法中的任意一种方法,对所输入的文字与拼音语料库、汉柯语料库、柯汉语料库的单词进行匹配,从基础语料库中检索出与上述所输入文字相对应或相同的待翻译的单词,然后根据检索模块3从基础语料库中所检索出的待翻译的单词,检索组合输出模块4获取与所述待翻译的单词意思相对应的汉语解释语句和柯语解释语句,再通过文本混合排版技术、图文混合排版技术进行编辑,将翻译的汉语解释语句或柯语解释语句组合成为输出的文字数据,显示在(屏幕)结果显示区域内。

使用者通过光标定位方式所输入的待翻译解释的文字(单词或文本),所输入的文字在经过语种识别环节后,语种识别模块2再从常用取词汉语库和常用取词柯语库(汉-柯语料库和/或柯-汉语料库)中检索出与所输入的文字(目标语言或源语言单词或文本)意思相同或相对应的另一语种单词(翻译数据),再通过文本混合排版技术、图文混合排版技术将翻译数据(结果)组合成为输出数据,并以动态方式构建符合输出数据大小的显示界面,显示最终翻译结果。

使用者输入文字(源语言单词或文本)后,所输入文字经过语种识别环节、单词检索确认环节、汉语和柯语转译环节、柯语音节单词切分环节等后,再调用真人汉语语音库、真人柯语语音库和合成柯语语音库,将所输入文字生成相应的汉语或柯语语音文件,语音识别模块5(语音检测设备)读取上述所输入的文字,并通过其扬声器依次按音节发出所输入文字的语音。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号