首页> 中国专利> 语句构件装置和母语读外文并生成世界文及文本转换方法

语句构件装置和母语读外文并生成世界文及文本转换方法

摘要

一种语句构件装置,包括语句构件存储部(101),含有用电子数据形式构成的语句构件的语句构件库;句型库(300),用于存储句型构件,有句型码、多文种句型字段,其包含至少一个记录,同记录内的不同文种舱模语意相同;意群串库(500,502),用于存储意群串构件,有意群码、多文种串字段,包含至少一个记录,同记录内的不同文种意群串语意相同;习语库(600),用于存储小习语构件,有习语码、多文种习语字段,包含至少一个记录,同记录内的不同文种小习语语意相同;意通代码编制部(103),与语句构件存储部(101)相连,用于对语句构件库的每一个记录编制一个意通代码。

著录项

  • 公开/公告号CN102007490A

    专利类型发明专利

  • 公开/公告日2011-04-06

    原文格式PDF

  • 申请/专利权人 刘树根;

    申请/专利号CN200880128636.7

  • 发明设计人 刘树根;

    申请日2008-09-28

  • 分类号G06F17/28(20060101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人杨晓松

  • 地址 516002 中国广东省惠州市东平大道1号江景新苑二区六栋803室

  • 入库时间 2023-12-18 01:56:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-22

    专利实施许可合同备案的生效 IPC(主分类):G06F17/28 专利申请号:2008801286367 专利号:ZL2008801286367 合同备案号:X2023330000484 让与人:嘉善凝溪建设有限公司 受让人:嘉善县天凝蒋家漾旅游开发股份有限公司 发明名称:语句构件制作方法和母语读外文并生成世界文方法 申请日:20080928 申请公布日:20110406 授权公告日:20160921 许可种类:普通许可 备案日期:20230804

    专利实施许可合同备案的生效、变更及注销

  • 2023-08-04

    专利权质押合同登记的注销 IPC(主分类):G06F17/28 授权公告日:20160921 申请日:20080928 专利号:ZL2008801286367 登记号:Y2022330001733 出质人:嘉善凝溪建设有限公司 质权人:浙江嘉善农村商业银行股份有限公司天凝支行 解除日:20230719

    专利权质押合同登记的生效、变更及注销

  • 2022-08-30

    专利权质押合同登记的生效 IPC(主分类):G06F17/28 专利号:ZL2008801286367 登记号:Y2022330001733 登记生效日:20220812 出质人:嘉善凝溪建设有限公司 质权人:浙江嘉善农村商业银行股份有限公司天凝支行 发明名称:语句构件制作方法和母语读外文并生成世界文方法 申请日:20080928 授权公告日:20160921

    专利权质押合同登记的生效、变更及注销

  • 2020-01-10

    专利权的转移 IPC(主分类):G06F17/28 登记生效日:20191223 变更前: 变更后: 申请日:20080928

    专利申请权、专利权的转移

  • 2017-05-17

    专利权的转移 IPC(主分类):G06F17/28 登记生效日:20170428 变更前: 变更后: 申请日:20080928

    专利申请权、专利权的转移

  • 2016-09-21

    授权

    授权

  • 2011-05-25

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20080928

    实质审查的生效

  • 2011-04-06

    公开

    公开

查看全部

说明书

mat="original" lang="zh">

语句构件装置和母语读外文并生成世界文及文本转换方法

技术领域 本发明涉及一种自然语言的处理或转换的装置和方法;特别涉及一种文本转换的 装置和方法; 即语句构件装置、 语句构件制作方法以及基于语句构件的母语读外文的 文本转换方法。 背景技术 计算机语言文字的信息处理代表是机器翻译、是技术难度的至高点。它的操作对 象是文本文件, 由计算机的文字处理技术所产生。 现有的文字处理技术是把各种语言 文字的字符进行编码, 然后利用字符代码 (内码) 生成文本文件。 缺点是如此产生的 计算机文本文件和纸上的文件一样, 只能供各自语种的人们读写、 交流。 因而不同语 种的人们必须借助翻译。 机器翻译如 《自然语言的计算机处理》 冯志伟著, 上海外语教育出版社 1996年 10月出版,其中第八章第一节机器翻译。全文详细阐述了 19世纪 30年代初法国科学 家阿尔楚尼提出用机器来进行语言翻译的想法开始; 到 1946年世界第一台计算机问 世, 同年就开始了机器翻译的研究, 并一时兴旺起来; 1966年 11月美国科学院的语 言自动处理咨询委员会公布了题为 "语言与机器 (ALPAC)" 的报告, 否定了机器翻 译并指出机器翻译遇到了难以克服的 "语义障碍"; 继后机器翻译出现的空前萧条; 1970-1976年复苏; 以至 1976年后的繁荣等等, 洋洋两万言, 最后指出 " 1964年, 美 国 ALPAC报告指出的机器翻译遇到的 '语义障碍' 至今仍然存在, 机器翻译技术至 今似乎仍然没有突破性的进展"。 "机器翻译系统的实用化和商品化问题面临着严峻的 考验"。 大众软件, 2004年第二期, 作者王槊, 采访业界多位专家后报道, 《机器翻译, 路在何方》一文中写道: "目前的机器翻译主要有两种形式, MT和 TM。 MT (machine translation) 就是我们常见的基于规则的机器翻译软件, 其主要用途是为了帮助英 文不好的用户提供翻译参考, 但准确性不高。 MT的关键技术有 4个方面: 单词分析、 语法分析、 意义分析和文理分析。 它的工作过程是, 先把语句分成几个单词, 通过存 放于机器数据库内的电子字典查清词义, 根据语法规则分析语句的意思, 并把它变换 成概念构造, 然后借助语言模型生成目标语言。 尽管从原理上来看, 要实现这一系列 步骤并不困难, 但由于语言的特殊性和多样化, 以及人工智能技术发展水平的限制, 目前要做到不同语种间正确互译是不可能的, 这也是为什么现在的机器翻译软件无法 。

Memory, 翻译记忆), 主要面向专业翻译人员和机构设计, 以翻译记忆和人机交互为 核心, 要求使用者具备独立的翻译能力。 TM的原理是基于数据库, 将翻译过的所有材 料以句子为单位存入数据库。 翻译时系统自动对电子文档进行分析, 100%匹配的句子 可以自动替换, 部分匹配的句子可根据匹配度提出翻译建议, 新句子则通过系统提供 的翻译建议进行人工翻译。 科学研究表明, 翻译中的重复工作量约为 30%, TM翻译软 件使"相同的句子永远不需要翻译第二遍", 从而提高了工作效率。"但 70%还得靠人 工 … 。 最后作者指出: "机器翻译技术本身存在的问题是阻碍其发展的硬伤。 目^ 不仅在中国, 整个世界范围内机器翻译技术都没有很大的突破。 试图用机器通过有限 的规则和语料提高翻译准确性, 在短期内无法实现。 在语言智能化研究理论不成熟的 情况下, MT软件研究在技术上碰到瓶颈,无法解决一个单词在不同语言环境下的词义 选择问题, 同样也无法在复杂多变的语境中正确选择语法规则, 因此, 翻译水平无法 实现明显提高。" 现有技术既然如此, 希望在于另辟蹊径! 发明内容 本发明要解决的技术问题是:

1、 现有计算机的语言文字表达, 对不同语言文字的字、 词、 句表意不对等也不 统一;

2、 现有机器翻译、 文本转换; 其结果可读性差, 不能表达原文本意。 本发明的目的在于克服现有技术的不足,提供①一种语句构件装置及②语句构件 制作方法; 用人机交互的技术手段, 解决现有计算机的语言文字表达, 同样是字、词、 句表意不对等也不统一的技术问题。从而产生贮存于语句构件库的、不同语言字、词、 句表意得以对等和统一的语句构件的技术效果。 本发明的进一步目的是提供③一种基于语句构件的母语读外文的文本转换方法; 解决现有机器翻译、 文本转换, 其结果可读性差, 不能表达原文本意的技术问题; 从 而提高译文或转换文本的可读性, 表意能与原文一致的技术效果。 转换的同时还生成 世界文, 产生可多语种读出的技术效果。 大大改观了现有字处理文本只供本语种人们 读写交流的现状。 本发明解决其技术问题所采用的技术方案是:

〈一〉、 提供一种语句构件装置,包括 CPU、 输入、 输出和存放查询相关索引表的 原有部 102, 其特征在于还包括: 语句构件存储部 101, 含有包括用电子数据形式构成的、 存储了多语种语意对 , : 句型库 300, 用于存储句型构件, 有句型码、 英文句型、 中文句型、 俄文句型字 段, 其包含至少一个记录, 相同语意的句型同处一个记录, 相应文种的句型存储在相 应文种句型字段内, 句型码代表了同一记录内各文种句型字段内的各文种句型的语 ; 舱模库 400, 用于存储舱模构件, 有舱模码、 英文舱模、 中文舱模、 俄文舱模字 段, 其包含至少 个记录, 相同语意的舱模同处 个记录, 相应文种的舱模存储在相 应文种舱模字段内, 舱模码代表了同一记录内各文种舱模字段内的各文种舱模的语 ; 意群串库 500、 502, 用于存储意群串构件, 有意群码、 英文串、 中文串、 俄文串 字段, 其包含至少一个记录, 相同语意的意群串同处一个记录, 相应文种的意群串存 储在相应文种串字段内, 意群码代表了同一记录内各文种串字段内的各文种意群串的 语意; 习语库 600, 用于存储小习语构件, 有习语码、 英文习语、 中文习语、 俄文习语 字段, 其包含至少一个记录, 相同语意的小习语同处一个记录, 相应文种的小习语存 储在相应文种习语字段内, 习语码代表了同一记录内各文种习语字段内的各文种习语 的语意; 意通代码编制部 103, 与语句构件存储部 101相连, 用于接收构件添加部 106的 通知, 仅当上述四个库任何之一出现新记录时, 把当前库代表数作高位字加上当前库 记录号生成意通代码, 并填入当前库的某某码字段, 作为语句构件统一的双字节定长 的多语种语意互通的意通代码, 意通代码对于当前库当前记录内各语种构件的同一语 意表示是唯一的; 构件读出部 104, 与语句构件存储部 101相连, 用于接收读出命令, 以意通代码 所含数段确定某库某记录, 并到相应库相应记录读出所需要的语种构件; 构件匹配给出部 105, 与语句构件存储部 101相连, 用于接收匹配命令, 根据所 给语种的句子或句舱内容以及当前操作点的指引, 在相应构件库相应语种索引字段查 询匹配, 给出匹配的所需要的语种构件或返回无匹配信号; 构件添加部 106, 分别与语句构件存储部 101、 意通代码编制部 103相连, 用于 接收添加新构件命令, 在查询证实相应构件库没有相同构件后, 将新构件添加到相应 构件库的相应语种构件字段内, 当给一个新记录添加新构件时, 同时发信息通知意通 代码编制部 103; 构件库操作控制、 接口部 107, 通过构件读出部 104、 构件匹配给出部 105、 构 件添加部 106与语句构件存储部 101相连,接收基于本语句构件的各种应用的调用或 , , ,

其它应用装置相连接。 所述的语句构件装置中的语句构件: 语句构件通过专家操作、人机交互的方式,来自剖析比对双语对训练样本语料得 到; 语句构件的另一个来源是用户的反馈信息经专家审核后再加入; 语句构件是用于组装语言句子的另部件、或对句子进行编码的标准件,包括如下 四种:

①句型构件 201, 301, 用于构成句子的基本结构框架, 代表了该类句子基本语意 类属, 也决定了该类句子所含句舱的位次和个数, 并包揽了该类句子的较复杂的语法 现象;

②舱模构件 202, 401, 用于构成复杂句舱的基本结构框架, 代表了该类句舱基本 语意类属, 也决定了该类句舱所含舱眼的位次和个数, 并包揽了该类句舱的较复杂的 语法现象;

③意群串构件 501、 503, 是由意群串充当的构件, 用于填充简单句舱 203〜204 或舱眼 205〜207 的构件, 简单句舱与舱眼是上、 下位概念而大小一样, 都是除不表 意虚词外不超过三个意群串;

④小 >J语构件 601, 由过于简短不足以分出句型、 句舱的句子充当小 >」语构件, 用于直接构成简短的句子。 所述的语句构件装置中的语句构件库: 库内所包括文种, 除英文、 中文、 俄文外, 每增加一个文种, 首先应将句型库、 舱模库、 意群串库、 习语库分别依次各增加一个某文句型、 某文舱模、 某文串、 某文 习语字段, 新加文种构件只有与已有文种构件语意相同的才能填加在同一个记录上; 提取其中句型库、 舱模库、 意群串库、 习语库中的某文句型、 某文舱模、 某文串 或某文习语和某某码两个字段构成某某语言库、 第一语言库或第二语言库, 用于语言 翻译或文本转换。

〈二〉、 提供一种语句构件的制作方法, 利用相同内容的双语或多语种文字版本 的语料作为训练样本, 利用人机交互的方式进行句型、 句舱两个层面的剖析比对, 得 出字、 词、 句表意得以对等和统一的语句构件, 包括如下步骤:

S1. 利用相同内容的双语或多语种文字版本的语料作为训练样本, 每轮选 A、 B 双语作为一个样本对, 其中 A语分配给拼音文字或已经比对过的文种, B语可以分配 ; 第一轮双语对训练样本的剖析比对,其中双语对样本的 A语为英文, B语为中文, 从第二轮开始新语对中必须其一是已经进行过剖析比对的, 如当加入俄文时, 只能取 中俄或英俄语料作为双语对训练样本, 第二轮剖析比对的双语对样本中 A语应是已比 对过的中文或英文, B语应是新加的俄文; 每一轮的训练语料样本应大到新增句型 /句例比 < 1%后方可考虑增加新语种、 进 行次 轮的剖析比对, 另 方面, 可以根据训练样本语料的行业来源或应用范围来源 来标记、 划分句型库、 舱模库、 意群串库、 习语库来构成相应分库, 用于行业或专用 版本;

52.句型层面剖析比对, 读取双语样本句对, 划分出句型、 句舱, 把句型作为句 型构件存入句型库, 把不足以分出句型、 句舱的小习语作为小习语构件存入习语库;

53.句舱层面剖析比对, 把已经划分出句型、 句舱的样本句例对, 依次取出句舱 内容, 进一歩划分出舱模、 舱眼, 把舱模作为舱模构件存入舱模库, 把经过意群对齐 的舱眼或简单句舱的内容以意群串为单元作为意群串构件存入意群串库; 处理完所有 句舱, 接着下一个的双语样本句对处理、 接续执行步骤 S2。 所述语句构件的制作方法中的句型层面剖析比对的步骤 S2 进一步包括如下步 骤:

521.读入一个双语样本句对;

522.调用配句型子程序查找句型库返回 A、 B语匹配句型, 若否、没有匹配句型, 执行步骤 S23, 若是、 有匹配句型执行步骤 S26 ;

523.以当前双语样本句对为例制作新句型, 弹开一窗口, 上横行显示 A语句、下 横行显示 B语句, 横行下再显示挖句舱、 存句型两个命令按钮, 并提示专家点击 、 B 语例句的待挖句舱的首尾点, 挖句舱计数器 N=0 ;

524.当接收到挖句舱命令按钮被点击后, N=N+1, 检查 A、 B语是否都被点击两个 点以及这两个点是否有效, 若否, 提示重作, 如果点击正确并且有效, 将 、 B语句 两点之间的内容挖去并填入 " [N] ", 该轮挖句舱结束,下一轮重复步骤 S24再挖下一 个句舱;

525.当接收到存句型命令按钮被点击并且 N ^ l, 表示挖句舱制作新句型操作完 毕, 清除步骤 S23、 S24的显示, 把两个新句型作为句型构件分别写入句型库 A文句 型、 B文句型字段, 如果接收到存句型命令按钮被点击、 但 N=0, 表示当前双语样本 句对不足以分出句型、 句舱而被判定为小习语, 清除步骤 S23、 S24 的显示, 把两个 小习语作为小习语构件分别写入习语库 A文习语、 B文习语字段; 、 「 作为已经划分出句型、 句舱的样本句例对存盘备 S3步骤读取, 再执行歩骤 S21。 所述语句构件的制作方法中的句舱层面剖析比对的步骤 S3 进一步包括如下步 骤:

531.读入一个由 S26步骤存盘的已经划分出句型、 句舱的样本句例对;

532.取句舱,依次取出已经划分出句型、 句舱的样本句例对当中的一个句舱作为 当前句舱, 开窗口一上部显示 A、 B语样本句例, 下部显示4、 B语当前句舱内容; 同时,把 A语当前句舱以词串为单元切分并依次填入参考表 A语字段, 再依次取 出一个词串查找意群串库的 A文串字段, 找到后取出同记录的 B文串字段内容, 如果 该 B文串内容在 B语当前句舱中含有, 把 B文串内容填入参考表 B语字段, 不含有让 它为空; 如果意群串库的 A文串字段有相同的记录,相应参考表也多一条 A语字段有重的 记录备选, 作完整个参考表, 开窗口二显示参考表、 组复词命令按钮以及可组复词操 作提示; 接受专家点击参考表并在被点记录标志字段作标志; 当组复词命令按钮被点击并且参考表有连续记录被点击,将参考表中有标志记录 的 A语字段内容以 " _ "相连组成复词, 并把有标志记录合并成一条记录, A语字段填 入该复词, B语字段以相等语意的词串填写;

533.判断当前句舱是否简单句舱, 若是执行步骤 S37, 若否、 进一步查询舱模库 判断当前句舱是否含有舱模, 若否、 不含舱模执行步骤 S34, 若是、 该所含舱模作为 当前舱模并对号入座地纳入当前句舱内容,执行步骤 S36 ;

534.开窗口三作为可编辑窗口,将当前双语句舱内容再显示,接受专家以此为基 础编写舱模, 还显示存舱模命令按钮;

535.当存舱模命令按钮被点击,并且可编辑窗口已经被编辑过,新编舱模也符合 格式要求,将新编 A、B语舱模作为舱模构件存入舱模库 A文舱模、 B文舱模字段,同时, 将当前句舱内容对号入座地填入当前舱模, 或填入新编舱模作为已经划分出舱模、 舱 眼的复杂句舱显示;

536. 依次取出一个舱眼的内容, 接续执行步骤 S37 ;

537. 意群对齐, 在第二个窗口参考表下显示对齐确定命令按钮, 参考表接受专 家按实例延伸或增补词义、 不改变原有字、 单词的前提下加减串长度、 粘带附随字、 词形变化增补词义项等意群对齐的修改, 或优选记录; , 、

已成意群串,然后逐记录地把 A、 B语字段内容作为意群串构件存入意群串库的 A文串 或 B文串字段;

S39.如果当前操作的是舱眼, 并且当前句舱还有舱眼没有操作, 执行步骤 S36 直到作完当前句舱的所有舱眼, 再判断当前已经划分出句型、 句舱的样本句例对中是 否还有未处理的句舱, 是, 执行步骤 S32继续处理句舱, 否, 全部句舱处理完毕, 执 行步骤 S31, 进行下一轮句对操作。

〈三〉、 提供一种基于语句构件的母语读外文方法, 包括如下步骤:

54. 界面, 由用户指定母语和源语(外语,下同)各是构件库所含的哪一个文种, 把屏幕分成上、 中、 下或前、 中、 后三个窗口, 中部窗口用于显示当前操作句以及操 作中的相关信息, 下或后部窗口用于显示源语待读文本, 上或前部窗口用于显示已读 的母语文本, 此外, 在提示行显示悔操作、 存盘退出等命令按钮以及一、 一移词序按 钮, 或把它们作成浮条紧随中部下或用户可移;

55.源语句读入, 读入源语一个句子作为当前句显示在中部窗口, 母语文本显示 尾加已处理的前一句内容, 源语文本显示减当前句内容;

56.转换操作, 利用四个语句构件库对当前句通过查表得出外、 母语相应构件和 意通代码的转换操作、 给出同记录的母语字段内容;

57. 句确定, 如果当前句的全部句舱处理完毕, 查询反馈缓存区和命令按钮: 当反馈缓存区不为空, 将反馈缓存区的信息加上源语、母语、 当前源语句子等信 息作成电子邮件反馈到支持网站, 清空反馈缓存区, 在世界文缓存区存入 "反馈句" 标志; 当悔操作命令按钮被点击,根据用户点击的欲悔词串,取出悔选择缓存中的相应 内容让用户重选词串并作相关修改; 当接收到存盘退出命令时, 将世界文缓存区的内容存盘为世界文, 文件名 =源语 文件名 . SJW, 如果源文未完,文件头中记下源文偏移; 当悔操作、 存盘退出命令按钮都没有被点击时, 确定当前句的给出, 执行步骤

S5。 所述一种基于语句构件的母语读外文方法,其中利用四个语句构件库对当前句通 过查表得出外、 母语相应构件和意通代码的转换操作、 给出同记录的母语字段内容的 歩骤 S6进一歩包括如下歩骤:

S601.判小习语, 以当前句查询习语库的源语习语字段, 若无, 没有找到, 执行 , , 将同记录的习语码读入世界文缓存区, 然后执行步骤 S5 ;

5602.调用配句型子程序, 以当前句查询句型库的源语句型字段, 若查到一个匹 配的句型, 执行步骤 S603 , 如果查到多个匹配句型, 在中部窗口下部显示相应的母语 句型, 接受用户选定后再执行步骤 S603 , 如果一个匹配的句型也没有, 存句型库代表 数于反馈缓存区;

5603.给出同记录的句型码、 母语句型以及源语句型, 将母语句型着重显示在中 部窗口的上部,把源语句子对号入座地套入源语句型,附注式显示在该窗口母语下方, 并把句型码读入世界文缓存区;

5604.取句舱, 从左到右在中部窗口标示母语句型中的当前句舱, 存入当前句舱 标号于世界文缓存区, 同时标示和取出源语相应句舱内容作为当前句舱内容, 判断当 前句舱内容是否属于简单句舱, 若否, 执行歩骤 S605 , 若是执行步骤 S608 ;

5605. 查配舱模, 以当前句舱内容查询舱模库的源语舱模字段,若查到一个匹配 的舱模, 执行步骤 S606,如果查到多个匹配舱模,向下扩展中部窗口,在扩展部显示相 应的母语舱模,接受用户选定后再执行步骤 S606,如果一个匹配的舱模也没有,存舱模 库代表数于反馈缓存区;

5606. 给出同记录的舱模码、母语舱模以及源语舱模,将母语舱模着重显示在中 部窗口的扩展部, 把源语句舱内容对号入座地套入源语舱模, 附注式显示在该窗口母 语舱模的下方, 并把舱模码读入世界文缓存区;

5607.取舱眼, 以母语舱模为准从左到右, 在母语舱模上逐个标示当前舱眼, 存 当前舱眼标号于世界文缓存区, 同时标示和取出源语相应舱眼内容, 执行步骤 S608 ;

5608. 词义确定, 从左到右读出源语的简单句舱或舱眼中的一个词串, 查询意群 串库的源语文串字段,若只查到一条相同词串,执行步骤 S609,若查到多条相同词串, 分别取出它们的同记录母语串字段内容,备份于悔选择缓存,并显示在已扩展的中部 窗口下部,接收用户选定后再执行步骤 S609,如果 条相同的词串也没有,存当前源语 词串于反馈缓存区;

5609.取出当前记录的母语串字段内容填入到当前母语句舱或当前母语舱眼, 取 出意群码存入世界文缓存区; 继续执行步骤 S608 ,直到当前简单句舱或当前舱眼操作 完毕; 根据个性丢失表的信息进行当前句舱或舱眼的个性丢失补偿操作; 再根据母语词序表的信息纠正当前句舱或舱眼的母语词序; 最后查询→、一移词序按钮, 当→按钮被点击将当前句舱或舱眼用户所点击词串 ,

词串之前, 同时将移后的词序加入母语词序表备用, 后续执行步骤 S610 ;

S610. 判断, 如果当前句舱还有舱眼未处理, 执行步骤 S607 , 若否而当前句子 还有句舱未处理, 执行步骤 S604, 若当前句子所有句舱全部处理完毕, 后续步骤 S7。 所述的一种基于语句构件的母语读外文的方法: 其中作成电子邮件反馈到支持网站, 当支持网站接收到来自用户的反馈邮件时, 由专家实时处理后,新构件加入相应构件库,并将新构件及相关信息实时反馈给用户, 并在用户的参与下替换原 "反馈句"标志; 其中将世界文缓存区的内容存盘为世界文, 是在用户利用母语读外文的过程中, 世界文缓存区被同时实时地存入了句型码、 习语码、 舱模码、 意群码等构件代码, 以 及句舱标号、 舱眼标号等,将它们存盘生成世界文,利用母语直接阅读外文,读后还生 成了世界文, 一篇外文只要一人读过, ,后面的千千万万人就可以读世界文了,读世界 文比母语读外文更快捷、 不用干预,语意准确,读出文种用户自选,世界文的多语读出 过程只是译码过程,具体步骤是:

①依次逐个取出代码;

②用开关语句将代码分类分别处理;

③其中如果是句舱标号、 舱眼标号, 用以指示当前句舱或当前舱眼;

④把句型码、 >」语码、 舱模码、 意群码分解为某库某记录号, 给出某库、 某记录 的某读出文种字段内容, 如果是意群码则按指示给出到当前句舱或当前舱眼;

⑤接续执行①直到文本结束。 所述的一种基于语句构件的母语读外文的方法, 其实是基于语句构件的应用之 一, 参照其中利用四个语句构件库对当前句的编码步骤、 世界文读出的译码步骤, 可 以产生多种基于语句构件的应用系统: 基于语句构件的世界文生成的方法系统,用于将传统文本转换成世界文, 继后可 以进行多语种读出; 基于语句构件的文本转换方法,用于将某源语文本转换成某目语文本给出, 或转 换成多文种给出; 基于语句构件的机器翻译方法,用于将某源语翻译成目语给出,或翻译成多语种。 与现有技术相比, 本发明的有益效果是:

1、 语句构件装置的语句构件存贮部设有四个库, 分别存贮句型、 舱模、 意群串 , ,

某某码字段, 用以编制意通代码。 意通代码不但唯一地代表了同记录同类构件的共同 语意, 而且可以分解为某库某记录。 这样的设计得到构件与构件之间可以直接转换或 通过意通代码转换而语意不变的有益效果。

2、 句型、 舱模构件为句子提供了一个框架, 包揽了复杂的语法, 决定了所含句 舱及舱眼的位次, 这就避免了现有技术利用人工智能作句法分析、 语法分析之苦。 有 效益于结果表意能与原文一致。

3、 根据训练样本语料的行业来源或应用范围来源来标记, 分出相应分库, 适宜 于行业或专用版本, 并且设有支持网站;有益于用户细分,有更适应用户的有益效果。

4、 所述语句构件的制作方法的步骤特征, 必然产生不同语言文字的字、 词、 句 的表意得以对等和统一而成为语句构件的有益效果。

5、 所述语句构件库的特征, 比现有技术机器翻译的电子词典、 规则库对翻译质 量、 文本转换质量的贡献更大更可靠; 必然使基于语句构件的各种应用, 产生译文或 转换文本质量提高的有益效果。

6、 母语读外文方法是基于语句构件的应用之一。 能用母语直接阅读外文, 人人 可读。 而且读后还生成世界文; 这样, 一篇外文只要一人读过, 后面的千千万万人就 可以读世界文——不必干预地多语种母语读出; 这一直是人们所梦昧以求的。

7、 设有网站支持能保证基于语句构件的产品的应用, 并建立了用户联系, 对服 务质量以及版本升级具有益的效果。 附图说明 图 1是语句构件装置结构示意图; 图 2是语句构件示意图; 图 3是句型库示意图; 图 4是舱模库示意图; 图 5a是意群串库 (英单串) 示意图; 图 5b是意群串库 (英复串) 示意图; 图 6是习语库示意图; 图 7是句型层面比对流程图; 图 8是句舱层面比对流程图; · ; 具体实施方式 本发明人认为, 对于计算机语言文字信息处理来说, 语法、 语音、 词汇不同不是 难题, 关键是不同自然语言的字、 词、 句表意不对等,也不统一; 机内表达亦然,只好 让计算机要象人一样理解分析它, 致使 " "语义障碍 "至今仍然存在,翻译出来的结果 往往令人啼笑皆非"。 句型构件理论 (本发明人的发现, 末公开): 我们明白, 电脑还不能象人脑一样理解语义; 电脑之长在于存贮和搜索。人脑正 好与电脑相反, 能理解语义, 但存贮和搜索能力都远远不及电脑。 人脑与电脑有着很 好的互补, 但能否实现很好的互补, 有懒于语言文字在计算机内的表达。 非常庆幸, 自然语言的本质就是表意,并且所表之意人类互通。各种语言文字都由字符组成词汇, 词汇组成句子, 句子组成文章; 其本质属性是: 句子是表达完整语意的基本单元; 不 同语言文字的句子可以表达相同的语意。 自然语言是整个人类社会发展的产物。 人类 产生语言文字的时候, 由于时空的隔离, 人们被分散在许多独立的社会里生活; 语言 文字也在这许多独立社会里, 在各自独立体系内缓慢演变和发展。 正因为各种语言文 字都在各自的独立体系内缓慢地演变发展而来。 不同语言文字之间, 语音不同, 语法 不一样, 词汇字符更是形形色色。 这也就造成了不同语言文字之间字、 词、 句表意不 对等也不统一。 假如语言文字在计算机中的表达 (表示), 字、 词、 句表意能够对等和 统一; 不同语言文字之间的翻译和转换就不是什么难事了。 如何才能使不同语言文字 之间的字、 词、 句表意能够对等和统一呢? 本发明人从句型着手研究, 不是语法书上的句型, 是便于计算机操作的句型。经 过多年的探讨, 得出语句构件理论。 这里把语句构件论所涉及的主要论断、 与本发明 有关的、 具有特定意义的概念定义和解释如下: 句子——在自然语言里,表达完整语意的基本单元称为句子; 不同语言文字的句 子可以表达相同的语意。句子可分为句型、句舱两部分,一个句型至少包含一个句舱。 句型——出自一类句子的抽象, 在句子中相对稳定, 体现句子基本语意及类属; 构成该类句子基本结构框架部分称句型。句型体现句子基本语意及类属是面向全人类 的、 跨语种的; 而其基本结构框架是面向具体自然语言的, 并包揽着自然语言复杂、 个性化的语法现象。 句舱——镶嵌在句型这个基本结构框架上的那些灵活的可替换部分称为句舱。句 舱接受句型的选择和制约; 句舱可用意群串填充或替换, 形成丰富多彩的、 具体的句 子。 句舱个数、 其语意内容是面向全人类的、 跨语种的; 但其在句型基本结构框架中 的位置、 次序和用以填充的意群串是面向具体自然语言的; 句舱即使有语法现象也极 句型句舱举例解释 (#示行号):

1# 只要会句型 (01074) 2个舱

2# 只要你 {1}, 你就会 {2} 。 1{坚持不懈} 2{成功 }

3# {1} and you will {2} . 1 {Persevere} 2 {succeed}

4# ECJIH {1}, TO {2} . 1 {BbmacTaHBaeTe} 2{6y eTe c ycnexoM}

5# 略 (其它语种)

6# 象一句型 (00892) 4个舱

7# {1}象 {4}一样 {3} {2}吗? 1{约翰}4{亨利}3{努力}2{工作}

8# Does{l} {2}as{3}as{4}? 1 {John} 2 {work} 3 {hard} 4 {Henry}

9# {1} {2} τακ{3} κακ {4} 1 {PaGoTaeT} 2{¾>KOH} 3{ycepHo} 4{ΓεΗΐΐΗ}

10# 略 (其它语种)

11# 的高句型 (00922) 3个舱

12# {2}的 {1}高于 {3} 。 2讓 } 1醒 } 3{红宝石 }

13# The {1} of {2} is above {3} • 1 {price} 2 {wisdom} 3 {rubies}

14# {1} {2} BMine {3} . 1{CTO ocTb} 2{MyApocTH} 3{py6nna}

15# 略 (其它语种)

上例① 1#6#11#三行各表示三个句型的表示基本语意和类属,面向世界、跨语种部>

② 2〜5#、 7〜擺、 12〜15#表示三个句型的结构框架, 是面向具体自然语言的。 每行的左前部分是句型的框架结构,花括号内是句舱;右后部分是相应句舱及内容例。 其中 2#7#12#面向中文; 3#8#13#面向英文; 4#9#14#面向俄语; 5#10#15#面向其它语 种等。

③上述举例花括号内或其前面的数字为句舱号。 句舱的个数 (如 1#有 2个舱、 6#有 4个舱), 和各句舱表示的语意是面向世界、 跨语种的; 而其在句型框架结构中 的位置、次序、用以填充的意群串是面向语种的(如 7〜9#中的 {2}在中英俄文句型内 的位次不同; 填充的意群串分别是: 工作 、 work 、 JI >κ 0 H )。 , ;

上述就是句型、 句舱的定义和解释的简洁举例。 句舱由意群统领的意群串填充或组成 (也可初步近似地理解为由词串填充或组 成)。 但句舱的大小有较大差别。 最小的句舱只包含一个意群串; 最大的句舱可以包 含一个从句或分句。 我们把句舱分为简单句舱和复杂句舱两种: 意群——意群是自然语言的字、 词、 词组或短语之 "意"的对等和统一; 是人类 思维活动的基本单元。 意群无语种之限,属 τ全人类; 也随人类杜会发展而代谢着。 意群串——意群在语言文字里相应的表示称意群文字串, 简称意群串。意群串分 单串、 复串两种; 只含有一个原有词串的为单串 (如图 5a中的英文串); 由两个或两 个以上原有词串组成, 并用 "_ "相连为复串 (如图 5b中的英文串)。 简单句舱——除不表意虚词外不超过三个意群串的句舱称简单句舱(如图 2所标 203〜204)。 英文如 "a an the in on to and"等不表意时忽略不计; 中文 的量词同样不计。 其它语种如此类推。 不同语种之间, 这三个串只要求有相应的、 语 意相同的串就可以, 不要求它们前后次序的一致。 复杂句舱——大于简单句舱, 含有舱模的句舱称复杂句舱。 上文所列举例句的句舱都属于简单句舱。 下面这个例句含有复杂句舱:

1 {the fisherman} consents to 2 { return the_f eather_suit} , on condition that 3 {fairy dance and play heavenly music for him} . 在 3 {仙女为他跳舞并演奏天上的乐曲 }的条件下, 1 {渔夫 }答应 2 {归还羽衣}。 本例句舱 1、 句舱 2都是简单句舱, 句舱 2英文含复串; 句舱 3大于简单句舱, 含有舱模, 属于复杂句舱。 舱模和舱眼——进一步剖析复杂句舱的内容;得出如同句型的框架结构部分称舱 模; 镶嵌在舱模框架结构上的可替换部分称舱眼。 句舱和舱眼是上、 下位概念; 但简 单句舱和舱眼的大小相等, 同样是除不表意虚词外不大于三个意群串。 如上例句船 3 {fairy dance and play heavenly music for him} 3 {仙女为他 跳舞并演奏天上的乐曲} 利用句型理论剖析,可得出舱模:

(00205) {l} + {2} +and+ {3} +for him

{ 1 }+为他 +{2}+并 +{3 } 其中(00205)是舱模号; 这个舱模包含 3个舱眼, 三个舱眼的内容都不大于三个 意群串: 3 {1 {fairy} 2 {dance} and 3 {play heavenly music} for him}

3 {1 {仙女}为他2 {跳舞}并3 {演奏 天上的 乐曲 } } 、 。 . i

do? 您好! Get away ! 滚开! "等等。 语句构件——语句构件是不同语言文字之间, 字、 词、 句表意的对等和统一。 根据自然语言之表意人类互通,剖析比对多语句对; 得出表意对等和统一的句型、 舱 模、 意群串和小习语等语句构件。 经建库编码后的语句构件可以是组装句子的另部件 或对句子进行编码的标准件。 语句构件包括句型构件、 舱模构件、 意群串构件和小习 语构件。 意通代码——面向多语种, 语意相等、 互通的语句构件的统一编码称意通代码。 世界文——由意通代码生成, 体现多文种语意互通, 并可进行多文种读出或文本 转换特殊的文本文件, 这种特殊的文件有望通用于世界而称世界文。 句型构件理论简化了自然语言的复杂性、又适应它的灵活性; 并化解它们之间语 法不一致难题。 然而, 我们把 语法分析、 语义理解分配给人脑。 组织专家根据句型 原理, 对句子进行句型、 意群串两个层面的语意剖析、 比对整理。 这些需要理解的艰 难的也是一劳永逸的事由人脑完成。 同时 把经常性的、 单调、 繁琐的记忆、 搜索、 匹配等工作交给电脑。 让计算机提供一个便捷的操作的平台, 利用人机交互的形式, 让人脑、 电脑能够很好地互补。 把剖析、 比对过程中产生的句型、 舱模、 意群串和小 习语等语句构件建库保存, 并统一编制意通代码, 如此产生语句构件库。 语句构件库存贮的是语句构件。 这些语句构件, 是多种语言文字之间表意得以对 等的、 可以组装、 拼接成句子的(图 2)。 我们可以利用这些构件组装句子; 也可以把 句子利用这些构件来编码, 利用与它们相匹配的意通代码生成世界文等。 在这过程中 计算机只要做简单的查表、 判断; 编码或者译码等操作就可了。 基于语句构件进行自 然语言的翻译、 转换; 或者文本转换等; 得到的译文或所转换出来的文本不但可读性 好, 而且表意能与原文一致。 下文参照附图、 利用实施例将本发明的内容进一步说明如下: 一、 一种语句构件装置 图 1是语句构件装置结构示意图。如图 1所示, 语句构件装置包括: 语句构件存 储部 101、 原有部 102、 意通代码编制部 103、 构件读出部 104、 构件匹配给出部 105、 构件添加部 106和构件库操作控制、 接口部 107等七个部件:

( )语句构件存储部 101, 是本装置的中心部件。 含有用电子数据形式构成的、 存 储了多语种语意对等的语句构件的二维数据库表。 它们是句型库、 舱模库、 意群串库 和习语库 (参附图 3〜6 ) 四个语句构件库:

1、 句型库 300, 用于存储句型构件, 有句型码、 英文句型、 中文句型、 俄文句 。 ,

种的句型存储在相应文种句型字段内 301。 这句所述文种句型实际是指句型的框架部 分, 是面向各自然语言的。 其中的花括号表示句舱, 中间的数字是该句舱的编号, 句 舱由意群串填充, 句舱在句型中的位置、 次序以及填充的意群串都是面向各自然语言 的; 从图 3的库中内容 301可以看出, 同一个句舱, 其标号一样但它在各语种句型中 的位置、 次序并不一致。 句型码字段存放句型码, 句型码代表了同一记录内各文种句 型字段内的各文种句型的语意。 句型体现该类句子基本语意及类属是面向全人类的、 跨语种的; 它所包含的句舱个数、 句舱语意都是面向全人类, 跨语种的; 面向人类, 跨语种的表示就是句型码。 也就是说, 句型码代表句型语意, 影射了各文种句型; 各 文种句型又可以通过句型码影射另一个文种句型。 至于语法是属于各自然语言的, 句 型的框架部分包揽着自然语言复杂、 个性化的语法现象, 然而句舱即使有语法现象也 极为简单了。

2、 舱模库 400, 用于存储舱模构件, 有舱模码、 英文舱模、 中文舱模、 俄文舱 模字段, 如图 4所示。 其包含至少一个记录, 相同语意的舱模同处一个记录, 相应文 种的舱模存储在相应文种舱模字段内 401。 舱模是复杂句舱的框架结构部分, 是面向 各自然语言的。 其中的方括号表示舱眼, 中间的数字是该舱眼的编号, 舱眼也由意群 串填充。 舱眼在舱模中的位置、 次序以及填充的意群串都是面向各自然语言的; 从图 4的库中内容 401可以看出, 同一个舱眼, 其标号一样但它在各语种舱模中的位置、 次序并不一致。 舱模码字段存放舱模码, 舱模码代表了同一记录内各文种舱模字段内 的各文种舱模的语意。 舱模的基本语意, 是面向全人类的、 跨语种的; 它所包含的舱 眼个数、 舱眼语意都是面向全人类, 跨语种的; 其表示就是舱模码。 也就是说, 舱模 码代表舱模语意, 影射了各文种舱模; 各文种舱模又可以通过舱模码影射另一个文种 舱模。 至于句舱内的语法也是属于各自然语言的, 舱模包揽着自然语言的语法现象, 然而舱眼即使有语法现象也极为简单。

3、 意群串库 500、 502, 用于存储意群串构件, 有意群码、 英文串、 中文串、 俄 文串字段, 如图 5a-b所示。 其包含至少一个记录, 相同语意的意群串同处一个记录, 相应文种的意群串存储在相应文种串字段内 501、 503。 意群串是句舱或舱眼的内容, 句舱与舱眼是上下位概念, 句舱分简单句舱和复杂句舱两种, 复杂句舱抽出如同句型 的框架结构后就是舱眼。句舱和舱眼是上、下位概念;但简单句舱和舱眼的大小相等, 同样是除不表意虚词外不大于三个意群串。 拼音文字的意群串有单串复串两种, 单串 即一个原有词串 501, 复串是由多于一个原有词串, 并以 " _ "相连而成 503。 意群码 字段存放意群码, 意群码代表了同一记录内各文种意群串字段内的各文种意群串的语 意, 是面向人类, 跨语种的; 各文种意群串是面向各自然语言的。 也就是说, 意群码 代表意群串的语意, 影射了各文种意群串; 各文种意群串又可以通过意群码影射另一 个文种意群串。 , , 、 、

习语字段, 如图 6所示。 其包含至少一个记录, 相同语意的小习语同处一个记录, 相 应文种的小习语存储在相应文种习语字段内 601。 习语码代表了同一记录内各文种习 语字段内的各文种小习语的语意。 也就是说, 习语码代表小习语的语意, 影射了各文 种小习语; 各文种小习语又可以通过习语码影射另一个文种小习语。 上述四个库的结构强调只有相同语意的同类构件才同处一个记录,同一记录又设 计了某某码字段, 用以编制意通代码。 意通代码与同记录的同类构件的相互影射。 这 样的结构保证了构件与构件之间可以直接转换或通过意通代码转换而语意不变; 也就 是说, 不同语种之间可以借此进行相互转换。 上述四个库之间的关系是平列的, 它们 互不干预又共处语句构件存贮部之中。 都要接受其它部件的操作或控制。

(二)原有部 102, 存贮有关上述四个库的索引文件; 也包括原有 CPU等。

(3意通代码编制部 103, 分别与语句构件存储部 101, 意通代码编制部 103相连。 仅当上述四个库任何之一出现新记录时, 把当前库代表数: 例如习语库 =FF00H、 句型 库=?00011、 舱摸库 =EF00H、 意群串库 =0001H (也是这四个库的库标、 数值段段标; 数 段的起点, 止点即下一个库标数 -1 )作高位字加上当前库记录号合成意通代码; 并填 入当前库的某某码字段, 作为语句构件统一的双字节定长的多语种语意互通的意通代 码。 意通代码对于当前库、 当前记录内各语种构件的同一语意的代表是唯一的;

(四)构件读出部 104, 与语句构件存储部 101直接相连, 用于接收读出命令, 以意 通代码所含数段标确定某库某记录, 即意通代码数一最小库标数 =最小库标数所指库 的记录号。 然后到相应库相应记录读出所需要的语种构件。

©构件匹配给出部 105, 与语句构件存储部 101直接相连, 用于接收匹配命令。 根据所给语种的句子或句舱内容以及当前操作点的指引, 在相应构件库相应语种索引 字段查询与其相匹配的记录, 给出匹配的所需要的语种构件。 如没有匹配记录则返回 无匹配信号。

(六)构件添加部 106,与语句构件存储部 101直接相连。用于接收添加新构件命令, 在查询证实相应构件库没有相同构件后, 将新构件添加到相应构件库的相应语种构件 字段内。 当给一个新记录添加新构件时, 同时发信息通知意通代码编制部 103。

(七)构件库操作控制、 接口部 107, 通过构件读出部 104、 构件匹配操作部 105、 构件添加部 106与语句构件存储部 101相连。用于接收基于本语句构件的各种应用的 调用或接收相关命令进行操作, 返回调用者所需语句构件, 或通过本接口与基于语句 构件的其它应用装置相连接。 上文所述语句构件 (参附图 2及 3〜6 ) 是用于组装语言句子的另部件, 也是对 句子进行另部件拆分、 编码的标准件。 有如下四种: , , 。

意类属, 也决定了该类句子所含句舱的位次和个数, 并包揽了该类句子的较复杂的语 法现象。

2、 舱模构件 202, 401, 用于构成复杂句舱的基本结构框架。 代表了该类句舱基 本语意类属, 也决定了该类句舱所含舱眼的位次和个数, 并包揽了该类句舱的较复杂 的语法现象。 句型和舱模构件都为句子提供了框架结构,包揽了复杂的语法, 决定了所含句舱 及舱眼的位次, 这就避免了现有技术利用人工智能作句法分析、 语法分析之苦。 有贡 献于结果表意能与原文一致。

3、意群串构件 501〜503, 是由意群串充当的构件。用于填充简单句舱 203〜204 或舱眼 205〜207 的构件, 简单句舱与舱眼是上、 下位概念而大小一样, 都是除不表 意虚词外不超过三个意群串;

4、 小习语构件 601, 由过于简短不足以分出句型、 句舱的句子充当小习语构件。 用于直接构成简短的句子。 上文所述的语句构件装置, 除已有的相应文种 (英文、 中文、 俄文)夕卜, 每增加 一个语种, 首先应将句型库、 舱模库、 意群串库、 习语库分别依次各增加一个某文句 型、 某文舱模、 某文串、 某文习语字段。 并且新加文种的构件只有与已有语种构件的 语意相同的才能填加在同一个记录上。也即再次强调只有相同语意的语句构件才能共 处一个记录。 对于上述四个库, 可以只提取二个字段构成相应分库; 即提取句型库、 舱模库、 意群串库、 习语库中的某文句型、 某文舱模、 某文串或某文习语和某某码两个字段, 构成某某语言库或第一语言库、 第二语言库而应用于语言翻译或文本转换等场合。 上文所述语句构件的来源, 其一、 是通过专家操作、 人机交互的方式, 剖析比对 双语对训练样本语料得到。 其二、 即另一个来源是用户的反馈信息经专家审核后再加 入; 通过支持网站实现。 二、 一种语句构件的制作方法: 语句构件的制作方法: ①准备样本语料,取相同内容的双语或多语种文字版本的 语料作为训练样本。 利用人机交互的方式先②进行句型层面的剖析比对; 然后③进行 句舱层面的剖析比对。 从而得出字、 词、 句表意得以对等和统一的语句构件, 包括如 下步骤:

()准备样本语料,利用相同内容的双语或多语种文字版本的语料作为训练样本。 每轮比对选 A、 B双语作为一个样本对。 其中 A语分配给拼音文字或已经比对过的文 ; 第一轮双语对训练样本的剖析比对。其中双语对样本的 A语为英文, B语为中文。 从第二轮开始新语对中必须其一是已经进行过剖析比对的。 如当加入俄文时, 只能取 中俄或英俄语料作为双语对训练样本, 第二轮剖析比对的双语对样本中 A语应是已比 对过的中文或英文, B语应是新加的俄文。 这个特征就是上文所强调的, 保证相同语 意的构件才共处一个记录, 是一个强有力的措施。 每 轮的训练语料样本应大到新增句型 /句例比 < 1%后方可考虑增加新语种; 例 如在操作过程中, 一个工作日下来统计, 新增的句型数除以新增的样本句对的比例 < 1%。 < 1%后再考虑进行次一轮的剖析比对。 另一方面, 根据训练样本语料的行业来源 或应用范围来源来标记。 借此划分句型库、 舱模库、 意群串库、 习语库为若干个相应 分库。 这些分库用于相应行业或专用版本。 加上设有支持网站; 有益于用户细分; 也 有益于版本升级。 上述语料的收集过程中、 必要时的录入是自然的事。

(二)句型层面剖析比对 图 7是句型层面比对流程图。句型层面剖析比对。读取双语样本句对, 划分出句 型、 句舱, 把句型作为语句构件存入句型库, 把不足以分出句型、 句舱的小习语作为 小习语构件存入习语库; 同时保存已经划分出句型、 句舱的双语样本句例对, 以备句 舱层面的进一步比对。 具体步骤如图 7所示: 开始, 先读入一个双语样本句对 701。 然后调用配句型字 程序 702, 查找句型库返回4、 B语匹配句型。判有匹配句型 703, 若是、有匹配句型, 下续型例配 707; 若否、 没有匹配句型, 续挖句舱作句型操作 704。 即以当前双语样 本句对为例制作新句型, 弹开一窗口, 上横行显示 A语句、 下横行显示 B语句, 横行 下再显示挖句舱、 存句型两个命令按钮, 并提示专家点击 A、 B语例句的待挖句舱的 首尾点, 挖句舱计数器 N=0。 当挖句舱命令按钮被点击后, 置N=N+l, 检查 A、 B语是 否都被点击两个点以及这两个点是否有效。 拼音文字两点间^一个词串、 表意文字^ 一个字为有效。 若否, 提示重作; 如果点击正确并且有效, 将 A、 B语句两点之间的 内容挖去并填入 " {N} ", 该轮挖句舱结束,下一轮重复挖句舱作句型操作 704再挖下 一个句舱。当判断到存句型 705命令按钮被点击并且 N^ l,表示挖句舱制作新句型操 作完毕。 清除上述相应显示, 进行存句型或存小习语 706。 把两个新句型作为句型构 件分别加入句型库 A文句型、 B文句型字段。 如果这时 N=0, 表示当前双语样本句对 不足以分出句型、 句舱而被判定为小习语。 那么, 清除相应显示, 则把两个小习语作 为小习语构件分别加入习语库 A文习语、 B文习语字段。 再接续型例配 707, 把当前 双语样本例句对号入座地填入当前匹配句型、 或填入当前新作句型, 作为已经划分出 句型、 句舱的样本句例对存盘备句舱层面的剖析比对读取接续。 本步骤结束。 下一个 , 。 配句型字程序, 其优选例是: 事先把句型变为句型词串 (如把 "Does {1} {2} as {3} as {4}? "变为 " does as as "), 再把例句从左到右, 英 (拼音文字) 逐个单 词、 中 (非拼音文字)逐个字取下, 以它们查句型首字或首单词; 把符合的句型集于 临时库。 然后以循环语句再逐个句型考测。 循环中又设开关语句, 以句型词串空之数 作开关语句 (如句型词串 " does as as " = 2空 3段), 进入后句型词串每段依次 与例句比对, 比对后两者都弃去 (相同者无影响)。 当各段都分别能在例句段中找到 为之中选, 即是匹配例句的句型, 列表给出。 如果有数个句型符合, 选取所含句型词 串最长的那个句型。 如果出现串长度相同的情况, 接受人工干预。 以下以具体的句例对进一步来说明上述歩骤流程: 开始, 读入一个双语样本句对 701 , 如果读入的句对是 "Does John work as hard as Henry ? 约翰象亨利一样努 力工作吗? ": 调用配句型字程序 702, 查找句型库返回4、 B语匹配句型。 判有匹配 句型 703, 若否、 没有匹配句型, 续挖句舱作句型操作 704步骤。 即以当前双语样本 句对为例制作新句型。 弹开一窗口, 上横行显示 A语句, "Does John work as hard as Henry ?"、 下横行显示 B语句 "约翰象亨利一样努力工作吗? ", 横行下再显示挖句 舱、 存句型两个命令按钮, 并提示专家点击 A、 B语例句的待挖句舱的首尾点, 挖句 舱计数器 N=0。 当挖句舱命令按钮被点击后, 置N=N+l, 检查 A、 B语是否都被点击两 个点以及这两个点是否有效。 如 "Does I John work as hard as Henry ?,, " |约 翰 I象亨利一样努力工作吗? "(' Ι ' 为被点击处)。 它们的点击正确并且有效, 将 、 Β语句两点之间的内容挖去, 这时 N=l填入 " { 1} ", 为 "Does {1} work as hard as Henry ?" " {1}象亨利一样努力工作吗? "。 存句型命令按钮没有被点击; 下一轮重 复挖句舱作句型操作 704再挖下一个句舱; 如 "Does {1} work | as hard as Henry?" " {1}象亨利一样努力 I工作 I吗? " N=2, 填入 " {2} ", 为 " Does {1} {2} as hard as Henry ?" " {1}象亨利一样努力 {2}吗? "。 如果存句型命令按钮没有被点击; 继 续, N=3、 N=4。 当为 "Does {1} {2} as {3} as {4} ?", " {1}象 {4}一样 {3} {2}吗? " 时, 判断到存句型 705命令按钮被点击并且 N ^ l, 表示挖句舱制作新句型操作完毕。 清除上述相应显示,进行存句型 706步骤;把两个新句型作为句型构件 "Does {1} {2} as {3} as {4} ?"加入句型库 A文句型字段; " {1}象 {4}一样 {3} {2}吗? "加入句型 库 B文句型字段。 再接续型例配 707步骤, 把当前双语样本例句对号入座地填入当前 新作句型, 作为已经划分出句型、 句舱的样本句例对, 如 "Does 1 {John} 2 {work} as 3 {hard} as 4 {Henry} ? 1 {约翰 }象 4 {亨利 }一样 2 {努力 } 3 {工作 }吗? ", 并存盘保 留, 备句舱层面的剖析比对读取, 本步骤结束。 下一个双语样本句对开始, 再执行读 入双语样本句对 701。 假如上面读入的句对是 "How do you do?"、 " 您好!", 当判断到存句型 705命 令按钮被点击, 这时 N=0, 表示当前双语样本句对不足以分出句型、 句舱而被判定为 。 , . you do?"加入习语库 A文习语、 " 您好!" 加入 B文习语字段。 再接续型例配 707, 本步骤结束。 下一个双语样本句对开始, 再执行读入双语样本句对 701。 句型层面比对整理的要点是挖句舱作句型, 其中该如何挖、该如何制作句型。要 求就是保证可操作性的前提下追求代表性。 可操作性即让电脑无需理解、 分析做诸如 上述的查表、 判断、 存储等操作。 代表性即句型涵盖的句例多少, 可涵盖句例越多代 表性越好。 句型层面比对过程中要求专家掌握的原则措施如下:

①多语对语义考虑原则 从多语对、至少是双语对的语义上考虑。如果条件许可, 自然是取尽可能多的语 对同时进行句型提取; 正是因为不可能才要求至少是双语对进行。 如:

We used to go to the movies about once a week. 通常我们每周大约去看一次电影。 这个句对, 英文可以把 " go to the movies ", 作为一个句舱, 但是中文相应的 "看电影" 中间插有 "一次"。 " once a week"作为一个句舱, 中文的 "每周一次" 又被其它词隔开。 这两种情况都不行, 必须在双语对语义上考虑均可才行。 这个句对 可:

1 {We} used to 2 {go to the movies about once} a week. 通常 1 {我们 } 每周 2 {大约去看一次电影 }。 ②代表性考虑原则 句舱的多少、大小直接影响句型的代表性。我们的原则是保证可操作性的前提下 追求代表性。 关于句舱大小以何为宜, 下文解说。 这里先解释一下代表性的问题:

How many are there in your fami ly? 你家有几口人? 这个句对如果只把" your fami ly"作为句舱;可用" his fami ly; John' s fami ly; your class "等等填充。 但是由于 "How many"与 " fami ly"语义有关联。 中文对于 "家"问 "几口人"; 但对于 "班级"应问 "多少学生", 或 "多少人"。这样只把 "your fami ly"作为句舱代表性就差。 如果把 "How many"与 " fami ly"作成两个句舱, 不 但语意上可以相互照应; 而且代表性也增加了。

③朴质准确的考虑原则 鉴于意通文本的定位是 "朴质准确地传递语义", 当挖句舱顾此失彼而无耐时, 可以修改华丽的译句为朴质直译, 再挖句型。 如: 兵不厌诈。 该例译句 "兵不厌诈"既华丽又简练, 但句型采集难以操作。 把中文改为朴质直 译 "战争中再多的诡计也不为过。"再作挖句舱处理:

There can never be too much 1 {deception} in 2 {war} . 2 {战争 } 中再多的 1 {诡计 } 也不为过 。

For al l their great size , the elephants moved absolutely noiselessly . 尽管象的身躯庞大, 它走动起来却一点声音也没有。 这 "一点声音也没有"; 很难落实到句型或某个句舱; 将它改为朴质直译 "走动 起来却静静地" 问题便迎刃而解了:

For al l their 1 {great size} , 2 {the elephants} 3 {moved} absolutely 4 {noiselessly} . 尽管 2 {象} 的 1 {身躯庞大} , 2 {它} 3 {走动} 起来却 4 {静静地 } 。

④语法简繁的原则 从语法方面考虑, 复杂的、个性化的语法现象都揽到句型上; 使句舱内语法极为 简单。 上面所举的例子不难明白这一点。 在具体操作上还可以适当增加句舱个数来降 低句舱复杂程度, 尽量少作大句舱 (详下文)。

1 {She} never 2 {comes} but 1 {she} 3 {brings something for the chi ldren} .

1 {她} 没有一次 2 {耒} 不是就 3 {为孩子们带来一些东西} 。 如增加句舱, 把句舱 {3}改成 {3} {4}复杂性就降低了。 如:

1 {She} never 2 {comes} but 1 {she} brings 3 {something} for the 4 {chi ldren} . 1 {她} 没有一次 2 {耒} 不是就为 4 {孩子们 } 带来 3 {—些东西} 。

⑤词性和可替换性的原则 句舱是可以被其它词汇替换的部分, 可替换的词汇越多, 可替代性越强; 间接地 使句型的代表性加强。 句舱内词汇的词性尽可能局限于数词、 名词、 形容词、 复串, 少数情况才考虑其它词类(如动词、副词等)。如果说要给做句舱的词类排优先次序, 那首先就是数串、 专用串, 次则名串、 形容词串……, 最后考虑动词串。 最不考虑 的是介词和连词。 也就是介词、 连词几乎都纳归句型部分。 要求句型采集达到句舱内语法极为简单, 复杂语法现象尽揽于句型; 挖去句舱后 留下的句型, 所含句型词不宜太少, 因为太少了不便句型的检出。 最理想的情况是每个句舱之前后都有句型词, 也就是没有连续句舱的情况。原则 是任何一个句型, 在任何文种里的框架结构必须有一个或一个以上的文字串作为句 型词。 不允许在多语对当中, 某文种甚至没有句型词, 中文因为最简洁, 这种情况 时有发生, -但发生就得返工, 必须避免。 有时连续出现几个句舱, 即连续句舱问题。还有是句舱的大小, 尽量少作大句舱 问题, 这些都与句型词不宜太少相关, 这些情况在相关标题下阐述。

⑦多连续句舱尽量避免的原则

1 {1} 2 {get to work} at 3 {nine o' clock} every morning . 每天早上 3 {九点钟 } 1 {我} 2 {开始工作} 。 上例英连续出现 {1} {2}两个句舱; 相应的中文则变为 {3} {1} {2}三个连续句舱。 二个或二个以上句舱相连称连续句舱; 三个或三个以上句舱相连称多连续句舱。 连 续句舱不但具有句型词太少之弊, 套句型还得人工干预。 特别是连续三个或更多的 情况应尽量避免。 如上例减少到两个句舱就无此之虑了:

I 1 {get to work} at 2 {nine o' clock} every morning . 每天早上 2 {九点钟 } 我 1 {开始工作} 。

⑧尽量少作大句舱的原则 句舱有大有小,最小的句舱只含一个意群串;最大的句舱可以包含一个分句或从 句。 我们在作句型时, 宜尽量少作大句舱。 那么, 如何掌握这个尽量少, 以何为尺 度呢? 以 "只能这样"为准。 例如下面句对:

Can, you guess 1 {what I was doing} 2 {this morning} ? 你能猜到 2 {今天上午} 1 {我在做什么 } 吗?

I have forgotten 1 {what time} he said he 2 {had dinner} 3 {last night} . 我忘记他说他 3 {昨天晚上} 是 1 {什么时候} 2 {吃的晚饭} 。

What were you doing when 1 {I cal led you on the telephone} ?

1 {我打电话给你 } 的时候, 你在做什么?

I have forgotten 1 {what he said his address was} . 上面四个句对, 分别由 what、 when引出一个从句。 第一对可以把主谓、 时间状 语分开作成两个句舱。 第二对可以作成三个句舱。 第三对不能将状语分开, 只能作 成一个句舱; 第四对 What针对表语提问, 也不能分开, 只能作成一个句舱。 第三、 四两对都 "只能这样", 这就是少作大句舱要把握的尺度。

⑨挖句舱后的审定原则 挖句舱之后还得认真审定: 将句型、 以至每个句舱分别审定。 先看句型义, 一定 要都来自句型词, 与句舱内容无粘连。 然后审定每个句舱, 它们必须是可替换的, 与句型分开的, 不与句型义有粘连。 如果某句舱与某句型词有所粘连, 必须修改之。 例如:

When do you think 1 {the meeting wi l l be held} ? 你认为 1 {会议在什么时候召开 } ? 这样划句型、 句舱不对, 句舱内容 "什么时候"与句型词 "When "有粘连。 应修 改为:

When do you think 1 {the meeting} wi l l be 2 {held} ? 你认为 1 {会议 } 会在什么时候 2 {召开 } ? (3句舱层面剖析比对 图 8是句舱层面比对流程图。 如图 8所示, 开始运行, 读入已经划分出句型、 句 舱的双语样本对 801。 执行取句舱、 显示、 组复词 802步骤, 依次取出已经划分出句 型、 句舱的样本句例对当中的一个句舱, 开窗口一上部显示 A、 B语样本句例, 下部 显示 A、 B语当前句舱内容。 同时, 把 A语当前句舱以词串为单元切分并依次填入参 考表 A语字段, 再依次取出一个词串查找意群串库的 A文串字段, 找到后取出同记录 的 B文串字段内容。 如果该 B文串内容在 B语当前句舱中含有, 把 B文串内容填入参 考表 B语字段, 不含有让它为空。 作完整个参考表, 开窗口二显示参考表、 组复词命 令按钮以及可组复词操作提示。 接受专家点击参考表并在被点记录标志字段作标志。 当组复词命令按钮被点击并且参考表有连续记录被点击, 将参考表中有标志记录的 A 语字段内容以 " _ "相连组成复词, 并把有标志记录合并成一条记录, A语字段填入该 复词, B语字段以相等语意的词串填写。 接续判断是否简单句舱 803, 若是接续意群 对齐 808 ; 若否、 查询舱模库判断当前句舱是否含有舱模 804。 若不含舱模执行编写 舱模 805, 开窗口三作为可编辑窗口, 将当前双语句舱内容再显示, 接受专家以此为 基础编写舱模, 还显示存舱模命令按钮。 若含有舱模, 把所含舱模作为当前舱模执行 步骤: 划分出舱模、舱眼 806。 当存舱模命令按钮被点击,并且可编辑窗口已经被编辑 , 、

Β文舱模字段,同时,将当前句舱内容对号入座地填入当前舱模, 或填入新编舱模作为 已经划分出舱模、 舱眼的复杂句舱显示。 续取舱眼 807, 依次取出一个舱眼的内容, 接续执行意群对齐 808步骤。 在第二 个窗口参考表下显示对齐确定命令按钮, 参考表接受专家按实例延伸或增补词义、 不 改变原有字单词的前提下加减串长度、 粘带附随字、 词形变化增补词义项等意群对齐 的修改, 或优选记录。 当对齐确定命令按钮被点击,表示参考表 ή Α、 Β语的词串已经 意群对齐、 即已成意群串,进行保存意群串 808操作, 逐记录地把 Α、 Β语字段内容作 为意群串构件存入意群串库的 Α文串或 Β文串字段。 如果当前操作的是舱眼, 判舱眼 完 809, 否, 如果当前句舱还有舱眼没有操作, 再执行取舱眼 807步骤; 直到作完当 前句舱的所有舱眼。 再判句舱完 810, 判当前已经划分出句型、 句舱的样本句例对中 是否还有未处理的句舱, 否, 还有未处理句舱, 执行取句舱 802步骤; 继续处理句舱。 如果全部句舱处理完毕, 执行再读入句对 801步骤, 读入下一个已经划分出句型、 句 舱的双语样本句对。 进行下一轮操作。 下面以具体的句例对进一步来说明上述歩骤流程: 开始运行, 读入(经句型层面比对过)已经划分出句型、句舱的双语样本对 801, 例如是 " 1 {the fisherman} consents to 2 { return the_feather_suit}, on condition that 3 {fairy dance and play heavenly music for him} .,,, " 在 3 {仙女为他跳舞 并演奏天上的乐曲 }的条件下, 1 {渔夫 }答应 2 {归还羽衣}。"这个例句对各有 1、 2、 3, 二个句舱。 执行取句舱、 显示、 组复词 802歩骤, 依次取出已经划分出句型、 句舱的 样本句例对当中的一个句舱, 开窗口一上部显示 A、 B语样本句例, 下部显示4、 B语 当前句舱内容。同时,把 A语当前句舱以词串为单元切分并依次填入参考表 A语字段, 再依次取出一个词串查找意群串库的 A文串字段, 找到后取出同记录的 B文串字段内 容。 如果该 B文串内容在 B语当前句舱中含有, 把 B文串内容填入参考表 B语字段, 不含有让它为空。 作完整个参考表, 开窗口二显示参考表、 组复词命令按钮以及可组 复词操作提示。假如句舱 2为当前句舱,当前句舱 A语是 "return the feather suit "; B语是 "归还羽衣"; 这时的参考表为:

A i吾字段: return the feather suit

B语字段: 归还 V 参考表 B语有三个记录为空, 但对应于 " feather"有 "羽毛"; 对应于 " suit " 有 "衣服"; 并且这三个记录都有专家点击的 " "标志。 并且复词命令按钮已被点 击, 将参考表中有标志记录的 A语字段内容以 "_"相连组成复词, 并把有标志记录 合并成一条记录, A语字段填入该复词, B语字段以相等语意的词串填写。 这时参考 表变为: — —

B语字段: 归还 羽衣 现在, 当前句舱 A语是 "return the_feather_suit ";>Suit>

A语字段: play heavenly music

B语字段: 演奏 天上的 乐曲 当对齐确定命令按钮被点击,表示参考表内 A、 B语的词串已成意群串,进行保存 意群串 808操作, 逐记录地把 A、 B语字段内容作为意群串构件存入意群串库的 A文 串或 B文串字段。 如果当前操作的是舱眼, 判舱眼完 809, 否, 如果当前句舱还有舱 眼没有操作,再执行取舱眼 807步骤;直到作完当前句舱的所有舱眼。再判句舱完 810, 判当前已经划分出句型、 句舱的样本句例对中是否还有未处理的句舱, 是, 还有未处 理句舱, 执行取句舱 802步骤; 继续处理句舱。 如果全部句舱处理完毕, 执行再读入 句对 801步骤,读入下一个已经划分出句型、句舱的双语样本句对。进行下一轮操作。 句舱层面比对操作如上述"组复词", 将原有词串以 "-"相连成复词(复串); 它 ;

种情况, 要求专家掌握:

①直接词译不能表达时, 按意群组成复串 you were gone 直译应是 "你 (是) 走"; "了"来源于过去式, 故组成复 串 "you— were— gone 你走了,, cal l—on— me 来访我 knew_nothing_about_it 一无所知 compel led— to—go 非去不可 show— himself— in_his— true— colours 现出原形、 现出本色

②以简洁看齐, 复杂表示者组成复串 英 " per-mu grain yield , 每亩谷物产量"; 中为 "亩产"。 将英组成复串 "per- grain—yield", 向中看齐。 又如:

Late— at— night 深夜 down—to— the—countryside 下乡 fight— it— out_to_the— end 斗争到底

③有转义表示一事物, 或经常性搭配的组成复串 fel l_asleep 入睡 knows—nothing —无所知 come—back— from_the_front 下火线 the— sweat— was— pouring— down 汗如雨下; pictures— it_have_just_taken 近照 put_my_f inger_on 指出

④词义有重合或重复的组成复串 very—wel l 不错; doubts_of_questions 疑问; bear—fruit 结果; the—far— distance 远处; 经过上述组复词的操作, 往往在一个句舱里, 部分词串组成了复串, 使部分看似 复杂的句舱变为简单句舱。 组复词也是意群对齐的措施之一, 应灵活应用。 句舱层面比对操作如上述 "意群对齐" 的操作要求专家掌握的原则、 措施如下:

①依照实例、 延伸或增补词义 2 {应用的 } 就不可能 1 {完美 } 。 其中" useful"词义有 "有用的、有帮手的 、有益的",选它们都不适合; 增补"应 用的"词义项。

1 {She} was 2 {strong} , for al l 1 {she} was so 3 {smal l} . 1 {¾} 虽然 3 {瘦 小} , 但很 2{结实} 。 如: 其中 small 小的, 增补 "瘦小" 词义项。

I am very i ll. 我患重病。 把动词 "am" 增补 "患" 的词义。

Learn the truth 明白真相, Learn 增补 "明白 "词义项。

②不改变原有字、 单词的前提下加减串长度, 便于拼接

I ask you to teach me every other day. 我请你每隔一天来教我。 其中〃 teach〃

V 有 "讲授、 教授"词义; 减词串长为 "教"便于拼接, 增加 "教"词义项。

Sttend school 人学; sttend力口 "人,, 词义项, 简释 "力口人"; school力口 "学,, 词义项, 简释 "学校"。

③粘带附随词串 如 " good好"粘带成 "好处、 好事、 好心、 好用"等 (中文别附随量词,后者另 行处理)。 如 "word 词"粘带成 "词儿"等。

④词形变化增补词义 (分词, 比较级等表达的语意, 增加相应词义), 这样可以 省略词形分析、 处理。 been 增补 "还是、 怎么样"词义; punished 增补"受处分"词义; best增补 "最好的"词义; had 增补 "以前"词义; done增补 "做好了、 完成了"词义; vi l lage^t曾补"多个农村"词义; 三、 一种基于语句构件的母语读外文方法 图 9是基于语句构件的母语读外文方法流程图。如图 9所示, 开始作一些界面等 准备。 由用户指定母语和源语各是构件库所含的哪一个文种。 把屏幕分成上、 中、 下 或前、 中、 后三个窗口; 中部窗口用于显示当前操作句以及操作中的相关信息, 下或 后部窗口用于显示源语待读文本, 上或前部窗口用于显示己读的母语文本。 此外, 在 提示行显示悔操作、 存盘退出等命令按钮以及→、 一移词序按钮; 或把它们作成浮条 紧随中部下或用户可移。 然后, 运行, 源语句读入 901, 读入源语一个句子作为当前 , , ,

内容。判断小习语 902, 以当前句查询习语库的源语习语字段。若有,给出小习语 903, 取出同记录的母语习语字段中的母语小习语, 显示在中部窗口, 并将同记录的习语码 读入世界文缓存区, 然后再执行步骤源语句读入 901。 若无, 没有找到, 续调用配句 型子程序 904。 以当前句查询句型库的源语句型字段, 如果一个匹配的句型也没有, 存句型库代表数于反馈缓存区。 如果查到多个匹配句型, 在中部窗口下部显示相应的 母语句型, 接受用户选定一个句型。 或者只查到一个匹配的句型, 给出同记录的句型 码、 母语句型以及源语句型, 将母语句型着重显示在中部窗口的上部, 把源语句子对 号入座地套入源语句型, 附注式显示在该窗口母语下方, 并把句型码读入世界文缓存 区。 接着执行取句舱 905步骤, 从左到右在中部窗口标示母语句型中的当前句舱, 存 入当前句舱标号, 即 (句型内原句舱标号 + FFE0H) 于世界文缓存区。 同时标示和取 出源语相应句舱内容作为当前句舱内容, 判断当前句舱内容是否属于简单句舱 906。 若是简单句舱, 执行步骤词义确定 909。 若否, 执行步骤查配舱模 907。 以当前句舱 内容查询舱模库的源语舱模字段。 如果一个匹配的舱模也没有, 存舱模库代表数于反 馈缓存区。 如果查到多个匹配舱模, 向下扩展中部窗口, 在扩展部显示相应的母语舱 模, 接受用户选定其一; 或只查到一个匹配的舱模; 给出同记录的舱模码、 母语舱模 以及源语舱模。 将母语舱模着重显示在中部窗口的扩展部, 把源语句舱内容对号入座 地套入源语舱模, 附注式显示在该窗口母语舱模的下方, 并把舱模码读入世界文缓存 区。 然而后续取舱眼 908步骤。 以母语舱模为准从左到右, 在母语舱模上逐个标示当 前舱眼; 存当前舱眼标号 (舱模上原舱眼标号 +FFD0H) 于世界文缓存区; 同时标示和 取出源语相应舱眼内容, 执行步骤词义确定 909。 从左到右读出源语的简单句舱或舱 眼中的一个词串, 查询意群串库的源语文串字段。 如果一条相同的词串也没有,存当 前源语词串于反馈缓存区。 若查到多条相同词串,分别取出它们的同记录母语串字段 内容,备份于悔选择缓存,并显示在已扩展的中部窗口下部,接收用户选定其一; 或只 查到一条相同词串,执行步骤给出母语串 909。取出当前记录的母语串字段内容填入到 当前母语句舱或当前母语舱眼, 取出意群码存入世界文缓存区; 继续执行词义确定 909, 直到当前简单句舱或当前舱眼操作完毕。 根据个性丢失表的信息进行当前句舱或舱眼的个性丢失补偿 911。再根据母语词 序表的信息纠正当前句舱或舱眼的母语词序 911。 并查询→、 一移词序按钮。 当→按 钮被点击将当前句舱或舱眼用户所点击词串后移于后一词串之后; 当一按钮被点击将 当前句舱或舱眼用户所点击词串前移于前一词串之前; 同时将移动后的词序加入母语 词序表备用。 后续判断 912, 如果当前句舱还有舱眼未处理, 执行步骤取舱眼 908。 后续判断句结束 913, 若否, 而当前句子还有句舱未处理, 执行步骤取句舱 905。 若 当前句子所有句舱全部处理完毕,查询反馈缓存区和命令按钮:当反馈缓存区不为空, 将反馈缓存区的信息加上源语种、 母语种、 当前源语句子等信息作成电子邮件反馈到 支持网站; 清空反馈缓存区, 在世界文缓存区存入 "反馈句"标志。 当悔操作命令按 , ,

并作相关修改。 当接收到存盘退出命令时, 将世界文缓存区的内容存盘为世界文, 文 件名 =源语文件名 .sjw; 如果源文未完,文件头中记下源文偏移。 如果悔操作、 存盘退 出命令按钮都没有被点击时, 接续执行步骤源语句读入 901。 下面以实例进一步来说明上述步骤流程: 开始作一些界面等准备。 源语句读入 901, 读入源语一个句子如 "Children not Allowed!"作为当前句显示在中部窗口, 母语文本显示尾加已处理的前 句内容, 源 语文本显示减当前句内容。 判断小习语 902, 以当前句查询习语库的源语习语字段。 有, 给出小习语 903, 取出同记录的母语习语字段中的 "儿童不许入内! "这个母语小 习语, 显示在中部窗口, 并将同记录的习语码 (便于阅读给编码名称及低字位十进制 数, 下同; 如: "^ 读入世界文缓存区, 然后再执行步骤源语句读入 901。 假如读入的源语句子是 " The doctor told his patient that he would prescribe him some patent medicine on condition that he strictly follow his instructions.,,, 作为当前句显示在中部窗口, 母语文本显示尾加已处理的前一句内容 "儿童不许入 内!", 源语文本显示减当前句内容。 判小习语 902, 以当前句查询习语库的源语习语 字段。 无, 没有找到, 续调用配句型子程序 904。 以当前句查询句型库的源语句型字 段, 这时只查到一个匹配的句型, 给出同记录的句型码、 母语句型以及源语句型, 将 母语句型 " {1} 告诉他的 {2} , 如果能 {4} , 就可以 {3} 。"着重显示在中部窗口 的上部, 把源语句子对号入座地套入源语句型 "the {1} told his {2} that {3} on condition that {4} .,,, 附注式显示在该窗口母语下方 " the 1 {doctor} told his 2 {patient} that 3 {he would prescribe him some patent medicine} on condition that 4 {he strictly follow his instructions} . ", 并把句型码 "句型码 001061" 读入世界文缓存区。 接着执行取句舱 905步骤, 从左到右在中部窗口标示母语句型中 的当前句舱, 存入当前句舱标号于世界文缓存区。 同时标示和取出源语相应句舱内容 作为当前句舱内容, 判断当前句舱内容是否属于简单句舱 906。 若是简单句舱, 执行 步骤词义确定 909。 例如: 这里母语依次标示句舱 1、 句舱 2; 存句舱标号 "

01"、 " 句舱标号 02"; 取出源语相应句舱内容 "dOCtor"、>

him some patent medicine ", 判简单句舱 906, 否, 执行步骤查配舱模 907。 以当前 句舱内容查询舱模库的源语舱模字段。 只查到一个匹配的舱模 "he would prescribe him [ 1] "; 给出同记录的舱模码 " 凝 i¾¾¾WT、 母语舱模 "开 [ 1] 给他" 以及源 语舱模 "he would prescribe him [ 1] "。 将母语舱模着重显示在中部窗口的扩展部, 把源语句舱内容对号入座地套入源语舱模 "he would prescribe him 1 [some patent medicine] 附注式显示在该窗口母语舱模的下方, 并把舱模码" " 读 入世界文缓存区。 然而后续取舱眼 908步骤。 以母语舱模为准从左到右, 在母语舱模 上逐个标示当前舱眼; 存当前舱眼标号 " 于世界文缓存区; 同时标示和 取出源语相应舱眼内容, " some patent medicine 执行步骤词义确定 909。 从左到 右读出源语的舱眼中的一个词串, 查询意群串库的源语文串字段。 若查到多条相同词 串,分别取出它们的同记录母语串字段内容,备份于悔选择缓存,并显示在已扩展的中 部窗口下部,接收用户选定其一。 这三个串分别如: some 若干 —— ifcb 相当的 几个 patent 专利的 执照 特效 明白的 medicine 内科的 内服 药 用户选定为 " 一些 特效 药 "。 执行步骤给出母语串 909。 取出当前记录 的母语串字段内容填入到当前母语舱眼为 "开 1 [一些特效药]给他", 取出意群码 "意 群码 008264"、 "意群码 017655"、 "意群码 005484"存入世界文缓存区; 当前舱眼操 作完毕。 (这里有"丢失补偿、 母语词序 911 "因未涉及, 待下文补述)。母语句为"医 生告诉他的病人, 如果能确实地执行他的医嘱, 就可以 3 {开 1 [一些 特效 药] 给 他} 。"判还有舱眼 912, 无。 再续判断句结束 913, 是。 至此, 当前句子所有句舱全部处理完毕, 查询反馈缓存区和命令按钮: 当反馈缓 存区不为空, 将反馈缓存区的信息加上源语、 母语、 当前源语句子等信息作成电子邮 件反馈到支持网站; 清空反馈缓存区, 在世界文缓存区存入 "反馈句"标志。 当悔操 作命令按钮被点击, 根据用户点击的欲悔词串, 取出悔选择缓存中的相应内容让用户 重选词串并作相关修改。 这已足够清楚完整, 所属技术领域的技术人员能够实现。 其 中悔操作即在词义确定中, 从多个词义当中选一时, 将当时所属之舱、 目艮, 多个词条 全部纳入一个 "悔操作表"内, 悔操作时在用户所点击的母语句中, 根据其所处句舱、 舱眼及词串给出同批表中内容, 让用户重选并作相应修改。 悔操作表有悔批次、 句舱 号、 舱眼号、 词串、 意群码等字段。 舱号、 眼号相同, 源语串不同悔批号也就不同。 这时,假如接收到存盘退出命令时,将世界文缓存区的内容,如上例 2句内容" ^ 语码 00064; 句型码 001061;句舱 1号;意群码 002131;句舱 2号;意群码 006386;句舱 4号;舱模码 00207;舱眼 1号;意群码 016841; 意群码 017951;舱眼 2号;意群码 019882; 存盘为世界文, 文件名 =源语文件名 . SJW; 如果源文未完,文件头中记下源文偏移。 然 而, 整个流程步骤终止。 假如悔操作、存盘退出命令按钮都没有被点击时,接续执行步骤源语句读入 901。 补述 (上文有 "丢失补偿、 母语词序 911 "等, 这里补述) : 根据个性丢失表的信息进行当前句舱或舱眼的个性丢失补偿 911。个性丢失补偿 因由是上文述及简单句舱和舱眼虽然是上、 下位概念, 但大小一样, 都是除不表意虚 词外少于或等于三个意群串。 不表意虚词例如中文的量词, 英文的冠词等。 这些丢失 了的词串在以母语读出时给以补偿。 其信息来源于个性丢失表, 个性丢失表含有关联 词串、 补偿串等字段。 母语词序有时需要调整, 其因由也是来自于句舱、 舱眼, 它们大小一样, 都是除 不表意虚词外少于或等于三个意群串。 在机内这三个意群串的前后次序没有要求, 所 以基于本语句构件的各种应用。 有可能存在母语词序有时需要调整的情况。 其调整简 单方便, 先可利用一个母语词序表, 母语词序表含有首词串、 读出串、 调整串字段。 读出串即当用母语读出时的串序; 首词串即读出串的首串; 调整串即应调整的词序。 当当前句舱或当前舱眼全部词串词义确定之后, 查该表, 查到符合者自动调整之。 然 后, 让系统判读 "一按钮"和 "一按钮"按钮。 如果被用户点击, 根据用户意图再调 整之。 当 "→按钮"被点击将当前句舱或舱眼用户所点击词串后移于后一词串之后; 当 "一按钮"被点击将当前句舱或舱眼用户所点击词串前移于前一词串之前; 同时将 移动后的词序加入母语词序表备用。 有一个不必干预的情况是当用户读者要求读出速度、不介意时也可不必干预。因 而丢失补偿、 母语词序等功能是作成让用户可选的。 有关支持网站: 上文述及作成电子邮件反馈到支持网站。当支持网站接收到来自 用户的反馈邮件时, 由专家实时处理后, 新构件加入相应构件库, 并将新构件及相关 信息实时反馈给用户, 并在用户的参与下替换原 "反馈句"标志。 这是①用户支持之 一; 用户有什么意见、 建议等等都可以通过这个方式进行沟通和支持。 此外对于②版 本升级, 可以得到社会性检验和社会性的积累。 ③引导多语种共同发展, 本发明的应 用, 为世界性跨语种交流提供了一个平台。 同时也结束了自然语言在各自独立体系内 缓慢地演变和发展的历史; 开始了多语种共同快速发展的历程。 例如要修正、 淘汰或 新增意群文字串; 推广新术语等等可以通过本发明的应用直接向写作者建议、 推荐; 向阅读者宣传解释。 上文述及在用户利用母语读外文的过程中,把世界文缓存区的内容存盘生成世界 文。 这样一篇外语文章只要一人读过, 后面的千千万万人就可以读世界文了, 读世界 文比母语读外文更快捷、 不用干预, 语意准确, 读出文种用户自选, 世界文的多语读 ,

群码 002131;句舱 2号;意群码 006386;句舱 4号;舱模码 00207;舱眼 1 号;意群码 016841; 意群码 017951;舱眼 2号;意群码 019882; 句舱 3号;舱模码 00206;舱眼 1 号;意群码 008260;意群码 017655;意群码 005484;": 假如以中文读出, 执行步骤: ① 依次逐个取出代码; ②用开关语句将代码分类分别处理; ③其中如果是句舱标号、 舱 眼标号, 用以指示当前句舱或当前舱眼; ④把句型码、 习语码、 舱模码、 意群码分解 为某库某记录号, 给出某库、 某记录的某读出文种字段内容, 如果是意群码则按指示 给出到当 句舱或当 舱眼; ⑤接续执行①直到文本结束。 例如:

^ -取-习语库 64记录的中文习语字段内容 "儿童不许入内!"。 句型码 1061记录的中文句型:

" {1} 告诉他的 {2} , 如果能 {4} , 就可以 {3} 。,, 句舱 1 指示 W -取-意群串库 2131记录的中文串 "医生 "据所指填入句舱 1成为: "1{医生} 告诉他的 {2} , 如果能 {4} , 就可以 {3} 。,, 句舱 2号- 亓、 盧 ^^W^ -取-意群串库 6386记录的中文串 "病人 "据所指填入句舱 2成为: "医生告诉他的 2{病人 } , 如果能 {4} , 就可以 {3} 。" 句舱 4号 H亓、 舱模码 207记录的中文舱模 " [1]+他的 +[2] "据所指填入句舱 4成为:

"医生告诉他的病人, 如果能 4{ [1] 他的 [2]} , 就可以 {3} 。,, 舱眼 1 指示 取-意群串库 16841记录的中文串 "确实地" 意群码 017951- -^ 17951记录的中文串 "执行"据所指填入舱眼 1成 为:

"医生告诉他的病人, 如果能 4{1 [确实地执行]他的 [2]}, 就可以 {3} 。,, 舱眼 2号 取-意群串库 19882记录的中文串 "医嘱" 据所指填入舱眼 2成 , , 句舱 3号- 亓、 凝 -取-舱模库 206记录的中文舱模 "开 [1] 给他" 据所指填入句舱 3成为:

"医生告诉他的病人, 如果能确实地执行他的医嘱, 就可以 3 {开 [1] 给他 } 。" 舱眼 1 指示 意群码 取 -意群串库 8260记录的中文串 "一些 "; 盧 W 7^5-取-意群串库 17655记录的中文串 "特效"; 取-意群串库 5484记录的中文串 "药 "; 据所指填入舱眼 1成为:

"医生告诉他的病人, 如果能确实地执行他的医嘱, 就可以 3 {开1 [一些特效药] 给他 } 。" 母语读外文方法是基于语句构件的应用之一。参照其中利用四个语句构件库对当 前句的编码步骤、 世界文读出的译码步骤, 可以产生多种基于语句构件的应用系统: 基于语句构件的世界文生成的方法系统。用于将传统文本转换成世界文,然后可 以进行多语种读出。 基于语句构件的文本转换方法。用于将某源语文本转换成目语文本给出, 或转换 成多文种给出。 基于语句构件的机器翻译方法。用于将某源语翻译成目语给出,或翻译成多语种。 实施本发明所产生的软件系统可以在现有的中型、 小型、 微、 巨型计算机, 笔记 本电脑、 掌上电脑等单独的或者相连成网的计算机上运行实施。 可以在各种计算机网 络, 特别是在因特网上运行实施。 还可以在诸如 "个人数字助理", PDA (Personal Digital Assistant)的装置上运行实施。 本发明实施后的产品, 可以应用于需要和其 它语种的人们进行交流的工作、 学习、 休闲、 旅游等等场合; 可以用于家庭、 机关、 学校以及各行各业涉及外文的场合。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号