首页> 中国专利> 一种基于P300的脑控话语发声器的实现方法

一种基于P300的脑控话语发声器的实现方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种基于P300的脑控话语发声器的实现方法，该脑控话语发声器是对用P300 Speller拼写的句子进行解码，再通过语音发声器播放出来，实现用户直接通过大脑完成说话的过程；主要包括以下步骤：用户通过P300 Speller依次拼写字符序列，拼写过程中可省略某些次要字符，直至拼写完整个句子；用解码算法对拼写的字符序列进行修正，得到正确的句子；然后将正确的句子传送至语音发声器。本发明提供的方法能够提高P300 Speller拼写句子的速度并实现直接利用大脑说话的功能。

著录项

公开/公告号CN106951081A

专利类型发明专利
公开/公告日2017-07-14

原文格式PDF
申请/专利权人福州大学;
展开▼

申请/专利号CN201710162409.7
发明设计人黄志华;郭红;王小娜;黄炜;马文鸿;林智锋;
展开▼

申请日2017-03-18
分类号
代理机构福州元创专利商标代理有限公司;
代理人蔡学俊
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区
入库时间 2023-06-19 02:48:20

法律信息

法律状态公告日

法律状态信息

法律状态
2019-12-17

授权

授权
2017-08-08

实质审查的生效 IPC(主分类):G06F3/01 申请日:20170318

实质审查的生效
2017-07-14

公开

公开

说明书

技术领域

本发明属于脑机接口与自然语言处理相结合的应用，涉及一种基于P300的句子拼写并通过语音设备实现大脑说话的方法。

背景技术

脑机接口为一些运动神经损害而大脑功能无损的患者提供与外界交流的一种方式，其中P300Speller对大脑通过一系列的刺激，分析脑电信号，识别出用户想要拼写的字符来达到与外界的交流。目前P300Speller要完成一个句子的拼写只能够对字符逐个拼写，在产生错误时用户只能自行修正。存在的问题是，拼写一个句子需要较长的时间，用户容易疲劳，拼写效果不佳。

发明内容

有鉴于此，本发明的目的是提高用户利用P300Speller拼写句子的速度，并提高用户与外界交流的效率。本发明中用户在拼写过程中可省略某些次要字符，并且不用自己修正错误，用解码算法对拼写的字符序列进行修正，将得到正确的句子传送至语音发声器。

本发明采用以下方案实现：一种基于P300的脑控话语发声器的实现方法，包括以下步骤：

步骤S1：用户通过P300拼写矩阵拼写句子Sentence＝c₁c₂,…,c_n，P300拼写矩阵包括字母A-Z，数字0-9共36个字符，c_i,i＝1,…n为P300拼写矩阵中的字符；

步骤S2：修正Sentence，在Sentence中插入漏输的字符，修改错误字符，得到一个新的句子C_Sentence；

步骤S3：将C_Sentence传送至语音发声器并播放。

进一步地，所述步骤S2具体包括以下步骤：

步骤S21：设置结构变量Cur，Cur.sen＝Sentence,Cur.loc＝1,Cur.len＝length(Sentence)；初始化栈S，表L，并将Cur压入栈S；

步骤S22：若栈S非空，弹栈更新Cur，转下一步；否则，转入步骤S26；

步骤S23：判断Cur.loc位置上是否要插入字符；若要，Ins.sen＝Insert(Cur.sen,Cur.loc),Ins.loc＝Cur.loc+1,Ins.len＝Cur.len+1,将Ins压入栈S；

步骤S24：修正Cur.loc位置上的字符，Cur.sen＝modify(Cur.sen,Cur.loc)；Cur.loc＝Cur.loc+1；

步骤S25：若Cur.loc大于Cur.len，将Cur插入表L，否则将Cur压入栈S；转入步骤S22；

步骤S26：用单词语言模型计算表L中所有句子的概率，输出概率最高的那个句子C_Sentence。

进一步地，步骤S23中所述的判断Cur.loc位置上是否要插入字符及Insert(Cur.sen,Cur.loc)的具体方法为：

以Cur.loc位置为中心，从Cur.sen中取出一个字符子序列，记为c₁c₂…c_k；在c₁c₂…c_k中对应Cur.loc的位置上插入字符c_i,c_i∈C,C包含空格字符和P300拼写矩阵中的所有字符，得到c₁c₂…c_i...c_k+1；用5-gram字符语言模型计算c₁c₂...c_k和c₁c₂…c_i...c_k+1,c_i∈C的概率，从c₁c₂…c_i…c_k+1,c_i∈C这一组字符序列中选出概率最大的那一个，比较它与c₁c₂...c_k的概率，若它的概率更大，则要插入字符；

当要插入字符时，Insert(Cur.sen,Cur.loc)在Cur.sen字符序列的Cur.loc位置上插入使得c₁c₂...c_i...c_k+1,c_i∈C概率最大的那个c_i。

进一步地，所述步骤S24中所述的修正Cur.loc位置上的字符，modify(Cur.sen,Cur.loc)的具体方法为：

根据Cur.sen在Cur.loc位置上的那个字符和P300拼写矩阵概率模型，选出实际要输入的可能性较大的若干个字符构成字符集合令i＝Cur.loc,计算其中c_l为Cur.sen在l位置上原本的那个字符，c_l'为Cur.sen在l位置上修正后的字符，P(c'_l|c_l)取自P300拼写矩阵概率模型，若c_l为插入的空格，则P(c'_l|c_l)取1；c₁c₂...c_i...c_n代表Cur.sen或其修正后的结果，P(c₁c₂...c_i...c_n)依据5-gram字符语言模型计算，α为一比例因子；计算得到c_b，用c_b替代Cur.sen中的c_i作为modify(Cur.sen,Cur.loc)的输出。

进一步地，所述步骤S26中所述的计算句子的概率的具体方法为：

读取表L中的句子Cur.sen，以空格为分隔符将单词分隔开,单词依序存于w_i,i＝1,...,m中，然后用3-gram单词语言模型计算句子的概率，公式如下，

其中C(w_i-2w_i-1w_i)和C(w_i-2w_i-1)分别为单词w_i-2w_i-₁w_i和w_i-2w_i-1在语料库中出现的次数。

进一步地，所述根据Cur.sen在Cur.loc位置上的那个字符和P300拼写矩阵概率模型，选出实际要输入的可能性较大的若干个字符构成字符集合以及P(c'_l|c_l)取自P300拼写矩阵概率模型，其具体方法为：

用户在使用前进行P300拼写训练，计算得到P300拼写矩阵概率模型，表示为矩阵A；A中的元素a_ij＝P(c_j|c_i)，c_i为用户拼写得到的字符，c_j为实际上要拼写的字符，P(c_j|c_i)为当拼写得到的字符为c_i时实际上想要拼写的字符是c_j的概率，c_i,c_j∈{'A','B',...,'Z','0',...,'9'}，i＝1,2,...,36,j＝1,2,..36；

对于Cur.sen在Cur.loc位置上的那个字符，查询矩阵A对应的行，就可得到实际要拼写的可能性较大的那些字符；

P(c'_l|c_l)中的c_l和c_l'都是字符，可分别对应矩阵A的行与列，从A中取出相应的概率。

进一步地，采用所述5-gram字符语言模型进行计算的具体方法为：

5-gram字符语言模型计算任一字符序列c₁c₂...c_n的概率所用的方法是，其中，C(c₁...c_i-1c_i)和C(c₁...c_i-1)分别为字符c₁...c_i-1c_i和c₁...c_i-1在语料库出现的次数，C(c_i-4...c_i-1c_i)和C(c_i-4...c_i-1)分别为字符c_i-4...c_i-1c_i和c_i-4...c_i-1在语料库中出现的次数。

运动神经受损而大脑功能完好的患者与外界进行尽可能快的交流对了解患者的需求以及病情是非常重要的，而现有的利用P300Speller来拼写句子所需要的时间较长。因此，与现有技术相比，本发明具有以下优点：

1、本发明能够让用户在拼写过程中省略一些字符，减少拼写的工作量，提高拼写效率。

2、本发明采用解码算法修正用户拼写的句子，提高句子拼写的速率，从而提高与外界交流的速度。

3、本发明将拼写的句子通过语音设备连接，更直接将用户与外界相联系，具有很强的实际应用意义。

附图说明

图1是本发明的方法流程图示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

本实施例提供一种基于P300的脑控话语发声器的实现方法，如图1所示，包括以下步骤：

步骤S1：用户通过P300拼写矩阵拼写句子Sentence＝c₁c₂,…,c_n，P300拼写矩阵包括字母A-Z，数字0-9共36个字符，c_i,i＝1,…n为P300拼写矩阵中的字符；

步骤S2：修正Sentence，在Sentence中插入漏输的字符，修改错误字符，得到一个新的句子C_Sentence；

步骤S3：将C_Sentence传送至语音发声器并播放。

在本实施例中，步骤S2中具体包括以下步骤：

步骤S21：设置结构变量Cur，Cur.sen＝Sentence,Cur.loc＝1,Cur.len＝length(Sentence)；初始化栈S，表L，并将Cur压入栈S；

步骤S22：若栈S非空，弹栈更新Cur，转下一步；否则，转入步骤S26；

步骤S23：判断Cur.loc位置上是否要插入字符；若要，Ins.sen＝Insert(Cur.sen,Cur.loc),Ins.loc＝Cur.loc+1,Ins.len＝Cur.len+1,将Ins压入栈S；

步骤S24：修正Cur.loc位置上的字符，Cur.sen＝modify(Cur.sen,Cur.loc)；Cur.loc＝Cur.loc+1；

步骤S25：若Cur.loc大于Cur.len，将Cur插入表L，否则将Cur压入栈S；转入步骤S22；

步骤S26：用单词语言模型计算表L中所有句子的概率，输出概率最高的那个句子C_Sentence。

在本实施例中，步骤S23中所述的判断Cur.loc位置上是否要插入字符及Insert(Cur.sen,Cur.loc)的具体方法为：

以Cur.loc位置为中心，从Cur.sen中取出一个字符子序列，记为c₁c₂…c_k；在c₁c₂...c_k中对应Cur.loc的位置上插入字符c_i,c_i∈C,C包含空格字符和P300拼写矩阵中的所有字符，得到c₁c₂…c_i…c_k+1；用5-gram字符语言模型计算c₁c₂...c_k和c₁c₂...c_i...c_k+1,c_i∈C的概率，从c₁c₂...c_i...c_k+1,c_i∈C这一组字符序列中选出概率最大的那一个，比较它与c₁c₂...c_k的概率，若它的概率更大，则要插入字符；

当要插入字符时，Insert(Cur.sen,Cur.loc)在Cur.sen字符序列的Cur.loc位置上插入使得c₁c₂...c_i...c_k+1,c_i∈C概率最大的那个c_i。

在本实施例中，所述步骤S24中所述的修正Cur.loc位置上的字符，modify(Cur.sen,Cur.loc)的具体方法为：

在本实施例中，步骤S26中所述的计算句子的概率的具体方法为：

读取表L中的句子Cur.sen，以空格为分隔符将单词分隔开,单词依序存于w_i,i＝1,...,m中，然后用3-gram单词语言模型计算句子的概率，公式如下，

其中C(w_i-2w_i-1w_i)和C(w_i-2w_i-1)分别为单词w_i-2w_i-₁w_i和w_i-2w_i-1在语料库中出现的次数。

在本实施例中，所述根据Cur.sen在Cur.loc位置上的那个字符和P300拼写矩阵概率模型，选出实际要输入的可能性较大的若干个字符构成字符集合以及P(c'_l|c_l)取自P300拼写矩阵概率模型，其具体方法为：

对于Cur.sen在Cur.loc位置上的那个字符，查询矩阵A对应的行，就可得到实际要拼写的可能性较大的那些字符；

P(c'_l|c_l)中的c_l和c_l'都是字符，可分别对应矩阵A的行与列，从A中取出相应的概率。

在本实施例中，采用所述5-gram字符语言模型进行计算的具体方法为：

在本实施例中，步骤S3的具体方法为：

将修正完的句子C_Sentence传入语音发声器espeak的命令行执行文件espeak.exe播放。

在本实施例中，P300拼写矩阵可调整，其大小以及所包含的字符不是本专利的核心内容。

在本实施例中，P300拼写矩阵概率模型中矩阵A的大小根据P300拼写矩阵的大小而定。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于P300的脑控话语发声器的实现方法 [P] . 中国专利： CN106951081B . 2019.12.17
2. 一种基于P300的脑控机器人系统及其实现方法 [P] . 中国专利： CN108415554B . 2020.11.10
3. APPARATUS AND METHOD FOR IMPLEMENTING A P300 COMPONENT-BASED BRAIN-COMPUTER INTERFACE [P] . 韩国专利： KR20150124368A . 2015-11-05

机译：用于实现基于P300组件的脑计算机接口的装置和方法
4. APPARATUS AND METHOD FOR IMPLEMENTING P300 COMPONENT-BASED BRAIN-COMPUTER INTERFACE [P] . 美国专利： US2015309572A1 . 2015-10-29

机译：用于实现基于P300组件的脑计算机接口的装置和方法
5. A method of implementing control means based on brain signals [P] . 英国专利： GB9929395D0 . 2000-02-09

机译：一种基于脑信号的控制手段的实现方法