首页> 中国专利> 一种基于正则化的去社会偏见的语言模型及应用

一种基于正则化的去社会偏见的语言模型及应用

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于正则化的去社会偏见的语言模型及应用，包括以下步骤：(1)清洗PTB语料文本库后，筛选PTB语料文本库中会出现社会偏见的词语并标记；(2)搭建包括三层LSTM网络、全连接层、softmax层的语言模型；(3)利用PTB语料文本库训练语言模型，在训练时，以文本生成任务的损失Lossaccuracy和去社会偏见正则化项损失Lossfairness组成的总损失Loss为最终损失；(4)每训练一阶段，以语言模型输出的预测文本的社会偏见分数相对PTB语料文本的社会偏见分数的分布状态来评判语言模型的去社会偏见效果，当分布状态满意时，获得最终的语言模型。该语言模型提高了预测输出的公平性。

著录项

公开/公告号CN111753044A

专利类型发明专利
公开/公告日2020-10-09

原文格式PDF
申请/专利权人浙江工业大学;
展开▼

申请/专利号CN202010609422.4
发明设计人陈晋音;缪盛欢;徐思雨;陈治清;徐国宁;
展开▼

申请日2020-06-29
分类号G06F16/31(20190101);G06N3/04(20060101);G06F40/205(20200101);G06F40/216(20200101);G06F40/263(20200101);G06F40/289(20200101);G06K9/62(20060101);
代理机构33224 杭州天勤知识产权代理有限公司;
代理人曹兆霞
地址 310014 浙江省杭州市下城区潮王路18号
入库时间 2023-06-19 08:30:12

法律信息

法律状态公告日

法律状态信息

法律状态
2022-05-17

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于正则化的去社会偏见的语言模型及应用 [P] . 中国专利： CN111753044A . 2020-10-09
2. 一种基于L0正则化的自然图像盲去运动模糊的方法 [P] . 中国专利： CN105809642A . 2016-07-27
3. Applications i.e. contactless payment applications, administrating method for mobile telephone terminal, involves deactivating applications to transmit deactivation request of previously activated group to access controller [P] . 法国专利： FR2945143A1 . 2010-11-05

机译：应用程序，即非接触式支付应用程序，一种用于移动电话终端的管理方法，涉及去激活应用程序以将先前激活的组的去激活请求发送到访问控制器。
4. Generation of topic-based language models for an app search engine [P] . 美国专利： US9805022B2 . 2017-10-31

机译：为应用搜索引擎生成基于主题的语言模型
5. Using speech recognition results based on an unstructured language model in a mobile communication facility application [P] . 美国专利： US8886540B2 . 2014-11-11

机译：在移动通信设施应用中使用基于非结构化语言模型的语音识别结果