首页> 中国专利> 通过有限身份信息生成自我介绍的语言模型构建训练方法

通过有限身份信息生成自我介绍的语言模型构建训练方法

摘要

本发明涉及语言模型构建训练技术领域,具体为一种通过有限身份信息生成自我介绍的语言模型构建训练方法,包括:S1、获取自我介绍样本,并提取身份特征;其中身份特征包括姓名、身份、职务、愿景和场景中一种或多种;S2、将身份特征转化为向量;S3、构建包含向量及其对应的自我介绍样本的训练数据集;S4、构建语言模型,并采用训练数据集对语言模型进行训练;其中向量作为语言模型的输入,学习向量及其自我介绍样本之间的关联,并根据关联生成自我介绍作为输出。本方案能通过有限的身份信息,训练出能生成更加贴合个人特征和当前应用环境的自我介绍的语言模型,以提升生成的自我介绍的针对性和准确性。

著录项

  • 公开/公告号CN116680573A

    专利类型发明专利

  • 公开/公告日2023-09-01

    原文格式PDF

  • 申请/专利权人 重庆珏盛教育科技有限公司;

    申请/专利号CN202310797196.0

  • 发明设计人 况锦文;王雩;罗欣;

    申请日2023-06-30

  • 分类号G06F18/214(2023.01);G06F18/10(2023.01);

  • 代理机构重庆强大凯创专利代理事务所(普通合伙) 50217;

  • 代理人赵玉乾

  • 地址 401121 重庆市渝北区金童路融创金贸时代北区9-20

  • 入库时间 2024-01-17 01:27:33

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-19

    实质审查的生效 IPC(主分类):G06F18/214 专利申请号:2023107971960 申请日:20230630

    实质审查的生效

  • 2023-09-01

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及语言模型构建训练技术领域,具体为一种通过有限身份信息生成自我介绍的语言模型构建训练方法。

背景技术

自我介绍是人们在众多场合中必不可少的一项技能,无论是在面试、社交活动还是在学校演讲中,都需要进行自我介绍,而一篇好的自我介绍可以让人对你留下深刻印象。

随着人工智能的发展,研究人员提出了能自动生成自我介绍的语言模型,辅助人们写作出一篇好的自我介绍,但是现有的语言模型在训练时,存在下列问题:

1、现有训练方法中,训练语言模型时通常使用的是大规模的匿名数据集,缺乏对个人身份特征的深入理解和学习,因此生成的自我介绍内容可能缺乏针对性和准确性,不贴合个人特征;

2、现有技术在训练语言模型时,没有充分考虑到个人身份信息对自我介绍的重要性,训练出来的语言模型,无法在生成过程中准确地融入个人特征,导致生成的自我介绍内容缺乏针对性和真实性;且由于语言模型在生成过程中,需要覆盖各种生成或应用场景,导致在特定场景的应用上,并不具备该领域专业人士的逻辑性,不贴合当前应用环境。

因此现在急需一种通过有限身份信息生成自我介绍的语言模型构建训练方法,能通过有限的身份信息,训练出能生成更加贴合个人特征和当前应用环境的自我介绍的语言模型,以提升生成的自我介绍的针对性和准确性。

发明内容

本发明意在提供一种通过有限身份信息生成自我介绍的语言模型构建训练方法,能通过有限的身份信息,训练出能生成更加贴合个人特征和当前应用环境的自我介绍的语言模型,以提升生成的自我介绍的针对性和准确性。

本发明提供如下基础方案:通过有限身份信息生成自我介绍的语言模型构建训练方法,包括:

S1、获取自我介绍样本,并提取身份特征;其中身份特征包括姓名、身份、职务、愿景和场景中一种或多种;

S2、将身份特征转化为向量;

S3、构建包含向量及其对应的自我介绍样本的训练数据集;

S4、构建语言模型,并采用训练数据集对语言模型进行训练;其中向量作为语言模型的输入,学习向量及其自我介绍样本之间的关联,并根据关联生成自我介绍作为输出。

进一步,还包括:S5、根据预设的评分机制,对语言模型输出的自我介绍进行评分,生成评分结果,并根据评分结果对语言模型输出的自我介绍进行筛选和调整。

进一步,所述评分机制为自定义的评分函数;

所述评分函数根据语言模型输出的自我介绍的预设指标来计算各自我介绍的得分,作为评分结果。

进一步,所述S1中,还包括:对获取自我介绍样本进行数据清洗和预处理,并对预设的敏感信息和个人身份识别内容进行匿名化处理。

进一步,所述S2,包括:通过预训练的词嵌入模型或自定义的嵌入层,将身份特征转化为向量。

进一步,所述语言模型为GPT-3模型,包括:若干个Transformer层和一个输出层;

Transformer层,用于处理作为输入的向量,学习向量及其自我介绍样本之间的关联;

输出层,用于根据关联生成自我介绍作,并输出。

进一步,所述构建语言模型,包括:使用深度学习框架构建语言模型。

本方案的有益效果:1、本方案在大量的自我介绍样本中提取有限的身份特征,即身份信息,包括:姓名、身份、职务、愿景和场景;将五项身份特征转化为向量,使其映射到一个高维向量空间中,便于后续语言模型能够处理和学习这些身份信息;再将向量及其对应的自我介绍样本构建成训练数据集,用于训练构建的语言模型,使语言模型能够学习向量及其自我介绍样本之间的关联,并根据关联生成自我介绍,使得生成的自我介绍更加贴合个人特征和当前应用环境,更加个性化,提升自我介绍的针对性和准确性。

2、为了更全面地表达个人特征,本方案将获取的自我介绍样本进行拆解,通过对这些要素之间的逻辑梳理和排列组合,为语言模型的训练提供了更加清晰的路径和生成逻辑,这种优化能够使得语言模型在生成自我介绍内容时更具有丰富性和表现力。

3、本方案设置了对语言模型的输出进行评分的评分机制,通过评分函数对语言模型输出的自我介绍的预设指标进行计算,获取各自我介绍中预设指标的得分,作为评分结果,根据评分结果对语言模型输出的自我介绍进行筛选和调整,从而提高语言模型输出的自我介绍的质量和准确性,使得生成的自我介绍更符合要求。

4.用户才有训练后的语言模型,能自动化且高效地生成自我介绍,节省用户的时间和精力;且用户只需提供有限的身份信息,即可获得贴合个人特点的自我介绍文字,根据不同的身份、职务、愿景和场景,能生成符合当前身份、职务、愿景和场景的自我介绍,便于用户当前使用,提高了使用的便捷性。

附图说明

图1为本发明通过有限身份信息生成自我介绍的语言模型构建训练方法实施例的流程示意图。

具体实施方式

下面通过具体实施方式进一步详细说明:

实施例基本如附图1所示:

通过有限身份信息生成自我介绍的语言模型构建训练方法,包括:

S1、获取自我介绍样本,对获取的自我介绍样本进行数据清洗和预处理,并对预设的敏感信息和个人身份识别内容进行匿名化处理,并提取身份特征;其中身份特征包括姓名、身份、职务、愿景和场景中一种或多种;

具体地,通过网络爬虫从互联网收集自我介绍样本,或通过人工方式从各种来源收集自我介绍样本;再对获取的自我介绍样本进行数据清洗和预处理,并对预设的敏感信息和个人身份识别内容进行匿名化处理,例如:家庭住址,身份证号等,以保护用户的个人隐私;最后在自我介绍样本中提取身份特征;

S2、将身份特征转化为向量;具体地,通过预训练的词嵌入模型(如:Word2Vec或GloVe)或自定义的嵌入层,将身份特征映射到一个高维向量空间中,转化为向量,以便语言模型能够处理和学习身份特征;

S3、构建包含向量及其对应的自我介绍样本的训练数据集;训练数据集中的每个训练样本都包含向量(身份特征)及其对应的自我介绍样本;训练数据集可以提供丰富的训练样本,以让语言模型学习身份特征与自我介绍之间的关联;

S4、构建语言模型,并采用训练数据集对语言模型进行训练;其中向量作为语言模型的输入,学习向量及其自我介绍样本之间的关联,并根据关联生成自我介绍作为输出;

具体地,本实施例中使用深度学习框架构(如:TensorFlow或PyTorch)建语言模型;其中语言模型为GPT-3模型,包括:若干个Transformer层和一个输出层;Transformer层,用于处理作为输入的向量,学习向量及其自我介绍样本之间的关联;输出层,用于根据关联生成自我介绍作,并输出。其中向量及其自我介绍样本之间的关联,由前期对所有的自我介绍样本进行逐个拆解,拆解成65个关键要素,并通过排列组合形成自我介绍的表达逻辑和方法,向量及其自我介绍样本之间的关联为向量和65个关键要素的关联,通过向量获取对应的关键要素进行排列组合形成自我介绍;

S5、根据预设的评分机制,对语言模型输出的自我介绍进行评分,生成评分结果,并根据评分结果对语言模型输出的自我介绍进行筛选和调整,以选择出更优秀的自我介绍,同时可以根据评分结果对语言模型进行调整;

其中评分机制为自定义的评分函数;评分函数根据语言模型输出的自我介绍的预设指标来计算各自我介绍的得分,作为评分结果;其中预设指标根据需求进行设置,本实施例中设置了六个预设指标,包括:字数标准、结构完整度、姓名解释评分、内容准确度、愿景续写评分和整体流畅度;评分函数中分数范围为0-10分,其中10分为满分;

本实施例中评分标准:分数范围为0-10分10分为满分,

字数标准,在200-400字范围以内,若在此范围外,扣除2分;

结构完整度,包含设置的每项身份特征,少一项扣除1分;

姓名解释,对姓名这一身份特征的解释是否合理应用姓名解释的关键要素,表达是否流程且具有记忆点,若否,则扣1分;具体地,可采用人工智能或者专家评价,本实施例中采用人工智能设置分类算法,对姓名这一身份特征的解释是否合理应用姓名解释的关键要素,表达是否流程且具有记忆点进行分类,从而对姓名解释进行评分;对于愿景续写评分和整体流畅度采用相同处理方式;

内容准确度,是否存在逻辑性错误和常识性错误,若是,则扣1分;

愿景续写评分,是否对愿景这一身份特征进行拆解并和其他身份特征(如:姓名和身份)进行关联,若否,则扣1分;

整体流畅度,生成的自我介绍文本的整体语言是否流畅,表达逻辑是否清晰,若否,则扣一份;

总分在6分以下为废稿,6-7分为合格,8分以上为优秀;根据评分结果对语言模型进行调整,可以为删除废稿,对合格和优秀的自我介绍文本进行排序输出。

生成的语言模型可用于用户在各类场景中生成自我介绍,例如:一名用户需要在社交场景进行自我介绍,该用户只需要提供他的姓名(例如:张三)、身份(例如:软件工程师)、职务(例如:前端开发)、愿景(例如:希望成为一名优秀的全栈工程师)、场景(例如:职场社交),训练好的语言模型,根据这些身份特征,生成一段个性化、准确和优秀的自我介绍,从而提高该用户撰写自我介绍的效率和质量,同时也为他们节省了准备自我介绍的时间和精力。

以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号