首页> 中国专利> 一种聊天数据分段方法、装置及存储介质

一种聊天数据分段方法、装置及存储介质

摘要

本发明公开了一种聊天数据分段方法及装置,该方法包括以下步骤:S1:对聊天数据进行切分获得多个预分段段落;S2:通过话题切换的特征语句库与预分段段落的句子向量相似度判断预分段段落是否是包含不同话题内容的段落,若是,则对预分段段落进行再分段获得再分段段落,并对再分段段落重复步骤S2,若否,则进入下一步;以及S3:通过计算相邻的再分段段落的段落向量相似度判断再分段段落是否存在内容相关的相邻的段落,若是,则对再分段段落进行合并获得终分段段落,对终分段段落重复步骤S3,若否,则将再分段段落作为终分段段落。通过此方法可以将不同话题的聊天数据进行有效的分段,提高聊天数据处理效率。

著录项

  • 公开/公告号CN110399489B

    专利类型发明专利

  • 公开/公告日2022-06-17

    原文格式PDF

  • 申请/专利权人 厦门市美亚柏科信息股份有限公司;

    申请/专利号CN201910611047.4

  • 申请日2019-07-08

  • 分类号G06F16/35;G06K9/62;

  • 代理机构厦门福贝知识产权代理事务所(普通合伙);

  • 代理人郝学江

  • 地址 361000 福建省厦门市软件园二期观日路12号102-402单元

  • 入库时间 2022-08-23 13:52:20

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号