首页> 中国专利> 一种基于深度域适应的跨域测试文档分类方法

一种基于深度域适应的跨域测试文档分类方法

摘要

本发明提出了一种基于深度域适应的跨域测试文档分类方法。包括1、数据采集阶段,获取足够多的辅助领域的文档数据及其标注,以及要分类的目标领域的文档数据;2、数据预处理阶段,对俩个领域的全部文档进行词语的划分之后进行去重和去停用词,之后进行字典的构建,再将每一个文档表示成one‑hot向量的形式;3、在跨域数据迁移阶段,将辅助领域和目标领域的数据同时送入深度网络中,来进行特征的学习和提取。本发明节省了数据标注的时间和人力成本,可结合多种网络结构进行特征的提取。

著录项

  • 公开/公告号CN113360633A

    专利类型发明专利

  • 公开/公告日2021-09-07

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN202110641886.8

  • 申请日2021-06-09

  • 分类号G06F16/335(20190101);G06F16/35(20190101);G06F40/242(20200101);G06F40/279(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32249 南京瑞弘专利商标事务所(普通合伙);

  • 代理人孙建朋

  • 地址 210023 江苏省南京市栖霞区仙林大道163号

  • 入库时间 2023-06-19 12:29:04

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号