首页> 中国专利> 一种基于深度学习的端到端说话人分割方法及系统

一种基于深度学习的端到端说话人分割方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于深度学习的端到端说话人分割方法及系统，其通过采集第一单人语音和第二单人语音进行真实STFT特征提取、语音混合处理、混合STFT特征的提取、分割STFT特征的计算、真实STFT特征与分割STFT特征的比较、模型的优化，从而训练得到所需的模型；使用时，无需先将混合语音分割成多段短语音，再通过聚类算法将属于同一个说话人的多个短语音进行聚类处理得到同一个说话人的长语音；而是直接将待分割的混合语音输入训练好的模型即可输出每一个说话人的分割语音，这种端到端的方法可以避免中间过程的误差积累，分割精度更高。

著录项

公开/公告号CN109461447A

专利类型发明专利
公开/公告日2019-03-12

原文格式PDF
申请/专利权人厦门快商通信息技术有限公司;
展开▼

申请/专利号CN201811158674.9
发明设计人叶志坚;李稀敏;肖龙源;蔡振华;刘晓葳;谭玉坤;
展开▼

申请日2018-09-30
分类号
代理机构厦门仕诚联合知识产权代理事务所(普通合伙);
代理人乐珠秀
地址 361007 福建省厦门市思明区嘉禾路267号9楼902室B区
入库时间 2024-02-19 06:49:52

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-05

实质审查的生效 IPC(主分类):G10L17/04 申请日:20180930

实质审查的生效
2019-03-12

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于深度学习的端到端说话人分割方法及系统 [P] . 中国专利： CN109461447A . 2019-03-12
2. 一种端到端说话人分割方法及系统 [P] . 中国专利： CN109545228A . 2019-03-29
3. NATURALIST INTELLIGENCE-BASED NATURAL EXPRESSION PROCESSING METHOD, AND RESPONSE METHOD, DEVICE AND SYSTEM, METHOD FOR TRAINING ROBOT, HUMAN-COMPUTER INTERACTION SYSTEM, METHOD FOR TRAINING NATURALIST INTELLIGENCE-BASED HUMAN-COMPUTER INTERACTION SYSTEM, AND END-TO-END CONTROL METHOD AND CONTROL SYSTEM [P] . 世界知识产权组织专利： WO2020151652A1 . 2020-07-30

机译：基于自然智能的自然表达处理方法，响应方法，装置和系统，训练机器人的方法，人机交互系统，训练基于自然智能的人机交互系统的方法以及端到端控制方法和系统控制系统
4. A system and method by which a mobile phone can communicate with Bluetooth Low Energy (BLE) devices in an end to end safety management application providing automated check-in / check-out function, automated display of safety messages, automated data collection, ability to trigger a duress sms, ability to monitor status of remote personnel or email via BLE hardware. The system operates by way of an ‘App’ on the mobile phone. The mobile phone App connects to a cloud based monitoring system to track above tasks. Tasks are activated by BLE Beacon hardware. [P] . AU2016100467A4 . 2016-05-26

机译：一种系统和方法，通过该系统和方法，手机可以在端到端安全管理应用程序中与低功耗蓝牙（BLE）设备进行通信，从而提供自动检入/检出功能，自动显示安全消息，自动数据收集，触发胁迫短信，能够通过BLE硬件监视远程人员或电子邮件的状态。该系统通过手机上的“应用”运行。手机应用程序连接到基于云的监视系统以跟踪上述任务。任务由BLE Beacon硬件激活。
5. METHOD FOR CONTROLLING TRANSMISSION OF MULTIMEDIA DATA FROM SERVER TO CLIENT BASED ON CLIENT'S DISPLAY CONDITION, METHOD AND MODULE FOR ADAPTING DECODING OF MULTIMEDIA DATA IN CLIENT BASED ON CLIENT'S DISPLAY CONDITION, MODULE FOR CONTROLLING TRANSMISSION OF MULTIMEDIA DATA FROM SERVER TO CLIENT BASED ON CLIENT'S DISPLAY CONDITION AND CLIENT-SERVER SYSTEM [P] . 日本专利： JP2006134326A . 2006-05-25

机译：基于客户端的显示状况的从服务器到客户端的多媒体数据传输控制方法，基于客户端的显示状况的从客户端到多媒体数据自适应解码的方法和模块，基于服务器的多媒体数据从客户端到客户端的传输到客户端的控制方法和客户端服务器系统