机译:使用远程麦克风和全向摄像头的低延迟实时会议识别和理解
机译:通过结合特定于说话人的GMM和适用于说话人的HMM,基于位置相关的CMN进行鲁棒的远方说话人识别
机译:使用音量评估的SRP-PHAT和视频分析为会议提供多峰发言人二分法
机译:利用扬声器的二元化来满足远处麦克风的识别
机译:会议发言者使用语音定位功能。
机译:使用随机森林监督扬声器日期:一种心理治疗过程研究的工具
机译:使用多种信息源进行多远程麦克风会议的演讲者区分
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。