机译:使用句子级功能和监督学习来检测几乎重复的文档
Department of Electrical Engineering, National Sun Yat-Sen University, Kaohsiung 804, Taiwan;
Department of Electrical Engineering, National Sun Yat-Sen University, Kaohsiung 804, Taiwan;
Department of Electrical Engineering, National Sun Yat-Sen University, Kaohsiung 804, Taiwan;
near-duplicate; feature selection; similarity function; training data; support vector machine; discriminant function;
机译:XNDDF:建立一种使用监督和无监督学习的灵活的近重复文档检测框架
机译:通过使用指纹算法Simhash检测俄语文档中的近重复项
机译:使用混合方法检测几乎重复的文本文档
机译:聚合句子级功能以进行中文近重复文档检测
机译:通过对持久性威胁和面向收件人的功能进行监督分类来检测目标恶意电子邮件。
机译:局部嵌入自动编码器:一种半监督的流形学习的文档表示形式
机译:XNDDF:建立一种使用监督和无监督学习的灵活的近重复文档检测框架