Charikar; LSH; Near-duplicate Vietnamese detection; Weighting scheme; Hash scheme;
机译:基于指纹的近重复文档检测及其在SNS垃圾邮件检测中的应用
机译:通过OpenCL在几乎重复的文档检测中评估CPU,GPU和FPGA的效率
机译:通过OpenCL在几乎重复的文档检测中评估CPU,GPU和FPGA的效率
机译:大型数据库中越南文档的近副本检测
机译:分层超视频文档数据库系统:超视频文档数据库的设计和建模
机译:大型专家管理的数据库用于对生物医学文献搜索中的基准文件相似性进行检测
机译:XNDDF:建立一种使用监督和无监督学习的灵活的近重复文档检测框架
机译:在自然医学中建立越南草药数据库走向大数据科学。