...
机译:通过使用指纹算法Simhash检测俄语文档中的近重复项
机译:基于指纹的近重复文档检测及其在SNS垃圾邮件检测中的应用
机译:使用混合方法检测几乎重复的文本文档
机译:使用句子级功能和监督学习来检测几乎重复的文档
机译:通过考虑图像,文本,文档和域的大小来检测近重Web文档的新方法
机译:“多种语言的大师”:俄罗斯科学院字典(1789--1794),是一种社会历史文献。
机译:RNA折叠的改进的四俄罗斯方法和稀疏四俄罗斯算法
机译:基于SimHash算法的大规模文献重复数据删除技术研究