牛骨文教育服务平台(让学习变的简单)
博文笔记

python 比较两个序列的相似度,不需要分词

创建时间:2015-07-09 投稿人: 浏览次数:4776

code

通过Python来判断2个文字列的相似度的多少,合理使用的话就可以实现Google等搜索引擎中的 你是不是要找 的功能了。

import difflib
a=u"阿里巴巴"
b=u"阿里爸爸"
print difflib.SequenceMatcher(None,a,b).ratio()

0.75

返回的结果超过0.6就算很相似。看来目前完全人肉做近义词词典的工作有一部分可以自动化来实现了。

ref

http://pymotw.com/2/difflib/
http://jianslog.appspot.com/tag/Python
http://jianslog.appspot.com/tag/Python

声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。