python中从字符串中截取中文和英文字符
# -*- coding: utf-8 -*- #encoding=utf8 import os,sys,re # # test_str1="蒙派克E" # # test_str2="新ABC蒙派克" # # test_s1 = test_str1.decode("utf-8") # test_s2= test_str2.decode("utf-8") # # pat_1 = re.compile(ur"[u4e00-u9fa5]") #这里是关键, # # s1_zhongwen="" # # s2_zhongwen="" # # for item in re.findall(pat_1,test_s1): #这里截取出中文字符 # # print item # s1_zhongwen=s1_zhongwen+item # print s1_zhongwen # # for item in re.findall(pat_1,test_s2): # s2_zhongwen=s2_zhongwen+item # print s2_zhongwen # # for item in (set(s1_zhongwen)-set(s2_zhongwen))|(set(s2_zhongwen)-set(s1_zhongwen)): # print item #计算到两个车型的中文名称的重叠度。 # print pat_1.split(test_s2)#这里截取出非中文的字符 以及,快速的把字符串,变成各个单个字符元素组成的集合的方法
# tl1=[1,3,5,"abc"] # # tl2=[3,4,5] # # tl3=[5,9] # # # # test_set=set(tl1) | set(tl2) | set(tl3) #
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。
- 上一篇: MMR自动摘要 python实现
- 下一篇: python 关键字提取