python中从字符串中截取中文和英文字符

创建时间：2016-09-20 投稿人：浏览次数：2263

# -*- coding: utf-8 -*-
#encoding=utf8
import os,sys,re
#
# test_str1="蒙派克E"
#
# test_str2="新ABC蒙派克"
#
# test_s1 = test_str1.decode("utf-8")
# test_s2= test_str2.decode("utf-8")
#
# pat_1 = re.compile(ur"[u4e00-u9fa5]") ＃这里是关键，
#
# s1_zhongwen=""
#
# s2_zhongwen=""
#
# for item in re.findall(pat_1,test_s1): ＃这里截取出中文字符
#     # print item
#     s1_zhongwen=s1_zhongwen+item
#     print s1_zhongwen
#
# for item in re.findall(pat_1,test_s2):
#     s2_zhongwen=s2_zhongwen+item
#     print s2_zhongwen
#
# for item in (set(s1_zhongwen)-set(s2_zhongwen))|(set(s2_zhongwen)-set(s1_zhongwen)):
#     print item
 #计算到两个车型的中文名称的重叠度。
 # print pat_1.split(test_s2)＃这里截取出非中文的字符 


以及，快速的把字符串，变成各个单个字符元素组成的集合的方法

# tl1=[1,3,5,"abc"]
#
# tl2=[3,4,5]
#
# tl3=[5,9]
#
#
#
# test_set=set(tl1) | set(tl2) | set(tl3)
#

声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。

上一篇： MMR自动摘要 python实现
下一篇： python 关键字提取

热门文章: CTF writeup 2_南邮网络攻防训...; SSM框架——详细整合教程（...; Linux Shell脚本编程－－curl命...; HttpClient使用详解; Java面试题全集（上）; JAVA设计模式之单例模式; java.lang.OutOfMemoryError: PermGen ...; TCP协议中的三次握手和四次...; form表单的两种提交方式，su...; String,StringBuffer与StringBuilder...

最新文章: Java之品优购课程讲义_day20（7）; 剑指 Offer - 8：跳台阶; Netty权威指南_札记02_NIO编程; mysql时间属性之时间戳和datetime之...; 虚拟现实或许可以拯救古埃及的“...; spring cloud服务注册中心eureka---集群...; Java SE 第六章; HTTP请求+数据库; HIDL学习笔记之HIDL C++（第二天）; ubuntu系统下指定tomcat运行时为JDK1.8...