轻松python文本专题-maketrans和translate
场景:
过滤字符串的某些字符,我们从例子出发
>>> tb=str.maketrans ("abc","123")
>>> "abcd".translate (tb)
"123d"
>>> "abcd+++a+b+cd".translate (tb)
"123d+++1+2+3d"
>>>
1.建立字符映射表,也就是maketrans方法所做的事情,它返回一个字符串的映射表,意思是:如果字符串里面出现a,那么它就会变成对应的1,如此类推,b->2,c->3
2.使用translate方法,将字符串里面的字符改掉
注意:
1.映射两遍的长度必须一致,不然报错,也就是说"abc"一定需要对于"123"或者"234"等,不能是"abc"对应"12",这个时候就报错
>>> tb=str.maketrans ("abc","12")
Traceback (most recent call last):
File "", line 1, in
tb=str.maketrans ("abc","12")
ValueError: the first two maketrans arguments must have equal length
>>>
2.还需要注意的是,字符串的translate方法只接受一个参数,而bytes的translate方法是可以接收两个参数,而且第二个参数可以快速实现删除方法
>>> bytes_tb = bytes.maketrans(b"abcd", b"ABCD")
>>> b"abcdefg".translate (bytes_tb,b"a")
b"BCDefg"
>>>
下面列举一些translate的一些应用方法:(注意:为了快速实现删除,所以下面的方法都是用bytes的translate)
修改某些字符串:
>>> def AToB(seq,frm,to):
if len(frm)or len(frm)>len(to):return "映射字符长度不一致"
else:
bytes_tb = bytes.maketrans(frm,to)
return seq.translate (bytes_tb)
>>> AToB(b"abcd",b"a",b"t1")
"映射字符长度不一致"
>>> AToB(b"abcd",b"a1",b"t")
"映射字符长度不一致"
>>> AToB(b"abcd",b"a",b"t")
b"tbcd"
>>>
删除某些字符串:
>>> def AToB(seq,delete):
return seq.translate (None,delete)
>>> AToB(b"abcd",b"a")
b"bcd"
>>>
保留某些字符:
>>> def AToB(seq,keep):
delete=seq.translate (None,keep)
return seq.translate (None,"font-family: Arial, Helvetica, sans-serif;">delete)
>>> AToB(b"abcd",b"a")
b"a"
>>>
就说到这里,谢谢大家