>> "abcd".translate (tb)   "123d"   >>> "abcd+++a+b+cd".translate (tb)   "12" />
牛骨文教育服务平台(让学习变的简单)

轻松python文本专题-maketrans和translate

场景:

过滤字符串的某些字符,我们从例子出发

  >>> tb=str.maketrans ("abc","123")  
  >>> "abcd".translate (tb)  
  "123d"  
  >>> "abcd+++a+b+cd".translate (tb)  
  "123d+++1+2+3d"  
  >>>   

1.建立字符映射表,也就是maketrans方法所做的事情,它返回一个字符串的映射表,意思是:如果字符串里面出现a,那么它就会变成对应的1,如此类推,b->2,c->3

2.使用translate方法,将字符串里面的字符改掉

注意:

1.映射两遍的长度必须一致,不然报错,也就是说"abc"一定需要对于"123"或者"234"等,不能是"abc"对应"12",这个时候就报错

  >>> tb=str.maketrans ("abc","12")  
  Traceback (most recent call last):  
    File "", line 1, in   
      tb=str.maketrans ("abc","12")  
  ValueError: the first two maketrans arguments must have equal length  
  >>>   

2.还需要注意的是,字符串的translate方法只接受一个参数,而bytes的translate方法是可以接收两个参数,而且第二个参数可以快速实现删除方法

  >>> bytes_tb = bytes.maketrans(b"abcd", b"ABCD")  
  >>> b"abcdefg".translate (bytes_tb,b"a")  
  b"BCDefg"  
  >>>   

下面列举一些translate的一些应用方法:(注意:为了快速实现删除,所以下面的方法都是用bytes的translate)

修改某些字符串:

  >>> def AToB(seq,frm,to):  
      if len(frm)or len(frm)>len(to):return "映射字符长度不一致"  
      else:  
          bytes_tb = bytes.maketrans(frm,to)  
          return seq.translate (bytes_tb)  
    
        
  >>> AToB(b"abcd",b"a",b"t1")  
  "映射字符长度不一致"  
  >>> AToB(b"abcd",b"a1",b"t")  
  "映射字符长度不一致"  
  >>> AToB(b"abcd",b"a",b"t")  
  b"tbcd"  
  >>>   

删除某些字符串:

  >>> def AToB(seq,delete):  
      return seq.translate (None,delete)  
    
  >>> AToB(b"abcd",b"a")  
  b"bcd"  
  >>>   

保留某些字符:

  >>> def AToB(seq,keep):  
      delete=seq.translate (None,keep)  
      return seq.translate (None,"font-family: Arial, Helvetica, sans-serif;">delete)  
    
  >>> AToB(b"abcd",b"a")  
  b"a"  
  >>>   

就说到这里,谢谢大家