保存特殊字符到utf8编码的mysql数据库中
由于特殊字符需要四个字节才能保存,而mysql5.5.3以下的版本中的utf8并不支持四字节的存储,(mysql5.5.3以上才有utf8mb4类型支持存储),此时,如果不能升级数据库,又不考虑过滤掉特殊字符,可以将特殊字符转换成iso8859-1保存到数据库中,但是会乱码,在需要使用的时候需要进行转码处理。
ps:
过滤特殊字符的方法:
public String removeEmojiUnicode(String str)
{
if (str == null)
{
return null;
}
str = str.replaceAll("[^\u0000-\uFFFF]", "");
return str;
}
转换编码:
public String encodeString(String value)
{
String retval = null;
try
{
retval = new String(value.getBytes("utf-8"), "ISO-8859-1");
} catch (UnsupportedEncodingException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
return retval;
}
public String decodeString(String value)
{
String retval = null;
try
{
retval = new String(value.getBytes("ISO-8859-1"), "utf-8");
} catch (UnsupportedEncodingException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
return retval;
}
retval = new String(value.getBytes("ISO-8859-1"), "utf-8");
此时需要保证value 为"ISO-8859-1"编码,否则转换将不成功。
具体表现:调用decodeString多次,乱码。
原因:String.getBytes("XX")是将String按照“XX”编码方式变成byte数组,
http://blog.sina.com.cn/s/blog_6d3fcc7e0101a4pn.html
- 上一篇: MD5信息摘要算法
- 下一篇: file_get_contents 小结