org.xml.sax.SAXParseException: An invalid XML character (Unicode: 0x7)

过滤掉xml文档不识别的字符


表中字段x_contact_method内容是:7986555 986567

System.out.println(rs.getString("x_contact_method"));
输出结果是:
7986555(注:此处是空白方框乱码)986567
中文输出正常。

我想用replaceAll("[\\r\\n]",",")把空白方框乱码替换掉,匹配不到这个字符,怎么匹配到这个字符?


String x_contact_method = rs.getString("x_contact_method");
System.out.println(x_contact_method);
java.util.regex.Pattern INVALID_XML_CHARS = Pattern.compile("[^\\u0009\\u000A\\u000D\\u0020-\\uD7FF\\uE000-\\uFFFD\uD800\uDC00-\uDBFF\uDFFF]");
x_contact_method = INVALID_XML_CHARS.matcher(x_contact_method).replaceAll(" ");
if(x_contact_method!=null){
x_contact_method = x_contact_method.replaceAll("[\\r\\n]",",");//去除有可能有换行的字段。否则出错。
x_contact_method = x_contact_method.replaceAll("\"","'");//去除有可能有双引号的字段。否则出错
}


参考:http://stackoverflow.com/questions/93655/stripping-invalid-xml-characters-in-java

总结:学好英语,利用好谷歌,解决疑难问题不再是问题。

你可能感兴趣的:(xml,String,null,文档,character)