用Python解析编码为gb2312的xml,
<?xml version="1.0" encoding="gb2312" ?>
<node>...</node>
会报错:
ValueError: multi-byte encodings are not supported
试过ElementTree和minidom,都是如此。
最后采用了先解码再编码为utf8:
dstr = dstr.decode('gb2312').encode('utf-8'),
然后再字符串替换
dstr = dstr.replace('gb2312', 'utf-8')
才可以解析xml。很不优雅!
有什么好的解决方案?
<?xml version="1.0" encoding="gb2312" ?>
<node>...</node>
会报错:
ValueError: multi-byte encodings are not supported
试过ElementTree和minidom,都是如此。
最后采用了先解码再编码为utf8:
dstr = dstr.decode('gb2312').encode('utf-8'),
然后再字符串替换
dstr = dstr.replace('gb2312', 'utf-8')
才可以解析xml。很不优雅!
有什么好的解决方案?