json.loads Python错误:
1、'utf8' codec can't decode byte ...
由于需求,要用python读取网页返回json,并取得其中的数据但是却遇到以上编码的问题。
终于找到了解决方案:
我们只需要对字符串进行unicode化,忽略错误就行了。
代码如下:
str2 = unicode( str, errors='ignore')
但是要注意,这里的str必须为字符串,处理之后再送入json.load就可以了。
data = json.loads(str2)
unicode化+忽略错误真给力。
2、ValueError: Invalid \escape: line 1 column 35442 (char 35441)
问题在于编码中是\xa0之类的,当遇到有些不用转义的\http之类的,则会出现以上错误。
解决方案如下:
import re regex = re.compile(r'\\(?![/u"])') fixed = regex.sub(r"\\\\", original)
众多python培训视频,尽在python学习网,欢迎在线学习!