最近遇到一个头疼的问题,用socket接收到一个字符串
格式如下:
{“trade_status”: {“desc”: “\u30106\u3011 - \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/
其中含有一段含有\u的编码字串,怎么将其转化为汉字。
decode().encode(‘utf-8') 不行,decode、encode半天搞不定,后来偶然发现,在decode时可以选则unicode-escape
代码如下:
1
2
3
4
5
6
7
8
9
10
11
|
# -*- coding: utf-8 -*- import socket if __name__ = = '__main__' : sock = socket.socket(socket.af_inet, socket.sock_stream) sock.connect(( '192.168.6.63' , 10001 )) sock.send( '[{"action": "trade_status"}]' ) rec = sock.recv( 1024 ) print rec print rec.decode( 'unicode-escape' ).encode( 'utf-8' ) print rec.decode( 'raw_unicode-escape' ).encode( 'utf-8' ) sock.close() |
输出结果:
1
2
3
|
{ "trade_status" : { "desc" : "\u30101\u3011 - \u4ea4\u6613\u4e2d " }} / * * end * * / { "trade_status" : { "desc" : "【1】 - 交易中 " }} / * * end * * / { "trade_status" : { "desc" : "【1】 - 交易中 " }} / * * end * * / |
补充:python3解析【\u】和【】字符
【\u】字符示例
1
2
|
a = '\u5317\u4eac\u5e02' print (a) |
北京市
1
2
|
b = '\\u5317\\u4eac\\u5e02' print (b) |
\u5317\u4eac\u5e02
json.loads解析
1
2
3
4
5
|
import json a = '\\u5317\\u4eac\\u5e02' b = '"%s"' % a c = json.loads(b) print (a, b, c, sep = '\n' ) |
\u5317\u4eac\u5e02
“\u5317\u4eac\u5e02”
北京市
读取文件中\u字符
demjson
1
|
from demjson import decode # pip install demjson |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/huilan_same/article/details/52218355