您当前的位置: 首页 >  Python

Python爬虫:处理html实体编码

彭世瑜 发布时间:2018-04-20 11:49:29 ,浏览量:4

Python处理HTML实体编码

python2
import HTMLParser  

char = r"〹"  
http_parser = HTMLParser.HTMLParser();  
uChar = http_parser.unescape(char);  
python3
from html import unescape

s = u'position.php?&start=10#a" id="next">下一页'

print(s)

print(unescape(s))

"""
position.php?&start=10#a" id="next">下一页
position.php?&start=10#a" id="next">下一页 
"""

参考: Python处理HTML实体编码

关注
打赏
1688896170
查看更多评论

彭世瑜

暂无认证

  • 4浏览

    0关注

    2727博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.4404s