您当前的位置: 首页 >  Python

每日出拳老爷子

暂无认证

  • 4浏览

    0关注

    135博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Python:ValueError: No tables found matching pattern ‘.+‘

每日出拳老爷子 发布时间:2021-08-25 14:51:49 ,浏览量:4

背景

用pandas的readhtml方法读Selenium拿下来的网页元素时发生报错。 之前这个爬虫已经正常运行了几周,感觉是网页源码出了什么问题。

思考

网上关于这个报错的原因解释千奇百怪,所以觉得是个挺宽泛的报错,原因还是得结合实际情况自己分析。 pd.readhtml的作用是自动识别html string中所有的table标签并将其转化为dataframe,所以应该是哪个table的内容识别出了问题。

找原因

有了思路,方法也就有了,既然是数据内容出了问题,那就从数据内容开始排查。 我将原html的整个篇幅形成了table数组,一个一个地排查,发现中间掺进来一个没有tr,th标签的空table.(写网页的人脑子怎么了?)

对应方法

找到了原因,对应的方法也就有了。 获得待分析的content内容后,对内部所有table结构做个过滤,排除掉所有不含

关注
打赏
1657016083
查看更多评论
立即登录/注册

微信扫码登录

0.1378s