您当前的位置: 首页 >  Python

蔚1

暂无认证

  • 0浏览

    0关注

    4753博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

如何用 Python 爬取网页制作电子书

蔚1 发布时间:2018-04-12 10:43:56 ,浏览量:0

最近,AI 的兴起让 Python 火了一把。实际上 Python 拥有庞大的第三方支持,生态系统非常完整,可以适用各种场景和行业。这次,我们准备通过 Python 学习爬虫的开发,既简单有趣,而且是数据采集重要一环。同时脱离应用谈技术就是耍流氓,通过制作电子书学习数据的收集与整理,即能学到东西又有实用价值。

我们将通过爬取网页信息这个很小的应用场景来体会数据预处理的思想,并从中学习了解数据处理中抓取、处理、分组、存储等过程的实现。我这次分享主要分为以下几个部分:

  1. Python 语法的讲解,通过分享掌握简单的 Python 开发语法和思路,侧重于后面爬虫开发的需要用的内容
  2. Scrapy 爬虫开发,通过分享了解基本的 Scrapy 开发,并实现从网络爬取数据
  3. 使用 Sigil 制作 epub 电子书

最后,我希望通过分享能够入门,并喜欢上 Python 开发,并且掌握 Scrapy 爬虫开发的思路和方法。

阅读全文: http://gitbook.cn/gitchat/activity/5a44901d7ea9db29d39ed8a4

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

关注
打赏
1560489824
查看更多评论
立即登录/注册

微信扫码登录

0.0527s