python通过pdfkit爬取麦子学院所有文档,并做成离线pdf文档

  • A+
所属分类:python

环境:python3.6

需要安装:

    安装:pip install pdfkit 

    电脑需要安装wkhtmltopdf插件,下载地址https://wkhtmltopdf.org/downloads.html

    其他:requests,BeautifulSoup4

脚本:

    

不出意外我爬取了700M的pdf文档,都是分开的,每个pdf

python通过pdfkit爬取麦子学院所有文档,并做成离线pdf文档

我的博客即将搬运同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
admin

发表评论

您必须登录才能发表评论!