Skip to content

Latest commit

 

History

History
10 lines (7 loc) · 518 Bytes

File metadata and controls

10 lines (7 loc) · 518 Bytes

第二部分:开始爬取

在本节中,您将学习如何通过使用 web 抓取和 Python 编程来规划、分析和处理目标网站所需的数据。将探讨有关有效工具和各种数据收集技术的信息。

本节由以下章节组成:

  • 第 2 章Python 和 Web——使用 urllib 和请求
  • 第 3 章使用 LXML、XPath 和 CSS 选择器
  • 第 4 章使用 pyquery 进行抓取—Python 库
  • 第 5 章爬取用粘滑靓汤