第7课: bs4 库 的 BeautifulSoup 基础学习

这里写目录标题

  • 本节课内容所需要安装的 库:
  • BeautifulSoup 简介:
  • lxml 简介:
  • requests ,BeautifulSoup 和 lxml 相互三者关系:
  • 如何利用 bs4 的 BeautifulSoup 抓取和筛选需要的数据:
  • bs4 的 Beautiful Soup 详细解释:
  • HTML 基础:
    • 什么是 html :
    • 网页的组成:
  • list 学习:
  • for 循环基础学习:
    • for 的使用方法:
  • 变量名:
    • 为什么find_all 要用 for 才能打印出来呢?
  • 回顾一下整体代码
  • 课程总结:

本节课内容所需要安装的 库:

第一个:bs4 库
第二个:lxml 库

不会安装包库的请参考 《第4课:在 Pycharm 编译器里,如何安装库 模块 包》

BeautifulSoup 简介:

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.

点击进入 bs4: 官方中文文档

lxml 简介:

lxml是功能最丰富,最易于使用的库,用于以Python语言处理,解析,格式化 XML和HTML。

你可能感兴趣的:(python3,爬虫零基础快速入门教学专栏,python,爬虫,bs4,编程)