Python之爬取CSND课程名

#爬取CSDN人工智能课程名
Python之爬取CSND课程名_第1张图片

###1.导入urllib&re模块
import urllib.request,re
###2.定义目标url变量
csdn_url=“https://edu.csdn.net/courses/o5329/人工智能”
###3.探寻目标规律
》》查看网页源代码
》》ctrl+f 搜索关键字

Python之爬取CSND课程名_第2张图片
》》发现每个课程名都在span块中
###4.匹配规则
pat = ’ ( .* ?) ’ //利用原字符将课程名提取出来
###5.获取网页二进制字符串,并解码(返回网页源代码)
data1=urllib.request.urlopen(csdn_url).read().decode(“utf-8”)
###6.编译正则表达式,并返回匹配的值
result=re.compile(pat).findall(data1)
print(result)
###每日一言

学而不思则罔,思而不学则殆

你可能感兴趣的:(Python)