爬虫小结

python爬虫小组作业

上周布置了python的小组作业,每一组要求爬取老师指定的信息,本组抽到的题目如下:
从中国银行网址:http://www.boc.cn/sourcedb/whpj/ 获取主要外汇(美元、欧元、英镑、加拿大元、澳大利亚元、日元、韩元、新台币、澳门元和港币)的牌价信息,计算出它们的每天平均价。要求把今年5月份每天平均价格保存到Excel文件中,每种外汇的数据保存在一个工作表中,并画出汇率变化的折线图。
我负责的是爬虫的部分.
先把代码贴上:

import urllib
from urllib import request, parse
from bs4 import BeautifulSoup
import xlwt


def main():
    Currency_name = input("请输入你要查找的货币名称:")        # 可以输入你想查找的货币名称
    url = "https://srh.bankofchina.com/search/whpj/search_cn.jsp"   # 目标网址
    # 1.爬取网页
    datalist = getDate(url, Currency_name)
    savepath = str(Currency_name + "牌价信息.xls")           # 保存路径
    # 2.保存数据
    saveDate(datalist, savepath)


# 1.爬取页面
def getDate(url, Currency_name):
    # 创建数据集合
    datalist = []     # 此数组储存每一个时间段的数据的数组
    for i in range(2, 162):    # 页数
        html = askURL(url, i, Currency_name)    # 得到html数据

        # 2.逐一解析数据
        soup = BeautifulSoup(html, 'html.parser')
        div = soup.find('div'

你可能感兴趣的:(python小项目,python,数据分析)