数据爬虫(一)

语言:python3.5

工具:notepad++

# -*- coding: utf-8 -*-
import urllib.request
response=urllib.request.urlopen("http://www.baidu.com")
content = response.read().decode('utf-8')
print (content)


  在python3.x中,urllib不同于python2.x的urllib2,3.x将其改为urllib.request

并且在windows环境的cmd中python环境下运行上述代码会出现UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 26838: illegal multibyte sequence 这样的错误。

解决方案为将DOS窗口设置为UTF-8格式,命令为:chcp 65001,直接在cmd中键入即可。


你可能感兴趣的:(数据挖掘)