奔跑吧邓邓子

【Python深入浅出㊵】解锁Python3的requests模块：网络请求的魔法钥匙

一、requests 模块初相识
二、requests 模块的基本使用
- （一）安装 requests 模块
- （二）发送 GET 请求
- （三）发送 POST 请求
- （四）响应内容处理
三、requests 模块的高级应用
- （一）会话维持（session）
- （二）证书验证
- （三）设置代理
四、实战案例
- （一）简单网页爬虫
- （二）模拟登录网站
五、总结与展望

一、requests 模块初相识

在 Python 的网络编程领域中，requests模块就如同一位得力助手，为开发者们在网络数据交互的世界里披荆斩棘。它的存在，极大地简化了 HTTP 请求的发送与处理过程，让原本复杂繁琐的网络操作变得轻松易懂。

与 Python 标准库中的urllib、urllib3等网络请求库相比，requests模块有着诸多令人瞩目的优势。首先，它的 API 设计简洁明了，极为人性化，即便是刚接触 Python 网络编程的新手，也能迅速上手。以发送 GET 请求为例，在urllib库中，你可能需要这样编写代码：

import urllib.request

url = 'https://www.example.com'
req = urllib.request.Request(url)
with urllib.request.urlopen(req) as response:
    data = response.read().decode('utf-8')
    print(data)

而使用requests模块，只需简单的两行代码：

import requests

response = requests.get('https://www.example.com')
print(response.text)

如此对比，高下立判，requests模块的代码简洁性不言而喻。

其次，requests模块在功能的丰富性与全面性上表现出色。它不仅对各种 HTTP 请求方法，如 GET、POST、PUT、DELETE、HEAD、OPTIONS 等提供了原生支持，还能轻松处理请求参数、请求头、Cookies、文件上传等复杂操作。在处理 POST 请求时，若要传递表单数据，requests模块只需将数据以字典形式传递给data参数即可，如下所示：

import requests

url = 'https://www.example.com/login'
data = {'username': 'user', 'password': 'pass'}
response = requests.post(url, data=data)
print(response.text)

反观urllib库，处理此类操作则需要更多的步骤和代码量。

另外，requests模块还具备出色的可扩展性。通过插件和适配器，它能够满足各种特定场景下的需求，例如在处理代理服务器、自定义认证机制等方面，都展现出了强大的灵活性。

从社区支持的角度来看，requests模块拥有庞大且活跃的社区。在遇到问题时，开发者可以轻松地在社区中找到丰富的文档、教程、示例代码以及其他开发者的经验分享，这无疑为解决问题提供了极大的便利，也加快了开发的速度。

二、requests 模块的基本使用

（一）安装 requests 模块

在开始使用requests模块之前，首先需要确保它已经被安装到你的 Python 环境中。安装requests模块的方法多种多样，下面为你详细介绍在不同环境下的安装方式。

命令行安装：
如果你使用的是 Python 3.4 及以上版本，pip已经默认集成在 Python 环境中。打开命令行终端，输入以下命令即可完成安装：

pip install requests

在安装过程中，pip会自动从 Python Package Index（PyPI）上下载requests模块及其依赖项，并将它们安装到你的 Python 环境中。

若你的pip版本较低，可能会遇到一些问题，此时可以先更新pip：

python -m pip install --upgrade pip

更新完成后，再执行安装requests的命令。

PyCharm 中安装：

1. 打开 PyCharm，点击菜单栏中的 “File”，选择 “Settings”。
1. 在弹出的设置窗口中，找到 “Project: [你的项目名称]”，点击展开后选择 “Python Interpreter”。
1. 在 Python Interpreter 界面中，点击右上角的 “+” 按钮，这将打开 Python 包的搜索界面。
1. 在搜索框中输入 “requests”，然后在搜索结果中找到 “requests” 包，点击 “Install Package” 按钮。
1. PyCharm 会自动下载并安装requests模块，安装完成后，你就可以在项目中使用它了。

（二）发送 GET 请求

简单 GET 请求示例
GET 请求是 HTTP 协议中最常用的请求方法之一，主要用于从服务器获取资源。下面以获取百度首页为例，展示如何使用requests.get()方法发送简单的 GET 请求：

import requests

url = 'https://www.baidu.com'
response = requests.get(url)
print(response.text)

在上述代码中：

首先导入requests模块，这是使用requests库的基础。
然后定义了目标 URL，即百度的首页地址https://www.baidu.com。
接着使用requests.get(url)方法发送 GET 请求，requests.get()方法会返回一个响应对象response。
最后通过response.text属性获取响应的文本内容，并将其打印出来。这里的response.text返回的是经过编码解析后的字符串，方便我们直接查看和处理。

传递参数的 GET 请求
在实际应用中，我们常常需要在 GET 请求中传递参数，以获取特定的资源。例如，在百度搜索中，我们需要传递搜索关键词。在requests模块中，通过params参数来传递这些数据。以下是一个以百度搜索 “Python 教程” 为例的代码示例：

import requests

url = 'https://www.baidu.com/s'
params = {'wd': 'Python教程'}
response = requests.get(url, params=params)
print(response.url)
print(response.text)

在这段代码中：

定义了百度搜索的 URLhttps://www.baidu.com/s，其中/s表示搜索页面。
创建了一个字典params，其中键wd是百度搜索参数的名称，值Python教程是我们要搜索的关键词。
在调用requests.get()方法时，除了传入 URL，还传入了params=params参数，这会将params字典中的数据以查询字符串的形式拼接到 URL 后面。
通过打印response.url，可以看到实际请求的 URL，它会类似于https://www.baidu.com/s?wd=Python教程，这表明参数已经成功传递。
最后打印response.text，查看搜索结果页面的内容。

（三）发送 POST 请求

以 form 表单形式提交数据
POST 请求在 HTTP 协议中主要用于向服务器提交数据，例如用户登录、表单提交等场景。与 GET 请求不同，POST 请求的数据通常不会显示在 URL 中，而是放在请求体中，这使得它更适合处理敏感信息或大量数据。

在requests模块中，将请求参数构造成字典，然后利用requests.post()的data参数以 form 表单形式提交数据。下面是一个模拟用户登录的示例：

import requests

url = 'https://example.com/login'
data = {
    'username': 'your_username',
    'password': 'your_password'
}
response = requests.post(url, data=data)
print(response.text)

在上述代码中：

定义了登录页面的 URLhttps://example.com/login。
创建了一个包含用户名和密码的字典data，模拟表单数据。
使用requests.post()方法发送 POST 请求，将data作为参数传递给data参数，这样数据就会以 form 表单的形式被提交到服务器。
服务器处理请求后返回响应，通过response.text查看响应内容，判断登录是否成功。

以 json 串提交数据
在前后端分离的开发模式中，尤其是在与 RESTful API 进行交互时，常常需要以 JSON 串的形式提交数据。这种方式能够更方便地传输结构化数据，并且在数据解析和处理上更加高效。

以下是一个向服务器发送 JSON 数据的示例：

import requests
import json

url = 'https://example.com/api/data'
data = {
    'name': 'John',
    'age': 30,
    'email': '[email protected]'
}
headers = {'Content-Type': 'application/json'}
response = requests.post(url, data=json.dumps(data), headers=headers)
print(response.text)

在这段代码中：

定义了 API 的 URLhttps://example.com/api/data。
创建了一个包含用户信息的字典data。
为了告知服务器我们发送的数据是 JSON 格式，需要设置请求头headers，其中Content-Type: application/json表示数据类型为 JSON。
使用json.dumps(data)将字典data转换为 JSON 格式的字符串，然后将其作为data参数传递给requests.post()方法。
服务器接收并处理数据后返回响应，通过response.text获取响应内容。

（四）响应内容处理

获取响应文本
在发送 HTTP 请求后，我们通常需要获取服务器返回的响应内容。response.text属性用于获取经过编码解析的文本内容，它会根据响应头中的Content-Type字段猜测编码方式，并进行解码。例如：

import requests

response = requests.get('https://www.example.com')
print(response.text)

然而，有时服务器返回的编码信息不准确，或者没有提供编码信息，这可能导致乱码问题。此时，可以手动设置response.encoding属性来指定编码方式。例如，如果已知响应内容是 UTF-8 编码，可以这样处理：

import requests

response = requests.get('https://www.example.com')
response.encoding = 'utf-8'
print(response.text)

获取二进制响应内容
当我们需要下载图片、文件等二进制数据时，response.content属性就派上用场了。它返回的是原始的二进制响应内容，以字节串（bytes）的形式表示。以下是一个下载图片的示例：

import requests

url = 'https://example.com/image.jpg'
response = requests.get(url)
with open('image.jpg', 'wb') as f:
    f.write(response.content)

在上述代码中：

使用requests.get(url)获取图片的响应。
以二进制写入模式（‘wb’）打开一个本地文件image.jpg。
通过f.write(response.content)将响应的二进制内容写入文件，从而实现图片的下载。
获取 JSON 格式响应数据
在与 API 进行交互时，很多时候服务器会返回 JSON 格式的数据。requests模块提供了response.json()方法，用于将 JSON 格式的响应数据解析为 Python 字典，方便我们进行后续处理。例如：

import requests

response = requests.get('https://example.com/api/data')
try:
    data = response.json()
    print(data)
except ValueError as e:
    print(f"解析JSON数据失败: {e}")

在这段代码中：

发送 GET 请求获取 API 数据。
使用response.json()尝试将响应数据解析为 Python 字典。
如果解析失败，会抛出ValueError异常，通过try - except语句捕获异常并进行相应处理，提示用户解析失败的原因。

获取响应状态码
response.status_code属性用于获取服务器返回的响应状态码，它是一个非常重要的信息，能够帮助我们了解请求的处理结果。常见的状态码及其含义如下：

200：表示请求成功，服务器已成功处理请求并返回了正常的响应。
404：表示请求的资源未找到，通常是因为 URL 错误或资源已被删除。
500：表示服务器内部错误，服务器在处理请求时遇到了问题，无法正常返回响应。

根据不同的状态码，我们可以进行相应的处理。例如：

import requests

response = requests.get('https://example.com')
if response.status_code == 200:
    print("请求成功，获取到数据:")
    print(response.text)
elif response.status_code == 404:
    print("请求的资源未找到，请检查URL是否正确。")
else:
    print(f"请求失败，状态码: {response.status_code}")

在上述代码中，通过判断response.status_code的值，进行不同的处理，从而提高程序的健壮性和用户体验。

三、requests 模块的高级应用

（一）会话维持（session）

session 的概念和作用

在网络通信中，会话维持是指在一系列连续的请求中保持某些状态信息，使得后续请求能够利用之前请求所建立的状态。在 HTTP 协议中，由于其本身是无状态的，即每次请求之间相互独立，服务器无法直接知晓请求之间的关联。然而，在许多实际场景中，如用户登录、购物车操作等，我们需要在多个请求之间保持状态。这就是session发挥作用的地方。

session可以理解为一个会话对象，它能够在多个请求之间保存和传递一些重要的信息，其中最常用的就是cookies。cookies是服务器发送到用户浏览器并保存在本地的一小段数据，它包含了用户的相关信息，如登录状态、用户偏好等。通过session对象，我们可以自动处理这些cookies，使得下一次请求能够带上前一次请求中服务器设置的cookies，从而实现跨请求的状态保持。

以模拟登录为例，当我们使用用户名和密码登录到一个网站时，服务器会验证我们的身份，并返回一个包含登录状态信息的cookie。如果我们使用普通的请求方式，每次请求都需要重新提供用户名和密码进行验证，这显然是非常繁琐且不现实的。而使用session，我们只需在第一次登录时进行身份验证，之后session会自动保存服务器返回的cookie，并在后续的请求中带上这个cookie，服务器通过验证cookie就能识别我们的身份，从而实现登录状态的保持，让我们能够访问那些需要登录才能访问的页面。
2. 使用 session 发送请求

下面以模拟登录知乎为例，展示如何使用session发送请求实现登录后的页面访问。

首先，我们需要分析知乎的登录过程，获取登录所需的参数和 URL。在登录过程中，知乎会要求我们提供用户名、密码以及一个名为_xsrf的参数，这个参数可以从登录页面的 HTML 源代码中获取。

import requests
import re


def get_xsrf_token(session):
    url = 'https://www.zhihu.com'
    response = session.get(url)
    match_obj = re.search('.*name="_xsrf" value="(.*?)"', response.text)
    if match_obj:
        return match_obj.group(1)
    else:
        return ""


def zhihu_login(account, password):
    session = requests.Session()
    agent = "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:54.0) Gecko/20100101 Firefox/54.0"
    headers = {
        "Host": "www.zhihu.com",
        "Referer": "https://www.zhihu.com/",
        "Upgrade-Insecure-Requests": "1",
        "User-Agent": agent
    }
    session.headers = headers

    _xsrf = get_xsrf_token(session)
    post_data = {}
    post_url = ""
    if re.match("^1\d{10}$", account):
        print("phone login")
        post_url = "https://www.zhihu.com/login/phone_num"
        post_data = {
            "_xsrf": _xsrf,
            "phone_num": account,
            "password": password
        }
    else:
        if "@" in account:
            print("email login")
            post_url = "https://www.zhihu.com/login/email"
            post_data = {
                "_xsrf": _xsrf,
                "email": account,
                "password": password
            }

    response = session.post(post_url, data=post_data)
    print(response.text)

    # 登录成功后，访问需要登录才能访问的页面
    profile_url = "https://www.zhihu.com/people/your_profile_name"
    response = session.get(profile_url)
    print(response.text)


if __name__ == "__main__":
    account = "your_account"
    password = "your_password"
    zhihu_login(account, password)

在上述代码中：

首先定义了get_xsrf_token函数，该函数接收一个session对象作为参数，通过发送 GET 请求获取知乎首页的内容，并使用正则表达式从页面中提取_xsrf参数的值。
然后在zhihu_login函数中，创建了一个session对象，并设置了请求头信息，以模拟真实的浏览器访问。
根据输入的账号类型（手机号码或邮箱），构造相应的登录 URL 和 POST 数据，其中包含了_xsrf参数、账号和密码。
使用session.post方法发送登录请求，服务器验证成功后会返回包含登录状态的响应。
登录成功后，使用session.get方法访问知乎个人主页（需替换为真实的个人主页链接），由于session已经保存了登录后的cookie，所以可以成功访问该页面，并打印出页面内容。

通过以上示例，我们可以看到session在模拟登录和保持会话状态方面的强大功能，它极大地简化了我们与需要身份验证的网站进行交互的过程。

（二）证书验证

https 协议与证书验证

https协议是在http协议的基础上，通过添加 SSL/TLS 加密层来实现数据传输的安全性。在https通信中，证书扮演着至关重要的角色。证书是由受信任的数字证书颁发机构（CA，Certificate Authority）颁发的，它包含了服务器的公钥、证书所有者信息、证书有效期、颁发机构签名等内容。

当客户端（如浏览器或使用requests模块的程序）与服务器建立https连接时，会进行以下步骤的证书验证：

客户端向服务器发送请求，服务器将其数字证书返回给客户端。
客户端验证证书的有效性，包括检查证书是否在有效期内、证书的用途是否与请求的站点匹配、证书是否在证书吊销列表（CRL，Certificate Revocation List）中、证书的颁发机构是否受信任等。这是一个递归的过程，直到验证到根证书（操作系统或浏览器内置的受信任的根证书）。
如果证书验证通过，客户端继续与服务器进行通信；如果验证不通过，客户端会显示警告信息，提示用户连接可能存在风险。

证书验证的目的是确保客户端与真正的目标服务器进行通信，防止中间人攻击。中间人攻击是指攻击者在客户端和服务器之间插入自己，截获、篡改或伪造通信数据。通过证书验证，客户端可以验证服务器的身份，保证数据传输的安全性和完整性。

requests 中的证书验证设置

在requests模块中，使用requests.get()等方法发送https请求时，默认会验证服务器的证书。通过verify参数可以控制证书验证的行为。

跳过验证（设为 False）：在某些情况下，如访问的是测试环境的服务器，其证书可能是自签名的，不受信任的证书颁发机构颁发的，此时可以将verify参数设置为False来跳过证书验证。例如：

import requests

url = 'https://self_signed_server.example.com'
response = requests.get(url, verify=False)
print(response.text)

需要注意的是，跳过证书验证会降低通信的安全性，存在被中间人攻击的风险。因此，在生产环境中，应谨慎使用此设置，确保访问的服务器是可信任的。

指定证书路径进行验证：如果服务器使用的是自定义的证书，而不是受信任的 CA 颁发的证书，我们可以通过指定证书路径来进行验证。假设我们有一个本地的 CA 证书文件ca_cert.pem，可以这样设置：

import requests

url = 'https://custom_cert_server.example.com'
cert_path = 'ca_cert.pem'
response = requests.get(url, verify=cert_path)
print(response.text)

在上述代码中，verify参数被设置为证书文件的路径，requests模块会使用该证书来验证服务器的证书，确保通信的安全性。

（三）设置代理

代理的作用和原理

代理服务器是位于客户端和目标服务器之间的一台服务器，它的作用是代理网络用户去获取网络信息。形象地说，它就像是网络信息的中转站。当我们设置了代理服务器后，本机不再直接向目标服务器发起请求，而是向代理服务器发出请求。代理服务器接收到请求后，会将请求转发给目标服务器，目标服务器处理请求后将响应返回给代理服务器，最后代理服务器再将响应转发给本机。

在爬虫等场景中，使用代理主要有以下几个原因：

避免 IP 被封：许多网站会对频繁访问的 IP 地址进行限制或封禁，以防止恶意爬虫等行为。通过使用代理服务器，我们可以不断更换请求的 IP 地址，分散请求来源，从而降低被封禁的风险。
突破访问限制：有些网站可能会根据 IP 地址的地理位置、所属网络等因素限制访问。使用代理服务器，我们可以获取不同地区、不同网络的 IP 地址，从而突破这些访问限制，访问到原本无法访问的资源。
提高访问速度：一些代理服务器会设置较大的硬盘缓冲区，当有外界的信息通过时，会将其保存到缓冲区中。当其他用户再访问相同的信息时，代理服务器可以直接从缓冲区中读取信息并传给用户，从而提高访问速度。

在 requests 中设置代理

在requests模块中，通过proxies参数来设置代理。以下是设置 HTTP 和 HTTPS 代理的示例：

import requests

url = 'https://www.example.com'
proxies = {
    'http': 'http://proxy_ip:proxy_port',
    'https': 'https://proxy_ip:proxy_port'
}
response = requests.get(url, proxies=proxies)
print(response.text)

在上述代码中，proxies是一个字典，其中http和https分别表示 HTTP 和 HTTPS 协议的代理地址，proxy_ip和proxy_port分别是代理服务器的 IP 地址和端口号。

如果代理服务器需要用户名和密码进行认证，可以这样设置：

import requests

url = 'https://www.example.com'
proxies = {
    'http': 'http://username:password@proxy_ip:proxy_port',
    'https': 'https://username:password@proxy_ip:proxy_port'
}
response = requests.get(url, proxies=proxies)
print(response.text)

在实际应用中，为了提高爬虫的稳定性和效率，我们还可以将多个代理 IP 地址放入一个列表中，并在每次请求时随机选择一个代理，以避免单个代理 IP 被频繁使用而导致被封禁。例如：

import requests
import random


url = 'https://www.example.com'
proxy_list = [
    'http://proxy1_ip:proxy1_port',
    'http://proxy2_ip:proxy2_port',
    'http://proxy3_ip:proxy3_port'
]
proxy = {
    'http': random.choice(proxy_list),
    'https': random.choice(proxy_list)
}
response = requests.get(url, proxies=proxy)
print(response.text)

通过以上设置代理的方法，我们可以灵活地利用代理服务器来满足各种网络请求的需求，提高程序的可用性和安全性。

四、实战案例

（一）简单网页爬虫

需求分析

假设我们要爬取豆瓣电影 Top250 页面（https://movie.douban.com/top250）的电影信息，包括电影名称、评分、评价人数以及电影简介。该页面的结构较为规整，电影信息都包含在div标签且class为item的元素中。每个item元素里，电影名称在span标签且class为title的元素中，评分在span标签且class为rating_num的元素中，评价人数在span标签且class为pl的元素中，电影简介在span标签且class为inq的元素中。我们的目标就是从这个网页中提取出这些信息。

代码实现

import requests
from bs4 import BeautifulSoup


def crawl_douban_movies():
    url = 'https://movie.douban.com/top250'
    headers = {
        'User - Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        movie_items = soup.find_all('div', class_='item')
        for item in movie_items:
            movie_name = item.find('span', class_='title').text
            rating = item.find('span', class_='rating_num').text
            comment_num = item.find('span', class_='pl').text.strip('()')
            quote = item.find('span', class_='inq')
            quote = quote.text if quote else '无简介'
            print(f'电影名称: {movie_name}')
            print(f'评分: {rating}')
            print(f'评价人数: {comment_num}')
            print(f'简介: {quote}')
            print('-' * 50)
    else:
        print(f'请求失败，状态码: {response.status_code}')


if __name__ == "__main__":
    crawl_douban_movies()

在上述代码中：

首先定义了目标 URL 和请求头，请求头中的User - Agent用于模拟浏览器访问，避免被网站识别为爬虫而拒绝访问。
使用requests.get()方法发送 GET 请求获取网页内容，并检查响应状态码。如果状态码为 200，表示请求成功。
利用BeautifulSoup库将响应的文本内容解析为 HTML 文档对象，方便后续的数据提取。
通过find_all()方法找到所有包含电影信息的div元素，然后在每个元素中，使用find()方法找到对应的电影名称、评分、评价人数和简介的元素，并提取其文本内容。最后将提取到的信息打印输出。

（二）模拟登录网站

模拟登录流程分析

以知乎为例，模拟登录的流程如下：

获取登录页面：首先发送 GET 请求到知乎的登录页面（https://www.zhihu.com/signin），获取登录页面的 HTML 内容。这个页面中包含了登录所需的一些参数，如_xsrf，以及可能出现的验证码图片链接。
解析登录表单：使用BeautifulSoup等解析库解析登录页面的 HTML，找到登录表单中的各个字段，如用户名、密码、_xsrf等。其中，_xsrf是一个用于防止跨站请求伪造（CSRF）的令牌，每次页面加载时都会动态生成，需要从页面中提取出来并在登录请求中发送。
处理验证码（如有）：如果登录页面存在验证码，需要识别验证码。可以使用第三方的 OCR（光学字符识别）库，如ddddocr来识别验证码图片中的字符。首先发送 GET 请求获取验证码图片的二进制内容，并保存为本地文件，然后使用 OCR 库对图片进行识别，得到验证码的文本。
发送登录请求：构造登录请求的数据，包括用户名、密码、_xsrf以及验证码（如果有），使用requests.post()方法发送 POST 请求到知乎的登录接口（https://www.zhihu.com/api/v3/oauth/sign_in）。登录成功后，服务器会返回一个包含用户信息和登录状态的响应，同时设置一些cookies，这些cookies用于保持用户的登录状态。

代码实现与注意事项

import requests
from bs4 import BeautifulSoup
import ddddocr


def zhihu_login(account, password):
    session = requests.Session()
    headers = {
        'User - Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    session.headers = headers

    # 获取登录页面
    login_url = 'https://www.zhihu.com/signin'
    response = session.get(login_url)
    if response.status_code!= 200:
        print(f'获取登录页面失败，状态码: {response.status_code}')
        return

    soup = BeautifulSoup(response.text, 'html.parser')
    _xsrf = soup.find('input', attrs={'name': '_xsrf'})['value']

    # 处理验证码
    captcha_url = 'https://www.zhihu.com/api/v3/oauth/captcha?lang=cn'
    response = session.get(captcha_url)
    if response.json()['show_captcha']:
        response = session.get(captcha_url, params={'type': 'login'})
        with open('captcha.jpg', 'wb') as f:
            f.write(response.content)
        ocr = ddddocr.DdddOcr()
        with open('captcha.jpg', 'rb') as f:
            img_bytes = f.read()
        captcha = ocr.classification(img_bytes)
    else:
        captcha = ''

    # 发送登录请求
    login_data = {
        'client_id': 'c3cef7c66a1843f8b3a9e6a1e3160e20',
        'grant_type': 'password',
        'source': 'com.zhihu.web',
        'username': account,
        'password': password,
        '_xsrf': _xsrf,
        'captcha': captcha,
        'lang': 'cn',
        'ref_source': 'homepage'
    }
    response = session.post('https://www.zhihu.com/api/v3/oauth/sign_in', data=login_data)
    if response.status_code == 200:
        print('登录成功')
        # 可以在此处进行登录后的操作，如访问需要登录才能访问的页面
        profile_url = 'https://www.zhihu.com/people/your_profile_name'
        response = session.get(profile_url)
        print(response.text)
    else:
        print(f'登录失败，状态码: {response.status_code}，原因: {response.text}')


if __name__ == "__main__":
    account = 'your_account'
    password = 'your_password'
    zhihu_login(account, password)

注意事项：
- 动态参数处理：_xsrf等参数是动态变化的，每次获取登录页面时都需要重新提取，确保登录请求中携带的参数是最新的。
- 验证码处理：验证码的识别准确率可能受到图片质量、验证码类型等因素的影响。如果识别失败，可以尝试使用更高级的 OCR 技术或人工识别的方式。同时，知乎等网站可能会对验证码的识别进行反制，如增加验证码的复杂度、限制验证码的获取次数等，需要根据实际情况进行调整。
- session 的使用：使用requests.Session()对象来保持会话状态，这样在发送登录请求后，session会自动保存服务器返回的cookies，后续的请求会自动带上这些cookies，从而实现登录状态的保持，方便进行登录后的操作，如访问个人主页、收藏页面等。

五、总结与展望

在 Python 的网络编程领域中，requests模块无疑是一颗璀璨的明星。通过本文的学习，我们深入了解了requests模块的核心知识点和丰富的使用技巧。从最基础的安装与导入，到发送各种类型的 HTTP 请求，如 GET、POST，再到对响应内容的多样化处理，包括获取文本、二进制数据、JSON 数据以及响应状态码等，我们逐步掌握了requests模块的基本操作。

在高级应用方面，requests模块同样展现出了强大的功能。会话维持（session）功能使得我们能够轻松地在多个请求之间保持状态，实现如模拟登录后访问受限页面等操作；证书验证机制确保了在https通信中的安全性，让我们能够放心地与服务器进行数据交互；而设置代理功能则为我们突破网络限制、避免 IP 被封等提供了有力的支持。

通过简单网页爬虫和模拟登录网站这两个实战案例，我们将requests模块的知识应用到了实际项目中，进一步加深了对其的理解和掌握。在网页爬虫案例中，我们利用requests模块获取网页内容，并结合BeautifulSoup库进行数据解析，成功地提取出了所需的信息；在模拟登录网站案例中，我们详细分析了登录流程，通过处理动态参数、验证码等，实现了对知乎等网站的模拟登录，充分展示了requests模块在实际场景中的应用价值。

然而，requests模块的潜力远不止于此。在未来的学习和实践中，读者可以进一步探索其高级用法和优化策略。例如，在处理大量并发请求时，可以研究如何利用requests模块结合多线程、异步编程等技术来提高效率；在与复杂的 API 进行交互时，深入了解如何更好地处理请求头、请求体以及各种响应状态，以确保数据的准确传输和高效处理。同时，随着网络技术的不断发展，requests模块也在持续更新和完善，读者可以关注其官方文档和社区动态，及时掌握新的功能和特性，将其更好地应用到实际项目中。希望大家能够在实际项目中充分发挥requests模块的优势，创造出更多有价值的应用。

你可能感兴趣的:(Python深入浅出,python,开发语言,requests)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

【Python深入浅出㊵】解锁Python3的requests模块：网络请求的魔法钥匙

目录

一、requests 模块初相识

二、requests 模块的基本使用

（一）安装 requests 模块

（二）发送 GET 请求

（三）发送 POST 请求

（四）响应内容处理

三、requests 模块的高级应用

（一）会话维持（session）

（二）证书验证

（三）设置代理

四、实战案例

（一）简单网页爬虫

（二）模拟登录网站

五、总结与展望

你可能感兴趣的:(Python深入浅出,python,开发语言,requests)