Taoist_Nie

网络爬虫学习第二弹：requests库的使用

requests库使用

requests库的功能与之前学习的urllib库类似，但功能更强大，实现也更简洁。下面是基本的使用方法。

import requests

r=requests.get("https://www.baidu.com/")
print(type(r)) # 打印Response的类型
print("---------------------")
print(r.status_code) # 打印Response的状态码
print("---------------")
print(type(r.text)) # 打印Response的内容类型
print("---------------")
#print(r.text) # 打印Response的内容
print("---------------")
print(r.cookies) # 打印Response的cookies


---------------------
200
---------------

---------------
---------------
]>

GET请求

import requests

data={
    'name':'germey',
    'age':22,
}
# 如果要附加额外信息，直接构造一个字典结构储存，传入参数params
r=requests.get('http://httpbin.org/get',params=data)
print(type(r.text))
print(r.text)
print("***************************")
# r.text返回的是str类型，但是是json格式。
#可以通过调用json()方法将json格式的字符串转化为字典类型
print(type(r.json()))
print(r.json())


{
  "args": {
    "age": "22", 
    "name": "germey"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.18.4"
  }, 
  "origin": "171.209.79.31", 
  "url": "http://httpbin.org/get?name=germey&age=22"
}

***************************

{'args': {'age': '22', 'name': 'germey'}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate', 'Connection': 'close', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.18.4'}, 'origin': '171.209.79.31', 'url': 'http://httpbin.org/get?name=germey&age=22'}

抓取网页

import requests
import re

# 构造请求头，伪装成浏览器来进行访问
headers={
    'User-Agent':'Mozilla/5.0(Macintosh;Intel Mac OS X 10_11_4) AppleWebkit/537.36(KHML,like Gecko)\
    Chrome/52.0.0.2743.116 Safari/573.36'
}
r=requests.get("https://www.zhihu.com/explore",headers=headers)
# 利用正则表达式来抓取相应内容
pattern=re.compile('explore-feed.*?question_link.*?>(.*?)',re.S)
titles=re.findall(pattern,r.text)
print(titles)

['\n如何看待美国五角大楼首次接受审计？\n', '\n李现和杨紫有可能产生火花吗？双方适合吗？\n', '\n你最欣赏的性格是什么样的？\n', '\n如何评价新 iPad Pro 宣称有 Xbox One S 一般的图形性能？\n', '\n你有亲历过道德绑架吗？\n', '\n外国人对中国的哪些刻板印象会令中国人大吃一惊？\n', '\n有哪些东西你以为很贵，但其实很便宜？\n', '\n如何看待靳东粉丝团官博靳东影视天地因王凯献血而造谣，以及后续处理？\n', '\n你家猫咪给过你哪些礼物或者回礼？\n', '\n怎么评价朱一龙幻乐之城的表现？\n']

抓取二进制数据

抓取页面用返回的HTML文档，而网页中的图片、音频、视频等都是有二进制码组成，抓取这些，首先要拿到它的二进制码

import requests

r=requests.get("https://github.com/favicon.ico")
#print(r.text) # 返回的是字符串内容，相当于将图片直接转化为字符串所以会出现乱码
#print(r.content) # 返回的是bytes类型的数据

import requests

r=requests.get("https://github.com/favicon.ico")
# open()方法，第一个参数是要保存的文件名，第二个参数代表用写入二进制的形式打开，可以向文件写入二进制
with open('favicon.ico','wb') as f:
    f.write(r.content)

添加headers

import requests
# 如果不传递headers就无法正常请求
r=requests.get("https://www.zhihu.com/explore")
print(r.text)


400 Bad Request

400 Bad Request
openresty

import requests
# 构造headers
headers={
    "User-Agent":"Mozilla/5.0(Macintosh;Intel Mac OS X 10_11_4) AppleWebkit/537.36(KHML,like Gecko)\
    Chrome/52.0.0.2743.116 Safari/573.36'"
}
r=requests.get("https://www.zhihu.com/explore",headers=headers)
#print(r.text)

POST请求

import requests 

data={
    'name':'germey',
    'age':'22'
}

r=requests.post("http://httpbin.org/post",data=data)
print(r.text)

{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {
    "age": "22", 
    "name": "germey"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "18", 
    "Content-Type": "application/x-www-form-urlencoded", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.18.4"
  }, 
  "json": null, 
  "origin": "171.209.79.31", 
  "url": "http://httpbin.org/post"
}

响应

import requests

r=requests.get("http://www.jianshu.com")
print(type(r.status_code),r.status_code) # 返回状态码
print(type(r.headers),r.headers) # 返回响应头
print(type(r.cookies),r.cookies) # 返回cookies
print(type(r.url),r.url) # 返回url
print(type(r.history),r.history) # 返回请求历史

 403
 {'Date': 'Sat, 03 Nov 2018 01:35:11 GMT', 'Content-Type': 'text/html', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Server': 'Tengine', 'Strict-Transport-Security': 'max-age=31536000; includeSubDomains; preload', 'Content-Encoding': 'gzip', 'X-Via': '1.1 dianxinxiazai180:5 (Cdn Cache Server V2.0), 1.1 PSscnjdx3gy39:6 (Cdn Cache Server V2.0)'}
 
 https://www.jianshu.com/
 []

requests库提供一个状态码查询对象requests.codes

import requests 

r=requests.get("http://www.jiansh.com")
# 如果返回的状态码不是200(requests.conde.ok返回的是请求成功的状态码)，终止程序，否则输出Successfully
exit() if not r.status_code==requests.codes.ok else print("Successfully")

Successfully

高级用法

文件上传

用requets可以模拟提交一些数据和文件

import requests

files={'file':open('favicon.ico','rb')} # 传入数据用字典的格式，value是用open()打开的本地文件
r=requests.post("http://www.httpbin.org/post",files=files)
#print(r.text)

Cookies

import requests

r=requests.get("http://www.baidu.com")
print(r.cookies)
# 返回的cookies是CookieJar类型，用items()的方法将其转化为元组构成的列表，遍历输出
for key,value in r.cookies.items():
    print(key+"="+value)

]>
BDORZ=27315

我们可以复制登录知乎后的cookies，来替换到自己的Cookies里面放在headrs中发送请求，来维持登录状态

import requests

headers={
    'Cookie':'_zap=a977c302-a5b4-4cf9-89de-9c44d5f8d0ae;\
    d_c0="ADAooIQzaA6PTnyPSh-yO0R7n8-EwQhfcSk=|1540290995";\
    q_c1=864dfba067974af29b460fb2158c25d2|1540290996000|1540290996000; \
    l_cap_id="ZjkzOGI3MThjYzIyNGZlNGFmYjY3ZDUzNWM0NWY3YWQ=|1540542856|b8797500de95d7f50dee23a5386d252e3ec3e97b";\
    r_cap_id="ODgxNGQ0ZmYyYTQyNDgwMDk2NDJmMzhiZDk3MGI3Njc=|1540542856|754b0a42d380d5f9c2f07e830da3a9e16212f76b"; \
    cap_id="ZjRmZWZkYjcwOTc1NGRkYzllYjY5MGYyMDAwMzY3ZmM=|1540542856|0578b4234ea73adafacbf5c1e932c1288f62f358";\
    tst=r; __gads=ID=a7a78c5ddc1f7e94:T=1540611321:S=ALNI_Mbgv0Vp_utqpBpA7F8HzEWx8uFEFA;\
    tgw_l7_route=61066e97b5b7b3b0daad1bff47134a22;\
    _xsrf=cqXGAOua1myL8pz9OD0y5Jc8AkaOp4Hg; \
    capsion_ticket=\
    "2|1:0|10:1541210996|14:capsion_ticket|44:\
    YmY1MTAxMjJkNjlkNGUxNGIxOGNmYTk1YjI5MDUwMWU=\
    |84ca07ff47cec6751101e7639bf6b73bea6c5da14337fb0779f73b7b7a99cbdc"; \
    z_c0="2|1:0|10:1541210997|4:z_c0|92:Mi4xYVlhNUJRQUFBQUFBTUNpZ2hETm9Ea\
    VlBQUFCZ0FsVk5kVkhLWEFBMi1fNy1Yb0hwNTY2bXVobGRWZUNabDFpX0ZR|3ffa6324aa\
    b11684be5e0ee557421de9e0923b46f9c339d69a7828e3d758cdc5"',
    'Host':'www.zhihu.com',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'
}
r=requests.get("https://www.zhihu.com",headers=headers)
#print(r.text)

import requests

cookies='_zap=a977c302-a5b4-4cf9-89de-9c44d5f8d0ae; d_c0="ADAooIQzaA6PTnyPSh-yO0R7n8-EwQhfcSk=|1540290995"; q_c1=864dfba067974af29b460fb2158c25d2|1540290996000|1540290996000; l_cap_id="ZjkzOGI3MThjYzIyNGZlNGFmYjY3ZDUzNWM0NWY3YWQ=|1540542856|b8797500de95d7f50dee23a5386d252e3ec3e97b"; r_cap_id="ODgxNGQ0ZmYyYTQyNDgwMDk2NDJmMzhiZDk3MGI3Njc=|1540542856|754b0a42d380d5f9c2f07e830da3a9e16212f76b"; cap_id="ZjRmZWZkYjcwOTc1NGRkYzllYjY5MGYyMDAwMzY3ZmM=|1540542856|0578b4234ea73adafacbf5c1e932c1288f62f358"; tst=r; __gads=ID=a7a78c5ddc1f7e94:T=1540611321:S=ALNI_Mbgv0Vp_utqpBpA7F8HzEWx8uFEFA; _xsrf=cqXGAOua1myL8pz9OD0y5Jc8AkaOp4Hg; tgw_l7_route=ec452307db92a7f0fdb158e41da8e5d8; capsion_ticket="2|1:0|10:1541212495|14:capsion_ticket|44:NjM3NWRjOTgzNTY3NDdmM2IyZGM3MmUyYzYxMmQwOGE=|53f5bcd729eff1b682d405c5194ec1686ee730c53ead793920b4d5de3299ef17"; z_c0="2|1:0|10:1541212497|4:z_c0|92:Mi4xYVlhNUJRQUFBQUFBTUNpZ2hETm9EaVlBQUFCZ0FsVk5VVmZLWEFDWGlyb1BwOGJqR2ZTamtiWEFBWDJSRG9ubW53|7b00132e6477871c34a19a4655b612a0e9ea64b6e14914044e06380b97453347"'
jar=requests.cookies.RequestsCookieJar()
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36",
    "Host":"www.zhihu.com"
}
# 将cookies分割成每个，再用set()方法设置好每个Cookie的key和value
for cookie in cookies.split(";"):
    key,value=cookie.split('=',1)
    jar.set(key,value)
r=requests.get("https://www.zhihu.com",headers=headers,cookies=jar)
#print(r.text)

会话维持

直接用法get()或post()方法进行网页请求，相当于两个不同的会话。也就是说第一次用post()方法登陆了页面，第二次想获取登录成功后的个人信息页面，等于同时打开了两个浏览的两个会话，就会获取失败。

import requests 

r=requests.get('http://httpbin.org/cookies/set/number/123456789')
r=requests.get("http://httpbin.org/cookies")
print(r.text)

{
  "cookies": {}
}

requests中的Session对象可以维持会话，通常用于模拟登录成功后的下一步操作

import requests

s=requests.Session()
s.get('http://httpbin.org/cookies/set/number/123456789')
r=s.get("http://httpbin.org/cookies")
print(r.text)

{
  "cookies": {
    "number": "123456789"
  }
}

SSL证书验证

有一些网站没有被官方的CA的机构信任，所以会出现证书验证错误，可以用参数verify控制是否检查此证书

import requests 
from requests.packages import urllib3

# 设置忽略警告来屏蔽这个警告
urllib3.disable_warnings()
r=requests.get("https://www.12306.cn",verify=False)
print(r.status_code)

import logging
import requests

# 通过捕获警告到日志的方式忽略警告
logging.captureWarnings(True)
r=requests.get("https://www.12306.cn",verify=False)
print(r.status_code)

import requests
# 也可以指定一个本地用户作为客户端证书，可以是单个文件(包含密钥和证书)或者一个包含两个文件路径的元组

r=requests.get("https://www.12306.cn",cert=("/path/server.crt,'/path/key'"))
print(r.status_code)

代理设置

当我们大规模爬取和频繁请求网站时，网站可能会弹出验证码或者跳转到登录页面，甚至会直接封禁客户端。此时我们需要设置代理来解决这种情况，需要用到参数proxies

import requests

proxies={
    "http":"http://www.10.10.1.10:3128",
    "https":"http://www.10.10.1.10:1080"
}
r=requests.get("https://www.taobao.com",proxies=proxies)
print(r.status_code)

若代理需要HTTP Basic Auth，我们可以使用类似http://user:password@host:port 这样的语法来设置代理

import requests

proxies={
    "http":"http://user:[email protected]:3128/",
}
r=requests.get("https://www.taobao.com",proxies=proxies)
print(r.status_code)

import requests
# requests支持socks代理
proxies={
    "http":"socks5://user:password@host:port",
    "https":"socks5://user:password@host:port"
}
r=requests.get("https://www.taobao.com",proxies=proxies)
print(r.status_code)

超时设置

import requests
# 请求分为两个阶段：连接(connect)和读取(read),也可以传入一个元组来进行分别设置
r=requests.get("http://www.baidu.com",timeout=1)
print(r.status_code)

身份认证

requests自带身份验证功能，可以传入auth模块的HTTPBasicAuth类，也可以在参数auth中直接传入一个元组

import requests
from requests.auth import HTTPBasicAuth

r=requests.get("http://localhost:5000",auth=HTTPBasicAuth('username','password'))
print(r.status_code)

import requests

r=requests.get("http://localhost:5000",auth=('username','password'))
print(r.status_code)

也可以使用OAuth1验证

import requests
from requests_oauthlib import OAuth1

url="https://api.twitter.com/1.1/account/verify_credentials.json"
auth=OAuth1("YOUR_APP_KEY","YOUR_APP_SECRET","USER_OAUTH_TOKEN","USER_OAUTH_TOKEN_SECRET")
r=requests.get(url,auth=auth)
print(r.status_code)

Prepared Request

在urllib中将请求表示为数据结构，其中各个参数都可以通过一个Request对象表示，这个数据结构交PreparedRequest

from requests import Request,Session

url="http://httpbin.org/post"
data={
    'name':'jake',
}
headers={
    'User-Agent':'Mozilla/4.0(compatible;MSIE 5.5;Windows NT',
}

s=Session()
req=Request('POST',url,data=data,headers=headers) # 构造一个Request对象
prepped=s.prepare_request(req) # 利用Session的prepare_request方法将其转化为Prepared Request对象
r=s.send(prepped)# 调用send方法发送
print(r.text)

{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {
    "name": "jake"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "9", 
    "Content-Type": "application/x-www-form-urlencoded", 
    "Host": "httpbin.org", 
    "User-Agent": "Mozilla/4.0(compatible;MSIE 5.5;Windows NT"
  }, 
  "json": null, 
  "origin": "139.207.99.242", 
  "url": "http://httpbin.org/post"
}

参考：崔庆才《python3网络爬虫开发实战》

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它