眸生

requests入门以及requests库实例和with,os的解释（Python网络爬虫和信息提取）

导学

定向网络数据爬取和网页解析的基本能力

requests入门

安装方法

首先cmd pip install requests
然后打开idle测试

**>>> import requests
>>> r= requests.get("http://www.baidu.com")
>>> r.status_code
200
>>> r.encoding='utf-8'
>>> r.text**

requests库的7个主要方法

requests.request()	构造一个请求，支持以下各方法的基础方法
requests.get()	获取HTML网页的主要方法，主要对应HTTP的GET
requests.head()	获取HTML网页头信息的主要方法，主要对应HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，主要对应HTTP的POST
requests.put()	向HTML网页PUT请求的方法，主要对应HTTP的PUT
requests.patch()	向HTML网页计较局部修改请求的方法，主要对应HTTP的PATCH
requests.delete()	TML网页提交删除请求方法，主要对应HTTP的DELETE

r=requests.get(url) 构建一个向服务器请求资源的Request对象。Request对象是大写
requests.get（）返回一个包含服务器资源的Response对象，用变量r表示
**requests.get(url,params=None,kwargs)
- url：拟获取页面的url链接
- params：url中额外的参数，字典或字节流格式，可选
- kwargs：12个控制访问的参数。你经常会看到形参名kwarges，它用于收集任意数量的关键字实参
Response对象的属性

r.status_code	HTTP请求的返回状态
r.text	HTTP响应内容的字符串形式，即，url对应的页面内容
r.encoding	从HTTP header中猜测的响应内容编码方式，从HTTP的header的charset字段获得，如果由这个编码，说明我们访问的服务器对他资源的编码有要求。但并不是都是有要求，如果header中没有charser，则认为编码为ISO-8859-1
r.apparent_encoding	从内容中分析出的响应内容编码方式（备选编码方式）更准确
r.content	HTTP响应内容的二进制形式，如果从一个url图片，图片是以二进制存储的，就可以用r.content还原他

流程
- 先用r.status_code 检查返回的response对象的状态
- 如果是200，就用r.text,r.encoding,r.apparent_encoding,r.content j解析访问的内容
- 如果是404等其他就访问异常
requests.get(url)并不是总是有效的，网络连接有风险，异常处理很重要

Requests库的异常

异常	说明
requests.ConnectionError	网络连接错误异常，如DNS查询失败，拒绝连接等
requests.HTTPError	HTTP错误异常
requests.URLRequired	URL缺失异常
requests.TooManyRedirects	超过最大重定向次数，产生重定向异常（经常是对一些复杂的链接访问时的错误）
requests.ConnectTimeout	连接远程服务器超时异常（仅仅是连接）
requests.Timeout	请求URL超时，产生超时异常（发起到获得url连接的整个过程）

理解requests库的异常

异常	说明
r.raise_for_ststus()	如果不是200，产生异常resquest.HTTPError

爬取网页的通用代码框架

通用代码框架中使用try except语句处理异常，可以有效地处理访问或爬取网页过程中可能出现的错误和网络不稳定现象，使用户访问或爬取网页变得更加有效，更稳定，更可靠

import requests
def getHTMLText(url):
    try:
        r= requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("产生异常")
if __name__=="__main__":
	url="http://www.baidu.com"
	print(getHTMLText(url))
	#

if name == “main”: 是 Python 中的一个常见用法，用于判断当前模块是否作为主程序运行。它的作用如下：

含义：
- name 是 Python 中的一个特殊变量，表示当前模块的名称。
- 当一个 Python 文件被直接运行时， name 的值会被设置为 “main” 。
- 当一个 Python 文件被作为模块导入时， name 的值会被设置为模块的文件名（不含 .py 后缀）。
作用：
- 用于区分模块是被直接运行还是被导入。
- 将模块的测试代码或主程序逻辑放在 if name == “main”: 块中，可以避免在模块被导入时执行这些代码。
1. 好处：
- 提高代码的可重用性：可以将模块导入到其他程序中，而不会执行测试代码。
- 便于测试：可以直接运行模块来测试功能。
  总结： if name == “main”: 是 Python 中用于区分模块是直接运行还是被导入的常用方式，有助于编写更模块化和可重用的代码。

HTTP协议

HTTP，Hypertext Transfer Protocol 超文本传输协议

HTTP是一个基于“请求与响应”模式的，无状态的应用层协议

HTTP协议采用URL作为定位网络资源的标识

URL格式: http://host[:port][path]
- host：合法的Internet主机域名或ip地址
- port：端口号，默认80
- path：请求资源的路径

URL是通过HTTP协议存取资源的Internet路径，一个URL对应一个数据资源

HTTP协议对资源的操作

方法	说明
GET	请求获取URL位置的资源
HEAD	请求获取URL位置的资源的响应报告，即获取该资源的头部信息
POST	请求向URL位置的资源后附加新的数据
PUT	请求向URL位置存储一个资源，覆盖原URL位置的资源
PATCH	请求局部更新URL位置的资源，即改变该处资源的部分内容
DELETE	请求删除URL位置存储的资源

PATCH和PUT区别

假设URL位置由一组数据UserInfo，包括UserID，UserName等20个字段

需求：用户修改了UserName，其他不变

采用PATCH，仅向URL提交UserName的局部更新请求
采用PUT，必须将所有20个字段一并提交到URL，未提交字段被删除

PATCH好处：节省网络带宽

requests库主要方法解析

request方法是所有方法的基础方法

requests.request(method,url.**kwarges)

method:请求方式

method==OPTIONS时：向服务器获取一些服务器和客户端打交道的参数，并不与获取资源直接相关，用的较少。

**kwargs:控制访问的参数，均为可选项，因为他是用于收集任意数量的关键字实参

params：字典或字节序列，作为参数增加到URL中

kv={'key1':'value1','key2':'value2'}

r=requests.request('GET','Http://python123/.in/ws',params=kv)

print(r.URL)

Http://python123/.in/ws?key1=value1,key2=value2

data:字典，字节序列或文件对象，作为Request的内容

kv={'key1':'value1','key2':'value2'}

r=requests.request('POST','Http://python123/.in/ws',data=kv)

body='主题内容'
r=requests.request('POST','Http://python123/.in/ws',data=body)

JSON:JSON格式化的数据，还作为Request内容

kv={'key1':'value1','key2':'value2'}

r=requests.request('POST','Http://python123/.in/ws',json=kv)

headers 字典HTTP定制头 (模拟浏览器可以)

hd={'user-agent':'Chrome/10'}
r=requests.request('POST','http://python123.io/ws',headers=hd)

cookies:字典或CookieJar，Request中的cookie

auth：元组，支持HTTP认证功能

files:字典类型，传输文件

fs={'file':open('data.xls','rb')}
r=requests.request('POST','http://python123.io/ws',files=fs)

- fs={'file':open('data.xls','rb')} :
- 打开名为 data.xls 的文件，以二进制只读模式 ( 'rb' ) 读取。
- 创建一个字典 fs ，其中键为 'file' ，值为打开的文件对象。这个键名通常对应服务器端接收文件的字段名。
- requests.request('POST','http://python123.io/ws',files=fs) :

- 使用 requests 库发送一个 HTTP POST 请求。
- 'POST' 指定请求方法为 POST。
- 'http://python123.io/ws' 是目标 URL，即文件要上传到的服务器地址。
- files=fs 指定要上传的文件， fs 是之前创建的文件字典。
- 整体功能 :

- 将本地的 data.xls 文件通过 POST 请求上传到 http://python123.io/ws 这个地址。
- 服务器会以 'file' 作为字段名接收这个文件。

timeout:设定超时时间，秒为单位

r=requests.request('GET','http://python123.io/ws',timeout=10)

proxies：字典类型，设定访问代理服务器，可以增加登录认证

pxs={'http':'http://user:[email protected]:1234'
'http':'https://10.10.10.1:4321'}
r=requests.request('GET','http://python123.io/ws',proxies=pxs)

allow_redirects:True/False，默认为True，重定向开关。表示允不允许被URL重定向

Stream：True/False，默认为True，获取内容立即下载开关

verify：True/False，默认为True，认证SSL证书开关

cert：本地SSL证书路径

6个主要函数

**requests.get(url,params=None,**kwargs) kwargs：除去params，12个

**requests.head(url,**kwargs) kwargs：13个

requests.post(url,data=None,json=None,**kwargs) **kwargs：11个

requests.put(url,data=None,**kwargs) data:字典，字节序列或文件 **kwargs：12个

requests.patch(url,data=None,**kwargs) **kwargs：12个

requests.delete(url,**kwargs) **kwargs：13个

网络爬虫盗亦有道

网络爬虫的尺寸

小规模，数据量小，爬取速度不敏感，Requests库，>90%	中规模，数据规模较大，爬取速度敏感，Scrspy库	大规模，搜索引擎，爬取速度关键，定制开发
玩转爬虫，玩转网页	爬取网站爬取系列网站	爬取全网

网络爬虫的限制

来源审查：判断User-Agent进行限制
- 检查来访HTTP协议的头的User-Agent域，只响应浏览器或友好爬虫的访问
发布公告：robots协议
- 告知所有爬虫网站的爬取策略，要求爬虫遵守

Robots协议

baidu.com/robots.txt

没有Robot协议，就不限制任何爬虫爬取所有内容

#注释 *代表所有 /代表根目录

User-Agent: *

Disallow: /

Robots Exclusion Standard 网络爬虫排除标准

作用：网站告知网络爬虫哪些页面可以爬取，哪些不行

形式：在网站根目录的robots.txt文件

Robots协议的使用

网络爬虫：自动或人工识别robots.txt,再进行内容爬取

建议但非约束性，类人行为可不参考

requests库实例

京东商品页面爬取

https://item.jd.com/100123450364.html

import requests
url="https://item.jd.com/100123450364.html"
try:
    r=requests.get(url)
    r.raise_for_status()  
    r.encoding=r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取失败")

亚马逊商品页面的爬取

import requests
try:
    url=''
    kv={'user-Agent':'Mozillo/5.0'}
    r=requests.get(url,headers=kv)
    r.raise_for_status()
    r.encoding=r.apparent_encoding

    print(r.text[:10000])
except:
    print("爬取错误")

r.status_code
503

r.request.headers
{‘User-Agent’: ‘python-requests/2.28.1’, ‘Accept-Encoding’: ‘gzip, deflate’, ‘Accept’: ‘/’, ‘Connection’: ‘keep-alive’}

kv={‘user-agent’:‘Mozilla/5.0’}

url=‘’
r=requests.get(url,headers=kv)
r.status_code
200

r.request.headers
{‘user-agent’: ‘Mozilla/5.0’, ‘Accept-Encoding’: ‘gzip, deflate’, ‘Accept’: ‘/’, ‘Connection’: ‘keep-alive’}

百度360搜索关键字提交

百度的关键字接口：

http://www.baidu.com/s?wd=keyword

360的关键字接口:

http://www.so.com/s?q=keyword

>>> import requests
>>> kv={'wd':'python'}
>>> r.requests.get('http://www.baidu.com/s',params=kv)
>>> r=requests.get('http://www.baidu.com/s',params=kv)
>>> r.status_code
200
>>> r.request.url
'http://www.baidu.com/s?wd=python'
>>> len(r.text)
1353463

import requests
try:
    url="http://www.baidu.com/s"
    kv={'wd':'python'}
    r=requests.get(url,params=kv)
    r.raise_for_status()
    print(r.request.url)
    length=len(r.text)
    print(length)
except:
    print("爬取错误")

网络图片的爬取和存储

import requests
import os

try:
    url = 'http://img0.dili360.com/ga/M02/33/7C/wKgBzFSbqQyAJVAuAARB8cSWH_w695.tub.jpg'
    r = requests.get(url)
    r.raise_for_status()

    # 指定保存路径和文件名
    save_dir = 'D:/software/pycharmpro/program/pythonbooktest/pythonProject0'
    filename = os.path.join(save_dir, 'image.jpg')

    # 检查文件是否已存在
    if os.path.exists(filename):
        print("文件已存在")
    else:
        # 保存文件
        with open(filename, 'wb') as f:
            f.write(r.content)
        print("文件保存成功")
except requests.exceptions.RequestException as e:
    print(f"爬取失败: {e}")
except IOError as e:
    print(f"文件保存失败: {e}")

with

with 是 Python 中的一个上下文管理协议（Context Management Protocol），主要用于简化资源管理，确保资源在使用后能够被正确释放。以下是它的详细解释：

1. 基本语法

with 表达式 as 变量:
    代码块

主要作用

自动资源管理： with 语句会在代码块执行完毕后自动调用资源的清理方法（如关闭文件、释放锁等），即使代码块中发生了异常。
简化代码：避免了手动调用 close() 或 release() 等方法，减少了代码量。

3. 工作原理

with 语句背后的机制依赖于对象的 enter() 和 **exit**() 方法：

enter() ：在进入 with 代码块时调用，通常用于初始化资源。
exit() ：在退出 with 代码块时调用，无论是否发生异常，都会执行，用于清理资源。

4. 常见使用场景

(1) 文件操作

with open('file.txt', 'r') as f:
    content = f.read()
# 文件会在代码块结束后自动关闭，无需手动调用 f.close()

(2) 数据库连接

with connect_database() as conn:
    conn.execute('SELECT * FROM table')
# 数据库连接会在代码块结束后自动关闭

(3) 线程锁

with threading.Lock():
    # 线程安全的代码块
# 锁会在代码块结束后自动释放

5. 优点

安全性：确保资源被正确释放，避免资源泄漏。
简洁性：减少代码量，提高可读性。
异常处理：即使代码块中发生异常，资源也会被正确清理。

6. 对比

不使用 with ：

f = open('data.txt', 'w')
try:
    f.write('Hello, World!')
finally:
    f.close()

使用 with ：

with open('data.txt', 'w') as f:
    f.write('Hello, World!')

总结： with 是 Python 中用于管理资源（如文件、数据库连接、锁等）的语法糖，能够确保资源在使用后被正确释放，同时简化代码并提高可读性。

OS模块

os 是 Python 标准库中的一个模块，提供了与操作系统交互的功能。它允许你执行文件操作、目录操作、环境变量管理、进程管理等任务。以下是 os 模块的常用功能：

1. 常用功能 (1)

文件与目录操作

os.getcwd() ：获取当前工作目录。
os.chdir(path) ：改变当前工作目录。
os.listdir(path) ：列出指定目录下的所有文件和子目录。
os.mkdir(path) ：创建目录。
os.makedirs(path) ：递归创建目录。
os.remove(path) ：删除文件。
os.rmdir(path) ：删除空目录。
os.removedirs(path) ：递归删除空目录。

进程管理

os.system(command) ：执行系统命令。
os.popen(command) ：执行系统命令并获取输出。
os.getpid() ：获取当前进程的 PID。
os.kill(pid, signal) ：向指定进程发送信号。

文件权限

os.chmod(path, mode) ：修改文件权限。
os.access(path, mode) ：检查文件权限。

os.path 是 Python 标准库 os 模块中的一个子模块，专门用于处理文件路径和目录路径。它提供了一系列函数来操作路径字符串，使得路径处理更加方便和跨平台兼容

路径操作

os.path ： os 的子模块，专门用于路径操作（如路径拼接、拆分、检查等）。
os.path.join(path1, path2) ：拼接路径。
os.path.exists(path) ：检查路径是否存在。
os.path.isfile(path) ：检查是否为文件。
os.path.isdir(path) ：检查是否为目录。

注意事项

路径分隔符：不同操作系统的路径分隔符不同（Windows 使用 \ ，Linux/macOS 使用 / ），建议使用 os.path.join() 来拼接路径。
权限问题：某些操作（如创建目录、删除文件）可能需要管理员权限。

1. 常用函数

以下是 os.path 中一些常用的函数：
(1) 路径拼接

os.path.join(path1, path2, …) ：将多个路径组件拼接成一个完整的路径。

import os
path = os.path.join('dir1', 'dir2', 'file.txt')
# 输出: 'dir1/dir2/file.txt'（Linux/macOS）或 'dir1\\dir2\\file.txt'（Windows）

(2) 路径拆分

os.path.split(path) ：将路径拆分为目录和文件名。

dir, file = os.path.split('/path/to/file.txt')
# dir = '/path/to', file = 'file.txt'

(3) 路径存在检查

os.path.exists(path) ：检查路径是否存在。

if os.path.exists('file.txt'):
    print('文件存在')

(4) 文件/目录判断

os.path.isfile(path) ：判断路径是否为文件。
os.path.isdir(path) ：判断路径是否为目录。

if os.path.isfile('file.txt'):
    print('这是一个文件')
if os.path.isdir('dir'):
    print('这是一个目录')

(5) 获取文件信息

os.path.getsize(path) ：获取文件大小（字节）。
os.path.getmtime(path) ：获取文件最后修改时间。

size = os.path.getsize('file.txt')
mtime = os.path.getmtime('file.txt')

(6) 路径规范化

os.path.normpath(path) ：规范化路径（去除冗余的分隔符和 . / … ）。

path = os.path.normpath('dir1/./dir2/../file.txt')
# 输出: 'dir1/file.txt'

获取绝对路径

os.path.abspath(path) ：将相对路径转换为绝对路径。

abs_path = os.path.abspath('file.txt')

3. 优点

跨平台兼容： os.path 自动处理不同操作系统（Windows/Linux/macOS）的路径分隔符。
功能丰富：提供了大量实用的路径操作函数。
安全性：避免手动拼接路径时可能出现的错误

ip地址归属地查询

ip138

import requests

url = "http://ip138.com/ip.asp?ip="
try:

    r = requests.get(url+"109.141.155")
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[-500:])  # 修正切片索引
except :  # 捕获特定异常
    print(f"查询失败")

我搞不出来，可能网站有查询验证，要钱啥的

你可能感兴趣的:(Python爬虫,python,爬虫,开发语言,笔记)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc