张謹礧

python爬虫——气象数据爬取

一、导入库与全局配置

python

运行

import json
import datetime
import time
import requests
from sqlalchemy import create_engine
import csv
import pandas as pd

作用：

引入数据解析、网络请求、时间处理、数据库操作等所需库。
requests：发送 HTTP 请求获取网页数据。
sqlalchemy：连接和操作 MySQL 数据库。
pandas：处理 CSV 文件和数据清洗。

潜在问题：

未处理requests的超时（可能导致程序卡死）。
数据库密码直接写死在代码中（存在安全风险）。

二、核心爬取函数 `scraw(code)`

python

运行

def scraw(code):
    url = f'http://www.nmc.cn/rest/weather?stationid={code}&_=1675259309000'
    response = requests.get(url, headers=headers)
    
    try:
        data = json.loads(response.text)
        info = data['data']
        passed = data['data']['passedchart']
        real = data['data']['real']
        tempchart = data['data']['tempchart']
        predict = data['data']['predict']['detail']
        
        # 解析24小时天气数据并写入CSV
        for i in passed:
            csv.writer(csv_obj).writerow([names[inx], ...])
        
        # 解析实时天气数据并写入CSV
        csv.writer(csv_obj2).writerow([names[inx], ...])
        
        # 解析7天温度数据并写入CSV
        for i in tempchart:
            csv.writer(csv_obj3).writerow([names[inx], ...])
        
        # 解析预报数据并写入CSV
        for i in predict:
            csv.writer(csv_obj4).writerow([names[inx], ...])
    
    except:
        print(f'{code}爬取失败')

功能拆解：

URL 构造：
- 拼接城市代码（stationid）和时间戳参数（_），可能用于防止缓存。
- 问题：时间戳硬编码（1675259309000），未动态生成，可能导致请求失效。
数据解析：
- 通过json.loads()解析 JSON 响应，提取passedchart（历史数据）、real（实时数据）等字段。
- 风险：假设 JSON 结构固定，若网站接口变更会导致解析失败（需添加容错处理）。
CSV 写入：
- 循环写入不同类型数据到 4 个 CSV 文件（data24h.csv、dataday.csv等）。
- 问题：names[inx]依赖全局变量inx，多线程环境下可能引发线程安全问题。

三、降雨量爬取函数 `scraw_rain24h()` & `scraw_rain1h()`

python

运行

def scraw_rain24h():
    url = f'http://www.nmc.cn/rest/real/rain/hour24/{date}?_={times}'
    csv_obj5 = open('csv/rain24h.csv', 'w', ...)
    response = requests.get(url, headers=headers)
    data = json.loads(response.text)
    raindata = data['data']['data']
    
    for i in raindata:
        csv.writer(csv_obj5).writerow([i[0]+i[1], i[5]])
    csv_obj5.close()

def scraw_rain1h():
    # 逻辑与scraw_rain24h()类似，仅URL和CSV文件不同

关键细节：

URL 参数：date由主程序生成（格式为YYYYMMDD08），times为当前时间戳（动态生成）。
数据结构：降雨量数据通过i[0]+i[1]拼接城市名（假设i[0]为省，i[1]为市），i[5]为降雨量。
问题：未处理城市名重复或异常数据（如i[0]或i[1]为空）。

四、数据库存储函数 `save()`

python

运行

def save():
    DB_STRING = 'mysql+pymysql://root:[email protected]:3306/tianqi'
    engine = create_engine(DB_STRING)
    
    # 读取CSV文件
    df = pd.read_csv("csv/data24h.csv")
    df2 = pd.read_csv("csv/dataday.csv")
    # ... 读取其他CSV文件
    
    # 数据清洗
    df = df.drop('24h降雨量', axis=1)
    df2 = df2[df2['体感温度'] != 9999]
    df3 = df3[df3['最高温度'] != 9999]
    
    # 写入数据库
    df.to_sql('24h', con=engine, if_exists='replace', index=False)
    # ... 写入其他DataFrame

功能说明：

数据库连接：
- 使用 SQLAlchemy 创建数据库引擎，连接本地 MySQL 的tianqi数据库。
- 风险：密码mysql硬编码，需通过环境变量或配置文件管理。
数据清洗：
- 删除无效列（如24h降雨量）和值为9999的行（假设9999为错误值）。
- 问题：清洗逻辑分散，未统一处理（如其他 CSV 文件可能也存在无效值）。
数据写入：
- 使用to_sql批量写入，if_exists='replace'会覆盖表数据（可能导致历史数据丢失）。

五、主程序逻辑（`if name == 'main'`）

python

运行

if __name__ == '__main__':
    df = pd.read_csv('csv/citycode.csv')
    codes = df.code.tolist()
    names = df.城市.tolist()
    
    date = time.strftime('%Y%m%d', time.gmtime()) + '08'
    times = int(time.time() * 1000)
    
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; ...)'
    }
    
    # 初始化CSV文件
    csv_obj = open('csv/data24h.csv', 'w', ...)
    # ... 初始化其他CSV文件
    
    for inx, i in enumerate(codes):
        scraw(i)
        print(f"{names[inx]}爬取完毕")
    
    # 关闭CSV文件
    csv_obj.close()
    # ... 关闭其他CSV文件
    
    scraw_rain24h()
    scraw_rain1h()
    save()

流程分析：

准备阶段：
- 读取城市代码表（citycode.csv），获取codes（城市代码）和names（城市名）。
- 生成date（当前日期 +08，可能为北京时间时区调整）和times（毫秒级时间戳）。
爬取阶段：
- 循环调用scraw(i)爬取每个城市的数据，依赖全局变量inx和names。
- 问题：未控制爬取频率（可能触发网站反爬机制），建议添加time.sleep()。
收尾阶段：
- 关闭 CSV 文件句柄（需确保在异常情况下也能关闭，建议用with语句）。
- 爬取降雨量数据并保存到数据库。

六、整体问题总结与改进方向

模块	问题	改进建议
爬取逻辑	硬编码时间戳、未处理反爬	动态生成时间戳，添加请求头（如`Referer`）、限制爬取频率
异常处理	全局`except`捕获，无详细日志	细化异常类型，使用`logging`模块记录错误信息
资源管理	CSV 文件未用`with`语句，可能泄漏资源	改用`with open(...) as f`管理文件
数据安全	数据库密码硬编码	使用环境变量（如`os.getenv()`）或配置文件
代码可维护性	全局变量耦合严重，逻辑分散	将功能封装为类，分离爬取、解析、存储逻辑
扩展性	难以为新城市或数据类型扩展	设计可配置的爬取规则和字段映射

通过分块优化，可显著提升代码的健壮性、可维护性和安全性，同时降低对目标网站的影响。

完整代码：

import json
import datetime
import time
import requests
from sqlalchemy import create_engine
import csv
import pandas as pd



def scraw(code):
    # 发送 HTTP 请求，获取网页内容
    url = f'http://www.nmc.cn/rest/weather?stationid={code}&_=1675259309000'
    response = requests.get(url, headers=headers)

    try:
        data = json.loads(response.text)
        info = data['data']

        # 24小时天气情况
        passed = data['data']['passedchart']
        # 一天
        real = data['data']['real']
        # 最近七天最高低温度
        tempchart = data['data']['tempchart']
        # 预测
        predict = data['data']['predict']['detail']

        for i in passed:
            humidity = i['humidity']  # 相对湿度
            pressure = i['pressure']  # 空气压力
            rain1h = i['rain1h']  #
            rain24h = i['rain24h']  #
            temperature = i['temperature']  # 温度
            windDirection = i['windDirection']
            windSpeed = i['windSpeed']
            time = i['time']
            tempDiff = i['tempDiff']  # 体感温度
            csv.writer(csv_obj).writerow(
                [names[inx],humidity, pressure, rain1h, rain24h, temperature, windDirection, windSpeed, time, tempDiff])

        csv.writer(csv_obj2).writerow(
            [names[inx],datetime.datetime.now().date(), real['weather']['airpressure'], real['weather']['feelst'],
             real['weather']['humidity'], real['weather']['info'], real['weather']['rain'], real['weather']['temperature'],
             real['wind']['direct'], real['wind']['power'], real['wind']['speed']])
        for i in tempchart:
            time = i['time']
            max_temp = i['max_temp']
            min_temp = i['min_temp']
            csv.writer(csv_obj3).writerow(
                [names[inx],time, max_temp, min_temp])

        for i in predict:
            date = i['date']
            temperatureday = i['day']['weather']['temperature']
            temperaturenight = i['night']['weather']['temperature']
            wind = i['day']['wind']['direct']
            csv.writer(csv_obj4).writerow(
                [names[inx],date, temperatureday, temperaturenight, wind])
    except:
        print(f'{code}爬取失败')

def scraw_rain24h():
    url = f'http://www.nmc.cn/rest/real/rain/hour24/{date}?_={times}'
    csv_obj5 = open('csv/rain24h.csv', 'w', encoding="utf-8",newline='')
    response = requests.get(url, headers=headers)
    data = json.loads(response.text)
    print(data)

    raindata = data['data']['data']

    csv.writer(csv_obj5).writerow(["城市",'降雨量'])
    for i in raindata:
        csv.writer(csv_obj5).writerow([i[0] +i[1], i[5]])

    print('爬取数据完毕')
    csv_obj5.close()

def scraw_rain1h():
    url = f'http://www.nmc.cn/rest/real/rain/hour1/{date}?_={times}'
    csv_obj6 = open('csv/rain1h.csv', 'w', encoding="utf-8", newline='')
    response = requests.get(url, headers=headers)
    data = json.loads(response.text)

    raindata = data['data']['data']

    csv.writer(csv_obj6).writerow(["城市", '降雨量'])
    for i in raindata:
        csv.writer(csv_obj6).writerow([i[0] + i[1], i[5]])

    print('爬取数据完毕')
    csv_obj6.close()


def save():
    # 存入数据库
    DB_STRING = 'mysql+pymysql://root:[email protected]:3306/tianqi'
    engine = create_engine(DB_STRING)
    df = pd.read_csv("csv/data24h.csv")
    df2 = pd.read_csv("csv/dataday.csv")
    df3 = pd.read_csv("csv/tempchart.csv")
    df4 = pd.read_csv("csv/predict.csv")
    df5 = pd.read_csv("csv/rain24h.csv")
    df6 = pd.read_csv("csv/rain1h.csv")
    #删除不正常值

    # 删除部分列值等于9999的行
    df = df.drop('24h降雨量',axis=1)
    df2 = df2[df2['体感温度'] != 9999]
    df3 = df3[df3['最高温度'] != 9999]

    df.to_sql('24h', con=engine, if_exists='replace',index=False)
    df2.to_sql('day', con=engine, if_exists='replace',index=False)
    df3.to_sql('tempchart', con=engine, if_exists='replace',index=False)
    df4.to_sql('predict', con=engine, if_exists='replace',index=False)
    df5.to_sql('rain24h', con=engine, if_exists='replace',index=False)
    df6.to_sql('rain1h', con=engine, if_exists='replace',index=False)

    print('保存数据库完毕')


if __name__ == '__main__':
    df = pd.read_csv('csv/citycode.csv')
    codes = df.code.tolist()
    names = df.城市.tolist()
    #北京
    # codes = [54511]
    # names = ['北京']

    date = time.strftime('%Y%m%d', time.gmtime()) +'08'
    times = int(time.time() * 1000)


    # # 设置请求头部信息，避免被识别为爬虫
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

    csv_obj = open('csv/data24h.csv', 'w', encoding="utf-8",newline='')
    csv_obj2 = open('csv/dataday.csv', 'w', encoding="utf-8", newline='')
    csv_obj3 = open('csv/tempchart.csv', 'w', encoding="utf-8", newline='')
    csv_obj4 = open('csv/predict.csv', 'w', encoding="utf-8", newline='')
    csv.writer(csv_obj).writerow(["城市","相对湿度", "气压", "一小时降雨量","24h降雨量", "温度", "风向", "风速","时间",'体感温度'])
    csv.writer(csv_obj2).writerow(["城市","日期","气压", '体感温度',"相对湿度","天气情况","一小时降雨量","温度", "风向", "风强度","风速"])
    csv.writer(csv_obj3).writerow(["城市","日期","最高温度", '最低温度'])
    csv.writer(csv_obj4).writerow(["城市","日期","白天温度", '夜晚温度',"风向"])
    for inx,i in enumerate(codes):
        scraw(i)
        print(f"{names[inx]}爬取完毕")
    csv_obj.close()
    csv_obj2.close()
    csv_obj3.close()
    csv_obj4.close()
    scraw_rain24h()
    scraw_rain1h()
    save()

import csv
import json
import requests
# 设置请求头部信息，避免被识别为爬虫


headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}


# 发送 HTTP 请求，获取网页内容

url = 'http://www.nmc.cn/rest/province/all?_=1678112903659'
response = requests.get(url, headers=headers)
data = json.loads(response.text)
csv_obj = open('allcsv/citycode.csv', 'w', encoding="utf-8", newline='')
csv.writer(csv_obj).writerow(['城市','code'])
for i in data:
    code = i['code']
    url = f'http://www.nmc.cn/rest/province/{code}?_=1677854971362'
    response = requests.get(url, headers=headers)
    data = json.loads(response.text)
    for x in data:
        csv.writer(csv_obj).writerow([x['city'], x['code']])



csv_obj.close()

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
Gerapy爬虫管理框架深度解析：企业级分布式爬虫管控平台 Python×CATIA工业智造爬虫分布式 python pycharm
引言：爬虫工程化的必然选择随着企业数据采集需求指数级增长，传统单点爬虫管理模式面临三重困境：管理效率瓶颈：手动部署耗时占开发总时长的40%以上系统可靠性低：研究显示超过65%的爬虫故障源于部署或调度错误资源利用率差：平均爬虫服务器CPU利用率不足30%爬虫管理方案对比：┌───────────────┬─────────────┬───────────┬───────────┬──────────
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

python爬虫——气象数据爬取

一、导入库与全局配置

二、核心爬取函数 scraw(code)

三、降雨量爬取函数 scraw_rain24h() & scraw_rain1h()

四、数据库存储函数 save()

五、主程序逻辑（if __name__ == '__main__'）

六、整体问题总结与改进方向

完整代码：

你可能感兴趣的:(python,爬虫,开发语言)

二、核心爬取函数 `scraw(code)`

三、降雨量爬取函数 `scraw_rain24h()` & `scraw_rain1h()`

四、数据库存储函数 `save()`

五、主程序逻辑（`if name == 'main'`）