Looooking

Python 自动化测试之滑块验证码处理

RPA 机器人流程自动化测试时，登录环节经常会出现各种拦路虎，比如像下面的滑块验证码。

那么，如何通过 Python 的工具自动破解这些滑动验证码呢？

破解思路

关于滑动验证码破解的思路大体上来讲就是以下的步骤：

获取背景图和滑块图
计算滑块在背景图的位置
根据缩放比例及滑块初始位置计算真实的滑动距离
模拟拖动滑块，通过验证

关于上面这种的滑块验证，滑块和缺口背景都是分别是一张独立的图片，我们可以把这两张图片下载下来，借助于图像识别的技术，去识别缺口在背景图中的位置，然后按照比例缩放后，再减去滑块当前所在位置，就可以得出需要滑动的距离。

示例讲解

以下以顺丰的函证通的登录为例进行分析函证通-运营后台系统

初始化浏览器

使用 selenium 初始化打开浏览器，这个属于常规的前置步骤，就不多说了（记得 chromedriver.exe 的版本和浏览器的版本要对应）。


class DriverClass:
    def __init__(self):
        self.driver = self._init_driver()

    def _init_driver(self):
        try:
            option = webdriver.ChromeOptions()
            option.add_experimental_option('excludeSwitches', ['enable-automation'])
            option.add_experimental_option('useAutomationExtension', False)
            prefs = dict()
            prefs['credentials_enable_service'] = False
            prefs['profile.password_manager_enable'] = False
            prefs['profile.name'] = "Person 1"
            option.add_experimental_option('prefs', prefs)
            option.add_argument('--disable-gpu')
            option.add_argument("--disable-blink-features=AutomationControlled")
            option.add_argument('--user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"')
            option.add_argument('--no-sandbox')
            option.add_argument('ignore-certificate-errors')
            # option.add_experimental_option("debuggerAddress", "127.0.0.1:9527")
            driver = webdriver.Chrome(r"./driver/chromedriver.exe", options=option)
            driver.implicitly_wait(2)
            driver.maximize_window()
            return driver
        except Exception as e:
            raise e

    def get_driver(self) -> webdriver.Chrome:
        if isinstance(self.driver, webdriver.Chrome):
            return self.driver
        raise Exception('初始化浏览器失败')

用户名密码输入

然后打开目标网址的登录首页，利用查找到的 XPath 输入用户名，密码并点击登录按钮。

def handle_login(self):
    try:
        print("开始登录")
        print(f'login_url: {self.login_url}')
        self.driver.get(self.login_url)
        time.sleep(1)
        self.driver.find_element(By.XPATH, '//div/div/input[@name="username"]').send_keys(self.username)  # 用户名
        self.driver.find_element(By.XPATH, '//div/div/input[@name="password"]').send_keys(self.password)  # 密码
        self.driver.find_element(By.XPATH, '//div/div/button/span[contains(text(), "登 录")]').click()  # 登录按钮
        print("等待拖动滑块验证...")
        self.solve_captcha()
        # 登录成功，记录当前页面句柄
        self.base_window_handle = self.driver.current_window_handle
        print("登录成功")
        return True
    except Exception as e:
        print(traceback.format_exc())
        self.save_error_img()
        return False

获取图片 XPath

等待滑块图片加载以后，获取背景图和滑块图的 XPath 并获取元素引用（这里需要先切换到新的 iframe）。

time.sleep(5)
self.driver.switch_to.frame("tcaptcha_iframe")
# 等待元素加载
xpath_bg_element = '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBgWrap"]/img'
WebDriverWait(self.driver, 5).until(EC.presence_of_element_located((By.XPATH, xpath_bg_element)))
bg_element = self.driver.find_element(By.XPATH, xpath_bg_element)
xpath_slider_element = '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBlockWrap"]/img'
slider_element = self.driver.find_element(By.XPATH, xpath_slider_element)
xpath_slider_button = '//div/div/div/p[@id="guideText"]/following::*/div[@id="tcaptcha_drag_thumb"]'
slider_button = self.driver.find_element(By.XPATH, xpath_slider_button)

下载并保存图片

根据元素的 src 属性，获取图片的下载链接，然后下载并保存背景图和滑块图到本地。

def get_images(self, bg_element, slider_element):
    # 获取背景图
    bg_src = bg_element.get_attribute("src")
    bg_content = requests.get(bg_src).content
    # 获取滑块图
    slider_src = slider_element.get_attribute("src")
    slider_content = requests.get(slider_src).content
    # 下载图片
    bg_path = os.path.join("img", "bg.png")
    slider_path = os.path.join("img", "slider.png")

    with open(bg_path, "wb") as f:
        f.write(bg_content)
    with open(slider_path, "wb") as f:
        f.write(slider_content)
    return bg_path, slider_path

识别滑块在背景图的位置

通过传入保存的背景图和滑块图的路径，并利用 opencv-python 进行二值化灰度处理（一般灰度处理后，去除了非必要的干扰项，识别精度会高一些），再识别滑块在背景图中的位置。

def get_slide_distance(self, bg_path, slider_path):
    # 读取进行色度图片，转换为numpy中的数组类型数据，
    slider_pic = cv2.imread(slider_path, 0)
    background_pic = cv2.imread(bg_path, 0)
    # 获取缺口图数组的形状 --> 缺口图的宽和高
    width, height = slider_pic.shape[::-1]
    # 将处理之后的图片另存
    slider01 = slider_path
    background_01 = bg_path
    cv2.imwrite(background_01, background_pic)
    cv2.imwrite(slider01, slider_pic)
    # 读取另存的滑块图
    slider_pic = cv2.imread(slider01)
    # 进行色彩转换
    slider_pic = cv2.cvtColor(slider_pic, cv2.COLOR_BGR2GRAY)
    # 获取色差的绝对值
    slider_pic = abs(255 - slider_pic)
    # 保存图片
    cv2.imwrite(slider01, slider_pic)
    # 读取滑块
    slider_pic = cv2.imread(slider01)
    # 读取背景图
    background_pic = cv2.imread(background_01)
    # 比较两张图的重叠区域
    result = cv2.matchTemplate(slider_pic, background_pic, cv2.TM_CCOEFF_NORMED)
    # 获取图片的缺口位置
    top, left = np.unravel_index(result.argmax(), result.shape)
    # 背景图中的图片缺口坐标位置
    print("当前滑块的缺口位置：", (left, top, left + width, top + height))
    return left

计算真实滑动距离

这里是关键步骤了，计算不正确的话很可能导致滑块拖动不到位。

背景图和滑块图在页面上的尺寸和下载到本地的图片尺寸是不一样的，我们上面计算的距离 distance 是以本地图片的尺寸为准，但最后的拖动操作是在页面上进行，所以需要按照缩放比例 scale 将距离转换成页面的距离。

同时由于滑块初始位置没有在背景图的最左边，所以计算的距离还需要减去滑块初始位置距离背景图左边缘的距离 delta。

real_distance = distance * scale - delta

distance = self.get_slide_distance(bg_path, slider_path)
# 根据背景图的页面尺寸和实际尺寸调整缩放比
bg_width = bg_element.size["width"]
real_width = cv2.imread(bg_path).shape[1]
scale = bg_width / real_width
print(f"图片宽度：{real_width}，页面图片宽度：{bg_width}，缩放比：{scale}")
# 统一转换成页面的尺寸规格，这里的 delta 大略是滑块初始位置距离背景图左边缘的距离，所以滑动时要减掉这段距离
delta = 25
real_distance = distance * scale - delta
print("滑动距离：", real_distance)

滑块拖动

直接拖动

计算出滑动距离以后，一般我们可以像下面这样对滑块直接一次性拖动到位。

def slide_verify_by_distance(self, slider, distance):
    # 执行滑动操作
    ActionChains(self.driver).click_and_hold(slider).perform()
    ActionChains(self.driver).move_by_offset(xoffset=distance, yoffset=0).perform()
    time.sleep(0.5)
    ActionChains(self.driver).release().perform()
    slider.click()

多次拖动

有时候有些网站的校验比较严格，直接一次拖动的话可能会触发校验，被反爬虫识别出来是机器人，这个时候，我们也可以将滑动距离拆分成多段，然后进行分段拖动，这样更像是人类的操作。

def get_track(self, distance):
    # 生成移动轨迹（模拟人类滑动）
    track = []
    current = 0
    mid = distance * 0.8
    t = 0.2
    v = 0

    while current < distance:
        if current < mid:
            a = 5  # 加速阶段
        else:
            a = -3  # 减速阶段
        v0 = v
        v = v0 + a * t
        move = v0 * t + 0.5 * a * t * t
        current += move
        track.append(round(move))

    # 微调误差
    track.append(distance - sum(track))
    return track

def slide_verify_by_track(self, slider, track):
    # 执行滑动操作
    ActionChains(self.driver).click_and_hold(slider).perform()
    for x in track:
        ActionChains(self.driver).move_by_offset(xoffset=x, yoffset=0).perform()
    time.sleep(0.5)
    ActionChains(self.driver).release().perform()
    slider.click()

目前自测顺丰的函证通，这两种方式进行拖动都是可以的。

完整代码

示例网站完整代码如下（错误的用户名密码也可以进入滑块验证码界面，下面代码可以直接运行）：

import os.path
import traceback
import time
import requests
import cv2
import numpy as np

import datetime

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.chrome.webdriver import WebDriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 新建 img 目录，存放下载的背景图和滑块图
os.makedirs("img", exist_ok=True)
# 新建 tmp 目录，存放失败时的截图
os.makedirs("tmp", exist_ok=True)


def get_current_time(fmt="%Y-%m-%d %H:%M:%S"):
    return datetime.datetime.now().strftime(fmt)


class DriverClass:
    def __init__(self):
        self.driver = self._init_driver()

    def _init_driver(self):
        try:
            option = webdriver.ChromeOptions()
            option.add_experimental_option('excludeSwitches', ['enable-automation'])
            option.add_experimental_option('useAutomationExtension', False)
            prefs = dict()
            prefs['credentials_enable_service'] = False
            prefs['profile.password_manager_enable'] = False
            prefs['profile.name'] = "Person 1"
            option.add_experimental_option('prefs', prefs)
            option.add_argument('--disable-gpu')
            option.add_argument("--disable-blink-features=AutomationControlled")
            option.add_argument('--user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"')
            option.add_argument('--no-sandbox')
            option.add_argument('ignore-certificate-errors')
            # option.add_experimental_option("debuggerAddress", "127.0.0.1:9527")
            driver = webdriver.Chrome(r"./driver/chromedriver.exe", options=option)
            driver.implicitly_wait(2)
            driver.maximize_window()
            return driver
        except Exception as e:
            raise e

    def get_driver(self) -> webdriver.Chrome:
        if isinstance(self.driver, webdriver.Chrome):
            return self.driver
        raise Exception('初始化浏览器失败')


class HZT:
    """函证通"""

    def __init__(self, params):
        self.name = "hzt"
        self.base_window_handle = ""
        self.login_url = params["login_url"]
        self.username = params["username"]
        self.password = params["password"]

    def init_driver(self):
        try:
            print('打开浏览器')
            dc = DriverClass()
            self.driver = dc.get_driver()
            return True
        except Exception as e:
            print('打开浏览器失败')
            print(traceback.format_exc())
            return False

    def close_driver(self):
        try:
            if self.driver and isinstance(self.driver, WebDriver):
                self.driver.quit()
            else:
                del self.driver
            print("浏览器正常关闭")
            return True
        except Exception as e:
            print(traceback.format_exc())

    def handle_login(self):
        try:
            print("开始登录")
            print(f'login_url: {self.login_url}')
            self.driver.get(self.login_url)
            time.sleep(1)
            self.driver.find_element(By.XPATH, '//div/div/input[@name="username"]').send_keys(self.username)  # 用户名
            self.driver.find_element(By.XPATH, '//div/div/input[@name="password"]').send_keys(self.password)  # 密码
            self.driver.find_element(By.XPATH, '//div/div/button/span[contains(text(), "登 录")]').click()  # 登录按钮
            print("等待拖动滑块验证...")
            self.solve_captcha()
            # 登录成功，记录当前页面句柄
            self.base_window_handle = self.driver.current_window_handle
            print("登录成功")
            return True
        except Exception as e:
            print(traceback.format_exc())
            self.save_error_img()
            return False

    def save_error_img(self):
        try:
            now_date = get_current_time("%Y%m%d")
            file_save_dir = os.path.join("tmp", now_date, self.name)
            os.makedirs(file_save_dir, exist_ok=True)
            err_file_path = os.path.join(file_save_dir, f'{self.name}_err_{get_current_time(fmt="%Y%m%d%H%M%S")}.png')
            print(f"存储错误发生时截图，err_file_path: {err_file_path}")
            self.driver.save_screenshot(err_file_path)
        except Exception as e:
            print(traceback.format_exc())

    def get_slide_distance(self, bg_path, slider_path):
        # 读取进行色度图片，转换为numpy中的数组类型数据，
        slider_pic = cv2.imread(slider_path, 0)
        background_pic = cv2.imread(bg_path, 0)
        # 获取缺口图数组的形状 --> 缺口图的宽和高
        width, height = slider_pic.shape[::-1]
        # 将处理之后的图片另存
        slider01 = slider_path
        background_01 = bg_path
        cv2.imwrite(background_01, background_pic)
        cv2.imwrite(slider01, slider_pic)
        # 读取另存的滑块图
        slider_pic = cv2.imread(slider01)
        # 进行色彩转换
        slider_pic = cv2.cvtColor(slider_pic, cv2.COLOR_BGR2GRAY)
        # 获取色差的绝对值
        slider_pic = abs(255 - slider_pic)
        # 保存图片
        cv2.imwrite(slider01, slider_pic)
        # 读取滑块
        slider_pic = cv2.imread(slider01)
        # 读取背景图
        background_pic = cv2.imread(background_01)
        # 比较两张图的重叠区域
        result = cv2.matchTemplate(slider_pic, background_pic, cv2.TM_CCOEFF_NORMED)
        # 获取图片的缺口位置
        top, left = np.unravel_index(result.argmax(), result.shape)
        # 背景图中的图片缺口坐标位置
        print("当前滑块的缺口位置：", (left, top, left + width, top + height))
        return left

    def get_images(self, bg_element, slider_element):
        # 获取背景图
        bg_src = bg_element.get_attribute("src")
        bg_content = requests.get(bg_src).content
        # 获取滑块图
        slider_src = slider_element.get_attribute("src")
        slider_content = requests.get(slider_src).content
        # 下载图片
        bg_path = os.path.join("img", "bg.png")
        slider_path = os.path.join("img", "slider.png")

        with open(bg_path, "wb") as f:
            f.write(bg_content)
        with open(slider_path, "wb") as f:
            f.write(slider_content)
        return bg_path, slider_path

    def slide_verify_by_distance(self, slider, distance):
        # 执行滑动操作
        ActionChains(self.driver).click_and_hold(slider).perform()
        ActionChains(self.driver).move_by_offset(xoffset=distance, yoffset=0).perform()
        time.sleep(0.5)
        ActionChains(self.driver).release().perform()
        slider.click()

    def get_track(self, distance):
        # 生成移动轨迹（模拟人类滑动）
        track = []
        current = 0
        mid = distance * 0.8
        t = 0.2
        v = 0

        while current < distance:
            if current < mid:
                a = 5  # 加速阶段
            else:
                a = -3  # 减速阶段
            v0 = v
            v = v0 + a * t
            move = v0 * t + 0.5 * a * t * t
            current += move
            track.append(round(move))

        # 微调误差
        track.append(distance - sum(track))
        return track

    def slide_verify_by_track(self, slider, track):
        # 执行滑动操作
        ActionChains(self.driver).click_and_hold(slider).perform()
        for x in track:
            ActionChains(self.driver).move_by_offset(xoffset=x, yoffset=0).perform()
        time.sleep(0.5)
        ActionChains(self.driver).release().perform()
        slider.click()

    def solve_captcha(self):
        """处理滑块图形验证码"""
        try:
            # 等待滑块图形加载
            time.sleep(5)
            self.driver.switch_to.frame("tcaptcha_iframe")
            # 等待元素加载
            xpath_bg_element = '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBgWrap"]/img'
            WebDriverWait(self.driver, 5).until(EC.presence_of_element_located((By.XPATH, xpath_bg_element)))
            bg_element = self.driver.find_element(By.XPATH, xpath_bg_element)
            xpath_slider_element = '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBlockWrap"]/img'
            slider_element = self.driver.find_element(By.XPATH, xpath_slider_element)
            xpath_slider_button = '//div/div/div/p[@id="guideText"]/following::*/div[@id="tcaptcha_drag_thumb"]'
            slider_button = self.driver.find_element(By.XPATH, xpath_slider_button)

            # 获取并处理图片
            bg_path, slider_path = self.get_images(bg_element, slider_element)
            distance = self.get_slide_distance(bg_path, slider_path)
            # 根据背景图的页面尺寸和实际尺寸调整缩放比
            bg_width = bg_element.size["width"]
            real_width = cv2.imread(bg_path).shape[1]
            scale = bg_width / real_width
            print(f"图片宽度：{real_width}，页面图片宽度：{bg_width}，缩放比：{scale}")
            # 统一转换成页面的尺寸规格，这里的 delta 大略是滑块初始位置距离背景图左边缘的距离，所以滑动时要减掉这段距离
            delta = 25
            real_distance = distance * scale - delta
            print("滑动距离：", real_distance)
            self.slide_verify_by_distance(slider_button, real_distance)
            # track = self.get_track(real_distance)
            # self.slide_verify_by_track(slider_button, track)
            # 等待用户输入滑动验证码
            time.sleep(10)
        except Exception as e:
            print("滑块验证码处理报错")
            print(traceback.format_exc())
            traceback.print_exc()


if __name__ == '__main__':
    params = {
        "login_url": "https://hzt.sf-laas.com/login",
        "username": "username", # 用自己的用户名
        "password": "password", # 用自己的密码
    }
    hwc = HZT(params)
    hwc.init_driver()
    hwc.handle_login()
    hwc.close_driver()

注意事项

下载链接获取

有时候图片加载比较慢，可能导致元素虽然能获取到，但是 src 属性的图片链接还没加载，这个时候可以等待 src 加载完全后再下载图片。

图片下载报错

有时候图片下载链接虽然获取到了，但是下载的时候报 Max retries exceeded with url，这个时候可以添加个重试机制，下载报错时，等待一段时间后再次下载。

def get_images(self, bg_element, slider_element):
    for i in range(30):
        bg_src = bg_element.get_attribute("src")
        if bg_src:
            break
        time.sleep(1)
    # 获取背景图
    bg_src = bg_element.get_attribute("src")
    # 获取滑块图
    slider_src = slider_element.get_attribute("src")
    try:
        bg_content = requests.get(bg_src).content
        slider_content = requests.get(slider_src).content
    except:
        time.sleep(1)
        bg_content = requests.get(bg_src).content
        slider_content = requests.get(slider_src).content
    # 下载图片
    bg_path = os.path.join("img", "bg.png")
    slider_path = os.path.join("img", "slider.png")

    with open(bg_path, "wb") as f:
        f.write(bg_content)
    with open(slider_path, "wb") as f:
        f.write(slider_content)
    return bg_path, slider_path

滑块处理重试

有时候滑块验证码首次处理可能不一定顺利，我们可以根据处理后是否还有滑块背景图来判断是否处理成功，如果不成功，重新打开滑块验证码进行处理。

def handle_login(self):
    try:
        print("开始登录")
        print(f'login_url: {self.login_url}')
        self.driver.get(self.login_url)
        time.sleep(1)
        self.driver.find_element(By.XPATH, '//div/div/input[@name="username"]').send_keys(self.username)  # 用户名
        self.driver.find_element(By.XPATH, '//div/div/input[@name="password"]').send_keys(self.password)  # 密码
        self.driver.find_element(By.XPATH, '//div/div/button/span[contains(text(), "登 录")]').click()  # 登录按钮
        print("等待拖动滑块验证...")
        self.solve_captcha()
        try:
            self.driver.find_element(By.XPATH, '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBgWrap"]/img')
            self.save_error_img()
            print("滑块背景图依然存在，再次重试处理滑块验证码")
            # 关闭滑块验证码并重新点击登录
            self.driver.find_element(By.XPATH, '//div[@id="captcha_close"]').click()
            time.sleep(1)
            self.driver.find_element(By.XPATH, '//div/div/button/span[contains(text(), "登 录")]').click()  # 登录按钮
            self.solve_captcha()
            # 如果滑块背景图还在，说明再次重试失败
            self.driver.find_element(By.XPATH, '//div/div/div/p[@id="guideText"]/following::*/div[@id="slideBgWrap"]/img')
            self.save_error_img()
            return False
        except:
            pass
        # 登录成功，记录当前页面句柄
        self.base_window_handle = self.driver.current_window_handle
        print("登录成功")
        return True
    except Exception as e:
        print(traceback.format_exc())
        self.save_error_img()
        return False

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要