坚持就完事了

bigtwotwo实验六

# optimize test1
# 先简单了解一下数据的大概情况
# import pandas as pd
# data = pd.read_excel('data.xlsx')
# print(data.shape) # （27722，8）
# print(data.isnull().any()) # 查看数据每列是否有缺失值
# print(data.isnull().sum().tolist()) # 查看数据每列一共有多少个缺失值 各列缺失值总和分别为[0, 0, 3, 16, 3, 111, 3, 3]
# stocks = pd.unique(data['Stkcd'])
# print(stocks.size) # 输出3620，一共有3620支股票


def question_one(df):
    """
    :param df: 原始数据，DataFrame类型
    :return: 一个Series类型数据，包含每支股票四个季度每股同比增长率；一个列表类型数据，为连续四个季度每股收益同比增长率大于等于20%的股票的代码
    """
    # 定义计算每股收益同比增长率函数
    # a季度每股收益同比增长率 = (今年a季度母公司的每股收益 - 去年a季度母公司的每股收益) ÷ 去年a季度母公司的每股收益
    def calculate_rate(x):
        """
        :param x: df分组后的数据
        :return: 每支股票的四个季度每股同比增长率的列表
        """
        r1 = (x.iloc[4, 2] - x.iloc[0, 2]) / x.iloc[0, 2]
        r2 = (x.iloc[5, 2] - x.iloc[1, 2]) / x.iloc[1, 2]
        r3 = (x.iloc[6, 2] - x.iloc[2, 2]) / x.iloc[2, 2]
        r4 = (x.iloc[7, 2] - x.iloc[3, 2]) / x.iloc[3, 2]
        return list(map(lambda t:round(t,2), [r1,r2,r3,r4]))

    df.dropna(inplace=True)
    # 考虑到仅仅是删除缺失值,这种操作可能导致某一股票的四个季度中缺少几个季度的数据,因此将数据不足8份的股票都删除
    filtered_df = df.groupby(by='Stkcd').filter(lambda t: len(t)==8)
    cal_df = filtered_df.groupby(by='Stkcd').apply(calculate_rate,include_groups=False)
    # 筛选每股收益同比增长率连续四个季度大于20%的股票
    all_great_then = cal_df.apply(lambda t: all(list(map(lambda y: y>=0.2,t))))
    result_stock = all_great_then[all_great_then.values == True]

    return cal_df,result_stock.index.tolist()


def question_two(df):
    """
    :param df: 原始数据，DataFrame类型
    :return: 2017年、2018年每股资本公积和每股未分配利润最大的10只股票，DataFrame类型
    """
    # 同问题一一样处理数据
    df.dropna(inplace=True)
    filtered_df = df.groupby(by='Stkcd').filter(lambda t:len(t)==8)

    def calculate_gonji(x):
        s1 = x.head(4).iloc[:,4].sum()
        s2 = x.tail(4).iloc[:,4].sum()
        return round(s1,2),round(s2,2)

    def calculate_wfp(x):
        s1 = x.head(4).iloc[:,5].sum()
        s2 = x.tail(4).iloc[:,5].sum()
        return round(s1,2),round(s2,2)

    result_gonji = filtered_df.groupby(by='Stkcd').apply(calculate_gonji,include_groups=False)
    result_wfp = filtered_df.groupby(by='Stkcd').apply(calculate_wfp,include_groups=False)

    # 取出2017年、2018男的每股资本公积年度总和，每股未分配利润年度总和
    gonji_2017 = []
    gonji_2018 = []
    wfp_2017 = []
    wfp_2018 = []
    for i in range(result_gonji.shape[0]):
        gonji_2017.append(result_gonji.values[i][0])
        gonji_2018.append(result_gonji.values[i][1])
        wfp_2017.append(result_wfp.values[i][0])
        wfp_2018.append(result_wfp.values[i][1])
    # 整理成数据框DataFrame
    R = pd.DataFrame(
        data={"gonji_2017":gonji_2017, "gonji_2018":gonji_2018, "wfp_2017":wfp_2017, "wfp_2018":wfp_2018},
        index=result_gonji.index
    )
    # 排序，获取排名前十的股票
    sort_gonji_17 = R['gonji_2017'].sort_values(ascending=False)
    sort_gonji_18 = R['gonji_2018'].sort_values(ascending=False)
    sort_wfp_17 = R['wfp_2017'].sort_values(ascending=False)
    sort_wfp_18 = R['wfp_2018'].sort_values(ascending=False)

    return sort_gonji_17.head(10),sort_gonji_18.head(10),sort_wfp_17.head(10),sort_wfp_18.head(10)


def question_three(df2):
    """
    :param df2: 第二份原始数据data2，DataFrame类型
    :return: 返回值依次为经过标准化处理的数据，主成分，特征向量
    """
    df2.dropna(inplace=True)
    df2['Accper'] = pd.to_datetime(df2['Accper'])
    data_2018 = df2[df2['Accper'].dt.year == 2018]
    x = data_2018.iloc[:,2:]
    from sklearn.preprocessing import StandardScaler
    X = StandardScaler().fit_transform(x)
    from sklearn.decomposition import PCA
    pca = PCA(n_components=0.95)
    Y = pca.fit_transform(X)
    tzxl = pca.components_

    return X,Y,tzxl


def question_four(ndarray):
    """
    :param ndarray: 数组类型的数据，question_three()函数返回的主成分
    :return: 聚类中心，数组类型
    """
    from sklearn.cluster import KMeans
    from sklearn.metrics import silhouette_score
    scores = []
    for i in range(2,11):
        kmeans_model = KMeans(n_clusters=i,random_state=0,max_iter=300)
        kmeans_model.fit(ndarray)
        labels = kmeans_model.labels_
        scores.append(round(silhouette_score(ndarray,labels),2))

    best_kind = max(enumerate(scores),key=lambda x: x[1])[0] + 2 # 获取轮廓系数最大的簇数
    kmeans = KMeans(n_clusters=best_kind,random_state=0,max_iter=300)
    kmeans.fit(ndarray)
    centers = kmeans.cluster_centers_
    return centers


# 主程序
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_excel('data.xlsx')
data2 = pd.read_excel('data2.xlsx')
# 问题一
r1 = question_one(data)
# 第一种处理方式
# a0 = pd.DataFrame(data=r1[0],columns=['四个季度同比增长率'])
# a0_index = pd.Series(a0.index).astype(str).apply(lambda x:x.zfill(6))
# a0.set_index(a0_index,inplace=True)
# a0[['第一季度同比增长率','第二季度同比增长率','第三季度同比增长率','第四季度同比增长率']] = a0['四个季度同比增长率'].apply(lambda x: pd.Series(x))
# a0.drop(columns='四个季度同比增长率',inplace=True)
# a1 = pd.DataFrame(data=r1[1],columns=['股票代码'])
# a1['股票代码'] = a1['股票代码'].astype(str).apply(lambda x: x.zfill(6))
# print(a0)

# 第二种处理方式
a0 = pd.DataFrame(data=r1[0].values,columns=['四个季度同比增长率'],index=r1[0].index)
# print(a0)
expand = pd.DataFrame(a0['四个季度同比增长率'].values.tolist(),columns=['第一个季度同比增长率','第二个季度同比增长率','第三个季度同比增长率','第四个季度同比增长率'],index=r1[0].index)
# print(expand)
a0 = pd.concat([a0,expand],axis=1)
a0.drop(columns='四个季度同比增长率',inplace=True)
a0.index = a0.index.map(lambda x: str(x).zfill(6))

print(a0)


# 第三种处理方式
# a0 = pd.DataFrame(data=r1[0].values,columns=['四个季度同比增长率'],index=r1[0].index)
# a0['第一个季度同比增长率'] = [x[0] for x in a0['四个季度同比增长率'].values]
# a0['第二个季度同比增长率'] = [x[1] for x in a0['四个季度同比增长率'].values]
# a0['第三个季度同比增长率'] = [x[2] for x in a0['四个季度同比增长率'].values]
# a0['第四个季度同比增长率'] = [x[3] for x in a0['四个季度同比增长率'].values]
# a0.drop('四个季度同比增长率',axis=1,inplace=True)
# a0.index = a0.index.map(lambda x: str(x).zfill(6))
# # print(a0['四个季度同比增长率'].values)
# print(a0)
# # print(type(a0.index))



# r1[0].to_excel("question_one.xlsx",sheet_name='每个季度每股同比增长率')
# a1.to_excel("question_one.xlsx",sheet_name='连续4个季度每股收益同比增长率大于20%的股票代码') # 第二次调用会覆盖掉第一次调用
# with pd.ExcelWriter('question_one.xlsx') as writer:
#     a0.to_excel(writer, sheet_name='Sheet1')
#     a1.to_excel(writer, sheet_name='Sheet2')

# optimize test1
# 先简单了解一下数据的大概情况
# import pandas as pd
# data = pd.read_excel('data.xlsx')
# print(data.shape) # （27722，8）
# print(data.isnull().any()) # 查看数据每列是否有缺失值
# print(data.isnull().sum().tolist()) # 查看数据每列一共有多少个缺失值 各列缺失值总和分别为[0, 0, 3, 16, 3, 111, 3, 3]
# stocks = pd.unique(data['Stkcd'])
# print(stocks.size) # 输出3620，一共有3620支股票


def question_one(df):
    """
    :param df: 原始数据，DataFrame类型
    :return: 一个Series类型数据，包含每支股票四个季度每股同比增长率；一个列表类型数据，为连续四个季度每股收益同比增长率大于等于20%的股票的代码
    """
    # 定义计算每股收益同比增长率函数
    # a季度每股收益同比增长率 = (今年a季度母公司的每股收益 - 去年a季度母公司的每股收益) ÷ 去年a季度母公司的每股收益
    def calculate_rate(x):
        """
        :param x: df分组后的数据
        :return: 每支股票的四个季度每股同比增长率的列表
        """
        r1 = (x.iloc[4, 2] - x.iloc[0, 2]) / x.iloc[0, 2]
        r2 = (x.iloc[5, 2] - x.iloc[1, 2]) / x.iloc[1, 2]
        r3 = (x.iloc[6, 2] - x.iloc[2, 2]) / x.iloc[2, 2]
        r4 = (x.iloc[7, 2] - x.iloc[3, 2]) / x.iloc[3, 2]
        return list(map(lambda t:round(t,2), [r1,r2,r3,r4]))

    df.dropna(inplace=True)
    # # 考虑到仅仅是删除缺失值,这种操作可能导致某一股票的四个季度中缺少几个季度的数据,因此将数据不足8份的股票都删除
    filtered_df = df.groupby(by='Stkcd').filter(lambda t: len(t)==8)
    cal_df = filtered_df.groupby(by='Stkcd').apply(calculate_rate,include_groups=False)
    # # 筛选每股收益同比增长率连续四个季度大于20%的股票
    all_great_then = cal_df.apply(lambda t: all(list(map(lambda y: y>=0.2,t))))
    result_stock = all_great_then[all_great_then.values == True]

    return cal_df,result_stock.index.tolist()

def question_two(df):
    """
    :param df: 原始数据，DataFrame类型
    :return: 2017年、2018年每股资本公积和每股未分配利润最大的10只股票，DataFrame类型
    """
    # 同问题一一样处理数据
    df.dropna(inplace=True)
    filtered_df = df.groupby(by='Stkcd').filter(lambda t:len(t)==8)

    def calculate_gonji(x):
        s1 = x.head(4).iloc[:,4].sum()
        s2 = x.tail(4).iloc[:,4].sum()
        return round(s1,2),round(s2,2)

    def calculate_wfp(x):
        s1 = x.head(4).iloc[:,5].sum()
        s2 = x.tail(4).iloc[:,5].sum()
        return round(s1,2),round(s2,2)

    result_gonji = filtered_df.groupby(by='Stkcd').apply(calculate_gonji,include_groups=False)
    result_wfp = filtered_df.groupby(by='Stkcd').apply(calculate_wfp,include_groups=False)

    # 取出2017年、2018男的每股资本公积年度总和，每股未分配利润年度总和
    gonji_2017 = []
    gonji_2018 = []
    wfp_2017 = []
    wfp_2018 = []
    for i in range(result_gonji.shape[0]):
        gonji_2017.append(result_gonji.values[i][0])
        gonji_2018.append(result_gonji.values[i][1])
        wfp_2017.append(result_wfp.values[i][0])
        wfp_2018.append(result_wfp.values[i][1])
    # 整理成数据框DataFrame
    R = pd.DataFrame(
        data={"gonji_2017":gonji_2017, "gonji_2018":gonji_2018, "wfp_2017":wfp_2017, "wfp_2018":wfp_2018},
        index=result_gonji.index
    )
    # 排序，获取排名前十的股票
    sort_gonji_17 = R['gonji_2017'].sort_values(ascending=False)
    sort_gonji_18 = R['gonji_2018'].sort_values(ascending=False)
    sort_wfp_17 = R['wfp_2017'].sort_values(ascending=False)
    sort_wfp_18 = R['wfp_2018'].sort_values(ascending=False)

    return sort_gonji_17.head(10),sort_gonji_18.head(10),sort_wfp_17.head(10),sort_wfp_18.head(10)


def question_three(df2):
    """
    :param df2: 第二份原始数据data2，DataFrame类型
    :return: 返回值依次为经过标准化处理的数据，主成分，特征向量
    """
    df2.dropna(inplace=True)
    df2['Accper'] = pd.to_datetime(df2['Accper'])
    data_2018 = df2[df2['Accper'].dt.year == 2018]
    x = data_2018.iloc[:,2:]
    from sklearn.preprocessing import StandardScaler
    X = StandardScaler().fit_transform(x)
    from sklearn.decomposition import PCA
    pca = PCA(n_components=0.95)
    Y = pca.fit_transform(X)
    tzxl = pca.components_

    return X,Y,tzxl


def question_four(ndarray):
    """
    :param ndarray: 数组类型的数据，question_three()函数返回的主成分
    :return: 聚类结果；聚类中心，数组类型
    """
    from sklearn.cluster import KMeans
    from sklearn.metrics import silhouette_score
    scores = []
    for i in range(2,11):
        kmeans_model = KMeans(n_clusters=i,random_state=0,max_iter=300)
        kmeans_model.fit(ndarray)
        labels = kmeans_model.labels_
        scores.append(round(silhouette_score(ndarray,labels),2))

    best_kind = max(enumerate(scores),key=lambda x: x[1])[0] + 2 # 获取轮廓系数最大的簇数
    kmeans = KMeans(n_clusters=best_kind,random_state=0,max_iter=300)
    cluster_result = kmeans.fit_transform(ndarray)
    centers = kmeans.cluster_centers_
    return cluster_result,centers


# 主程序
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_excel('data.xlsx')
data2 = pd.read_excel('data2.xlsx')
# 问题一
# r1 = question_one(data)
# a0 = pd.DataFrame(data=r1[0].values,columns=['四季度每股收益同比增长率'])
# columns = ['第一季度每股收益同比增长率','第二季度每股收益同比增长率','第三季度每股收益同比增长率','第四季度每股收益同比增长率']
# a0[columns] = a0['四季度每股收益同比增长率'].apply(lambda x: pd.Series(x))
# a0.drop(columns='四季度每股收益同比增长率',inplace=True)
# a0.index = a0.index.map(lambda x: str(x).zfill(6))
# a1 = pd.DataFrame(
#     data = map(lambda x: str(x).zfill(6),r1[1]),
#     columns = ['股票代码']
# )
# a1['排名'] = a1.index.values + 1
# a1 = a1[['排名','股票代码']] # 交换列的位置
# print(a1)
# # r1[0].to_excel("question_one.xlsx",sheet_name='每个季度每股同比增长率')
# # a1.to_excel("question_one.xlsx",sheet_name='连续4个季度每股收益同比增长率大于20%的股票代码') # 第二次调用会覆盖掉第一次调用
# with pd.ExcelWriter('question_one.xlsx',engine='openpyxl') as writer:
#     a0.to_excel(writer, sheet_name='每个季度每股同比增长率')
#     a1.to_excel(writer, sheet_name='连续4个季度每股收益同比增长率大于20%的股票代码',index=False) # 设置index=False不把索引也导入进Excel表格中

# 问题二
# r = question_two(data)
# sub_plot = [221,222,223,224]
# years = [2017,2018,2017,2018]
# category = ['每股资本公积','每股未分配利润']
# import matplotlib.pyplot as plt
# plt.rcParams['font.sans-serif'] = "SimHei"
# plt.figure(figsize=[10, 8])

# for i in range(4):
#     plt.subplot(sub_plot[i])
#     # plt.bar(r1.index,r1.values)
#     r[i].plot(kind='bar')
#     plt.title(f"{years[i]}年{category[i//2]}Top10股票榜")
#     plt.xlabel("股票代码")
#     plt.ylabel(category[i//2])
#     plt.xticks(rotation=90)
# plt.tight_layout()
# plt.show()

# 问题三
data2 = pd.read_excel('data2.xlsx')
X,Y,tzxl = question_three(data2)
tzxl = tzxl.T
for i in range(5):
    print('第',i+1,'个主成分的表达式为: X * ',tzxl[:,i],'\n'
          ,'\t表示该主成分与原始数据X的6个特征的关系程度系数依次为:\n\t'
          ,tzxl[:,i])
    print()

# 问题四
r4 = question_four(Y)
print('聚类中心为：\n',r4[1])

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

bigtwotwo实验六

你可能感兴趣的:(python,开发语言)