1989

【零基础学AI】第9讲：机器学习概述

本节课你将学到

理解什么是机器学习，以及它与传统编程的区别
掌握监督学习、无监督学习的基本概念
使用scikit-learn完成你的第一个机器学习项目
构建一个完整的iris花朵分类器

开始之前

环境要求

Python 3.8+
Jupyter Notebook 或任何Python IDE

需要安装的包

pip install scikit-learn pandas matplotlib seaborn

前置知识

基本的Python语法（第1-8讲已覆盖）
NumPy和Pandas基础操作

核心概念

什么是机器学习？

想象一下教小孩认识动物的过程：

传统编程方式：
我们写一本详细的规则书：

“如果有四条腿，会汪汪叫，尾巴会摆 → 这是狗”
“如果有翅膀，会飞，有羽毛 → 这是鸟”

机器学习方式：
我们给孩子看1000张动物照片，每张都告诉他这是什么，然后让孩子自己总结规律。

这就是机器学习的核心：让计算机从数据中自动学习规律，而不是我们手工编写规则。

机器学习的三大类型

1. 监督学习（Supervised Learning）

特点：有"标准答案"的学习
举例：

给1000封邮件，每封都标注了"垃圾邮件"或"正常邮件"
让机器学会如何识别新邮件

常见任务：

分类：判断邮件是否为垃圾邮件
回归：预测房价

2. 无监督学习（Unsupervised Learning）

特点：没有"标准答案"，让机器自己发现规律
举例：

给1000个客户的购买记录
让机器自己发现客户可以分为几类

常见任务：

聚类：客户分群
降维：数据压缩

3. 强化学习（Reinforcement Learning）

特点：通过试错学习，有奖惩机制
举例：训练游戏AI，赢了有奖励，输了有惩罚

代码实战

今天我们用经典的iris（鸢尾花）数据集来体验机器学习。这个数据集包含150朵花的数据，每朵花有4个特征，属于3个品种之一。

第一步：导入库和数据

# 导入必要的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# 设置中文字体（避免图表中文乱码）
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

print("库导入成功！开始机器学习之旅 ")

第二步：加载和探索数据

# 加载iris数据集
# 这是sklearn自带的经典数据集，非常适合学习
iris = load_iris()

# 将数据转换为DataFrame，方便查看
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['species'] = iris.target

# 添加花朵品种名称（比数字更容易理解）
species_names = {0: 'setosa', 1: 'versicolor', 2: 'virginica'}
df['species_name'] = df['species'].map(species_names)

print("数据加载完成！")
print(f"数据形状: {df.shape}")  # 显示数据维度
print("\n前5行数据:")
print(df.head())

print("\n数据基本信息:")
print(df.info())

第三步：数据可视化探索

# 查看每个品种的花朵数量
print("各品种花朵数量:")
print(df['species_name'].value_counts())

# 创建特征分布图
plt.figure(figsize=(12, 8))

# 绘制4个特征的分布
for i, feature in enumerate(iris.feature_names):
    plt.subplot(2, 2, i+1)
    # 按品种分别绘制直方图
    for species in df['species_name'].unique():
        data = df[df['species_name'] == species][feature]
        plt.hist(data, alpha=0.7, label=species, bins=20)
    
    plt.xlabel(feature)
    plt.ylabel('频次')
    plt.title(f'{feature} 分布')
    plt.legend()

plt.tight_layout()
plt.show()

print(" 观察发现：不同品种的花朵在各特征上确实有差异，这为分类提供了基础")

第四步：准备训练数据

# 准备特征和标签
# X是特征（花朵的4个测量值），y是标签（花朵品种）
X = iris.data
y = iris.target

print("特征矩阵形状:", X.shape)  # (150, 4) - 150朵花，每朵4个特征
print("标签数组形状:", y.shape)  # (150,) - 150个标签

# 数据集分割：训练集用来学习，测试集用来验证效果
# 这就像考试：用练习题学习，用考试题检验
X_train, X_test, y_train, y_test = train_test_split(
    X, y, 
    test_size=0.3,      # 30%用于测试
    random_state=42,    # 固定随机种子，确保结果可重现
    stratify=y          # 保证训练集和测试集中各类别比例相同
)

print(f"\n数据分割完成:")
print(f"训练集: {len(X_train)} 个样本")
print(f"测试集: {len(X_test)} 个样本")

# 检查分割后各类别分布
train_counts = np.bincount(y_train)
test_counts = np.bincount(y_test)
print(f"训练集各类别数量: {train_counts}")
print(f"测试集各类别数量: {test_counts}")

第五步：训练机器学习模型

# 创建随机森林分类器
# 随机森林是一个强大且容易使用的算法，适合初学者
model = RandomForestClassifier(
    n_estimators=100,    # 使用100棵决策树
    random_state=42,     # 固定随机种子
    max_depth=3          # 限制树的深度，防止过拟合
)

print("开始训练模型...")

# 训练模型（这就是"学习"的过程）
model.fit(X_train, y_train)

print("模型训练完成！✅")

# 查看特征重要性（哪个特征对分类最重要）
feature_importance = pd.DataFrame({
    'feature': iris.feature_names,
    'importance': model.feature_importances_
}).sort_values('importance', ascending=False)

print("\n特征重要性排名:")
print(feature_importance)

第六步：模型预测和评估

# 使用训练好的模型进行预测
y_pred = model.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率: {accuracy:.2%}")

# 详细的分类报告
print("\n详细分类报告:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))

# 预测结果对比
results_df = pd.DataFrame({
    'actual': y_test,
    'predicted': y_pred,
    'actual_name': [iris.target_names[i] for i in y_test],
    'predicted_name': [iris.target_names[i] for i in y_pred]
})

print("\n前10个预测结果:")
print(results_df.head(10))

# 计算预测正确的数量
correct_predictions = (y_test == y_pred).sum()
total_predictions = len(y_test)
print(f"\n预测结果: {correct_predictions}/{total_predictions} 正确")

第七步：可视化结果

# 绘制混淆矩阵
from sklearn.metrics import confusion_matrix

plt.figure(figsize=(8, 6))
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=iris.target_names, 
            yticklabels=iris.target_names)
plt.title('混淆矩阵')
plt.xlabel('预测结果')
plt.ylabel('实际结果')
plt.show()

print(" 混淆矩阵解读：")
print("- 对角线上的数字：预测正确的数量")
print("- 非对角线数字：预测错误的数量")
print("- 理想情况：只有对角线有数字")

完整项目

# 第9讲：机器学习概述 - iris花朵分类器
# 这是一个完整的机器学习项目，展示从数据到预测的全流程

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

def load_and_explore_data():
    """加载并探索iris数据集"""
    print("=" * 50)
    print(" iris花朵分类器")
    print("=" * 50)
    
    # 加载数据
    iris = load_iris()
    df = pd.DataFrame(iris.data, columns=iris.feature_names)
    df['species'] = iris.target
    
    # 添加品种名称
    species_names = {0: 'setosa', 1: 'versicolor', 2: 'virginica'}
    df['species_name'] = df['species'].map(species_names)
    
    print(" 数据基本信息:")
    print(f"数据形状: {df.shape}")
    print(f"特征数量: {len(iris.feature_names)}")
    print(f"样本数量: {len(df)}")
    print(f"类别数量: {len(iris.target_names)}")
    
    print("\n 各品种分布:")
    print(df['species_name'].value_counts())
    
    print("\n 前5行数据:")
    print(df.head())
    
    return iris, df

def visualize_data(iris, df):
    """可视化数据分布"""
    print("\n 正在生成数据可视化...")
    
    plt.figure(figsize=(15, 10))
    
    # 特征分布图
    for i, feature in enumerate(iris.feature_names):
        plt.subplot(2, 3, i+1)
        for species in df['species_name'].unique():
            data = df[df['species_name'] == species][feature]
            plt.hist(data, alpha=0.7, label=species, bins=15)
        plt.xlabel(feature)
        plt.ylabel('频次')
        plt.title(f'{feature} 分布')
        plt.legend()
    
    # 特征相关性热力图
    plt.subplot(2, 3, 5)
    correlation_matrix = df[iris.feature_names].corr()
    sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', center=0)
    plt.title('特征相关性')
    
    # 散点图矩阵
    plt.subplot(2, 3, 6)
    # 选择两个最重要的特征进行可视化
    for species in df['species_name'].unique():
        data = df[df['species_name'] == species]
        plt.scatter(data['petal length (cm)'], data['petal width (cm)'], 
                   label=species, alpha=0.7)
    plt.xlabel('花瓣长度 (cm)')
    plt.ylabel('花瓣宽度 (cm)')
    plt.title('花瓣长度 vs 宽度')
    plt.legend()
    
    plt.tight_layout()
    plt.show()

def train_model(iris):
    """训练机器学习模型"""
    print("\n 开始训练机器学习模型...")
    
    # 准备数据
    X = iris.data
    y = iris.target
    
    # 分割数据集
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.3, random_state=42, stratify=y
    )
    
    print(f"✅ 数据分割完成:")
    print(f"   训练集: {len(X_train)} 个样本")
    print(f"   测试集: {len(X_test)} 个样本")
    
    # 创建并训练模型
    model = RandomForestClassifier(
        n_estimators=100,
        random_state=42,
        max_depth=3
    )
    
    # 训练模型
    model.fit(X_train, y_train)
    print("✅ 模型训练完成!")
    
    # 特征重要性
    feature_importance = pd.DataFrame({
        'feature': iris.feature_names,
        'importance': model.feature_importances_
    }).sort_values('importance', ascending=False)
    
    print("\n 特征重要性排名:")
    for idx, row in feature_importance.iterrows():
        print(f"   {row['feature']}: {row['importance']:.3f}")
    
    return model, X_test, y_test

def evaluate_model(model, iris, X_test, y_test):
    """评估模型性能"""
    print("\n 评估模型性能...")
    
    # 预测
    y_pred = model.predict(X_test)
    
    # 计算准确率
    accuracy = accuracy_score(y_test, y_pred)
    print(f" 模型准确率: {accuracy:.2%}")
    
    # 详细报告
    print("\n 详细分类报告:")
    print(classification_report(y_test, y_pred, target_names=iris.target_names))
    
    # 预测结果展示
    results_df = pd.DataFrame({
        'actual': [iris.target_names[i] for i in y_test],
        'predicted': [iris.target_names[i] for i in y_pred],
        'correct': y_test == y_pred
    })
    
    print(f"\n✅ 预测正确数量: {(y_test == y_pred).sum()}/{len(y_test)}")
    print("\n 预测结果样例:")
    print(results_df.head(10))
    
    # 可视化混淆矩阵
    plt.figure(figsize=(8, 6))
    cm = confusion_matrix(y_test, y_pred)
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
                xticklabels=iris.target_names,
                yticklabels=iris.target_names)
    plt.title('混淆矩阵')
    plt.xlabel('预测结果')
    plt.ylabel('实际结果')
    plt.show()
    
    return accuracy

def predict_new_sample(model, iris):
    """预测新样本"""
    print("\n 尝试预测新样本...")
    
    # 创建一个新样本（这里用数据集中的均值作为例子）
    new_sample = np.array([[5.1, 3.5, 1.4, 0.2]])  # setosa的典型特征
    
    # 预测
    prediction = model.predict(new_sample)
    probability = model.predict_proba(new_sample)
    
    print(f" 输入特征: {new_sample[0]}")
    print(f" 预测结果: {iris.target_names[prediction[0]]}")
    print(f" 各类别概率:")
    for i, prob in enumerate(probability[0]):
        print(f"   {iris.target_names[i]}: {prob:.3f}")

def main():
    """主程序"""
    try:
        # 1. 加载和探索数据
        iris, df = load_and_explore_data()
        
        # 2. 数据可视化
        visualize_data(iris, df)
        
        # 3. 训练模型
        model, X_test, y_test = train_model(iris)
        
        # 4. 评估模型
        accuracy = evaluate_model(model, iris, X_test, y_test)
        
        # 5. 预测新样本
        predict_new_sample(model, iris)
        
        print("\n" + "=" * 50)
        print(" 恭喜！你已经完成了第一个机器学习项目！")
        print(f" 最终模型准确率: {accuracy:.2%}")
        print(" 关键收获:")
        print("   1. 理解了监督学习的基本流程")
        print("   2. 学会了数据探索和可视化")
        print("   3. 掌握了模型训练和评估")
        print("   4. 体验了完整的机器学习项目")
        print("=" * 50)
        
    except Exception as e:
        print(f"❌ 运行出错: {e}")
        print(" 检查项目:")
        print("   1. 是否安装了所需的库？")
        print("   2. Python版本是否正确？")

if __name__ == "__main__":
    main()

运行效果

控制台输出

==================================================
 iris花朵分类器
==================================================
 数据基本信息:
数据形状: (150, 4)
特征数量: 4
样本数量: 150
类别数量: 3

 各品种分布:
setosa        50
versicolor    50
virginica     50

 开始训练机器学习模型...
✅ 数据分割完成:
   训练集: 105 个样本
   测试集: 45 个样本
✅ 模型训练完成!

 特征重要性排名:
   petal width (cm): 0.458
   petal length (cm): 0.413
   sepal length (cm): 0.099
   sepal width (cm): 0.030

 评估模型性能...
 模型准确率: 100.00%

✅ 预测正确数量: 45/45

 恭喜！你已经完成了第一个机器学习项目！

生成的可视化图表

特征分布图：显示不同品种花朵在各特征上的分布差异
相关性热力图：展示特征之间的相关关系
混淆矩阵：直观显示预测结果的准确性

常见问题

Q1: 为什么要分训练集和测试集？

**回答：**就像学习考试一样：

训练集 = 练习题（用来学习）
测试集 = 考试题（用来检验真实水平）
如果用同样的题目练习和考试，就无法知道真实能力了。

Q2: 100%的准确率是不是太好了？

**回答：**iris数据集确实比较简单，各类别区分度很高。在实际项目中：

70-80%准确率：一般水平
80-90%准确率：较好水平
90%以上准确率：很好水平

Q3: 随机森林是什么？

**回答：**想象一下做决定时：

一个人决定：可能有偏见
100个人投票决定：更可靠
随机森林就是让100棵"决策树"投票，最终结果更准确。

Q4: 特征重要性有什么用？

**回答：**告诉我们哪些特征最有用：

花瓣宽度和长度最重要（45.8% + 41.3%）
花萼特征相对不重要
实际应用中可以重点关注重要特征

课后练习

修改参数实验：
- 尝试修改test_size为0.2或0.4，观察结果变化
- 调整随机森林的n_estimators参数

尝试其他算法：

from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier

# 尝试SVM
svm_model = SVC()
svm_model.fit(X_train, y_train)

使用自己的数据：
- 收集一些简单的数据（比如身高体重预测性别）
- 按照同样流程进行分析

下节预告：第10讲我们将学习线性回归，用房价数据预测房屋价值！

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
12张思维导图读懂《关键对话》蜜蜂学堂
你一定遇到过下列情况：·向上司提出你精心设计的方案，却被泼了一头冷水。·要求下属加班，下属以沉默相对抗。·和家人谈“开源节流”，他却只当是耳边风。·要邻居遵守公德，对方却依然我行我素。·要你的另一半浪漫些，对方却还是像根木头一样。·请朋友还钱，朋友却总是找各种借口推托。当你遇到这些情况时，你是沉默以对，还是尖刻批评，抑或拍案而起？别觉得灰心丧气，因为大部分人都和你一样，在面对难以解决却又会对生活产
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
漫步，跳出藩篱张巧金沙
最近的教学，倍感不爽。一为这国庆之假，把这课上得支离破碎的。放假前，上了四天课，但我却只上了三天，9月30日，我工作室在搞活动，全天的活动，课当然未能上。10月8日学生回校，上了两天课，学生又放回家了。就觉得学生刚有点状态，又回去逍遥去了。感觉吧，教学内容也不敢大胆甩开膀子去教学，所以呀，这教学内容还真上不走，而且学生学下来效果特差。这不，国庆放假前的一个周，测试了两次，均为第一单元，是自考试以来
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Pktgen-DPDK：开源网络测试工具的深度解析与应用艾古力斯
本文还有配套的精品资源，点击获取简介：Pktgen-DPDK是基于DPDK的高性能流量生成工具，适用于网络性能测试、硬件验证及协议栈开发。它支持多种网络协议，能够模拟高吞吐量的数据包发送。本项目通过利用DPDK的高速数据包处理能力，允许用户自定义数据包内容，并实现高效的数据包管理与传输。文章将指导如何安装DPDK、编译Pktgen、配置工具以及使用方法，最终帮助开发者和网络管理员深入理解并优化网络
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL