小吉择

解密监督学习：带你玩转预测未来的魔术 (代码驱动)

你好，未来的数据魔法师！你是否曾对机器如何看懂图片、预测股价、甚至诊断疾病感到好奇？这一切的背后，很多时候都离不开机器学习中的一个核心分支——监督学习 (Supervised Learning)。今天，我们将一起揭开它的神秘面纱，并通过大量代码实例，让你亲手体验构建预测模型的乐趣！

什么是监督学习？一切从“标签”开始

想象一下，你正在教一个孩子看图识字。你会给他看一张苹果的图片，并告诉他：“这是苹果”。然后是一张香蕉的图片，告诉他：“这是香蕉”。

监督学习与此类似。我们给机器提供一堆“问题”和对应的“正确答案”。这里的“问题”就是我们的输入数据 (Features)，而“正确答案”就是标签 (Labels)。模型的目标就是学习从输入数据到标签之间的映射关系。当模型“学成”之后，我们就可以给它新的、它没见过的问题，让它预测出答案。

核心思想： 利用带有明确标签的训练数据，训练出一个模型，使其能够对新的、未见过的数据进行预测。

监督学习的两大核心任务

监督学习主要解决两大类问题：

回归 (Regression)： 当我们想预测一个连续的数值时，比如房价、气温、股票价格等。
- 例子： 根据房屋的面积、卧室数量、地理位置等特征预测其价格。
分类 (Classification)： 当我们想预测一个离散的类别时，比如邮件是否为垃圾邮件、图片中的动物是猫还是狗、肿瘤是良性还是恶性等。
- 例子： 根据病人的体检指标判断其是否患有某种疾病。

接下来，让我们用代码深入探索这两个任务！

(一) 回归任务：预测连续值 - 以线性回归为例

线性回归是最简单也最经典的回归算法之一。它假设输入特征和输出标签之间存在线性关系。

场景： 假设我们有一组关于房屋面积 (平方米) 和其对应售价 (万元) 的数据，我们想建立一个模型，通过房屋面积来预测售价。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.model_selection import train_test_split

# 1. 准备数据 (特征 X: 房屋面积, 标签 y: 售价)
# 假设我们有以下数据
X_data = np.array([50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150]).reshape(-1, 1) # 面积 (平方米)
y_data = np.array([150, 180, 210, 250, 280, 310, 330, 370, 400, 430, 450])          # 售价 (万元)

# 2. 数据可视化 (可选，但推荐)
plt.figure(figsize=(8, 5))
plt.scatter(X_data, y_data, color='blue', label='实际数据')
plt.xlabel("房屋面积 (平方米)")
plt.ylabel("售价 (万元)")
plt.title("房屋面积与售价关系")
plt.legend()
plt.grid(True)
plt.show()

# 3. 划分训练集和测试集 (在数据量较少时，有时会跳过这一步，但规范做法是划分)
# 如果数据量大，通常会划分。这里为了演示完整流程，我们还是划分一下。
# 如果不划分，可以直接用 X_data 和 y_data 进行训练。
X_train, X_test, y_train, y_test = train_test_split(X_data, y_data, test_size=0.2, random_state=42)

print(f"训练集样本数: X_train: {X_train.shape[0]}, y_train: {y_train.shape[0]}")
print(f"测试集样本数: X_test: {X_test.shape[0]}, y_test: {y_test.shape[0]}")

# 4. 创建并训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train) # 核心步骤：模型学习

# 5. 查看模型参数
print(f"\n模型截距 (w0): {model.intercept_:.2f}")
print(f"模型系数 (w1 - 面积的权重): {model.coef_[0]:.2f}")
# 线性回归方程可以表示为: y = w0 + w1*X

# 6. 使用模型进行预测
y_pred_train = model.predict(X_train)
y_pred_test = model.predict(X_test)

# 7. 评估模型
# 对于训练集
mse_train = mean_squared_error(y_train, y_pred_train)
r2_train = r2_score(y_train, y_pred_train)
print(f"\n训练集评估:")
print(f"  均方误差 (MSE): {mse_train:.2f}")
print(f"  R² 分数: {r2_train:.2f}")

# 对于测试集
mse_test = mean_squared_error(y_test, y_pred_test)
r2_test = r2_score(y_test, y_pred_test)
print(f"\n测试集评估:")
print(f"  均方误差 (MSE): {mse_test:.2f}")
print(f"  R² 分数: {r2_test:.2f}") # R² 越接近1，模型拟合越好

# 8. 结果可视化
plt.figure(figsize=(10, 6))
plt.scatter(X_data, y_data, color='blue', label='实际数据', s=50) # 所有原始数据点
plt.plot(X_train, y_pred_train, color='green', linestyle='--', linewidth=2, label='训练集拟合线')
plt.plot(X_test, y_pred_test, color='red', linewidth=2, label='测试集预测线') # 通常将所有X排序后画一条完整的线
# 为了更清晰地画出拟合线，我们可以对所有X进行预测
X_plot = np.sort(X_data, axis=0)
y_plot_pred = model.predict(X_plot)
plt.plot(X_plot, y_plot_pred, color='orange', linewidth=3, label='整体拟合线')

plt.scatter(X_test, y_test, color='purple', marker='x', s=100, label='测试集实际值')
plt.scatter(X_test, y_pred_test, color='cyan', marker='o', s=100, facecolors='none', label='测试集预测值')

plt.xlabel("房屋面积 (平方米)")
plt.ylabel("售价 (万元)")
plt.title("线性回归模型拟合结果")
plt.legend()
plt.grid(True)
plt.show()

# 9. 使用模型预测新数据
new_area = np.array([[160]]) # 注意：输入需要是二维数组
predicted_price = model.predict(new_area)
print(f"\n预测面积为 {new_area[0][0]} 平方米的房屋售价: {predicted_price[0]:.2f} 万元")

代码解读：

numpy: 用于高效的数值计算，特别是数组操作。
matplotlib.pyplot: 用于数据可视化。
sklearn.linear_model.LinearRegression: Scikit-learn库提供的线性回归模型。
sklearn.metrics.mean_squared_error: 均方误差，衡量预测值与真实值差异的常用指标。
sklearn.metrics.r2_score: R²分数 (决定系数)，表示模型对数据变异性的解释程度，值越接近1越好。
sklearn.model_selection.train_test_split: 用于将数据集划分为训练集和测试集，避免模型在见过的数据上表现好，但在新数据上表现差（过拟合）。
model.fit(X_train, y_train): 这是训练模型的关键步骤，模型通过学习X_train和y_train之间的关系来调整内部参数。
model.predict(X_test): 使用训练好的模型对新数据X_test进行预测。

其他回归算法： 除了线性回归，还有多项式回归、决策树回归、支持向量回归 (SVR)、K近邻回归等，它们可以处理更复杂的非线性关系。

(二) 分类任务：预测离散类别 - 以逻辑回归和K近邻为例

1. 逻辑回归 (Logistic Regression)

虽然名字里带“回归”，但逻辑回归实际上是一种非常经典的二分类算法（也可以扩展到多分类）。它通过Sigmoid函数将线性回归的输出映射到(0,1)之间，表示属于某个类别的概率。

场景： 根据学生的学习时长和睡眠时长，预测其是否能通过考试 (通过/不通过)。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler # 特征缩放，对逻辑回归和KNN等算法很重要
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import seaborn as sns # 用于绘制更美观的混淆矩阵

# 1. 准备数据 (特征 X: [学习时长, 睡眠时长], 标签 y: 是否通过考试 [0:未通过, 1:通过])
# 假设我们有以下数据
X_data_clf = np.array([
    [2, 7], [3, 8], [5, 6], [6, 7], [8, 5], [1, 4], [2, 5], [4, 3], [3, 6], [7, 4]
])
y_data_clf = np.array([1, 1, 1, 1, 1, 0, 0, 0, 0, 0]) # 1代表通过，0代表未通过

# 2. 数据可视化 (简单示意)
plt.figure(figsize=(8,5))
plt.scatter(X_data_clf[y_data_clf == 1][:, 0], X_data_clf[y_data_clf == 1][:, 1], color='green', marker='o', label='通过 (1)')
plt.scatter(X_data_clf[y_data_clf == 0][:, 0], X_data_clf[y_data_clf == 0][:, 1], color='red', marker='x', label='未通过 (0)')
plt.xlabel("学习时长 (小时)")
plt.ylabel("睡眠时长 (小时)")
plt.title("学习、睡眠与考试结果")
plt.legend()
plt.grid(True)
plt.show()


# 3. 划分训练集和测试集
X_train_clf, X_test_clf, y_train_clf, y_test_clf = train_test_split(X_data_clf, y_data_clf, test_size=0.3, random_state=42, stratify=y_data_clf)
# stratify=y_data_clf 确保训练集和测试集中类别比例与原始数据相似

print(f"训练集样本数: X_train_clf: {X_train_clf.shape[0]}, y_train_clf: {y_train_clf.shape[0]}")
print(f"测试集样本数: X_test_clf: {X_test_clf.shape[0]}, y_test_clf: {y_test_clf.shape[0]}")

# 4. 特征缩放 (非常重要，尤其是对于依赖距离或梯度的算法)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train_clf) # 在训练集上fit并transform
X_test_scaled = scaler.transform(X_test_clf)     # 在测试集上只transform，使用训练集的参数

# 5. 创建并训练逻辑回归模型
log_reg_model = LogisticRegression(solver='liblinear', random_state=42) # solver='liblinear' 适用于小数据集
log_reg_model.fit(X_train_scaled, y_train_clf)

# 6. 使用模型进行预测
y_pred_log_reg = log_reg_model.predict(X_test_scaled)
y_pred_proba_log_reg = log_reg_model.predict_proba(X_test_scaled) # 获取属于各类的概率

print("\n逻辑回归预测结果:")
for i in range(len(y_test_clf)):
    print(f"  真实值: {y_test_clf[i]}, 预测值: {y_pred_log_reg[i]}, 预测为'通过'的概率: {y_pred_proba_log_reg[i][1]:.2f}")

# 7. 评估模型
accuracy_log_reg = accuracy_score(y_test_clf, y_pred_log_reg)
conf_matrix_log_reg = confusion_matrix(y_test_clf, y_pred_log_reg)
class_report_log_reg = classification_report(y_test_clf, y_pred_log_reg, zero_division=0)

print(f"\n逻辑回归模型评估:")
print(f"  准确率 (Accuracy): {accuracy_log_reg:.2f}")
print(f"  混淆矩阵:\n{conf_matrix_log_reg}")
print(f"  分类报告:\n{class_report_log_reg}")

# 混淆矩阵可视化
plt.figure(figsize=(6,4))
sns.heatmap(conf_matrix_log_reg, annot=True, fmt='d', cmap='Blues', xticklabels=['未通过', '通过'], yticklabels=['未通过', '通过'])
plt.xlabel('预测标签')
plt.ylabel('真实标签')
plt.title('逻辑回归 混淆矩阵')
plt.show()

代码解读：

sklearn.preprocessing.StandardScaler: 用于特征标准化，将数据按其属性(列)分别进行标准化，即均值为0，标准差为1。这对于逻辑回归、SVM、KNN等算法非常重要，可以加速收敛并提高性能。
LogisticRegression(solver='liblinear', random_state=42): solver参数指定了优化算法，liblinear适合小数据集。
model.predict_proba(): 返回每个样本属于各个类别的概率。对于二分类，它返回一个 N x 2 的数组，每行两个值分别表示属于类别0和类别1的概率。
accuracy_score: 准确率，即正确预测的样本数占总样本数的比例。
confusion_matrix: 混淆矩阵，清晰展示了模型在每个类别上的预测表现（真阳性、假阳性、真阴性、假阴性）。
classification_report: 提供了更全面的分类指标，如精确率 (Precision)、召回率 (Recall)、F1分数 (F1-score) 等。

2. K-近邻算法 (K-Nearest Neighbors, KNN)

KNN是一种非常直观的分类（和回归）算法。它的核心思想是“物以类聚，人以群分”。对于一个新的样本，KNN会查看它在特征空间中距离最近的K个训练样本，然后根据这K个邻居的类别来决定新样本的类别（多数表决）。

场景： 同样使用上面的学生考试数据。

# (接上文的X_train_scaled, X_test_scaled, y_train_clf, y_test_clf)
from sklearn.neighbors import KNeighborsClassifier

# 1. 创建并训练KNN模型
k = 3 # 选择邻居数量，通常选择奇数避免平票
knn_model = KNeighborsClassifier(n_neighbors=k)
knn_model.fit(X_train_scaled, y_train_clf)

# 2. 使用模型进行预测
y_pred_knn = knn_model.predict(X_test_scaled)
y_pred_proba_knn = knn_model.predict_proba(X_test_scaled)

print("\nKNN预测结果 (k=3):")
for i in range(len(y_test_clf)):
    print(f"  真实值: {y_test_clf[i]}, 预测值: {y_pred_knn[i]}, 预测为'通过'的概率: {y_pred_proba_knn[i][1]:.2f}")


# 3. 评估模型
accuracy_knn = accuracy_score(y_test_clf, y_pred_knn)
conf_matrix_knn = confusion_matrix(y_test_clf, y_pred_knn)
class_report_knn = classification_report(y_test_clf, y_pred_knn, zero_division=0)

print(f"\nKNN模型评估 (k={k}):")
print(f"  准确率 (Accuracy): {accuracy_knn:.2f}")
print(f"  混淆矩阵:\n{conf_matrix_knn}")
print(f"  分类报告:\n{class_report_knn}")

# 混淆矩阵可视化
plt.figure(figsize=(6,4))
sns.heatmap(conf_matrix_knn, annot=True, fmt='d', cmap='Greens', xticklabels=['未通过', '通过'], yticklabels=['未通过', '通过'])
plt.xlabel('预测标签')
plt.ylabel('真实标签')
plt.title(f'KNN (k={k}) 混淆矩阵')
plt.show()

# 尝试不同的k值 (可选，用于调优)
# for k_val in [1, 3, 5]:
#     knn_temp = KNeighborsClassifier(n_neighbors=k_val)
#     knn_temp.fit(X_train_scaled, y_train_clf)
#     y_pred_temp = knn_temp.predict(X_test_scaled)
#     acc_temp = accuracy_score(y_test_clf, y_pred_temp)
#     print(f"k={k_val}, Accuracy: {acc_temp:.2f}")

代码解读：

KNeighborsClassifier(n_neighbors=k): n_neighbors参数就是K值，即选择多少个最近邻居。K值的选择对模型性能有很大影响，需要通过交叉验证等方法来确定最优K值。
KNN算法本身不需要显式的“训练”过程，它只是存储训练数据。预测时才进行计算。
KNN对特征的尺度非常敏感，因此特征缩放通常是必需的。

其他分类算法： 支持向量机 (SVM)、决策树、随机森林、朴素贝叶斯、神经网络等，它们各有优缺点，适用于不同类型的数据和问题。

监督学习项目的一般流程

一个典型的监督学习项目通常遵循以下步骤：

问题定义： 明确你要解决什么问题？是回归还是分类？
数据收集： 获取相关的、带有标签的数据。
数据预处理：
- 数据清洗： 处理缺失值、异常值、重复值。
- 特征工程： 创建新的特征，选择有用的特征，转换特征（如独热编码、数值化）。
- 特征缩放： 如标准化、归一化，确保不同尺度的特征得到公平对待。
数据集划分： 将数据分为训练集、验证集（可选，用于调参）和测试集。
模型选择： 根据问题类型和数据特点选择合适的算法。
模型训练： 使用训练集数据训练模型。
模型评估： 使用测试集（或验证集）评估模型性能，常用的指标有：
- 回归： MSE, RMSE, MAE, R²分数等。
- 分类： 准确率, 精确率, 召回率, F1分数, ROC曲线, AUC值, 混淆矩阵等。
参数调优： 根据评估结果调整模型参数（超参数），以获得最佳性能（如网格搜索、随机搜索）。
模型部署与应用： 将训练好的模型集成到实际应用中，进行预测。
模型监控与迭代： 持续监控模型在实际应用中的表现，并根据需要重新训练或更新模型。

如何选择合适的监督学习算法？

没有万能的算法。选择算法时需要考虑：

问题类型： 回归还是分类？
数据量大小： 小数据集可能更适合线性模型、KNN；大数据集可以尝试更复杂的模型如SVM、神经网络。
特征数量： 高维数据可能需要考虑降维或使用对高维不敏感的算法。
数据特性： 数据是线性可分的还是非线性的？是否有异常值？
模型复杂度与可解释性： 某些模型（如决策树、线性回归）更易于解释，而另一些（如神经网络、复杂SVM）则像“黑箱”。
训练时间与预测时间要求。

经验法则：

从简单的模型开始尝试（如线性回归、逻辑回归）。
如果简单模型效果不佳，再尝试更复杂的模型。
理解不同算法的假设和优缺点。

挑战与未来

监督学习虽然强大，但也面临一些挑战：

对高质量、大量标注数据的依赖： 获取标注数据成本高昂。
过拟合 (Overfitting)： 模型在训练数据上表现很好，但在新数据上表现差。需要正则化、交叉验证等技术来缓解。
欠拟合 (Underfitting)： 模型过于简单，未能捕捉数据中的模式。
模型可解释性： 复杂模型往往难以解释其决策过程。

尽管如此，监督学习仍然是机器学习领域应用最广泛、最成功的分支之一。随着数据量的爆炸式增长和算法的不断进步，它将在更多领域大放异彩。

希望这篇充满代码的博客能让你对监督学习有一个更直观和深入的理解！现在，打开你的编辑器，亲自尝试运行这些代码，修改参数，探索不同的数据集，开启你的数据科学之旅吧！记住，实践是学习的最佳途径。

如果你有任何问题或想法，欢迎在评论区交流！

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
2021-10-23 赵甄文的幸福
秀荣感恩日记Day42[烟花]感恩语录感恩自己有能力有好身体，可以到处走动，做自己想做的事情10.23感恩日记今天做的事情瑜伽一小时户外散步一小时泡脚20分钟学习打卡和孩子沟通[爱心]感动的瞬间今天瑜伽回来，发现老公在厨房里做鱼。每次老公有时间休息的时候都会给我做硬菜。刘姐约我一起去公园散步晒太阳。虽然完美错过，但心里还是暖暖的。每天睁开眼打开手机，先去自己的群里逛一逛，每每发现有人点赞或者互动都
孤独的守候怒吼的生命
孤独了时光岁月了寂寞带来了惆怅那些孤独的日子里我们珍惜奋斗起来品味人生的真谛做到更好奋斗当中的你是那么努力格外自律学习起来五彩斑斓那些日子时光匆匆人生的机会很多需要把握痛苦的回忆记得住那些忧愁孤苦五一的日子寂寞当中的你时光荏苒独自带给我荒草学习起来努力奋斗可是我们做的还不够把握发展生活带给我们更多希望静静的述说你的故事你的精彩人生当中我们总是努力把握生活带给我们更多的学习生活当中我们奋斗可是做的还
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
2018-08-29精进打卡米兰王
姓名:王兰英【日精进打卡第25天】【知～学习】《六项精进》1遍共39遍《大学》1遍共50遍【经典名句分享】一切都是最好的安排。【行～实践】一、修身：（对自己个人）1，散步1小时。2，每天坚持读书。二、齐家：（对家庭和家人）1，指导孩子开车。2，和家人一起逛超市。三、建功：（对工作）用心做好每件事。｛积善｝：发愿从2018年8月5日起1年内365个善事。今日1善，累计27善。【省～觉悟】正人先正己。
陶勇：要不要参加分班考试学习？看完再说。陶勇
每年到了升学季，有很多培训机构都特别忙，为什么呢？因为有成千上万的学生，会选择升学前的分班考试的培训。比如说，小升初的孩子，到了暑假，很多孩子都会去选择一个初中，初一的分班考试的培训，那考入高中的孩子也有很多孩子会选择这种新高一的分班考试的培训。当然了，我个人认为这种选择并不是孩子自身的选择，主要还是家长的选择。当然也有少数孩子会对自己有比较高的要求，他们也会主动的去选择。为什么要去上分班考试的这
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
求解——妊娠纹霜哪个牌子好？皮肤专家推荐的热门秘诀！ zhangxing0100
妊娠纹会严重影响女性的美观，那孕期的女性朋友该如何避免减少妊娠纹的出现呢?下面美腹丽人小编为大家分享了预防妊娠纹的方法，赶紧一起来学习吧!一、预防妊娠纹的饮食习惯1、多食用对皮肤内胶原纤维有利的食品来增强皮肤的弹性。2、控制糖分摄入，少吃色素含量高的食物。3、早晚两杯脱脂牛奶，多食用维丰富的蔬菜、水果和富含维生素及矿物质的食物，增加细胞膜的通透性和皮肤的新陈代谢功能。4、正确的喝水习惯可以提速皮肤
2023-01-07 阿诗玛_6209
姓名：赵丽娟【日精进打卡第1783天】【知～学习】读书《经营与会计》ok《活法》3-47-8【经典名句】执着追求并从中得到最大快乐的人，才是成功者。——梭罗一、修身：（对自己个人）1、保持心态平和.2、坚持打卡.坚持读书。3、早晨喝杯温水.4、坚持烫脚，养成早睡早起的习惯.二、齐家：三、建功：（对工作）｛积善｝：发愿从2018年1月28日起见善行善，今日0善。【省～觉悟】1,睡觉时把手机放到离自己
认命修运每日一省（16）星_6329
命每个人的命都是父母带来的，我们每个人都没有权利选择父母，没有权利选择自己的出生。一个人从出生的那一刻就注定了你的命。我所说的认命，就是客观的接受自己的父母，接受自己的家庭。不对抗，不较劲。有些人是含着金汤匙出生的，有些人刚一出生拥有的财富可能是我们一生都得不到的。有些人是踩着泥坑出生的。有些人一出生就是等着继承皇位的。运在我们成长的过程当中，我们付出努力，学习知识，成长自己，帮助他人。我们有权利
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

解密监督学习：带你玩转预测未来的魔术 (代码驱动)

什么是监督学习？一切从“标签”开始

监督学习的两大核心任务

(一) 回归任务：预测连续值 - 以线性回归为例

(二) 分类任务：预测离散类别 - 以逻辑回归和K近邻为例

1. 逻辑回归 (Logistic Regression)

2. K-近邻算法 (K-Nearest Neighbors, KNN)

监督学习项目的一般流程

如何选择合适的监督学习算法？

挑战与未来

你可能感兴趣的:(学习)