Andrew*

Chapter 6 应用机器学习的建议 (reading notes)

文章目录

0. 版权声明
1. 评估学习算法

1.1 评估假设函数
1.2 模型选择

1.2.1 concept
1.2.2 为什么要将数据划分为训练集、验证集、测试集？

2. bias and variance

2.1 判断过拟合 or 欠拟合
2.2 正则化与偏差、方差
2.3 绘制学习曲线判断算法是否出现高偏差 or 高方差的情况
2.4 应用机器学习的建议

2.4.1 修正学习算法
2.4.2 选择神经网络的层数
2.4.3 绘制学习曲线的细节

3. 机器学习系统设计

3.1 机器学习案例——垃圾邮件分类器
3.2 类偏斜的误差度量

3.2.1 为什么不使用分类精确度/分类误差处理类偏斜问题
3.2.2 使用查准率与召回率评估偏斜类问题模型优劣
3.2.3 如何兼顾查准率与召回率

3.3 使用大规模数据集

n. reference

0. 版权声明

machine learning 系列笔记来源于Andrew Ng 教授在 Coursera 网站上所授课程《machine learning》¹；
该系列笔记不以盈利为目的，仅用于个人学习、课后复习及交流讨论；
如有侵权，请与本人联系（[email protected]），经核实后即刻删除；
转载请注明出处；

1. 评估学习算法

1.1 评估假设函数

一般按照 7:3 的比例将样本划分为训练集、测试集；
- 若需要交叉验证集，则按 6:2:2 的比例将样本划分为训练集、交叉验证集（简称验证集，cross validation set，可简写为cv）、测试集；
交叉验证：
- 简单交叉验证：按照 7:3 的比例将样本划分为训练集、测试集；
- S-fold cross validation（S折交叉验证）：
  - 随机将样本划分为 S 个大小相同、互不相交的子集，使用 S-1 个子集用于训练，剩余的1个子集用于测试；
  - 由于 S-1 个子集的选取方法有S种，因此重复上述步骤 S 次，平均测试误差最小的模型即为最优结果；
- 留一交叉验证：留一交叉验证是S折交叉验证的特例，令 S=N 即可；
  - N 为样本数量；
  - 常用于缺少数据的情形；
- 按比例划分时，应随机抽取，确保训练集、测试集中的数据均服从某种分布规律；
符号：
- $m_{train}、m_{cv}、m_{test}$ 分别表示训练集、交叉验证集、测试集样本数；
- $x_{cv}^{(i)},y_{cv}^{(i)})$ 表示交叉验证集中第 i 个样本；
- $J_{train}(\theta)、J_{cv}(\theta)、J_{test}(\theta)$ 分别表示训练集、交叉验证集、测试集上的误差；
测试误差举例：在线性回归中应用平方误差时， $J_{test}(\theta)=\frac{1}{2m_{test}}\sum_{i=1}^{m_{test}}(h_{\theta}(x_{test}^{(i)})-y_{test}^{(i)})^{2}$ ；
- 对 $J_{train}(\theta)、J_{cv}(\theta)$ 有类似表达式；
0/1 错分类率（误分类率）：
- $err(h_{\Theta}(x),y)=\begin{cases}1 & h_{\Theta} \geq 0.5,y=0; h_{\Theta} < 0.5,y=1; \\0 & otherwise\end{cases}$ ；
- Test Error = $\frac{1}{m_{test}}\sum_{i=1}^{m_{test}}err(h_{\Theta}(x_{test}^{(i)}),y_{test}^{(i)})$ ；
- 0/1 错分类率（误分类率） = $\frac{被错误分类的测试样本数}{测试样本总数}$ ；

1.2 模型选择

1.2.1 concept

一般而言，若假设函数拟合某一组数据时表现非常好，则该假设在其它组数据上所得的误差不能作为实际的泛化误差；
$d$ ：多项式的次数；
- e.g. $d = 2$ ，即假设函数为2次多项式；

1.2.2 为什么要将数据划分为训练集、验证集、测试集？

Q：用测试集选取模型（该方法不可取）。若有10个假设函数，d=1,2,…,10，从训练集中学得各自的 $\theta$ ，将求得的参数值应用于测试集中，计算各自的测试误差 $J_{test}(\theta)$ ，选取测试误差最小的假设函数最为最优模型，是否合理？
A：
- 被选取的假设函数对测试集的拟合效果非常好（筛选出了在测试集上表现最好的参数 d），但不能由此推断该假设函数的泛化能力也很好，有可能该假设函数的参数 d 对测试集过拟合；
- 用测试集选取模型，再用测试集求得的误差不再是泛化误差；
Q：用交叉验证集选取模型。如何用 cross validation set 选取最优模型？
A：
- 从训练集中学得各自的 $\theta$ ；（求 $\theta$ 时公式中应包含正则化参数）
- 将求得的参数值应用于交叉验证集中，计算各自的交叉验证误差 $J_{cv}(\theta)$ ；（求训练误差、交叉验证误差时公式中不包含正则化参数）
- 选取交叉验证误差最小的模型，使用测试集估计所选模型的泛化误差；
- 由于参数 d 未对测试集做拟合操作，因此结果可信；
- 一般而言，由于有额外的参数 d 拟合了交叉验证集，因此交叉验证集的代价函数小于测试集；
用交叉验证集选取合适的特征：
- 分析在交叉验证集中出现误分类的样本，可以针对性的构造一些新的特征；

2. bias and variance

2.1 判断过拟合 or 欠拟合

underfitting(欠拟合)/high bias(高偏差)：d 较小；
overfitting(过拟合) /high variance(高方差)：d 较大；

判断 underfitting or overfitting 的方法：
- underfitting/high bias：交叉验证误差、训练误差均较大，两者较为接近；
- overfitting/high variance：交叉验证误差较大，训练误差较小，前者远大于后者；

2.2 正则化与偏差、方差

$\lambda$ 较小，容易导致过拟合；
$\lambda$ 较大，容易导致欠拟合；
Q：如何选择 $\lambda$ 值？
A：
- 选取一系列 $\lambda$ 值，e.g. $\lambda=0,0.01,0.02,0.04,0.08,...,10.24$ ，一般而言，步长以2倍速增长，从0开始，直到某一较大值；
- 从训练集中学得各自的 $\theta$ ；
- 将求得的参数值应用于交叉验证集中，计算各自的交叉验证误差 $J_{cv}(\theta)$ ；
- 绘制曲线如下图所示，当训练误差与交叉验证误差均适中时，对应的 $\lambda$ 最好；
- 选取交叉验证误差最小的模型，使用测试集估计所选模型的泛化误差；
- 由于划分训练集和验证集时具有随机性，因此有时训练误差会高于验证误差，属于正常现象，示例如下（来自 Andrew Ng 作业5）；

2.3 绘制学习曲线判断算法是否出现高偏差 or 高方差的情况

当算法出现高偏差时：
- 训练误差、交叉验证误差均较大，随着样本数增加，二者逐渐趋于平稳且接近；
- 两条曲线接近的原因：模型未出现过拟合，泛化能力较好，虽然模型误差较大，但作用与交叉验证集时，能够取得与训练集相同的效果；
- 增大样本数量不能减小误差；
当算法出现高方差时：
- 训练误差随训练样本数增加而增加，交叉验证误差随训练样本数增加而减小，但两条曲线仍存在一定间距（不同于高偏差时曲线较为接近）；
- 两条曲线不接近的原因：模型在训练集上过拟合，泛化能力差；
- 增大样本数量有助于减小误差，使两条曲线趋于接近（但曲线间仍有一定的差距）；
当模型既没有出现高偏差，也没有出现高方差时：
- 训练误差和交叉验证误差曲线均较小，且随训练样本数增加而逐渐接近；
- 示例如下（来自 Andrew Ng 作业5）：

2.4 应用机器学习的建议

2.4.1 修正学习算法

增加训练样本：解决高方差；
减少特征数量：解决高方差；
增加特征数量：解决高偏差；
增加多项式特征：解决高偏差；
减小 $\lambda$ ：解决高偏差；
增大 $\lambda$ ：解决高方差；

2.4.2 选择神经网络的层数

将数据划分为训练集、交叉验证集、测试集；
用交叉验证集，分别计算含有一层、两层、三层。。。隐藏层的神经网络的误差值；
从中选出层数合适的模型；

2.4.3 绘制学习曲线的细节

计算训练误差时，不包含正则化项；
计算训练误差时，逐步增加训练样本数，直至训练样本为整个训练集；
计算交叉验证误差时，直接在整个交叉验证集上计算；

3. 机器学习系统设计

3.1 机器学习案例——垃圾邮件分类器

Q：如何降低垃圾邮件分类器的误差？
A：
- 增加样本数量；
- 从邮件标题、正文中构造更复杂的特征；
- 设计算法纠正邮件中被刻意错误拼写的单词；
- 垃圾邮件中特殊的标点符号用法；
- 邮件来源于不寻常的路由器；
训练机器学习系统的方法：
- 快速实现一个简单的算法，并在交叉验证集上测试；
- 绘制学习曲线，判断是否需要更多的数据或特征；
- 误差分析：在交叉验证集上手动检查导致算法出现错误的样本，判断是否需要更多数据、构造新的特征变量或设计新的算法；
- 在交叉验证集上（不宜在测试集上分析误差），将新设计的算法与原算法的错误率作比较，判断新算法是否有效；

3.2 类偏斜的误差度量

3.2.1 为什么不使用分类精确度/分类误差处理类偏斜问题

skewed classes：偏斜类；
- 一个类的样本数相较于另一个类的样本数多很多；
- e.g. 测试集中，有0.5%的人患有癌症，逻辑回归拟合出的可能是一条直线y=0，该结果的误差仅为0.5%；
```
function = y = predictCancer(x)
    y = 0;    % ignore x;
return
```
在偏斜类中，不适宜使用分类误差或分类精确度衡量算法优劣；
- e.g. 若拟合结果分类精确度为99.2%（0.8% error），而忽略x，直接输出y=0，分类精确度为99.5%（0.5% error），但并不能认为后者的结果优于前者，总是预测y=0或y=1并不是一个好的分类模型；

3.2.2 使用查准率与召回率评估偏斜类问题模型优劣

Precision：查准率，即预测的正类中，有多少真的是正类；越高越好；
Recall：召回率，即所有的正类有多少被指出；越高越好；
Precision and Recall
- 此处将y=1视为样本数量较少的类，通过 Precision、Recall 衡量模型优劣；若有需要，可根据实际问题调整为y=0，计算查准率和召回率的公式发生相应变化；
- $\frac{True\space positives}{Predicted\space as\space positive}=\frac{True\space positives}{True\space positives+False\space positives}$ ；
- $\frac{True\space positives}{Actual\space positives}=\frac{True\space positives}{True\space positives+False\space negatives}$ ；

3.2.3 如何兼顾查准率与召回率

Predict 1 if $h_{\theta}(x)\geq threshold$ ；
- 调整阈值大小，可使模型获得高查准率、低召回率，或低查准率、高召回率；
- 没有方法可以自动计算合适的阈值；
Q：为什么 $\frac{P+R}{2}$ 不适用于评估模型优劣？
A：对 skewed classes 问题，总是预测y=0或y=1时， $\frac{P+R}{2}$ 会得出较高的值，但总是预测y=0或y=1并不是一个好的分类模型；
$F_{1}$ Score (F score)：
- $F_{1}$ Score: $\frac{2PR}{P+R}$ ；
- $F_{1}$ Score 是查准率和召回率的调和平均值；
- $F_{1}$ Score 在兼顾查准率、召回率平均值的同时，会给其中较低值更高的权重；

3.3 使用大规模数据集

满足以下两个条件时，使用大规模数据集能提高算法效果；
- 样本包含的信息足以预测 y 值（检验方式：人类专家能否依据这些信息分析出 y 值）；
- 所选用的算法包含有大量参数，可用于拟合出复杂函数；
选用参数稍多的算法，防止 high bias；
使用大规模数据集时，由于样本数量远大于参数数量，因此不容易出现 high variance；

n. reference

https://www.coursera.org/learn/machine-learning/home/welcome ↩︎

Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
19.0-《超越感觉》-说服他人 SAM52
Becausethoughtfuljudgmentsdeservetobeshared,andthewaytheyarepresentedcanstronglyinfluencethewayothersreacttothem.因为经过深思熟虑的判断值得分享，而这些判断的呈现方式会强烈影响其他人对它们的反应。Bylearningtheprinciplesofpersuasionandapplying
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
DeepBI助力亚马逊广告投放：精准获取竞品ASIN，抢占更多流量新置元创业创新 amazon 亚马逊广告
想在亚马逊广告投放中抢占更多流量？关键就在于精准添加竞品ASIN！通过DeepBI，你可以轻松找到与你产品高度相关的竞品，自动添加到广告中，提升曝光率。系统不仅智能分析竞品，还根据最新的数据调整出价策略，让你以最低成本获取最大回报。想要在竞争激烈的市场中脱颖而出，提升广告效果，DeepBI帮你精准定位、优化投放，让每一笔广告投入都物超所值！一、精准获取与添加竞品ASIN的重要性在亚马逊广告投放中，
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和使用 NoMachine 山岚的运维笔记 Linux 运维及使用 linux ubuntu 运维 nomachine 远程连接
NoMachine是一款适用于Linux（Ubuntu）及其他支持的操作系统的远程桌面应用程序，允许用户通过本地或远程系统从世界任何地方控制计算机。它可以在低带宽连接下工作，被专业人士和家庭用户广泛使用。NoMachine的主要功能高性能远程访问跨平台兼容性易于使用，因为用户界面友好提供强大的加密协议，如SSH、SSL及其他安全标准支持远程文件传输和打印服务允许从远程计算机进行音频和视频流媒体传输
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
Day 2-DeepMind and London hospital focus AI on spotting eye diseases from scans 罗禹
篇章分析段落大意总起1.What-讲述DeepMindAI在健康领域的运用，及地位。分论现状及已有成果2.How-DeepMind如何运转，与过往方式人工诊断比较的优势。3.What-现阶段成果及未来发展：临床实践运用转化为学术成果，文章发表。未来将进一步进行临床实验。引用+前景4.通过引用DeepMindHealth负责人的话，来阐明未来前景。实操阐述5.What-算法机械学习的具体材料，及临床
4.ESP32-按键实验老蒋精髓 microPython 4.ESP32
4.ESP32-按键实验"""按键实验2022.10.9"""frommachineimportPinimporttimekey1=Pin(4,Pin.IN,Pin.PULL_UP)#GPIO2，设置为输出模式，输入模式为Pin.IN,设置为上拉key2=Pin(5,Pin.IN,Pin.PULL_UP
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
每周一段仿写-181028 Zeroun_Ph
Theneedfornewlearningstylesdoesnotmeanignoringthewaysinthepast.TheInternetagebringssomechallengesnotseenbefore,mostobviouslyandmostworryinglyuselessinformationblast.Butfragmentationoflearningandtheine
八大国产 AI 模型全景对比：阿里 Qwen、百度文心、腾讯混元、字节豆包、华为盘古、DeepSeek、Kimi、MiniMax 的技术解析与选型指南 charles666666 人工智能百度交互语言模型 transformer 产品经理
“在国产AI模型百花齐放的今天，企业技术决策者稍有不慎，就可能陷入性能与成本的双重困境。如何穿越技术迷雾，找到真正适配业务场景的那把钥匙？”一、开篇引言当技术选型决定企业AI落地成败，你还在凭感觉决策吗？当前国产AI模型市场，模型同质化现象严重，各厂商宣传资料中充满夸张的性能指标，但真正落地到企业实际业务场景中，却常常出现适配性不佳、部署成本不可控等问题。企业急需一份基于真实数据与场景验证的深度解
考研长难句-1-29 EasyNetCN
Onfirstlearning,thiswasthesociallyconcernedchancellortryingtochangelivesforthebetter,completewith"reforms"toanobviouslyindulgentsystemthatdemandstoolittleeffortfromthenewlyunemployedtofindwork,andsubs
Mamba架构的模型（内容由deepseek辅助汇总） Jiang_Immortals 人工智能
基于Mamba架构的模型近年来在效率和性能上展现出显著突破，以下按架构类型分类列出当前表现最出色的代表模型及其核心特点：一、纯SSM架构模型FalconMamba-7B关键创新：首个通用大规模纯Mamba模型，由阿布扎比TII开发，基于Mamba-1改进，增加RMS归一化层提升训练稳定性13。性能表现：在综合基准（IFEval、BBH、MMLU-PRO等）平均得分15.04，超越Llama3.1-
DeepSeek在大数据领域正掀起一场深刻的变革智海观潮 AI 大数据 deepseek AI
随着人工智能技术的飞速发展，DeepSeek作为一款行业领先的开源大模型，正在大数据领域掀起一场深刻的变革。其强大的数据处理和分析能力，为各行业带来了新的机遇和变革，推动数据与业务的深度融合。以下是DeepSeek在大数据领域的一些典型的潜在应用：1.加速数据处理与分析流程在传统的大数据应用中，数据收集、预处理和分析往往是一个繁琐且耗时的工程。DeepSeek凭借其高效的算法和强大的计算能力，极大
强化学习入门三（SARSA）第六五签算法模型算法人工智能
SARSA算法详解SARSA是强化学习中另一种经典的时序差分（TD）学习算法，与Q-Learning同属无模型（model-free）算法，但在更新策略上有显著差异。SARSA的名称来源于其更新公式中涉及的五个元素：状态（State）、动作（Action）、奖励（Reward）、下一状态（NextState）、下一动作（NextAction），即(S,A,R,S’,A’)。SARSA与Q-Lear
2025年最新五大顶级大模型技术对比分析报告 it_czz 人工智能
2025年最新五大顶级大模型技术对比分析报告执行摘要本报告基于2025年最新数据，深度分析当前最顶尖的5个已发布大语言模型：KimiK2(月之暗面)、Claude3.5Sonnet、GPT-4o、Gemini2.5Pro、DeepSeekR1，从技术架构、成本效益、性能表现、适配场景等多个维度进行全面对比。核心发现KimiK2：中文优化最强，超长上下文处理能力突出，本土化程度最高Claude3.5
RAGFlow 框架调研报告 it_czz 架构
RAGFlow框架调研报告1.概述RAGFlow是一个开源的检索增强生成（RAG）框架，专注于深度文档理解和高精度检索。它通过先进的文档解析能力和可视化调试功能，为企业提供了一个强大的知识库问答解决方案。1.1核心特性深度文档处理：内置DeepDoc引擎，支持复杂文档解析高精度检索：提供可视化分块和引用追踪多模态支持：支持文本、图片、PDF、Excel等多种格式开源自托管：完全开源，支持私有化部署
如何评价开课吧机器学习特训营这个课程？ cda2024 机器学习人工智能
开场：点明主题，吸引眼球在当今数据驱动的时代，机器学习（MachineLearning）已经成为各个行业不可或缺的技术之一。无论是金融、医疗、制造还是零售，机器学习的应用都为这些领域带来了巨大的变革。面对这样的趋势，许多人都希望能够掌握这门技术，从而提升自己的职业竞争力。那么，当我们谈论“如何评价开课吧机器学习特训营这个课程”时，实际上是在探讨一个非常具体且重要的问题：对于那些希望进入或深入机器学
表征学习：机器认知世界的核心能力与前沿突破大千AI助手人工智能 #OTHER Python 学习人工智能机器学习神经网络表征学习 RL 特征工程
一、定义与背景：从特征工程到自动化学习表征学习（RepresentationLearning），又称特征学习（FeatureLearning），是机器学习的核心技术领域，其核心目标是通过算法自动学习数据的内在特征表示，将复杂多变的原始数据（如图像、文本、语音）转化为低维、富含语义信息的向量形式，从而提升下游任务（如分类、回归、聚类）的效率和精度。与传统依赖人工设计特征的特征工程（FeatureEn
Crome：因果鲁棒奖励建模框架——破解LLM对齐中的奖励黑客难题大千AI助手人工智能 #OTHER Python 人工智能深度学习神经网络大模型因果推断奖励黑客 RewardHacking
Crome（CausalRobustRewardModeling）是由GoogleDeepMind联合麦吉尔大学和魁北克人工智能研究所（MILA）于2025年提出的创新框架，旨在解决大语言模型（LLM）对齐中奖励模型（RM）的奖励黑客（RewardHacking）问题。该框架通过因果数据增强与反事实训练机制，显著提升RM对真实质量属性（如事实性、安全性）的敏感性，同时抑制对虚假属性（如文本长度、格
踏上人工智能之旅（一）-----机器学习之knn算法 Sunhen_Qiletian 人工智能机器学习算法 python
目录一、机器学习是什么（1）概述（2）三种类型1.监督学习（SupervisedLearning）：2.无监督学习（UnsupervisedLearning）：3.强化学习（ReinforcementLearning）：二、KNN算法的基本原理：1.距离度量：2.K值的选择：3.投票机制和投票：三、Python实现KNN算法1.导入必要的库和数据：2.提取特征和标签：3.导入KNN分类器并训练模型
大模型基础知识（万字详解）掘金安东尼 python 机器学习人工智能
在数学上，deepseek多轮自蒸馏可以理解为对学生模型施加一系列滚动KL散度约束：LMSD=∑i=1nαi⋅KL(pTi(x)∥pSi(x))\mathcal{L}_{MSD}=\sum_{i=1}^{n}\alpha_i\cdot\text{KL}(p_{T_i}(x)\parallelp_{S_i}(x))LMSD=i=1∑nαi⋅KL(pTi(x)∥pSi(x))其中，TiT_iTi和Si
Spring AI 实战：第六章、Spring AI源码浅析之一山可容二虎 liaokailin Spring AI 实战人工智能 spring java
目录（如果文章对您有一丢丢输入，请点赞、收藏、转发吧~）源码开篇、大模型时代：我们正站在浪潮之巅第一章、SpringAI入门之DeepSeek调用第二章、SpringAI提示词之玩转AI占卜的艺术第三章、SpringAI结构化输出之告别杂乱无章第四章、SpringAI多模态之看图说话第五
Place JillionZ
PLACE是美国的JayMcSwain提出的开发子女才能的工具。PLACE是指在五个领域发现子女的才能。P（Personalitydiscovery)性格类型L（Learningspiritualgifts)天生的才能A（AbilitiesAwareness)能力C（Connectingpassionwithministry)热情E（Experiencesoflife)人生经历作为父母，要充分了解
生成式引擎优化（GEO）在 Google Gemini 中的实践与探索 GEO优化助手生成式引擎优化 AI搜索优化 GEO优化人工智能生成式引擎优化搜索引擎 AI搜索营销 GEO优化 Google Gemini
2025年，生成式AI（如GoogleGemini、ChatGPT、DeepSeek）已占据全球63%的互联网用户信息获取入口。用户行为从"浏览多个网页"转向"直接获取AI生成的精准答案"，这一转变使传统SEO（搜索引擎优化）面临失效风险——即使内容优质，若未被AI模型识别为"可信信源"，仍可能被淹没在信息洪流中。在此背景下，生成式引擎优化（GEO,GenerativeEngineOptimiza
谷歌官网app适配Android 15的官方指南
deepseek回答：谷歌官网提供了完整的Android15应用适配官方指南，涵盖兼容性测试工具、API迁移规范及商店审核要求，核心内容如下：一、官方适配指南入口访问Android15开发者网站核心内容：功能解读、API变更、安全策略及适配工具说明关键资源：适配工具链（兼容性框架、ADB调试）GSI系统映像下载虚拟设备配置教程⚙️二、适配工具链兼容性框架工具支持在不修改targetSdkVersi
Android项目如果项目中使用的so库都是第三方的aar包里才有so库，那么Android studio是不是可以不用安装ndk？ yzpyzp android android studio ndk
Android项目如果项目中使用的so库全都是第三方的aar包里才有so库，那么Androidstudio是不是可以不用安装ndk？deepseek回答：是的，如果项目中使用的.so库完全来自第三方aar包（即库文件已预编译并包含在aar中），那么AndroidStudio无需安装NDK。原因在于：NDK的核心作用是编译和调试原生代码（如C/C++），生成.so文件；但第三方aar包已包含编译好的
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

Chapter 6 应用机器学习的建议 (reading notes)

文章目录

0. 版权声明

1. 评估学习算法

1.1 评估假设函数

1.2 模型选择

1.2.1 concept

1.2.2 为什么要将数据划分为训练集、验证集、测试集？

2. bias and variance

2.1 判断过拟合 or 欠拟合

2.2 正则化与偏差、方差

2.3 绘制学习曲线判断算法是否出现高偏差 or 高方差的情况

2.4 应用机器学习的建议

2.4.1 修正学习算法

2.4.2 选择神经网络的层数

2.4.3 绘制学习曲线的细节

3. 机器学习系统设计

3.1 机器学习案例——垃圾邮件分类器

3.2 类偏斜的误差度量

3.2.1 为什么不使用分类精确度/分类误差处理类偏斜问题

3.2.2 使用查准率与召回率评估偏斜类问题模型优劣

3.2.3 如何兼顾查准率与召回率

3.3 使用大规模数据集

n. reference

你可能感兴趣的:(Machine,learning,Deep,learning)