Gingkens

机器学习--基础

1. 介绍

机器学习，也就是实现AI的一种方式，跟我们以往硬编码的方式不同，是能够让计算机拥有学习能力的编程方式。其理论基础自然是数学，将高等数学运用到在编程之中。由于现在数据的爆炸式增长，为需求大量数据的机器学习算法打下了基础，所以最近人工智能火了起来，数据，数据，大数据。

1.1 定义

下面给出两个定义：

Arthur Samuel (1959). Machine Learning: Field of
study that gives computers the ability to learn
without being explicitly programmed.

Tom Mitchell (1998) Well-posed Learning
Problem: A computer program is said to learn
from experience E with respect to some task T
and some performance measure P, if its
performance on T, as measured by P, improves
with experience E

上面的定义虽然都有点久远，但是也从侧面反映了机器学习很久以前就可以研究了，只是最近因为大数据时代才火了起来。看不懂的自行Google翻译 ..

1.2 运用场景

机器学习可以运用的方向，我觉是只有你没想到，没有它做不到。下面列出一些常见的运用场景。

自动驾驶
语音、图像识别
机器翻译
推荐系统（好的推荐系统带来的盈利难以想象）

1.3 机器学习算法

说得那么厉害，那么到底是怎样实现的呢？机器学习算法主要有两个：

Supervise Learning - 监督学习
Unsupervise Learning - 无监督学习

1.3.1 监督学习

监督学习，顾名思义就是就是监督着计算机来学习，就是对提出的问题会给出参考答案给计算机；然后让计算机根据正确答案，不断的进行迭代，使得计算机看到类似的问题时也能给出正确的答案。这种学习方式，跟找规律很相像，只是这些规律的特征很多，我们人脑无法找出，只能靠计算机高速运行以及大容量的优势来处理。

如上图，出给房子的大小，并给出房子的价格（需要计算机预测的）。通过数据的灌输和迭代使得计算机能够得出一条能够拟合数据的曲线，这就是回归模型了啊。

1.3.2 无监督学习

那么无监督学习，自然就是不给出正确的答案啦，具体是这样的，给出一组数据，让计算机自己去找出其中的规律。看图：

根据数据的分布的特点，自动给数据进行了分类。

2. 无监督学习

2.1 线性回归模型

通常我们将数据划分为训练集、验证集以及测试集。不论是什么集，数据中拿去训练模型的成为特征，用X作为记号，Y为结果（如果有的话）。

有了数据，怎么用是个问题？

于是就有了 Hypothesis Function —— 仿函数，不要在意名字，我们就是利用仿函数来实现数据到结果的映射的。说了叫线性回归，那么这个映射函数就是 hθ(x)=θ0+θ1x 。正如房价预测的模型一样，特征X只有一个就是房子大小，这个函数也是线性函数，对房价的预测将会是一条直线。

等等，好像 θ0,θ1 都还没有说是什么，其实 θ （向量，包含了 θ0,θ1 ，之后没有特别说明没有下标的都为向量）就是我们希望通过机器学习自动给出的参数，就好像房价估测，我们想让计算机通过计算得出能最好的 θ 来拟合上面的数据集的。

这样就可以了？No,No,No.计算机怎么会知道哪个 θ 好，哪个不好。所以还有 Cost Function 代价函数，用 J(θ)=12m∑m1(hθ(xi)−yi)2 ，我们用 J(θ) 来评判 θ 的好坏，这样计算机就知道如何“选择”合适的 θ 了,目标变成使 J(θ) 达到最小，这里m是训练集的个数。

这选择是什么意思？还打引号…难道到是暴力遍历每一种可能？这可能吗？先不说实数是无穷的，就算是整数，还限制了取值范围，当你只有一个特征的时候是时间复杂度是 O(n) ，那两个，三个呢？在机器学习中，数据的特征甚至可能成百上千，就例如一张30*30像素的gray图片，也有900个特征了。用暴力法，难以想象，感觉比汉诺塔还伤。

So，我们应该怎么处理？这里数学君来又来了， J(θ) 不是二次函数吗？二次函数开口向上的，就有最小值。看图：

我知道图片有点大，可是….大图不好吗？这里是我们熟悉的二次函数，我们可以把 X 看函数的常量， θ 看成变量，那么总有个 θ 能够让 J 达到最小值。那么求导记得吗？我们随机初始化 θ ，对 J 求导，导数为0的点，就是极值点。对于这个图，其他点的导数都为负数。那么我们可以通过下面的公式更新 θ 。

θ j = θ j - α \partial J ( θ ) \partial θ j

\partial J ( θ ) \partial θ j = 1 m \sum i = 0 m (h θ (x i) - y i) x i j

因为 θ 是个向量，所以是求偏导，然后通过这样就可以有方向的找到最好的 θ 了，其中 α 是学习率，可以看出影响了每次更新 θ 的步伐。对于求导的地方有了 xij 这里是第 i 个训练样本的第 j 个特征。

好的，那么如何训练一个模型的过程我们就知道了，下面总结一下。

记号	说明
Hypothesis 仿函数	计算特征到结果的映射
Parameters θ	模型的参数
Cost Function J	J(θ)=12m∑m1(hθ(xi)−yi)2
Goal 目标	最小化 J(θ)

Step：

首先有函数 J(θ)
目标最小化 J(θ)
选择一些 θ 为初始值，经常随机初始化
通过不断改变 θ 来减少 J(θ) ，直到达到一个我们期望的值。

伪代码：
θ=Initialization(x)

do until J(θ) convergence{
hθ(x)=x∗θT
J(θ)=12m∑m1(hθ(xi)−yi)2
∂J(θ)∂θj=1m∑mi=0(hθ(xi)−yi)xij
θj=θj−α∂J(θ)∂θj
}

真的假的，我读得书少，你不要骗我…好吧，我知道，是时候来点实例来“睡服”你们了。

注：代码都是用Python实现。

2.2 线性回归模型实例

问题描述：假设你是一家餐厅的老板并且考虑在别的城市开分店，并且你有不同城市的人口及食物货车的收益数据。你希望通过这些数据帮助你选择在哪个城市开分店。

数据集： X （97,1） , Y (97,1) 表示有 97 个数据，X是城市人口，Y是收益。将使用 m 作为数据个数 , n 作为特征个数, 这里 m 为 97 ， n 位 1 。

在开始任何工作前，将数据可视化，都是有用的。下图就是根据数据所画的点。

训练好模型后，我们希望给出一个新的城市人口数据，模型能够返回一个可能的收益值。

有了数据，现在我们应该初始化 θ ，在程序中，使用 theta 作为 θ 。

"""
    这里给X加了一列 1，因为有theta0,theta1, H_theta = theta0 + theta * x 的.
    所以为了实现向量话的运算，就为X加了一列1. theta 是(2,1). 所以 X * theta = (m , 1)
"""
def initilization(X):
    m,n = X.shape
    theta = np.ones((n+1,1))
    X = np.column_stack(( np.ones((m,1)) ,X))

    return X,theta

初始化好 θ 后，下一步我们开始计算 Cost J

def compute_cost(X,Y,theta):
    H_theta = np.dot( X , theta )
    J = np.sum( np.power( H_theta-Y , 2 ) )/(2*m)

    return J,H_theta

此时我们测试一下。

X,theta = initilization(X_raw)
J,H_theta = compute_cost(X,Y,theta)
print(J)
输出：10.2665204914

然后就是利用梯度下降更新 θ 的值了。

def gradient_descent(X,Y,H_theta,theta,alpha):
    m = X.shape[0]

    Dtheta = np.sum( (H_theta-Y)*X ,axis=0,keepdims=True)/m
    theta = theta - alpha*Dtheta.transpose()

    return theta

再测试一下：

X,theta = initilization(X_raw)
J,H_theta = compute_cost(X,Y,theta)
theta = gradient_descent(X,Y,H_theta,theta,alpha=0.01)
print(theta)
输出：
[[ 0.96679335]
 [ 0.75765107]]

嗯，一切都跟计划中的一样，现在我们把他整合起来。

def model(X,Y,theta,alpha=0.01,iterations=1000):

    for i in range(iterations):
        J,H_theta = compute_cost(X,Y,theta)
        theta = gradient_descent(X,Y,H_theta,theta,alpha)


    return theta

传入训练集数据，已经初始化好的 theta ，选择 α 学习率，以及迭代次数。每次迭代，我们计算出当前 θ 对应的 Cost J ，然后再更新 θ 。一个简单的模型就完成了。我们看一下结果。

可以看出，在训练完后，我们得出了一条蓝色的直线，使得数据点的的分布在直线附近。现在我们输入新的人口数据，就可以得出对应的收益值了。

也来试试，下载资源点这里。
或者Github。

2.3 逻辑回归模型实例

问题描述：假设你是工厂的产品经理，并且你有对一些微芯片的两个不同测试的结果。从这这些测试中，你想确定新的微芯片是否应该接受或拒绝。

数据集：X(118,2) ，Y(118,1) 。

数据可视化：

问题发现：可以发现数据的分布无法用一条直线将其分开，而应该是一条较为复杂的曲线。那么我们只有两个特征的模型过于简单了，无法将这两类数据很好的分开，这里就有一个新的概念，“多项式特征”。多项式是指它是利用原来的特征生成多项式，这样我们的方程就变成多元多次方程，这样足够复杂的去描述数据的分布了。

Python中特征多项式生成：

from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(6)
poly_features = poly.fit_transform(X)

我们将特征进行6次的多项式转化，y 就变成了二元六次方程，这样就足够我们去拟合数据了。

跟前面一样，我们需要初始化 θ ，一样的代码。只是我们记得先用X生成多项式特征。 θ 会是 (29,1)。

不同的地方是 Hθ ，因为我们现在是逻辑回归模型，我们需要的输出是介于 0-1 之间的数（我们可以选择 >=0.5 为真，否则为假）。所以我们对 θ 作了调整如下：

def sigmoid(Z):
    return 1/(1+np.exp(-Z))

H_theta = sigmoid( X*theta )

Sigmoid 函数的图像如下：

对应的，我们的Cost J函数也要稍作调整：

J = - 1 m \sum i m (Y * log (H θ) + (1 - Y) * log (1 - H θ))

可以看出，当Y为1时，只有

log(Hθ) 这一项，那么 Cost J 就仅受此项的影响，为了让 Cost J 变小，根据上面的Sigmoid 可以知，我们期望

X∗θ 的值尽可能的大，这一

Sigmoid(X∗θ) 就会越靠近 1 ，同样机会有

log(Hθ) 越靠近 0 。当 Y 为 0 时的情况就相反。至于梯度下降函数，则不变（其实是有变的，只是求导后形式一样而已）。

另外，我们的模型已经足够复杂去识别数据了，意味着我们可以在训练集上的表现得很好，但是实际情况中，我们并不希望在训练集上的表现得太过好，因为这很可能意味着我们的模型对训练集过度拟合了。我们根据训练集的数据来训练模型，并不是说只希望它能正确的识别训练集上的数据，要是这样，何不硬编码实现？所以我们是希望它能够正确的处理未出现过的数据。所以我们有了正规项：

J = - 1 m \sum i m (Y * log (H θ) + (1 - Y) * log (1 - H θ)) + λ 2 m \sum j n θ 2 j

我们需要在Cost J 后面加上最后一项。同样在梯度下降也许要加上对应的项：

\partial J ( θ ) \partial θ j = 1 m \sum i = 0 m (h θ (x i) - y i) x i j + λ m θ j

注意：因为 θ0 是常量项，在上面的正规项我们通常不会处理 θ0 所以 j 从 1 开始。只是梯度下降的项喔。

在实现上述步骤后，我们训练完模型。得出以下数据：

还有精度界线：

通过精度界限，我们可以很直观的了解到模型区分数据的情况，圈内的都为真，圈外的都为假。

具体实现及数据

3. 总结

为了控制文章篇幅，就在此作出基础总结。

习惯

在训练模型的时候，如果数据是二维或者三维的，我们都会讲数据可视化，以便我们分析数据的分布。在开始的时候，模型不必很复杂，根据 Cost J 的变化图，我们可以适当的调整模型，加入多项式特征或者正规项又或者是其他参数。

尝试

上面介绍了，线性回归以及逻辑回归模型，且都给出了相应的实现。所以如果你想建立自己模型也是可以的了。至于分类问题，上面介绍的是二元分类，如果是多元的话，我们可以利用划分的技术实现多元分类，也就是把其中一个看为“真”，其它 N-1个看为“假”，循环 N 次，选择概率最高的。

英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
重复文件清理工具，附免费链接 mixiumixiu 其他
链接:https://pan.baidu.com/s/1s_Zx1eHp5Y-XnbbGldIgvw?pwd=kjex提取码:kjex复制这段内容后打开百度网盘手机App，操作更方便哦
【三桥君】AI技术发展下，单智能体局限性凸显，如何通过MCP和A2A协议实现智能体团队协作转变？
你好，我是✨三桥君✨本文介绍>>一、引言在AI技术突飞猛进的今天，单智能体的局限性正日益暴露，而智能体（AIAgents）协作已然成为不可逆转的趋势。你是否曾思考过，如何通过MCP和A2A协议实现智能体从单兵作战到团队协作的革命性转变？本文三桥君将深入探讨MCP和A2A协议的核心功能与优势，帮助你全面理解智能体协作的无限可能。二、A2A与MCP协议作用MCP（ModelControlProtoco
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户