让我看看好学吗

AI产品经理技术篇：从传统AI到生成式AI，解密大模型的核心概念

在人工智能技术飞速发展的今天，AI产品经理不仅需要理解业务逻辑，还需深入技术底层，把握从传统AI到生成式AI的演进脉络。传统AI以分类、预测和规则驱动为核心，而生成式AI则颠覆了这一范式，通过大模型实现内容创作、对话生成等创造性任务。这种转变背后，是参数规模、模型架构和训练方式的根本性革新。

作为AI产品经理，理解大模型的核心概念至关重要。从“参数”的意义到“Token”的向量化，从Transformer的上下文理解到模型如何生成下一个Token，每一个环节都直接影响产品的设计逻辑和用户体验。本文将解析这些关键技术概念，帮助产品经理在技术浪潮中找准方向，打造更具竞争力的AI产品。

1 生成式AI与传统AI的差异

2 什么是参数

2.1 参数分类

2.2 参数：大模型 vs 非大模型

2.3 大模型的模型参数

3 Token与Embedding向量化

4 Transformer和上下文

5 大模型如何生成下一个Token

1 生成式AI与传统AI的差异

生成式AI是指能够生成新内容的人工智能模型，如文本、图像、音频等。与传统的判别式AI（如分类模型）不同，生成式AI不仅能够理解输入数据，还能基于学习到的模式生成新的数据。这种能力使得生成式AI在自然语言处理、图像生成和音乐创作等领域展现出巨大的潜力。

传统AI：判别式模型的任务与局限

传统AI通常依赖于规则和逻辑推理，使用明确的算法和模型来解决特定问题。它基于已有数据，学习输入（X）到输出（Y）的映射。其局限性在于只能处理已有模式，无法生成新内容。

生成式AI：创造新内容的核心能力

生成式AI通过学习数据的分布规律，能够生成新的、合理的内容。它不仅识别模式，还能模拟数据分布，创造性地生成与训练数据相似但不完全相同的输出（如续写文章、生成代码）。典型应用包括ChatGPT对话、Midjourney绘图、代码补全（GitHub Copilot）等。

对比维度	传统AI（判别式）	生成式AI
核心任务	用于特定任务的解决，分类、预测、判断（如垃圾邮件的识别）	创造新内容（文本/图像生成）
数据关系	基于已有数据建立输入-输出的映射	学习数据分布并生成符合分布的新样本
学习方式	包括监督学习和无监督学习	主要通过无监督学习和自监督学习进行训练
典型应用	推荐系统、图像分类	内容创作、对话系统、代码生成
可解释性	通常较高（规则或概率明确）	较低（黑箱生成过程）
数据敏感性	对数据质量要求高，噪声敏感	依赖数据规模，需多样性避免生成偏差
示例模型	决策树、支持向量机（SVM）、传统神经网络	Transformer、GAN、VAE等

关键差异总结：

传统AI通常关注于的确定性映射，这种方法强调的是对已知数据的学习和预测，目标是优化决策效率。

生成式AI关注于分布建模，即通过学习数据的分布 $P(x_{new})$ 来生成新样本，这种方法不仅仅是预测结果，而是追求内容的创新和多变性。

例如：传统AI可以将一张图片分类为猫或狗，而生成式AI可以生成一张新的猫或狗的图像。

2 什么是参数

2.1 参数分类

参数类型	定义	常见参数
模型参数	通过训练数据自动学习的内在参数，直接影响模型输出	神经网络的权重W、偏置b
超参数	人工预设的训练控制参数，决定模型的学习过程	学习率、正则化系数
生成控制参数	推理阶段调节生成内容特性的参数（仅生成式模型特有）	top-K、重复惩罚系数

大模型中，模型参数（权重&偏置）是核心，原因：

1）直接编码知识表示（参数规模可达千亿级别）

2）决定模型推理能力和任务表现

3）占据存储/计算资源的主体（例如GPT-3的175B参数，此处的175B参数指的是模型参数）

超参数及生成控制参数具体内容请见：产品经理技术篇：必知的模型参数&调优

2.2 参数：大模型 vs 非大模型

参数占比对比

参数占比	大模型（如GPT、DeepSeek）	非大模型（如线性回归、小型神经网络）
模型参数占比	极高（>99.9%）量级通常在亿级以上，模型参数主导（如Qwen-72B）。	较高（70%-95%）千级以下，模型参数仍占多数但相对可控；例如，线性回归的权重W和偏置b占主导，但参数量级较小（可能仅几千）。
超参数占比	极低（0.01%~0.1%）训练流程固定，超参数调优空间小；学习率等超参数数量固定且较少（通常几十个）。	相对重要（5%~30%）超参数调优对性能影响显著，例如SVM的核函数选择、决策树的深度等。
生成控制参数	少量，关键推理时需通过调节T、top-K等参数控制生成质量，但参数本身不参与训练	仅生成式小模型具备，传统判别模型无此类参数

模型参数占比分析：

1. Transformer架构：当前的GPT、Qwen、DeepSeek等系列LLM模型基于Transformer架构，参数集中在自注意力层和前馈网络层，模型参数随层数、维度指数增长。

2. 超参数固化：学习率等超参数数量固定，不随模型规模增加而显著变化。

3. 参数规模庞大：当前的GPT、Qwen、DeepSeek等系列LLM模型均为百亿至千亿级参数的大模型，权重矩阵占据绝对主导。

ps：DeepSeek-MoE-16B混合专家模型，模型参数仍占99.9%，超参数控制专家路由权重。虽引入MoE（混合专家），模型参数总量增加，但单设备激活参数有限，不影响整体占比。

结论：无论模型规模大小，模型参数占比始终最高。

大模型因参数量极大，其训练和推理的复杂度呈指数级增长，这种设计是为了最大化模型容量，同时通过自动化训练（如学习率自适应）和标准化接口（如固定T的范围），降低人工调参成本。

模型参数>99.9%，决定模型的核心能力。
超参数与生成控制参数<0.1%，仅优化训练流程或调节生成结果。

非大模型的模型参数与超参数占比不固定，会根据具体任务、数据集和模型复杂性产生变化，更依赖超参数调优和结构设计（如特征工程）。

例如线性回归：模型参数（W，b）占比80%，超参数（学习率等）占比20%
例如决策树：模型参数（分裂特征、阈值）占70%，超参数（最大深度）占30%。
如上例子中的比例也需依据实际任务来进行调整.

2.3 大模型的模型参数

参数是模型内部的权重和偏置，数量越多，模型的表达能力越强，但也可能导致过拟合。

权重（Weights）——食材的配比

权重是连接神经网络中两个节点的参数，控制输入特征对输出的影响程度。例如，在矩阵乘法 y = Wx + b 中，W 就是权重矩阵。
做菜类比：权重相当于食谱中每种食材的用量比例。
- 例如：做一道鱼香肉丝，权重决定「肉丝:笋丝:木耳 = 5:3:2」的配比。
为什么重要？
- 权重过大（如盐放太多）会掩盖其他味道（过拟合）；
- 权重过小（如糖太少）则风味不足（欠拟合）。

偏置（Biases）——调味料的基准值

偏置是加到神经元输出上的常数项，用于调整模型的灵活性。例如公式 y = Wx + b 中的 b。
做菜类比：偏置相当于菜品的默认口味基线，比如「基础咸度」或「默认辣度」。
- 例如：即使不放辣椒（输入为0），宫保鸡丁也有微甜味（偏置保证输出不为零）。
为什么重要？没有偏置（如完全不放盐），菜品可能寡淡无味（模型无法拟合简单模式）。

结合做菜的全流程类比
假设要训练一个「学会做鱼香肉丝」的模型：

输入数据（x）：食材（肉、笋、木耳、调料等）。
权重（W）：每种食材的用量比例（肉丝50g，笋30g…）。
偏置（b）：默认口味（必加1勺酱油提鲜）。
输出（y）：最终的鱼香肉丝。
损失函数：食客的评价（太甜/太咸→反向传播调整配方）。

过拟合：就像死板照搬食谱，无法适应新食材（测试数据）。
正则化：限制调料用量（权重衰减），防止味道过重（过拟合）。
注意力机制：动态调整配比（如炒菜时临时多放辣椒）。

训练过程

初期：随机分配权重和偏置（乱放调料，难吃）。
训练中：根据食客反馈（损失函数）逐步调整配比（梯度下降）。
最终：找到最佳权重和偏置（完美配方）。

权重与偏置的角色

权重的角色：决定不同特征（食材）的相对重要性。例如，GPT-3中某些权重会让「猫」和「动物」的关联更强。
偏置的角色：提供基础偏移量。例如，即使输入为0（无文字），模型也可能输出一个默认概率分布。

3 Token与Embedding向量化

Token：

Token是文本的基本单位，可以是单词、子词或字符。在处理自然语言时，文本首先被分解为Token，以便模型能够理解和处理。
将文本分解成这些单位的过程称为Tokenization。例如。句子“我爱学习”可以被分解为三个Token：[“我”，“爱”，“学习”]。Token化的目的是将文本转换为计算机可以处理的格式。

向量：

在NLP中，每一个Token通常对应着一个向量。这个向量用一组数字来表示，用于表示Token的特征和语义信息。
将单词、句子、用户ID、商品等转换为固定长度的数字向量（例如 [0.2，-0.5，1.3，...]）。
- 例如，"猫" → [0.7，0.2]， "狗" → [0.6，0.3]（二维简化示例）。

Embedding：

Embedding是将Token转换为向量的过程，即将离散数据（如文字、图像、类别等）转换为连续向量的技术。它通过将高维、稀疏的原始数据映射到低维、稠密的向量空间，同时保留关键信息，从而方便机器学习模型进行计算和学习。
每个Token被映射到一个向量空间中的稠密向量，这种向量化表示保留了Token之间的语义关系，使得模型能够更好地理解文本的含义。
保留语义关系：语义相似的实体在向量空间中距离更近。
- 比如，有三个Token："猫" → [0.7，0.1，0.1]， "狗" → [0.8，0.2，0.1]， "汽车" → [0.1，0.9，0.3]。“猫”和“狗”的向量比较近，表面它们在语义上有相似性；而“汽车”的向量与它们相距较远，表明它与动物的语义关系较弱。

为什么需要Embedding？

解决稀疏性：One-Hot编码效率低下，Embedding更紧凑。
捕捉隐藏关系：向量空间中的几何关系（如加减）反映现实语义。
适配模型需求：深度学习等模型需要连续数值输入。

4 Transformer和上下文

在NLP领域，传统的模型（如RNN、LSTM）存在着记性太差的缺陷。

RNN的问题：像金鱼一样，只能记住前面几个词，长文本就懵了。
LSTM的改进：记忆稍强，但计算慢，仍然难以捕捉长距离依赖。

于是，2017年，Google的论文《Attention is All You Need》提出了Transformer，彻底改变了NLP的游戏规则。它的核心思想是：不要逐词计算，而是让模型学会"注意力"，直接关注最重要的信息！

原论文：[1706.03762] Attention Is All You Need

Transformer的核心：自注意力机制（Self-Attention）

1）什么是自注意力？
想象在读一本小说，读到"他拿起苹果咬了一口"时，大脑会：

自动关联："苹果"可能指水果，而不是公司（除非上下文在聊iPhone）。
动态调整重点：如果前文提到"水果摊"，那"苹果"大概率是水果。

Transformer的自注意力机制，就是让AI模拟这个过程！

2）自注意力的计算过程
Transformer通过三个关键矩阵计算注意力：

Query（Q）：当前词在问："我应该关注谁？"
Key（K）：其他词回答："我和你的相关性有多高？"
Value（V）：最终贡献的信息。

计算步骤：

计算Q和K的相似度（点积），得到注意力分数。
用Softmax归一化，得到权重（哪些词更重要）。
用权重加权求和V，得到最终表示。

数学公式： ${Attention}(Q, K, V) = {Softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V$

3）多头注意力（Multi-Head Attention）
单一注意力可能不够：就像人会用"视觉、听觉、触觉"多角度理解世界。
Transformer的做法：使用多组Q/K/V矩阵（比如8个头），让模型从不同角度学习上下文关系，最后拼接结果。

Transformer如何理解上下文？

1）位置编码（Positional Encoding）
RNN/LSTM 是按顺序处理词的，但Transformer是并行计算，所以需要额外告诉模型"词的顺序"。

方法：给每个词嵌入（Embedding）加上一个位置信号（如正弦/余弦函数）。
效果： "猫追狗" ≠ "狗追猫"（模型能区分顺序）。

2）层叠的Transformer Block
Transformer由多个相同的层堆叠而成，每一层都包含：

自注意力层（捕捉词间关系）。
前馈神经网络（进一步处理信息）。
残差连接 & LayerNorm（稳定训练）。

3）深层模型的作用

浅层：学习局部语法（如"苹果"是名词）。
深层：理解全局语义（如"苹果"指公司还是水果）。

为什么Transformer适合长文本？

1）并行计算，效率极高

RNN/LSTM 必须逐词计算，速度慢。
Transformer 可同时处理所有词（适合GPU加速）。

2）长距离依赖不再困难

传统RNN：信息传递会衰减（如第1个词很难影响第100个词）。
Transformer：自注意力可直接关联任意两个词（如"开头的主语"直接影响"结尾的谓语"）。

Transformer的魔法

自注意力：让模型动态关注重要信息。
并行计算：比RNN/LSTM快得多。
位置编码：解决词序问题。
深层堆叠：逐步理解复杂语义。

Transformer让AI真正学会了"联系上下文"，而不是像金鱼一样健忘！

5 大模型如何生成下一个Token

生成下一个Token的流程：

1. 输入处理：将输入文本（如句子）进行Token化，将其分解为Token序列。

2. 上下文编码：使用神经网络（如Transformer）对输入的Token序列进行编码，生成上下文表示。这些表示捕捉了Token之间的关系和语义信息。

3. 预测下一个Token：模型根据上下文表示，计算每个可能Token的概率分布。通常使用Softmax函数将模型的输出转换为概率分布。

4. 选择下一个Token：根据概率分布选择下一个Token。

可以使用不同的策略，如：

贪婪搜索：选择概率最高的Token。
随机采样：根据概率分布随机选择Token。
束搜索：保留多个候选Token，进行更复杂的选择。

5. 更新输入：将新生成的Token添加到输入序列中，形成新的输入，重复上述过程，直到生成结束标志（如达到最大长度或生成特定的结束Token）。

示例：假设要生成一个句子，起始部分是“今天的天气真”。

1. 输入处理：Token化后，输入为[“今天”，“的”，“天气”，“真”]。

2. 上下文编码：模型对这四个Token进行编码，生成上下文表示，捕捉到“今天的天气真”这一短语的语义信息。

3. 预测下一个Token：

模型计算下一个Token的概率分布，假设输出为：

“好”：0.6； “差”：0.2； “冷”：0.1； “热”：0.1

4. 选择下一个Token：使用贪婪搜索，选择概率最高的Token“好”。

5. 更新输入：新的输入序列为[“今天”，“的”，“天气”，“真”，“好”]。

6. 再次预测下一个Token：“啊”：0.7； “！”：0.5； “，”：0.2； “真”：0.1。

7. 选择下一个Token：选择概率最高的Token“啊”。

8. 更新输入：新的输入序列为[“今天”，“的”，“天气”，“真”，“好”，“啊”]。

以下网站为对Transformer的直观解释：

The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time.

Transformer Explainer: LLM Transformer Model Visually Explained

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
2021-10-23 赵甄文的幸福
秀荣感恩日记Day42[烟花]感恩语录感恩自己有能力有好身体，可以到处走动，做自己想做的事情10.23感恩日记今天做的事情瑜伽一小时户外散步一小时泡脚20分钟学习打卡和孩子沟通[爱心]感动的瞬间今天瑜伽回来，发现老公在厨房里做鱼。每次老公有时间休息的时候都会给我做硬菜。刘姐约我一起去公园散步晒太阳。虽然完美错过，但心里还是暖暖的。每天睁开眼打开手机，先去自己的群里逛一逛，每每发现有人点赞或者互动都
孤独的守候怒吼的生命
孤独了时光岁月了寂寞带来了惆怅那些孤独的日子里我们珍惜奋斗起来品味人生的真谛做到更好奋斗当中的你是那么努力格外自律学习起来五彩斑斓那些日子时光匆匆人生的机会很多需要把握痛苦的回忆记得住那些忧愁孤苦五一的日子寂寞当中的你时光荏苒独自带给我荒草学习起来努力奋斗可是我们做的还不够把握发展生活带给我们更多希望静静的述说你的故事你的精彩人生当中我们总是努力把握生活带给我们更多的学习生活当中我们奋斗可是做的还
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
2018-08-29精进打卡米兰王
姓名:王兰英【日精进打卡第25天】【知～学习】《六项精进》1遍共39遍《大学》1遍共50遍【经典名句分享】一切都是最好的安排。【行～实践】一、修身：（对自己个人）1，散步1小时。2，每天坚持读书。二、齐家：（对家庭和家人）1，指导孩子开车。2，和家人一起逛超市。三、建功：（对工作）用心做好每件事。｛积善｝：发愿从2018年8月5日起1年内365个善事。今日1善，累计27善。【省～觉悟】正人先正己。
陶勇：要不要参加分班考试学习？看完再说。陶勇
每年到了升学季，有很多培训机构都特别忙，为什么呢？因为有成千上万的学生，会选择升学前的分班考试的培训。比如说，小升初的孩子，到了暑假，很多孩子都会去选择一个初中，初一的分班考试的培训，那考入高中的孩子也有很多孩子会选择这种新高一的分班考试的培训。当然了，我个人认为这种选择并不是孩子自身的选择，主要还是家长的选择。当然也有少数孩子会对自己有比较高的要求，他们也会主动的去选择。为什么要去上分班考试的这
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
求解——妊娠纹霜哪个牌子好？皮肤专家推荐的热门秘诀！ zhangxing0100
妊娠纹会严重影响女性的美观，那孕期的女性朋友该如何避免减少妊娠纹的出现呢?下面美腹丽人小编为大家分享了预防妊娠纹的方法，赶紧一起来学习吧!一、预防妊娠纹的饮食习惯1、多食用对皮肤内胶原纤维有利的食品来增强皮肤的弹性。2、控制糖分摄入，少吃色素含量高的食物。3、早晚两杯脱脂牛奶，多食用维丰富的蔬菜、水果和富含维生素及矿物质的食物，增加细胞膜的通透性和皮肤的新陈代谢功能。4、正确的喝水习惯可以提速皮肤
2023-01-07 阿诗玛_6209
姓名：赵丽娟【日精进打卡第1783天】【知～学习】读书《经营与会计》ok《活法》3-47-8【经典名句】执着追求并从中得到最大快乐的人，才是成功者。——梭罗一、修身：（对自己个人）1、保持心态平和.2、坚持打卡.坚持读书。3、早晨喝杯温水.4、坚持烫脚，养成早睡早起的习惯.二、齐家：三、建功：（对工作）｛积善｝：发愿从2018年1月28日起见善行善，今日0善。【省～觉悟】1,睡觉时把手机放到离自己
认命修运每日一省（16）星_6329
命每个人的命都是父母带来的，我们每个人都没有权利选择父母，没有权利选择自己的出生。一个人从出生的那一刻就注定了你的命。我所说的认命，就是客观的接受自己的父母，接受自己的家庭。不对抗，不较劲。有些人是含着金汤匙出生的，有些人刚一出生拥有的财富可能是我们一生都得不到的。有些人是踩着泥坑出生的。有些人一出生就是等着继承皇位的。运在我们成长的过程当中，我们付出努力，学习知识，成长自己，帮助他人。我们有权利
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

AI产品经理技术篇：从传统AI到生成式AI，解密大模型的核心概念

1 生成式AI与传统AI的差异

2 什么是参数

2.1 参数分类

2.2 参数：大模型 vs 非大模型

2.3 大模型的模型参数

3 Token与Embedding向量化

4 Transformer和上下文

5 大模型如何生成下一个Token

你可能感兴趣的:(人工智能,产品经理,学习,深度学习,自然语言处理)