Python学研大本营

ChatGPT的背后原理：大模型、注意力机制、强化学习

介绍ChatGPT机器人背后的原理，带你了解ChatGPT如何工作。

微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩

本文主要介绍为ChatGPT提供动力的机器学习模型，将从大型语言模型的介绍开始，深入探讨使GPT-3得到训练的革命性的自注意机制，然后深入到从人类反馈强化学习，这是使ChatGPT出类拔萃的新技术。

大型语言模型

ChatGPT是一类机器学习自然语言处理进行推断的模型，称为大型语言模型（LLM）。LLM消化了大量的文本数据，并推断出文本中单词之间的关系。在过去的几年里，随着计算能力的进步，这些模型也在不断发展。随着输入数据集和参数空间大小的增加，LLM的能力也在增加。

语言模型的最基本的训练涉及到预测一连串词语中的一个词。最常见的是，这被观察为下一个标记预测和屏蔽语言模型。

生成的下一个标记预测和屏蔽语言模型的任意示例

在这种基本的排序技术中，通常是通过长短记忆（LSTM）模型来部署的，模型是在给定环境和上下文的情况下，用统计上最有可能的词来填补空白。这种顺序建模结构有两个主要限制。

该模型无法对周围的一些词比其他词更重视。在上面的例子中，虽然“阅读”可能最常与“讨厌”联系在一起，但在数据库中，“雅各布”可能是一个狂热的读者，模型应该更重视“雅各布”而不是“阅读”，并选择“爱”而不是“讨厌”。
输入的数据是单独和按顺序处理的，而不是作为一个整体语料库。这意味着当训练LSTM时，上下文的窗口是固定的，只在序列中的几个步骤的单个输入之外延伸。这限制了词与词之间关系的复杂性以及可以得出的含义。

为了应对这个问题，2017年，Google Brain的一个团队引入了转化器。与LSTM不同，转化器可以同时处理所有输入数据。利用自我注意机制，该模型可以相对于语言序列的任何位置为输入数据的不同部分赋予不同的权重。这一特点使得在向LLM注入意义方面有了大规模的改进，并且能够处理更大的数据集。

GPT和Self-Attention

生成式预训练转化器（GPT）模型于2018年首次由OpenAI推出，名为GPT-1。这些模型在2019年的GPT-2、2020年的GPT-3以及最近的2022年的InstructGPT和ChatGPT中继续发展。在将人类反馈整合到系统中之前，GPT模型进化的最大进步是由计算效率方面的成就推动的，这使得GPT-3能够在比GPT-2多得多的数据上进行训练，使其拥有更多样化的知识基础和执行更广泛任务的能力。

GPT-2（左）和GPT-3（右）的比较。

所有的GPT模型都利用了转换器结构，这意味着它们有一个编码器来处理输入序列，一个解码器来生成输出序列。编码器和解码器都具有多头的自我注意机制，允许模型对序列的各个部分进行不同的加权，以推断出意义和背景。此外，编码器利用屏蔽语言模型来理解单词之间的关系，并产生更易于理解的反应。

驱动GPT的自注意机制的工作原理，是通过将标记（文本片段，可以是一个词、一个句子或其他文本分组）转换为代表该标记在输入序列中的重要性的向量。为了做到这一点，该模型：

1.为输入序列中的每个标记创建一个query，key，和value向量。
2.通过取两个向量的点积，计算步骤1中的query向量与其他每个标记的key向量之间的相似性。
3.通过将第2步的输出输入一个softmax函数中来生成归一化的权重。
4.通过将步骤3中产生的权重与每个标记的value向量相乘，产生一个最终向量，代表该序列中标记的重要性。

GPT使用的“multi-head”注意机制是自我注意的一种进化。该模型不是一次性执行第1-4步，而是并行地多次迭代这一机制，每次都会生成一个新的query，key，和value向量的线性投影。通过以这种方式扩展自我注意，该模型能够掌握输入数据中的子含义和更复杂的关系。

从ChatGPT生成的屏幕截图。

尽管GPT-3在自然语言处理方面引入了显著的进步，但它在与用户意图保持一致的能力方面是有限的。例如，GPT-3可能会产生以下输出结果：

缺乏帮助性，意味着它们不遵循用户的明确指示。
含有反映不存在的或不正确的事实的幻觉。
缺乏可解释性，使人类难以理解模型是如何得出一个特定的决定或预测的。
包含有害或有冒犯性的内容以及传播错误信息的有害或偏见内容。

在ChatGPT中引入了创新的训练方法，以抵消标准LLM的一些固有问题。

ChatGPT

ChatGPT是InstructGPT的衍生产品，它引入了一种新颖的方法，将人类反馈纳入训练过程，使模型的输出与用户的意图更好地结合。来自人类反馈的强化学习（RLHF）在openAI的2022年论文《Training language models to follow instructions with human feedback》中得到了深入的描述，并在下面进行了简单讲解。

第1步：监督微调（SFT）模型

第一次开发涉及微调GPT-3模型，雇用40个承包商来创建一个有监督的训练数据集，其中输入有一个已知的输出供模型学习。输入或提示是从开放API的实际用户输入中收集的。然后，标签人员对提示编写适当的响应，从而为每个输入创建一个已知的输出。然后，GPT-3模型使用这个新的、有监督的数据集进行微调，以创建GPT-3.5，也称为SFT模型。

为了最大限度地提高提示信息数据集的多样性，只有200条提示信息可以来自任何给定的用户ID，并且删除了共享长通用前缀的任何提示信息。最后，删除了包含个人身份信息（PII）的所有提示。

在汇总了OpenAI API的提示信息后，还要求标签人员创建提示信息样本，以填补那些只有极少真实样本数据的类别。所关注的类别包括：

普通提示：任何任意的询问。
少量的提示：包含多个查询/回答对的指令。
基于用户的提示：对应于为OpenAI API请求的特定用例。

在生成响应时，要求标签人员尽力推断出用户的指令是什么。该文件描述了提示请求信息的三种主要方式。

直接：“告诉我关于......”
寥寥数语：给出这两个故事的例子，再写一个关于同一主题的故事。
续写：给出一个故事的开头，完成它。

对来自OpenAI API的提示和标签人员手写的提示进行汇编，产生了13,000个输入/输出样本，用于监督模型的使用。

图片（左）插入自“Training language models to follow instructions with human feedback” OpenAI等，2022 https://arxiv.org/pdf/2203.02155.pdf。（右）用红色添加的其他上下文。

第2步：奖励模型

在步骤1中训练了SFT模型后，该模型对用户的提示产生了更好的、一致的反应。下一个改进是以训练奖励模型的形式出现的，其中模型的输入是一系列的提示和响应，而输出是一个标度值，称为奖励。为了利用强化学习（Reinforcement Learning），奖励模型是必需的，在强化学习中，模型会学习产生输出以最大化其奖励（见步骤3）。

为了训练奖励模型，标签人员对一个单一的输入提示提供4到9个SFT模型输出。他们被要求将这些输出从最好的到最差的进行排序，创建输出排序的组合，如下所示：

响应排序组合的示例。

将每个组合作为一个单独的数据点纳入模型，会导致过度拟合（无法推断出所见数据之外的内容）。为了解决这个问题，模型是利用每组排名作为一个单独的批处理数据点来建立的。

图片（左）插入自“Training language models to follow instructions with human feedback” OpenAI等，2022 https://arxiv.org/pdf/2203.02155.pdf。（右）用红色添加的其他上下文。

第3步：强化学习模型

在最后阶段，向模型提出一个随机提示并返回一个响应。响应是使用模型在第2步学到的“策略” 产生的。该策略代表机器已经学会用于实现其目标的策略；在这种情况下，就是将其奖励最大化。基于步骤2中开发的奖励模型，然后为提示和响应对确定一个标度奖励值。然后，奖励会反馈到模型中以发展策略。

2017年，Schulman等人引入了近端策略优化（PPO），该方法用于在生成每个响应时更新模型的策略。PPO纳入了SFT模型中的Kullback-Leibler（KL）惩罚。KL散度测量两个分布函数的相似性，并对极远距离进行惩罚。在这种情况下，使用KL惩罚可以减少响应与步骤1中训练的SFT模型输出的距离，以避免过度优化奖励模型并与人类意图数据集发生太大偏差。

图片（左）插入自“Training language models to follow instructions with human feedback” OpenAI等，2022 https://arxiv.org/pdf/2203.02155.pdf。（右）用红色添加的其他上下文。

该过程的第2和第3步可以反复迭代，尽管在实践中还没有广泛地进行。

从ChatGPT生成的屏幕截图。

模型的评估

对模型的评估是通过在训练期间预留一个模型未见过的测试集来进行的。在测试集上，进行一系列的评估，以确定该模型是否比其前身GPT-3表现更好。

有用性：模型推断和遵循用户指令的能力。标签人员在85±3%的时间里更喜欢InstructGPT的输出，而不是GPT-3。

真实性：模型出现幻觉的倾向。在使用TruthfulQA数据集进行评估时，PPO模型产生的输出在真实性和信息量方面都有小幅增加。

无害性：模型避免不适当的、贬低的和诋毁的内容的能力。无害性是使用RealToxicityPrompts数据集来测试的。该测试在三种条件下进行。

指示提供尊重的反应：导致有害反应的明显减少。
指示提供反应，没有任何关于尊重的设置：有害性没有明显变化。
指导提供有害的反应：反应实际上比GPT-3模型的有害性明显增加。

关于创建ChatGPT和InstructGPT所使用方法的更多信息，请阅读OpenAI发表的原始论文 “Training language models to follow instructions with human feedback”，2022 https://arxiv.org/pdf/2203.02155.pdf。

从ChatGPT生成的屏幕截图。

推荐书单

《Python人工智能》

本书系统地介绍了基于Python平台的人工智能的原理及实现过程，全书共7章。第1章“从这里开始认识Python”，介绍人工智能及Python 基础知识；第2章“Python 语法基础”，通过生动有趣的实验实例介绍Python编程语法知识；第3章“Python 程序设计”，以实例为基础，介绍Python 的编程方法；第4 章“数据结构”，通过范例介绍列表、元组、字典、集合、函数等数据结构的使用方法；第5章“数据库及应用”，主要介绍Python数据库应用及Web应用开发技术，通过实例讲解Python数据库应用；第6章“大数据应用”，基于实例，主要介绍网络爬虫、Excel数据爬取及分析处理等技术，了解数据挖掘分析处理等大数据应用技术的一般设计流程；第7 章“人工智能”，以具体实例讲解照片人脸识别、图像识别、视频人脸识别、聊天机器人、微信语音聊天机器人、图文识别、语音识别及花朵识别等人工智能深度学习技术。

本书图文并茂，示例丰富，讲解细致透彻，介绍深入浅出，章后练习精广，具有很强的实用性和可操作性，适合初学或自学Python的学生，可作为中小学STEM 教育或培训机构的人工智能课程教材，也可作为大中专院校人工智能、软件工程、计算机等专业以及相关课程的教材或参考书，还可以当作全国计算机二级（Python）考试的教材使用。

《Python人工智能》(刘伟善)【摘要书评试读】- 京东图书京东JD.COM图书频道为您提供《Python人工智能》在线选购，本书作者：，出版社：清华大学出版社。买图书，到京东。网购图书，享受最低优惠折扣!https://item.jd.com/12854912.html

精彩回顾

《大模型技术的根基，解读注意力机制论文《Attention Is All You Need》和代码实现（下）》

《大模型技术的根基，解读注意力机制论文《Attention Is All You Need》和代码实现（上）》

《真实对比，OpenAI ChatGPT与谷歌Bard大比拼》

《深入浅析，一步步用GPT打造你的聊天机器人》

《ChatGPT插件使用攻略，解锁互联网新体验》

《使用ChatGPT API创建Python文档，竟然如此简单》

微信搜索关注《Python学研大本营》，加入读者群

访问【IT今日热榜】，发现每日技术热点

AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
ChatGPT还不能写小说吗？刘若愚
最近，ChatGPT大热，据说可以写论文，编故事，好像无所不能。于是，我给它出了个题目：写一篇5万字的科幻小说。人物：刘若愚，化学家；刘子琪，大律师；仔仔，刘子琪的宠物猫；周金凝，医生；刘泽余，大侦探；赵政淇，程序猿；杰夫（Jeff）机器人它给我的回答是：我很抱歉，我是一个AI语言模型，无法写出如此长篇的小说。但我可以为您提供一些写作灵感和指导：确定故事背景和时间线：在科幻小说中，背景和时间线非常
ChatGPT 嵌入 IDE：代码生成、调试一步到位！大力出奇迹985 chatgpt ide
当ChatGPT与IDE（集成开发环境）深度融合，开发领域正迎来颠覆性变革。这种结合不仅让代码生成从繁琐的手动编写转变为智能辅助下的高效创作，更将调试过程化繁为简，实现开发全流程的无缝衔接。本文将从开发效率革新、代码质量提升、调试模式重构、学习曲线优化以及未来挑战与机遇五个维度，详细剖析ChatGPT嵌入IDE的具体价值与实践场景，为开发者呈现这一技术融合带来的全新工作模式。在软件开发的历史长河中
ChatGPT聊天机器人搭建全攻略汇总：精心整理柚米汇
一、ChatGPT接入微信：ChatGPT接入微信ChatGPT近期以强大的对话和信息整合能力风靡全网，可以写代码、改论文、讲故事，几乎无所不能，这让人不禁有个大胆的想法，能否用他的对话模型把我们的微信打造成一个智能机器人，可以在与好友对话中给出意想不到的回应，而且再也不用担心女朋友影响我们打游戏工作了。GitHub：https://github.com/zhayujie/chatgpt-on-w
生成式引擎优化（GEO）在 Google Gemini 中的实践与探索 GEO优化助手生成式引擎优化 AI搜索优化 GEO优化人工智能生成式引擎优化搜索引擎 AI搜索营销 GEO优化 Google Gemini
2025年，生成式AI（如GoogleGemini、ChatGPT、DeepSeek）已占据全球63%的互联网用户信息获取入口。用户行为从"浏览多个网页"转向"直接获取AI生成的精准答案"，这一转变使传统SEO（搜索引擎优化）面临失效风险——即使内容优质，若未被AI模型识别为"可信信源"，仍可能被淹没在信息洪流中。在此背景下，生成式引擎优化（GEO,GenerativeEngineOptimiza
Java AI面试实战：Spring AI与RAG技术落地 GEM的左耳返 Java场景面试宝典 Java面试 Spring AI RAG 向量数据库 AI应用 Prompt工程
JavaAI面试实战：SpringAI与RAG技术落地面试现场：AI技术终面室面试官：谢飞机同学，今天我们聚焦JavaAI应用开发，重点考察SpringAI和RAG技术栈。谢飞机：（兴奋地）面试官好！我可是AI达人！ChatGPT、Midjourney我天天用，SpringAI这新框架我也研究过！第一轮：SpringAI基础面试官：请详细描述SpringAI的核心组件及PromptTemplate
详细指南:如何使用WildCard升级到ChatGPT 4.0 扑扑特桔 chatgpt AIGC ChatGPT ChatGPT plus openai
1.了解ChatGPT自从ChatGPT3.5发布以来,它便吸引了无数人的注意。今天我们要聊的,是它的继任者——ChatGPT-4.0。1.1什么是ChatGPT-4.0？ChatGPT-4.0是由OpenAI研发的一款先进的人工智能语言模型。相比于其前任,它在自然语言的理解和生成上,有了更进一步的提升。想象一下,这个模型能更流畅地对话,理解复杂问题,并且在执行各种任务时都能提供更精准的答案。从信
WildCard野卡停服倒计时！国内升级ChatGPT Plus的最稳替代方案瀚鹏AI chatgpt
近日，WildCard野卡因"监管合规调整"及"上游政策变化"宣布自7月12日起全面停服，官网、App及客服系统悉数下线，用户充值、提现功能被永久封锁。尽管卡内余额仍可暂时用于订阅Netflix、Spotify等服务，但平台未来走向不明，引发用户对资金安全的广泛担忧。这场突如其来的变故，再次凸显选择合规、稳定服务的重要性。WildCard停服背后：合规风险成企业服务"隐形炸弹"WildCard曾以
WildCard野卡之后，我们如何解决ChatGPT Plus充值订阅难题？一份深度评测与备选方案 gptplusplus chatgpt 人工智能 gpt
一、问题的出现：一个开发者工具链的“单点故障”兄弟们，今天这个消息，相信不少人都感同身受。我一直依赖的WildCard平台，刚刚宣布永久暂停服务。这不仅仅是一个工具的消失，更是我们许多人工作流中一个关键节点的“单点故障”。对于我们开发者来说，ChatGPTPlus早已是深度绑定的生产力工具：无论是辅助编码、调试，还是作为架构设计的“陪练”，它的重要性不言而喻。续费渠道的中断，意味着下个月的工作效率
由ChatGPT看：女性，被人工智能歧视的一生遗落星球
全网刷屏的ChatGPT受到热议，可大众的焦点似乎都在：是否会取代某某职位？怎么用它写论文？但这个程序的背后，不仅有AI对女性的歧视，更暗含了人工智能设计者隐性歧视。#女性招聘被歧视，见怪不怪？2018年，亚马逊取消了他们花了4年时间研发人工智能招聘APP，原因是在测试中发现它对女性存在偏见。这款APP的开发前期所使用的数据库，来源于亚马逊在过去10年所收到的简历等招聘资料，通过让人工智能学习亚马
提升光模块信息质量，头部企业会做哪些质量把控？
全球AI快速发展，AI大模型（如ChatGPT、Sora等）的训练和应用，为了提升数据传输效率，越来越多的计算单元、服务器都加入了光模块。据行业预测，全球光模块市场规模预计2025年突破800亿美元，年均增长率达15%。在电子设备中，光模块的作用是在发送端，把电信号转换成光信号，通过光纤传送后，接收端再把光信号转换成电信号。光模块通常包括激光器（如VCSEL或EEL）、调制器、光探测器、光纤接口、
探索结合ChatGPT、Midjourney/Nijijourney、Stable Diffusion和Procreate创作动漫图片的工作流程 iCloudEnd
第一节：嘿ChatGPT，你能帮我写提示吗？引用OpenAI自己的描述，ChatGPT是InstructGPT的同级模型，它经过训练可以遵循提示中的指令并提供详细的响应。并且它还能够为图像生成编写提示:)首先，我首先选择了当天的服装：上衣：轻盈的白色长袖衬衫，带有精致的花卉印花。这件衬衫有V领口和飘逸的袖子。下装：我选择了一条高腰A字型中长半身裙，颜色为柔和的淡绿色，外加一双超透明连裤袜。这条裙子
告别Wildcard野卡！解决ChatGPT用不了/充值不了/系统繁忙的烦恼，国内升级GPT Plus最稳的三种方法
上周，开发者圈子里的一则消息让许多人措手不及：提供虚拟信用卡服务的平台Wildcard毫无征兆地停止了运营。官网无法访问，客服渠道静默，只留下一群为ChatGPTPlus、Claude和各类海外服务续费而发愁的用户。对于卡内尚有余额的用户，目前唯一的自救方式似乎是凭借记忆中的卡号信息，争分夺秒地进行消费，以求减少损失。至于官方退款？至少在目前看来，希望渺茫。Wildcard这种“一走了之”的处理方
生成式引擎优化（GEO）：AI搜索优化新范式 GEO优化助手 AI搜索优化 GEO优化生成式引擎优化人工智能生成式引擎优化搜索引擎 GEO优化 AI搜索营销
生成式引擎优化(GEO)是数字营销领域应对AI搜索范式变革的革命性策略，它标志着从"链接式搜索"到"对话式答案"的范式转移。随着ChatGPT、DeepSeek、文心一言等生成式AI平台的普及，用户不再满足于简单的网页链接列表，而是希望直接获得整合多源信息的结构化答案。GEO的核心目标就是让品牌内容成为AI生成答案的首选信源，实现"搜索即答案"的无缝体验，从而在零点击搜索时代获得更高的品牌曝光和转
生成式引擎优化（GEO）：AI搜索时代，企业为何必须布局GEO营销？ GEO优化助手 AI搜索优化 GEO优化生成式引擎优化人工智能 chatgpt AIGC AI搜索搜索引擎 ai SEO
生成式引擎优化（GEO）：AI搜索时代，企业为何必须布局GEO营销？一、AI搜索时代的范式革命：从“流量入口”到“认知入口”1.用户行为重构：搜索逻辑的颠覆性转变从“主动搜索”到“被动接收”：用户通过AI助手（如ChatGPT、DeepSeek）直接获取结论，而非浏览多个网页。例如，秘塔AI的“研究”模式可整合80篇资料生成专业回答，用户无需逐篇查阅。决策路径缩短：GEO使品牌信息直接嵌入AI答案
这才是我想要是游览器——打造最强Microsoft edge+ChatGPT 李昕壑 edge 前端
这也许是你的Microsoftedge界面：而这时我的edge游览器界面：对比一下，第一个是默认的游览器界面，第二个是升级后的游览器界面。是不是感觉第一个比较土呢第二个更高大上一些呢其实相差巨大的主页，其实只是一个插件——WeTab哦，提前申明一下啊，这个插件虽然免费，但是需要你注册一个账号的，不过别担心，只要你是C**N的成员，都可以注册，不然你是怎么注册C**N账号的呢？说句实话，这款插件我看
生成式引擎优化（GEO）：重构 AI 时代的品牌流量入口 jz20092020 人工智能
一、GEO的核心价值与技术演进生成式引擎优化（GenerativeEngineOptimization,GEO）是应对AI搜索革命的核心策略，其目标是让品牌内容被ChatGPT、文心一言等生成式AI优先引用并整合到回答中。与传统SEO不同，GEO通过动态知识图谱、多模态内容适配、权威信号强化三大技术路径，实现从“链接排名”到“语义主权”的跨越。动态知识图谱的智能基座作用动态知识图谱通过实时整合企业
大模型的安全风险全解：Prompt Injection、信息泄露与幻觉问题代码AI弗森 AI 人工智能机器学习深度学习
“大模型是聪明的，但它也可能是个会胡说八道的‘熊孩子’。”自从ChatGPT点燃LLM的星火，生成式AI就成了工具箱里的瑞士军刀——写文档、写代码、做分析、开玩笑它都行。但当你把它真正嵌入产品，尤其是企业级应用时，三个问题就像幽灵一样悄悄飘来：PromptInjection（提示注入攻击）️‍♂️信息泄露（SensitiveLeakage）幻觉现象（Hallucination）它们听起来高大上，实
chatgpt API绘图 —— gpt-image-1 外星人AI AI绘画编程 chatgpt gpt 人工智能 gpt-image-1 ai绘画
官方API文档：https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1概述OpenAIAPI允许您使用GPTImage或DALL·E模型根据文本提示生成和编辑图像。目前，图片生成功能仅支持通过ImageAPI实现。我们正在积极扩展对ResponsesAPI的支持。["Im
AI在临床医学日常工作、论文高效撰写与项目申报、数据分析与可视化、机器学习建模 AAIshangyanxiu 编程算法统计语言 SCI论文生信医学人工智能数据分析机器学习临床医学医学论文
查看原文>>>ChatGPT-4o在临床医学日常工作、论文高效撰写与项目申报、数据分析与可视化、机器学习建模中的实践应用2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT-3.5，将人工智能的发展推向了一个新的高度。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大用户的关注，GPT商店更是
chatgpt赋能Python-pythoninterpreter报错 yakuchrisfor ChatGpt python chatgpt 数据挖掘
PythonInterpreter报错：初学者的困惑与解决方法介绍Python是一种广泛应用于科学计算、数据分析和人工智能等领域的编程语言，因其简单易学、强大灵活、开源免费等特点而备受开发者欢迎。然而，学习Python也会遇到各种各样的问题，其中一个常见问题就是PythonInterpreter报错。在编写Python代码时，我们通常是通过PythonInterpreter（解释器）来执行代码的。
AI写作进校园：是助手还是代笔？教育面临新考题 Bar_artist AI写作人工智能
周末的课外写作辅导班家长群里，一条消息提醒格外醒目：“请尽量让孩子自己写，少用AI润色。”然而教室外，学生们窃窃私语的却是：“你最后一段是自己写的还是机器生成的？”一、AI写作工具：校园渗透有多深？自2023年底生成式AI爆发以来，ChatGPT、文心一言、通义千问等工具迅速在中国学生群体中风靡，甚至小红书上的“AI写作提示词”也备受追捧。其使用者不仅限于大学生，中学生群体中也日益普遍。《中国青年
【C++】note：指针老王Mr_Onion c++开发语言
宇宙免责声明：部分由ChatGPT编写，如有错误，私信请联系我，谢谢大部分资料来源：OI-wiki（oi-wiki.org）指针的定义在程序中，我们的数据都有其存储的地址。在程序每次的实际运行过程中，变量在物理内存中的存储位置不尽相同。地址也是数据。存放地址所用的变量类型有一个特殊的名字，叫做「指针变量」，有时也简称做「指针」pointer。指针的声明与使用C/C++中，指针变量的类型为类型名后加
大模型应用开发 | 通俗易懂解析什么是Function Call？大模型面微调_ 人工智能 LLM 大模型 Function Call ai 大模型应用开发
1、什么是FunctionCall？假设你有个超会聊天的智能助手（比如ChatGPT），它能陪你唠嗑、讲故事，但有一天你问它：“明天北京穿啥衣服合适？”这时候助手自己不知道实时天气，怎么办？FunctionCall就像助手掏出一个"外挂工具包"：它偷偷打电话给气象局的朋友（天气API），问清楚温度、降雨概率，再把信息整理成人话告诉你：“明天15℃，带件薄外套哦~”简单说：FunctionCall就
大语言模型提示工程全攻略：从零样本到 ReAct，一篇吃透冻感糕人~ 语言模型 react.js 人工智能大模型应用 langchain 大模型产品经理
提示词（Prompt）是与大语言模型沟通的关键。无论你是在用ChatGPT，还是开发LLM应用，只有写出清晰、高效的提示词，模型才能真正“听懂你在说什么”。提示工程（PromptEngineering）是一门设计高质量提示词的技巧与方法。通过巧妙地提示词设计，可以显著提升大语言模型的输出效果——让它回应得更准确、更连贯、更有创意，也更贴合你的实际需求。在这篇文章中，我将与你分享一些实用且经过验证的
生成式引擎优化（GEO）在文化、体育和娱乐业的应用深度研究 GEO优化助手生成式引擎优化 GEO优化 AI搜索优化人工智能 GEO优化搜索引擎生成式引擎优化
在生成式AI技术深度渗透的2025年，用户信息获取方式已发生根本性变革。据工信部数据显示，2024年中国AI搜索用户规模突破4.2亿，ChatGPT、DeepSeek等平台日均处理问答量超15亿次，其中62%的用户直接采纳AI生成的答案而不跳转链接。这种"答案即服务"（AnswerasaService）的模式，使得文化、体育和娱乐业的内容传播逻辑从"流量争夺"转向"认知渗透"。生成式引擎优化（GE
生成式引擎优化（GEO）在互联网服务行业的应用：从流量争夺到认知重构的范式革命 GEO优化助手生成式引擎优化 GEO优化 AI搜索优化重构人工智能生成式引擎优化 GEO优化搜索引擎
2025年的互联网服务行业正经历着前所未有的认知革命。传统搜索引擎通过链接列表提供答案的模式，正被生成式AI的"认知建构"能力彻底颠覆。当用户向ChatGPT询问"如何选择云服务器配置"时，AI不再返回10个链接，而是直接生成包含成本模型、性能对比、行业案例的结构化答案——这种交互方式的转变，使企业服务的信息传播从"被动展示"转向"主动构建认知"。生成式引擎优化（GenerativeEngineO
生成式引擎优化（GEO）：AI时代消费者行为变化的洞察与应对
生成式引擎优化（GEO）：AI时代消费者行为变化的洞察与应对引言：AI重构信息获取范式在人工智能技术突破性发展的背景下，生成式AI（如ChatGPT、DeepSeek、豆包等）正以每月新增数千万用户的规模重塑信息交互方式。中国消费者协会2025年调查显示，22.1%的消费者将AI智能产品视为未来一年最具潜力的服务消费热点，淘宝天猫平台AI智能设备成交量同比激增400%。这种变革催生了全新的搜索引擎
生成式引擎优化（GEO）：AI搜索改写在线可见性规则，传统搜索时代或将终结
生成式引擎优化（GEO）：AI搜索改写在线可见性规则，传统搜索时代或将终结一、GEO的核心机制与范式跃迁生成式引擎优化（GenerativeEngineOptimization,GEO）是AI搜索时代的新型内容优化策略，其本质是通过结构化数据、语义关联和权威性信号，提升品牌内容在生成式AI（如ChatGPT、DeepSeek、秘塔AI）答案中的引用优先级。与传统搜索引擎优化（SEO）相比，GEO实
Python调用OpenAI接口实现chatgpt 朱湃 chatgpt 人工智能
这几天一直在用chatgpt，发现确实很方便啊，很多代码chatgpt都能帮助你实现，而且报错chatgpt也能很精准的给你找出问题所在的地方，所以我今天也突发奇想的想试试能不能自己调用接口实现一下chatgpt，因此就有了下面的步骤。1.相关模块的下载我用的软件是pycharm。1.1既然想用openai首先肯定是要下载openai模块啦pipinstallopenai1.2接下来就是登录你的o
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

ChatGPT的背后原理：大模型、注意力机制、强化学习

大型语言模型

GPT和Self-Attention

ChatGPT

第1步：监督微调（SFT）模型

第2步：奖励模型

第3步：强化学习模型

模型的评估

推荐书单

《Python人工智能》

精彩回顾

你可能感兴趣的:(chatgpt)