PPO流程的个人疑问集锦 Q & A

文中大部分为GPT生成，并由我个人理解后添加了注解。

1. PPO Loss 和 Actor Loss 是一个东西吗?

个人理解：

上图中：

PPO-clip Loss指的是用了clip的Actor loss（含kl散度罚项），用来鼓励actor模型在不过度偏离ref模型以及old actor模型的前提下，对齐人类偏好；

LM Loss指的是（交叉）熵损失函数，用来促进actor生成更多样的输出；

MSE Loss指的是critic loss，用来促进critic的价值打分value更接近真实收益return（在不过度偏离old critic的前提下）。

但是实际上，一般：

我们用actor loss（已包含kl散度罚项）、critic loss、LM loss指代这三种loss

而ppo loss则是将这三个loss用超参数耦合起来

类似：

下面仅给出一般情况下的理解

一般来说：

Actor Loss

是指策略网络（Actor）的损失。
它的目标是：更新策略，使其获得更高的预期回报（expected return）。

PPO Loss

是Proximal Policy Optimization（PPO）算法设计的整体损失函数。
包括：
- Actor Loss（策略损失）
- Critic Loss（价值函数损失）
- （可选）Entropy Bonus（鼓励探索的项）

PPO 中的 Actor Loss 具体形式：

PPO 的 Actor Loss 有一个特殊设计，叫做 Clipped Objective，如下：

L^{\text{CLIP}}(\theta) = \mathbb{E}_t \left[ \min \left( r_t(\theta) \hat{A}_t,\ \text{clip}(r_t(\theta), 1 - \epsilon, 1 + \epsilon)\hat{A}_t \right) \right]

其中：

：新旧策略的概率比。
：优势函数（Advantage）。
：裁剪参数，防止策略变化太大。

这个裁剪形式就是 PPO 特有的 Actor Loss。

总结关系如下表：

	Actor Loss	PPO Loss
指代	策略网络的损失	PPO算法的总损失
是否包含Critic	❌	✅（通常包括 critic 和 entropy）
数学形式	常用 Clipped Objective	通常是：Actor Loss + Critic Loss + Entropy Bonus
是否特指 PPO	❌（其他算法也有）	✅（是PPO特有设计）

所以：

在 PPO 中，Actor Loss 是 PPO Loss 的一部分；
但在说 “Actor Loss” 时，我们通常只指“优化策略的那一部分”；
而 “PPO Loss” 是整个训练目标，包括策略、价值、熵等多项指标的加权和。

2. ref模型接受的输入究竟是什么？

ppo中，actor基于prompt生成response，以及response所选出的各token id对应的概率，也就是logprobs，

我们将prompt + response拼成一个完整序列送给ref进行前向（注意ref模型只做一次前向，而不是生成！），

然后获取actor生成的response中的各token id所对应的ref给出的概率，作为ref_logprobs，

进而与logprobs做kl散度计算来约束actor的更新。

在 PPO 中，actor 的 response 会和 prompt 拼接成一个完整的序列，送入 reference model（也就是 pre‑trained LM 或 SFT model，简称 ref）进行一次前向传播，用来获取每个 token 的 log-probabilities。这些就是所谓的 ref_logprobs。

流程总结：

拼接序列
把 prompt（环境状态）和 actor 生成的 response（模型行为）拼接成一整段文本序列。
丢给 reference model 前向计算
用这个完整序列在 ref 模型上前向计算，从而获得 response 部分每个 token 的概率（用 log-prob 表示）。

注意！

这里相当于用actor生成的response中的各token的token id，去索引ref做完前向之后对应位置上的token id所对应的概率！
记录 token log‑probabilities
得到的 log-probabilities 就是 ref_logprobs，对应 actor 输出的每个 token。
用于 KL 惩罚和计算 reward
PPO 的 reward 包括两个部分：一是 reward model 打分，二是 KL penalty —— 即 actor logprobs 与 ref logprobs 差值，防止偏离太远。

问题回答：

ref接收的输入就是prompt + actor生成的response；
ref_logprobs 就是 actor的response中的每个 token 在 reference 模型（freeze 后）前向计算得到的 log-prob。
这些值同时用于构造 KL penalty，也用在 PPO 的 reward 计算中。

3.PPO整个流程中，actor和critic以及old actor和old critic的更新顺序

个人理解：

在更小一层的PPO epochs循环中,我们更新了new Actor和new Critic，

然后当这个PPO epochs结束之后，我们立刻将new Actor的参数赋给了old Actor, 然后将new Critic的参数赋给了old Critic

（虽然实际上我们不会保存old actor和old critic的参数，因为太占空间了，事实上我们保存的是old模型的经验的快照，在ppo epochs中我们直接更新actor和critic！）

（此外critic其实没有新旧之说，我们仅保存大循环开始时critic对response的打分序列values，用这个values来clip后续critic的更新）

（具体见后续问题）

下面用清晰的步骤和小粒度对齐，说明 PPO 中 newActor、newCritic 和 oldActor（旧策略）之间的更新顺序与流程：

小循环 & 大循环中的更新逻辑：

大循环：多次 iterations（或 epochs）

每个 iteration 包括采样、更新等完整步骤。

（快照old模型）
小循环（单次 iteration 里的 PPO epochs）

使用同一批体验数据，进行多轮梯度更新。

（更新new模型，在ppo epochs全部跑完后将new模型赋给old模型）

每次 iteration 的完整流程细节：

采样阶段（Sampling）
使用当前策略 actor θₖ 与环境交互，收集 trajectories，并记录动作 log prob。这 log prob 即代表 “旧策略” 在采样时做出的判断。
计算 Advantage & Return
利用当前 critic φₖ （可以理解为old critic，实际上就是大循环开始时的critic模型）估计值value，以及reward的打分（含kl散度），

结合奖励信号计算 TD‑error 或 GAE→得出 Aₜ, Rₜ。
快照旧策略
将当前 actor θₖ 复制一份为 θ_old，此时就固定为旧策略，用于后续多个 PPO epoch 中计算比值 rₜ(medium.com)。
训练小循环（多个 PPO epochs）
对同一批数据，执行 K 个 epoch 的小批训练（batch）：
- Actor 更新（newActor θ）：计算 clipped surrogate loss，用 θ_old 的 log‑prob 比较当前策略，进行梯度上升。
- Critic 更新（newCritic φ）：用均方误差最小化 V_φ(sₜ) 与 Return 的差距，同步调整参数。
- 顺序：
  
  同一个 batch 上，多数实现是先 actor，再 critic 或者分开独立 optimize，
  
  但都是多轮使用相同 θ_old 的旧策略。
结束本次 iteration
当所有 epoch 完成：
- newActor 参数成为下一次 sampling 用的 actor θₖ₊₁；
- newCritic 参数更新日常评估值函数；
- θ_old 将在下次 iteration 的小循环中再次快照。

总结一句话：

在一个 iteration 内：

小循环中：不断更新 newActor 和 newCritic，但“旧策略 θ_old”保持不变；

小循环结束时：整个 newActor（和 newCritic）替代旧参数，成为下一轮 iteration 的 actor 和 critic。

回答问题：

“也就是说在更小一层的循环中,我们更新了newActor和newCritic, 然后当这个PPO epochs结束之后,我们立刻将newActor赋给了oldActor, 然后将newCritic赋给了oldCritic, 是这样吗？”

完全正确：

小循环（PPO epochs）中，oldActor 一直是之前快照的版本。
Epoch 结束后，newActor（更新完的 actor）就会替换 oldActor 为下一次 iteration 的快照。
Critic 没有“旧策略”之说，直接用 newCritic 更新。

4. old actor和old critic的权重需要保存吗？

个人理解：

实际上我们并没有保存Old Actor和Old Critic的权重,

而是我们将它们所生成的一些旧经验用快照冻结, 然后保存到了一个buffer里面,

然后我们在ppo Epochs里面持续更新原来的Actor和Critic。

许多 PPO 的实现并不保存完整的 oldActor、oldCritic 网络参数，

而是通过将旧策略生成的经验（如 log π_old）冻结并缓存到 buffer，

在多个 epoch 内反复使用这些旧经验来训练，不断更新原来的 Actor 和 Critic。

下面详细说明这种关键机制。

PPO 中对“旧策略”处理的两种方式：

最直观的做法：保存完整网络快照
- 在采样结束后，用 θ_old = θ_current 来保存旧策略参数。
- 多 epoch 中，仍旧使用这个完整快照网络来重新计算旧策略 log‑prob。
- 优点：回放使用的是实际的旧网络，确保一致性；
- 缺点：存储网络快照复杂，计算开销更大。
常见高效实现：只缓存旧策略的 log‑prob
- 在采样时，actor 输出时同时保存这个动作在当时策略下的 log π_old 到 buffer。
- 在多个 PPO epoch 中，无需再调用一个旧策略网络，
  
  只需从 buffer 中读取旧的 log π_old，
  
  并与当前策略生成的新 log π_new 作对比，计算比例：
  
  r _ t =exp(log π _{ new} (a _ t ∣s _ t )−log π _{ old} )
- 这就等效于“冻结旧策略”的效果，但效率更高。
  
  reddit 上也指出：
  
  “after collecting data using the old policy, we do k epochs update, so the policy in each epoch is the new policy compared to the old log probabilities saved in Replay Buffer”(reddit.com)
  
  即：用 buffer 冻结旧 log‑prob，更新时直接对比，不需要保存旧模型。

总结与对照表：

方法	是否存网络快照	使用旧策略方式	优点	缺点
快照网络	✅	每 epoch 调用旧模型	精准、逻辑清晰	存储和计算量大
缓存 log‑prob	❌	buffer 里读取旧 log‑prob	高效、简洁，常用	不保留网络状态，只保留行为统计

回答问题：

“我们并没有保存 OldActor 和 OldCritic 的权重，而是将旧经验快照冻结到 buffer，然后持续更新 Actor 和 Critic是吗？”

完全正确，且是 PPO 常见且推荐的实现方式。

5. ref、old actor、old critic、reward（重要）、new actor、new critic获得的输入和输出

详细、清晰地给出ref、old actor、old critic、reward、new actor、new critic获得的输入和输出

（其中你需要明确给出reward的输出相当于给非结尾的token不附加reward模型打分，给response结尾附加reward模型打分，但是response每个token位置都有加入kl散度约束来作为该token的reward的一部分）

本问题的重点在于reward模型的输出究竟是一个序列还是一个标量）

个人理解：

reward模型接收prompt + response作为输入，

然后我们给response处的各token打分，

在这里我们要求reward模型给response非结尾处的token都打0分（无reward奖励），

只给response结尾处附上一个整体的reward打分。

实际上reward模型是可以做到逐token打分的，这里只是只取最后一个token生成的打分值（也就是对应整体的打分）而已！

这样，目前的rewards其实相当于一个[0, 0, ..., reward_score]的序列。

然后我们为rewards加上actor和ref模型之间的kl散度，

这样就得到了我们最终期望的rewards序列（也就是获得了response中每个token对应的reward打分）。

这样的设计公式如下：

"select * from blocks where id='20250624002126-0jv0w6s'"

目的是：

当时，我们更加关心Actor是否有在Ref的约束下生产token

当时，我们不仅关心Actor是否遵从了Ref的约束，也关心真正的即时收益

具体详见：（3）重新设计 R_{t}

以下是基于标准 RLHF + PPO 实现（以 TRL PPOTrainer 为例）的详细流程图，说明每个模型：reference model（ref）、old actor、old critic、reward model、new actor、new critic 在训练中的输入与输出，以及如何将 KL 散度约束与 reward 模型评分融入 token‑级别的 reward：

一、采集阶段（Rollout）：

模块	输入	输出
old actor（即当前策略）	Prompt（x）	Response tokens y = (y₁…yᴺ)，及其 log‑probs π_old(yₜ
reward model	Prompt+Response 完整序列 (x,y)	reward_score = r(x,y)（一个 scalar，仅在整个 response 结尾计算一次）

reward_score 只在 yᴺ（结尾 token）处被添加！！！
之前的每个 token t < N 暂无 reward 模型直接评分！！！

二、风控与评价阶段（Ref 前向 & Critic）：

reference model（ref）
- 输入：相同的 (x, y)
- 输出：每个生成 token 的 log‑probs π_ref(yₜ|x, y_
- 用于计算 KL penalty，防止策略偏离原始语言模型(newfacade.github.io, en.wikipedia.org)。
old critic（value/value head）
- 输入：prompt + response 序列（x, y）
- 输出：每个 time‑step 的估值 V_old(x, y_
  
  此处下标小于t的解释详见：7. 为什么PPO 中，critic 的输入使用的是当前时刻之前的上下文 (x, y_{

三、构造 token‑级 rewards + advantage：（重要）

对每个 token t：

reward from reward model：
- 如果 t = N（response 结尾），r_t = reward_score。
- 否则，r_t = 0。
KL penalty（每个 token 都计算）：
- klₜ = log π_old(yₜ) − log π_ref(yₜ)

综合 token reward：

随后使用 gamma 折扣累计至各步，得到 return-to-go R̂ₜ。

再计算优势：

Aₜ = R̂ₜ − V_old(x, y_

四、PPO 更新阶段：

在一个批次内，使用下面步骤更新 actor 和 critic：

新 actor（new policy π_new）
- 输入：相同 prompt，生成整个 batch 的 y 并记录新 log‑probs π_new(yₜ)
- 使用 PPO-clip 目标函数更新：
  
  其中 (en.wikipedia.org)。
新 critic（new value V_new）
- 输入：prompt+response
- 输出：预测 V_new(x, y_
- 最小化目标：均方误差：

流程总结图：

prompt x
 ├─▶ old actor ─▶ response y, actor log‑probs

拼接完整序列 (x,y)
 ├─▶ reward model ─▶ reward_score at token N
 ├─▶ reference model ─▶ ref log‑probs for every token

每个 token 的生成上下文 (x,y_{

 
  总结要点： 
   
   Reference model：只做一次前向，输出 ref log‑probs（不会生成文本）。 
   Reward model：只对整个 response 结尾打分。 
   KL constraint：对每个 token 施加 log‑prob 差值惩罚。 
   Critic：为每个 time‑step 提供 baseline 估值用于优势计算。 
   Actor 更新：结合 token‑级 KL 惩罚和结尾的 reward 模型评分，通过 PPO clip 优化策略。 
   
   
  6. 给出清晰明确分层的ppo流程 
  以下是一个层级清晰、结构明确的 RLHF + PPO 流程，帮助梳理每个阶段各模型的输入输出及它们之间的关系： 
  第 1 层：数据采集（Rollout） 
  目的：使用旧策略生成回应并打标签。 
   
    输入：Prompt
  
    模型：旧 actor（） 
     
     功能：采样响应 
     输出：sequence of tokens ，及对应 log-probs 
    
  
    模型：奖励模型（Reward model） 
     
     输入：拼接完整序列 
     输出：一组标量 reward score ，仅在 结束时提供一次 
    
  
   
   
  第 2 层：评价与打分 
  目的：为每个 token 打分 —— 引入 KL 惩罚及计算 critic 的 baseline。 
   
    模型：Reference model（冻结 LM） 
     
     输入：完整序列 
     输出：每个生成 token 的 log-probs 
    
  
    模型：旧 critic（Value model） 
     
      输入：每个 token 的生成上下文 
       
       此处下标小于t的解释详见：7. 为什么PPO 中，critic 的输入使用的是当前时刻之前的上下文 (x, y_{ 
      
  
      输出：每个 time‑step 的状态价值估计
  
    
  
   
   
  第 3 层：构造 Token‑级 Reward & Advantage 
  目的：根据模型输出构建 token‑级 reward，并计算 advantage。 
   
    KL 惩罚（每个 token）：
 
  
    Reward 分配： 
     
     对所有 ，
  
     对结尾 token ，
  
    
  
    累积折扣收益（Return-to-go）：
 
  
    优势估计（Aₜ）：
 
  
   
   
  第 4 层：PPO 更新（Actor 和 Critic） 
  目的：依据 PPO 的目标函数更新策略与价值网络。 
   
    新 actor（） 
     
      输入：原 batch 的 prompt 序列
  
      输出：新 log-probs
  
      损失函数（PPO-Clip + KL penalty）：
 L_{\text{actor}} = \mathbb{E}_t \left[ \min \Big( r_t A_t,\; \text{clip}(r_t,1-\epsilon,1+\epsilon) A_t \Big) \right] - \beta\,\mathbb{E}_t[\text{kl}_t]
 其中
  
    
  
    新 critic（） 
     
     输入：prompt + past tokens 
     输出：每 step 的新值估计 
     损失：
  
    
  
   
   
  小结： 
   
   层级划分：Rollout → 评价打分 → 构造 reward → PPO 更新； 
   Token 级 Reward：每个位置都有 KL 惩罚；结尾 token 额外加 reward model 评分； 
   Actor & Critic：并行训练，actor 用 PPO clip + KL penalty，critic 用 MSE fitting return。 
   
   
  7. 为什么PPO 中，critic 的输入使用的是当前时刻之前的上下文 (x, y_{ 
   
   
   
   个人理解： 
   如图中所示也可以看出，其实左边的value模型接收的输入是t时刻的状态，但是实际上一共有1~T个时刻！ 
   所以我们可以理解为，这样写是要求value模型必须是一个causal因果模型， 
   value只能依赖当前状态（prompt + 已生成的可见的前文）去给当前状态打分，而不能看到未来的信息！因为它的任务是预估未来的信息。 
   但是在实际操作中，我们已经获得了prompt + actor给出的完整response， 
   因此我们在操作上，就是将整个序列塞给value作为输入！ 
   不过我们又做了一个causal mask + teacher forcing的事情来让value打分。 
   其中： 
    
    causal mask是指，对于T长度的response，我们逐token打分，且当前token只能看到之前的tokens 
    teacher forcing是指，对于T长度的response，我们的输出不会影响输入（也就是说不是自回归的），我们只是一个一个token去给response中的所有token位置（状态）打分！从而获得一个values序列。 
    
   
  在 PPO 中，critic 的输入使用的是当前时刻之前的上下文 (x, y_ 
  
为什么是 y_ 
  
 
   模拟马尔可夫状态（Markov State）
 在 RL 中，每个 time-step 的状态表示环境当前状况，即当前所见的历史信息。在文本生成中，step 的状态是 prompt 和已经生成的 tokens ，即 (x, y_ 
   
时间一致性
 critic 的目标是预测从这个状态开始，到未来所有奖励的期望值 。如果 critic 知道了后续 token（甚至结尾 token），它就“偷看未来”了，估值会过高，违反 causal consistency。 
   符合 Advantage/Gare 等估计机制
 critic 项用来计算优势 。这里的 应严格基于 当前时刻可见的上下文，这样 才是合理的差值(ar5iv.labs.arxiv.org)。 
   
  总结： 
   
   状态设计：每个 token 对应一个状态，stateₜ = (prompt, 已生成 tokens) 
   critic 输入： 
   critic 图片：是未来回报的估计，不包含未来信息，保证模型的泛化能力和训练稳定性 
   
  批量对 prompt+付出的每个位置 y_ 
  
 
  8. 在ppo实际操作中如何实现critic 的输入仅使用当前时刻之前的上下文 (x, y_{ 
   
   再po一次第七个问题的个人理解： 
   个人理解： 
   如图中所示也可以看出，其实左边的value模型接收的输入是t时刻的状态，但是实际上一共有1~T个时刻！ 
   所以我们可以理解为，这样写是要求value模型必须是一个causal因果模型， 
   value只能依赖当前状态（prompt + 已生成的可见的前文）去给当前状态打分，而不能看到未来的信息！因为它的任务是预估未来的信息。 
   但是在实际操作中，我们已经获得了prompt + actor给出的完整response， 
   因此我们在操作上，就是将整个序列塞给value作为输入！ 
   不过我们又做了一个causal mask + teacher forcing的事情来让value打分。 
   其中： 
    
    causal mask是指，对于T长度的response，我们逐token打分，且当前token只能看到之前的tokens 
    teacher forcing是指，对于T长度的response，我们的输出不会影响输入（也就是说不是自回归的），我们只是一个一个token去给response中的所有token位置（状态）打分！从而获得一个values序列。 
    
   
   
   问题： 
   但是我们不是一次性生成了所有prompt + response的吗？所以具体critic只用y_ 
   
  是的，你的理解完全正确 ——在 PPO 中，新旧 critic 的输入方式可以通过 teacher forcing + causal mask 实现，只看历史 tokens 而不泄露未来信息。 
   
  为什么只用 而不包括 ？ 
   
   因果一致性（Causality）：critic 的目标是预测当前状态下（即 step t 时，已生成的上下文 = prompt + ）的价值 ，不应看到未来的对话内容。 
   避免“偷看”信息：如果 critic 知道后续 tokens，它就会过度拟合，无法正确估值，会导致优势计算不准确。 
   
   
  实现方式：只需一次前向，使用 teacher forcing + causal mask 
   
    因为你在 rollout 阶段已经生成了整个响应 sequence ，所以 critic 只要： 
     
     以输入序列 [x, y_1, …, y_{t-1}, y_t] 前向，并 
     用 causal mask 来确保当前 step 的预测不看未来 tokens，就等于在每个 t 步输入了 (x, y_{ 
    
  
    这就是典型的 teacher forcing。不需要手动循环 t，只需一个 batch forward + causal mask，即可获得所有 time-step 的 value 输出。
  
   
   
  小结： 
   
   输入：完整序列 [x, y_1…y_N] 
   注意力机制：decoder 使用 causal mask，确保 step t 只能看到 <= t 步输入 
   输出：critic 在每个 position t 输出 ，即合理的价值估计 
   
  TRL/PPOTrainer 就是这样在一次 batch 数据前向中完成多时刻的 critic 估值的，无需显式循环，非常高效。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
程翔授《评价一篇记叙文》行吟斯基
桂林十一中高一2中学生自读程老师学生文章板书课题师巡看。看完举手。问：它是记叙文。不商量。独立打分。学生评价打分。师：高低都正常，不受干扰。师巡，略评。打完举手。调查：分层次举手——高分先举手。最低分。最高95分。最低45分。女：差距太大！师：同一篇，相差55分。若是你的文章，愿落谁手？男：身临其境感觉。师：你有此经历？没也没关系。女：不优美……，结尾无升华……无感悟……师：辞藻不美？(师追问)男
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
自律打卡第四天：比昨天进步一点点花儿的念想
今天新闻我们县城又确诊了一例，截止目前已经确诊的三例了，打开，看了一篇简友写的武汉的真实情况，有病住不了院，还没等到床位已经去世的消息，心里更加的难受，武汉尚且这样，如果是我们这没有高速没有火车的十八线的小县城发生这种情况，那情况将是更加的不堪设想，不敢想，唯有祈求灾难早点快去，平安才是最大的福气。突然觉得我的自律打卡，比昨天进步一点点。更希望疫情战争每一天都要比昨天好一点，希望一觉醒来听到的是好
15个小技巧，让我的Windows电脑更好用了！曹元_
01.桌面及文档处理第一部分的技巧，主要是围绕桌面的一些基本操作，包括主题设置、常用文档文件快捷打开的多种方式等等。主题换色默认情况下，我们的Win界面可能就是白色的文档界面，天蓝色的图表背景，说不出哪里不好看，但是就是觉得不够高级。imageimage说到高级感，本能第一反应就会和暗色模式联想起来，如果我们将整个界面换成黑夜模式的话，它会是这样的。imageimage更改主题颜色及暗色模式，我们
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
月光下的罪恶（5）允歌玖沐
5.被孤立顾纨是转校过来的，进入学校后，回头率很高“诶诶诶，你看那女生，哪个系的？”“不知道没见过。”“看那样，一看就是个胆小的货。”顾纨当做没听到，更狠的话她都听过，更何况女生们耍心眼？“他爸爸是做黑生意的，估计女儿也不是什么好的，你以后离他一家子远点。”她走向自己要上课的教室，一进门，所有人的目光看向她，顾纨若无其事的走进教室，开始上课。下课，一群人站起来，但是很显然，她周围的一圈人都不愿意和
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
贝多芬诞辰250周年纪念万千星河赴远方
就算不是古典音乐爱好者，你也一定听说过贝多芬。作为古典音乐史上最伟大的音乐家之一，他不仅是古典主义风格的集大成者，同时也是浪漫主义风格的开创者。贝多芬肖像画（1813年）贝多芬的一生共创作了9部交响曲、36首钢琴奏鸣曲、10部小提琴奏鸣曲、16首弦乐四重奏、1部歌剧及2部弥撒曲等等。数量虽然不及前辈海顿、莫扎特多，但他几乎改造了当时所有的音乐表达形式，赋予了它们全新的价值，对后世音乐的发展产生了极
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
25-1-2019 树藤与海岛呢
hello八月来报道了今天看到了一篇文章就只想记下那两句话：良田千顷不过一日三餐广夏万间只睡卧榻三尺大概的意思就是要珍惜当下不要等来不及的时候才珍惜分享今天的两餐最近没有时间运动呢下个月补回好了说完了哈哈goodnight图片发自App图片发自App
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
力扣热题100-------54. 螺旋矩阵海航Java之路力扣 leetcode 矩阵 java
给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]示例2：输入：matrix=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出：[1,2,3,4,8,12,11,10,9,5,6,7]提示：m==matrix.lengthn
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
SpringMVC执行流程（原理），通俗易懂国服冰 SpringMVC spring mvc
SpringMVC执行流程（原理），通俗易懂一、图解SpringMVC流程二、进一步理解Springmvc的执行流程1、导入依赖2、建立展示的视图3、web.xml4、spring配置文件springmvc-servlet5、Controller6、tomcat配置7、访问的url8、视图页面一、图解SpringMVC流程图为SpringMVC的一个较完整的流程图，实线表示SpringMVC框架提
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
现在发挥你的优势爱生活的佑嘉
来和我做咨询的一些朋友，涉及到定位的，都会说，我不知道我的优势是什么，你能不能帮我看看？还有一些朋友，喜欢做各种测试来了解自己，测试过后，然并卵。今天，我想来聊聊优势，如何能了解自己的优势是什么。首先，我们要知道，如果要成为“不一般”的人，我们所做的事情，就要基于自身的优势。我做管理者十多年，看到每个员工都有不同的特长，有的擅长数字，有的擅长人际，有的擅长写作。这些知道自己优势并且在这方面刻意练习
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
48. 旋转图像 - 力扣（LeetCode） Fiee-77 #数组 leetcode 算法 python 数据结构数组
题目：给定一个n×n的二维矩阵matrix表示一个图像。请你将图像顺时针旋转90度。你必须在原地旋转图像，这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[[7,4,1],[8,5,2],[9,6,3]]示例2：输入：matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s