二分掌柜的

vLLM - 控制生成过程中返回对数概率信息 logprobs的输出和解释

flyfish

在 vLLM 的代码中，logprobs 是一个控制生成过程中返回对数概率信息的参数。它决定了模型在生成每个 token 时，会返回多少个候选 token 的概率分布信息。以下是详细解释：

`logprobs` 参数的作用

在 SamplingParams 中设置 logprobs=k 时：

模型会返回每个生成 token 的对数概率（即模型选择该 token 的自信程度）。
同时返回概率最高的 k 个候选 token 的 ID、文本和对数概率。
实际返回的候选数量可能是 k+1（包含选中的 token 本身）。

sampling_params = SamplingParams(
    logprobs=5,  # 返回选中 token 和 top-4 候选的对数概率
    # 其他参数...
)
代码
```py
from transformers import AutoProcessor
from vllm import LLM, SamplingParams
from qwen_vl_utils import process_vision_info
import os

MODEL_PATH = "Qwen/Qwen2.5-VL-7B-Instruct"
# 本地图像路径，请替换为实际图像路径
image_path = "path_to_your_image.jpg"

llm = LLM(
    model=MODEL_PATH,
    limit_mm_per_prompt={"image": 10, "video": 10},
)

# 启用logprobs功能，设置为5表示返回选中token和top4候选token的对数概率
sampling_params = SamplingParams(
    temperature=0.7,
    top_p=0.9,
    n=1,                # 只生成1个序列，专注于logprobs分析
    max_tokens=256,
    logprobs=5,         # 返回每个token的对数概率及top4候选
    repetition_penalty=1.05,
)



if not os.path.exists(image_path):
    raise FileNotFoundError(f"图像文件不存在: {image_path}")

image_messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": image_path,
                "min_pixels": 224 * 224,
                "max_pixels": 1280 * 1280,
            },
            {"type": "text", "text": "What is in this image?"},
        ],
    },
]

messages = image_messages

processor = AutoProcessor.from_pretrained(MODEL_PATH)
prompt = processor.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
)
image_inputs, video_inputs = process_vision_info(messages)

mm_data = {}
if image_inputs is not None:
    mm_data["image"] = image_inputs
if video_inputs is not None:
    mm_data["video"] = video_inputs

llm_inputs = {
    "prompt": prompt,
    "multi_modal_data": mm_data,
}

# 生成结果
outputs = llm.generate([llm_inputs], sampling_params=sampling_params)
# 获取第一个生成序列的logprobs信息
output = outputs[0].outputs[0]
print("生成的文本:")
print(output.text.strip())

# 解析并打印token_ids和logprobs信息
if output.logprobs is not None:
    print("\n=== Token IDs 和 Logprobs 详细信息 ===")
    
    # 确保token_ids和logprobs长度匹配
    token_count = min(len(output.token_ids), len(output.logprobs))
    
    for i in range(token_count):
        token_id = output.token_ids[i]
        token_text = processor.tokenizer.decode([token_id])
        logprob_info = output.logprobs[i]
        
        print(f"\nToken {i+1}:")
        print(f"  Token ID: {token_id}")
        print(f"  Token 文本: {token_text}")
        
        # 打印原始logprobs字典结构（用于调试）
        print("  Logprobs 原始数据:")
        print(logprob_info)
else:
    print("\n警告: 未获取到logprobs信息，请确认模型和vllm版本支持此功能")

输出

生成的文本:
The image depicts a vintage green truck parked on a dirt path surrounded by a lush, forested area with tall trees and mountains in the background. On top of the truck, there is a praying mantis perched on the hood. The scene has a serene, nature-inspired atmosphere, and there are red seals with Chinese characters in the top right corner, adding an artistic or cultural element to the illustration.

=== Token IDs 和 Logprobs 详细信息 ===

Token 1:
  Token ID: 785
  Token 文本: The
  Logprobs 原始数据:
{785: Logprob(logprob=-0.20143340528011322, rank=1, decoded_token='The'), 1986: 
Logprob(logprob=-1.7014334201812744, rank=2, decoded_token='This'), 641: 
Logprob(logprob=-10.826433181762695, rank=3, decoded_token='In'), 2132: 
Logprob(logprob=-16.201433181762695, rank=4, decoded_token='It'), 8420: 
Logprob(logprob=-17.701433181762695, rank=5, decoded_token='Here')}


Token 2:
  Token ID: 2168
  Token 文本:  image
  Logprobs 原始数据:
{2168: Logprob(logprob=0.0, rank=1, decoded_token='Ġimage'), 6802: 
Logprob(logprob=-17.125, rank=2, decoded_token='Ġpicture'), 107553:
 Logprob(logprob=-18.625, rank=3, decoded_token='åĽ¾åĥı'), 4654: 
 Logprob(logprob=-18.625, rank=4, decoded_token='ĠImage'), 1805: 
 Logprob(logprob=-19.375, rank=5, decoded_token='image')}

Token 3:
  Token ID: 61891
  Token 文本:  depicts
  Logprobs 原始数据:
{61891: Logprob(logprob=-0.055077165365219116, rank=1, decoded_token='Ġdepicts'), 374: 
Logprob(logprob=-3.055077075958252, rank=2, decoded_token='Ġis'), 4933: 
Logprob(logprob=-5.680077075958252, rank=3, decoded_token='Ġshows'), 4419: 
Logprob(logprob=-6.305077075958252, rank=4, decoded_token='Ġfeatures'), 7952: 
Logprob(logprob=-7.305077075958252, rank=5, decoded_token='Ġappears')}

Token 4:
  Token ID: 264
  Token 文本:  a
  Logprobs 原始数据:
{264: Logprob(logprob=-0.06197008118033409, rank=1, decoded_token='Ġa'), 458: 
Logprob(logprob=-2.8119699954986572, rank=2, decoded_token='Ġan'), 1378: 
Logprob(logprob=-13.436969757080078, rank=3, decoded_token='Ġtwo'), 279: 
Logprob(logprob=-14.811969757080078, rank=4, decoded_token='Ġthe'), 23790: 
Logprob(logprob=-16.311969757080078, rank=5, decoded_token='Ġvintage')}


Token 5:
  Token ID: 23790
  Token 文本:  vintage
  Logprobs 原始数据:
{23790: Logprob(logprob=-0.960280179977417, rank=1, decoded_token='Ġvintage'), 6176: 
Logprob(logprob=-1.710280179977417, rank=2, decoded_token='Ġgreen'), 94763: 
Logprob(logprob=-1.835280179977417, rank=3, decoded_token='Ġserene'), 32976: 
Logprob(logprob=-2.585280179977417, rank=4, decoded_token='Ġvibrant'), 69105: 
Logprob(logprob=-3.335280179977417, rank=5, decoded_token='Ġwhims')}

。。。。。。

理解模型决策过程

数据结构解析

每个token的输出包含以下核心信息：

1. 选中的token信息

Token 1:
  Token ID: 785        # 模型实际选择的token在词汇表中的唯一ID
  Token 文本: The       # 该ID对应的文本内容

2. 概率分布信息（Logprobs 原始数据）

这是一个字典，键为token ID，值为该token的详细概率信息：

{
  785: Logprob(logprob=-0.20143340528011322, rank=1, decoded_token='The'),
  1986: Logprob(logprob=-1.7014334201812744, rank=2, decoded_token='This'),
  ...
}

logprob：对数概率（log probability），值越小表示概率越低。例如：
- -0.2014 对应的概率约为 exp(-0.2014) ≈ 0.818（即81.8%）
- -1.7014 对应的概率约为 exp(-1.7014) ≈ 0.183（即18.3%）
rank：该token在概率分布中的排名（1表示最可能）
decoded_token：token ID对应的文本表示

关键指标解读

1. 模型置信度

观察选中token的对数概率：

接近0的值（如 -0.2）表示模型非常确定
绝对值较大的负值（如 -10）表示模型对该选择信心很低

例如，Token 1中：

选中的 The 的 logprob=-0.2014（高概率，模型很确定）
排名第二的 This 的 logprob=-1.7014（低概率）

2. 竞争候选词

查看排名靠前的其他候选token，可以了解模型在生成时的"犹豫程度"：

Token 2中，模型在 image（ID:2168）和 picture（ID:6802）之间选择，两者的logprob差距较大（0 vs -17.125），说明模型对 image 的选择非常确定。

3. 异常token检测

注意概率分布中的异常token，例如：

Token 2中的 åĽ¾åĥı（ID:107553）是乱码，不知道是不是词汇表中的特殊符号或未正确解码的字符，没关系这种低概率的异常token通常可以忽略。

实际应用建议

评估生成质量：
- 高logprob（接近0）的token表示模型生成质量较好
- 若连续多个token的logprob很低（如<-5），可能需要调整模型或提示
优化提示工程：
- 如果模型对关键token的logprob较低，可以通过修改提示来引导模型
- 例如，在视觉问答中，明确要求"用一个词描述图像中的物体"可能提高确定性
后处理过滤：
- 对于生成任务，可以设置logprob阈值，丢弃置信度过低的结果
- 例如，当选中token的logprob < -5时，认为生成质量不可靠

示例分析

Token 1

模型以81.8%的概率选择了 The
第二候选 This 的概率为18.3%
模型在这两个词之间有一定"犹豫"，但 The 明显更可能

Token 2

模型几乎完全确定地选择了 image（概率接近100%）
其他候选词的概率极低，说明模型对这个选择非常自信

分词器对句首位置的处理逻辑

核心原因：句首词前无空格

在自然语言中，句子的第一个词前面没有空格，因此分词器不会为其添加 Ġ（空格标记）。

Token 1 是生成文本的第一个词 The，作为句首词，其前没有空格，因此分词器直接输出 The。
Token 2 是后续词 image，其前有空格（文本为 The image），因此分词器用 Ġimage 表示“空格+image”。

分词器的空格标记逻辑

1. `Ġ` 的作用范围

Ġ 仅用于表示 词与词之间的空格（即词首空格），不用于句首。
例如：
- 文本 "The image" 会被分词为 ["The", "Ġimage"]（句首词无 Ġ，后续词有 Ġ）。
- 文本 " image"（开头有空格）会被分词为 ["Ġimage"]。

2. 你的输出示例解析

# Token 1（句首词）
decoded_token='The'  # 无前缀空格，正常
# Token 2（后续词）
decoded_token='Ġimage'  # 表示前有空格，对应文本中的 " image"

模型生成的完整文本可能是 The image，其中 The 是句首词，image 前有空格，因此分词器分别处理为 The 和 Ġimage。

第二个 token 有 `Ġ`

假设生成的文本是 The image，其分词过程如下：

文本拆分："The" + " " + "image"
分词器处理：
- "The" → 直接编码为 token ID 785（无 Ġ，因是句首）。
- " image" → 空格转换为 Ġ，与 image 合并为 Ġimage，编码为 token ID 2168。

若文本开头没有多余空格，说明模型正确生成了句首词。
Ġ 是分词器的内部表示，在最终解码的文本中会被自动转换为真实空格。

`Ġ` 的出现

场景	分词结果示例	说明
句首词	`The`	无 `Ġ`，因前方无空格
非句首词（有前置空格）	`Ġimage`	`Ġ` 表示前方有空格
连续空格	`ĠĠhello`	多个 `Ġ` 表示连续空格

对数概率（log probability）和自然指数函数的转换

1. 对数概率基础

在概率论中，对数概率（log probability）是指对概率值取自然对数（即以 e 为底的对数，记为 ln）。例如：

概率 p = 0.5 对应的对数概率为 ln(0.5) ≈ -0.693
概率 p = 0.1 对应的对数概率为 ln(0.1) ≈ -2.303

为什么用对数概率？

概率值通常在 [0, 1] 之间，而对数概率可以将其映射到整个实数轴 (-∞, 0]，便于数值计算和比较。
对数概率越小（即绝对值越大），表示对应的原始概率越低。

2. 从对数概率还原原始概率

如果已知对数概率 log_p，可以通过 自然指数函数 exp() 还原原始概率 p：

p = exp(log_p)

其中 exp(x) 表示 e 的 x 次幂（e ≈ 2.71828）。

3. 具体计算示例

示例1：log_p = -0.2014

import math

log_p = -0.2014
p = math.exp(log_p)  # 计算 e^(-0.2014)
print(f"概率: {p:.4f} ({p:.2%})")

计算过程：e^(-0.2014) ≈ 0.8177（四舍五入为 0.818，即 81.8%）。

示例2：log_p = -1.7014

log_p = -1.7014
p = math.exp(log_p)
print(f"概率: {p:.4f} ({p:.2%})")

计算过程：e^(-1.7014) ≈ 0.1826（四舍五入为 0.183，即 18.3%）。

4. 直观理解

对数概率 (log_p)	原始概率 (p = exp(log_p))	解释
0	exp(0) = 1.0	确定性事件（概率100%）
-0.5	exp(-0.5) ≈ 0.607	约60.7%的概率
-1.0	exp(-1.0) ≈ 0.368	约36.8%的概率
-2.0	exp(-2.0) ≈ 0.135	约13.5%的概率
-10.0	exp(-10.0) ≈ 0.000045	极小概率（约0.0045%）

5. 应用

在模型生成的 logprobs 数据中：

logprob=-0.2014 表示模型对该 token 的置信度很高（约 81.8% 的概率）。
logprob=-1.7014 表示其他候选 token 的概率较低（约 18.3%）。

代码

from transformers import AutoProcessor
from vllm import LLM, SamplingParams
from qwen_vl_utils import process_vision_info
import os
import math
MODEL_PATH = "Qwen/Qwen2.5-VL-7B-Instruct"
# 本地图像路径，请替换为实际图像路径
image_path = "path_to_your_image.jpg"





llm = LLM(
    model=MODEL_PATH,
    limit_mm_per_prompt={"image": 10, "video": 10},
)

# 启用logprobs功能，设置为5表示返回选中token和top4候选token的对数概率
sampling_params = SamplingParams(
    temperature=0.7,
    top_p=0.9,
    n=1,                # 只生成1个序列，专注于logprobs分析
    max_tokens=256,
    logprobs=5,         # 返回每个token的对数概率及top4候选
    repetition_penalty=1.05,
)



if not os.path.exists(image_path):
    raise FileNotFoundError(f"图像文件不存在: {image_path}")

image_messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": image_path,
                "min_pixels": 224 * 224,
                "max_pixels": 1280 * 1280,
            },
            {"type": "text", "text": "What is in this image?"},
        ],
    },
]

messages = image_messages

processor = AutoProcessor.from_pretrained(MODEL_PATH)
prompt = processor.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
)
image_inputs, video_inputs = process_vision_info(messages)

mm_data = {}
if image_inputs is not None:
    mm_data["image"] = image_inputs
if video_inputs is not None:
    mm_data["video"] = video_inputs

llm_inputs = {
    "prompt": prompt,
    "multi_modal_data": mm_data,
}

# 生成结果
outputs = llm.generate([llm_inputs], sampling_params=sampling_params)
# 获取第一个生成序列的logprobs信息
output = outputs[0].outputs[0]
print("生成的文本:")
print(output.text.strip())


if output.logprobs is not None:
    print("\n=== Token IDs 和 Logprobs 详细信息 ===")
    token_count = min(len(output.token_ids), len(output.logprobs))
    
    for i in range(token_count):
        token_id = output.token_ids[i]
        token_text = processor.tokenizer.decode([token_id])
        logprob_info = output.logprobs[i]
        
        print(f"\nToken {i+1}:")
        print(f"  Token ID: {token_id}")
        print(f"  Token 文本: {token_text}")
        
        # 解析选中token的概率
        selected_logprob = None
        selected_prob = None
        if token_id in logprob_info:
            selected_logprob = logprob_info[token_id].logprob
            selected_prob = math.exp(selected_logprob)
            print(f"  选中概率: {selected_prob:.4%}")
        
        # 解析top-k候选
        print("  Top-k候选:")
        sorted_candidates = sorted(
            logprob_info.items(), 
            key=lambda x: x[1].rank if hasattr(x[1], 'rank') else 0
        )
        for j, (candidate_id, candidate_info) in enumerate(sorted_candidates[:5]):
            candidate_text = processor.tokenizer.decode([candidate_id])
            candidate_logprob = candidate_info.logprob
            candidate_prob = math.exp(candidate_logprob)
            is_selected = candidate_id == token_id
            print(f"    {j+1}. {'*' if is_selected else ''} Token ID: {candidate_id}, 文本: {candidate_text}, 对数概率: {candidate_logprob:.4f}, 概率: {candidate_prob:.4%}")

输出

生成的文本:
The image depicts a vintage green truck parked on a dirt path in a lush, forested area with mountains in the background. The truck has a classic design with a large front grille and round headlights. On top of the truck, there is a praying mantis perched. The scene is serene and natural, with trees, rocks, and wildflowers surrounding the vehicle. There is also a red stamp with Chinese characters in the upper right corner of the image.

=== Token IDs 和 Logprobs 详细信息 ===

Token 1:
  Token ID: 785
  Token 文本: The
  选中概率: 81.7558%
  Top-k候选:
    1. * Token ID: 785, 文本: The, 对数概率: -0.2014, 概率: 81.7558%
    2.  Token ID: 1986, 文本: This, 对数概率: -1.7014, 概率: 18.2422%
    3.  Token ID: 641, 文本: In, 对数概率: -10.8264, 概率: 0.0020%
    4.  Token ID: 2132, 文本: It, 对数概率: -16.2014, 概率: 0.0000%
    5.  Token ID: 8420, 文本: Here, 对数概率: -17.7014, 概率: 0.0000%

Token 2:
  Token ID: 2168
  Token 文本:  image
  选中概率: 100.0000%
  Top-k候选:
    1. * Token ID: 2168, 文本:  image, 对数概率: 0.0000, 概率: 100.0000%
    2.  Token ID: 6802, 文本:  picture, 对数概率: -17.1250, 概率: 0.0000%
    3.  Token ID: 107553, 文本: 图像, 对数概率: -18.6250, 概率: 0.0000%
    4.  Token ID: 4654, 文本:  Image, 对数概率: -18.6250, 概率: 0.0000%
    5.  Token ID: 1805, 文本: image, 对数概率: -19.3750, 概率: 0.0000%

Token 3:
  Token ID: 61891
  Token 文本:  depicts
  选中概率: 94.6412%
  Top-k候选:
    1. * Token ID: 61891, 文本:  depicts, 对数概率: -0.0551, 概率: 94.6412%
    2.  Token ID: 374, 文本:  is, 对数概率: -3.0551, 概率: 4.7119%
    3.  Token ID: 4933, 文本:  shows, 对数概率: -5.6801, 概率: 0.3413%
    4.  Token ID: 4419, 文本:  features, 对数概率: -6.3051, 概率: 0.1827%
    5.  Token ID: 7952, 文本:  appears, 对数概率: -7.3051, 概率: 0.0672%

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
大模型量化终极对决：FP8 vs AWQ INT4，谁才是性能与精度的王者？曦紫沐大模型人工智能大模型量化 FP8 AWQ_INT4
摘要在大模型部署与优化中，量化技术是突破性能瓶颈的关键。FP8量化与AWQINT4量化作为当前主流方案，分别以“高精度”和“极致压缩”为核心优势。本文通过表格对比二者的数据格式、精度损失、硬件依赖及适用场景，助您在不同需求下精准选择最优方案。一、数据格式：浮点与整数的底层差异FP8量化采用浮点数（FP8），包含E4M3（4位阶码+3位尾数）和E5M2（5位阶码+2位尾数）两种格式，保留动态范围；而
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

vLLM - 控制生成过程中返回对数概率信息 logprobs的输出和解释