Y1nhl

搜广推校招面经六十六

高德推荐算法

一、介绍Transformer中的位置编码（Positional Encoding）

在 Transformer 结构中，由于模型没有内置的序列信息（不像 RNN 那样有时间步的顺序依赖），需要通过**位置编码（Positional Encoding, PE）**来提供位置信息，使得模型能够区分不同 token 的相对位置。

1.1. 位置编码的作用

由于 Transformer 采用的是自注意力机制（Self-Attention），它对输入序列的排列顺序不敏感，因此需要显式地向输入中添加位置信息。位置编码的主要作用包括：

提供位置信息，使模型能够捕捉顺序关系。结合词向量（Embedding）输入到 Transformer 中，以提供语义和位置信息。

1.2. 正弦-余弦位置编码（Sinusoidal Positional Encoding）

Vaswani 等人在 “Attention is All You Need” 论文中提出了一种固定的位置编码方法，使用不同频率的正弦（sin）和余弦（cos）函数来编码位置：
$PE_{(pos, 2i)} = \sin\left(\frac{pos}{10000^{2i/d}}\right) \\ \ \\ PE_{(pos, 2i+1)} = \cos\left(\frac{pos}{10000^{2i/d}}\right)$
其中：

$p os$ 表示序列中的位置（Position）。
$i$ 表示维度索引（每个位置编码有 d 维）。
$d$ 表示编码的总维度（等于 Embedding 维度）。
$10000^{2i/d}$ 作为不同维度的缩放因子，使得不同维度的 PE 具有不同的变化率。

1.3. 为什么使用正弦和余弦？

周期性：不同位置的编码可以通过线性组合推导出新位置的编码，有利于泛化到更长的序列。
不同频率：较低维度的编码变化较快，较高维度的编码变化较慢，使得模型能够学习不同粒度的相对位置信息。
平滑变化：相邻位置的编码变化平滑，符合自然语言的顺序特性。

1.4. PyTorch 实现

以下是使用 PyTorch 实现的位置编码模块：

import torch
import torch.nn as nn
import math

class PositionalEncoding(nn.Module):
    def __init__(self, d_model: int, max_len: int = 5000):
        """
        :param d_model: 词向量维度 (Embedding 维度)
        :param max_len: 序列最大长度
        """
        super(PositionalEncoding, self).__init__()

        # 创建位置编码矩阵（shape: [max_len, d_model]）
        pe = torch.zeros(max_len, d_model)
        position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)  # [max_len, 1]
        div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))  # [d_model/2]

        # 计算 sin 和 cos 位置编码
        pe[:, 0::2] = torch.sin(position * div_term)  # 偶数索引
        pe[:, 1::2] = torch.cos(position * div_term)  # 奇数索引

        # 增加 batch 维度以便广播
        pe = pe.unsqueeze(0)  # shape: [1, max_len, d_model]

        # 注册为 buffer，使其不会被模型参数更新
        self.register_buffer('pe', pe)

    def forward(self, x):
        """
        :param x: 输入张量，形状为 [batch_size, seq_len, d_model]
        :return: 加入位置编码后的张量
        """
        return x + self.pe[:, :x.size(1), :]

二、如何解决CTR预估中广告位置的bias，讲讲网络中的bias net如何做

见【搜广推校招面经二十六】
在广告投放中，**广告位置（Ad Placement）会对点击率（CTR）、转化率（CVR）等关键指标产生影响，导致模型学习到的特征偏向某些广告位，而不是用户真实的兴趣或广告的质量。这种位置偏差（Position Bias）**可能导致：

高曝光广告位置的 CTR 过高，导致模型高估广告效果。
低曝光广告位置的 CTR 过低，导致模型低估广告的潜力。
难以推广新的广告位，模型可能更倾向于已经有数据的广告位。

2.1. Bias Net（偏置网络）原理

Bias Net 主要用于建模广告位置对点击率的影响，并将其从主模型（如 CTR 预估模型）中剥离，使主模型学习到去除位置影响后的广告真实效果。
Bias Net 主要采用 “双塔网络”（Two-Tower Model） 的思想：

一个塔（主网络 MainNet）：学习广告本身的影响，如广告内容、用户兴趣等。
一个塔（BiasNet）：专门学习广告位置的偏置，并将其影响去除。
最终的去偏目标：
$P(\text{click} | \text{ad, user}) = P(\text{click} | \text{ad, user, pos}) / P(\text{click} | \text{pos})$
其中：
$P(\text{click} | \text{ad, user, pos})$ 是普通 CTR 预估模型的预测值。
$P(\text{click} | \text{pos})$ 由 BiasNet 预测，建模广告位置的影响。

2.2. Bias Net 结构

BiasNet 通过 MLP（多层感知机）或 Embedding 方式 学习广告位置的偏置。以下是 BiasNet 的常见结构：

Embedding + MLP 方式：
- 输入：广告位 position_id
- 处理：通过 Embedding 层将广告位转换为向量，再通过 MLP 学习其对点击率的影响。
- 输出：广告位的偏置得分。
独立建模：
- 训练一个单独的网络，仅依赖广告位置 position_id 预测 CTR，然后归一化，使其成为位置偏置因子。

2.2.1. PyTorch 实现 BiasNet

import torch
import torch.nn as nn

class MainNet(nn.Module):
    def __init__(self, ad_feature_dim, user_feature_dim):
        super(MainNet, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(ad_feature_dim + user_feature_dim, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 1),
            nn.Sigmoid()
        )
    
    def forward(self, ad_features, user_features):
        x = torch.cat([ad_features, user_features], dim=1)
        return self.fc(x)

2.3. 去除广告位置（pos）的影响，为什么使用除法？

在去除广告位置（Position, pos）的影响时，使用除法而不是加法的主要原因是 归一化 和 比例调整。

2.3.1. 直觉解释

假设我们要预测广告的点击率（CTR），模型的原始预测值是：
$P(\text{click} | \text{ad}, \text{user}, \text{pos})$
但由于广告位置会影响点击率（例如，广告展示在页面顶部时点击率更高），我们需要去除 pos 的影响，使得模型的预测结果更加公正，仅反映广告内容和用户兴趣。
BiasNet 是专门用于学习 pos 对点击率影响的网络，它的输出是：
$P(\text{click} | \text{pos})$
最终，我们想要的去偏点击率应该是：
$P_{\text{debiased}}(\text{click} | \text{ad}, \text{user}) = \frac{P(\text{click} | \text{ad}, \text{user}, \text{pos})}{P(\text{click} | \text{pos})}$

2.3.2. 为什么使用除法？

(1) 归一化（Normalization）

$P(\text{click} | \text{pos})$ 代表某个广告位置的整体点击率，它可以看作是该位置的“全局 CTR”。
通过除法，我们可以消除广告位置对 CTR 的整体提升或降低的影响，使不同广告位置的 CTR 处于相同的基准水平。

(2) 避免负值

如果使用加法去除位置影响，比如 $P(\text{click} | \text{ad}, \text{user}, \text{pos}) - P(\text{click} | \text{pos})$ ，可能会导致负的点击率，这不符合实际情况。
而使用除法确保调整后的 CTR 始终是正数，并且仍然具有可解释性。

(3) 保持比例关系

广告位的影响往往是乘法关系，而非加法关系。例如：
- 广告 A 在顶部位置 的点击率可能是 广告 B 在底部位置 点击率的 3 倍。
- 如果使用除法，广告 A 和广告 B 的 CTR 仍然可以保持这个比例。
- 而如果使用加法，会导致 CTR 计算失真，失去原有的相对比例。

2.4. 也可以通过多任务学习，联合优化两个loss。

CTR 预测的目标： $P(\text{click} | \text{ad}, \text{user})$
位置偏置预测的目标： $P(\text{click} | \text{pos})$
联合损失函数：
$L_{\text{CTR}} + \lambda L_{\text{BiasNet}}$

三、点击率（CTR）建模中如何保证广告位自上而下 CTR 率依次递减？

在广告点击率（CTR）建模中，广告通常是按一定策略排序展示的。通常情况下，用户的注意力随广告位（Position）下降而减少，因此 CTR 也应该遵循 “自上而下递减” 的规律。然而，在实际建模过程中，CTR 可能会受到其他因素（如广告内容、用户兴趣等）的干扰，导致某些下方广告的 CTR 反而比上方广告高。

3.1. 为什么需要保证 CTR 递减？

符合用户行为模式：在大多数应用场景中，用户对上方广告的关注度较高，因此 CTR 也应该较高。
避免模型异常学习：如果 CTR 没有递减趋势，可能意味着模型没有正确建模广告位置的影响，或者数据存在偏差。
提升广告排序的稳定性：确保 CTR 预测结果合理，有助于广告投放系统优化广告排序，提高收益。

如果模型未能正确学习广告位的影响，CTR 预测可能出现异常。

3.2 保证广告位 CTR 递减的方法

(1) 在模型输入中添加广告位置信息

显式建模广告位特征：在模型中添加广告位 pos 作为一个重要特征，并确保其影响符合期望：
$P(\text{click} | \text{pos}) \text{ 递减}$
位置编码方式：
- Embedding 方式：使用 pos_embedding = nn.Embedding(n_pos, embedding_dim)，让模型学习广告位的影响。
- 数值归一化方式：直接使用 pos / n_pos 作为一个数值特征输入。

(2) 在模型优化中添加单调性约束

为了确保 $P(\text{click} | \text{pos})$ 递减，可以对模型进行约束：

位置影响单调递减：
- 约束 $\frac{\partial P(\text{click})}{\partial \text{pos}} \leq 0$ ，即广告位 pos 越大（排名越靠后），CTR 预测值不会上升。
- 在神经网络中，可通过 单调性网络（Monotonic Neural Networks） 或 权重约束 来实现。
使用单调递减的变换函数：
- 例如在 MLP 层中，使用 $S o f tpl u s (- x)$ 或 $- R e LU (x)$ 来确保输出单调递减：

  class MonotonicLayer(nn.Module):
      def __init__(self, input_dim):
          super().__init__()
          self.linear = nn.Linear(input_dim, 1)
      
      def forward(self, x):
          return -torch.relu(self.linear(x))  # 保证单调递减

使用排序损失（Ranking Loss）**：
- 设 pos_1 在 pos_2 之上，则 P(\text{click} | \text{pos_1}) 应该大于 P(\text{click} | \text{pos_2})：

(3) 在数据处理阶段去除位置偏差

如果数据中广告位的 CTR 没有遵循递减规律，可以通过以下方法调整：

分层归一化（Layer-wise Normalization）：
- 在训练数据中，对不同广告位的 CTR 进行归一化，避免数据不均衡带来的问题。
- 例如，对每个广告位 pos 计算均值 CTR μ_pos，然后对 y 进行调整：
  $\frac{y}{\mu_{\text{pos}}}$
逆倾向采样（Inverse Propensity Weighting, IPW）：
- 由于广告位较高的曝光量远大于广告位较低的曝光量，可以使用 P(\text{pos}) 作为权重，对样本进行重新加权：
  $w_i = \frac{1}{P(\text{pos}_i)}$
- 在损失函数中加入权重：

 loss = torch.mean(weight * loss_function(y_pred, y_true))

(4) 在预测阶段调整 CTR

如果模型仍然预测出了不符合递减规律的 CTR，可以在后处理时进行 排序约束调整：

强制后验排序修正：
- 对每个广告列表的 CTR_pred 进行 Sort，确保 P(\text{click} | \text{pos}) 递减：

ctr_pred_sorted, _ = torch.sort(ctr_pred, descending=True)

加权平均平滑：
- 使用滑动窗口平滑方法，确保预测的 CTR 递减：

def smooth_ctr(ctr_pred):
    for i in range(1, len(ctr_pred)):
        ctr_pred[i] = min(ctr_pred[i], ctr_pred[i-1])
    return ctr_pred

你可能感兴趣的:(搜广推面经,机器学习,python,推荐算法,广告算法,搜索算法,pytorch,深度学习)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
25-1-2019 树藤与海岛呢
hello八月来报道了今天看到了一篇文章就只想记下那两句话：良田千顷不过一日三餐广夏万间只睡卧榻三尺大概的意思就是要珍惜当下不要等来不及的时候才珍惜分享今天的两餐最近没有时间运动呢下个月补回好了说完了哈哈goodnight图片发自App图片发自App
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
不能随便扔垃圾小猪宝贝0905
阴雨天的周五，看你生病在家窝了快一周，嚷嚷着要去游乐场，那就决定带你去四海书城；为了不让你被雨淋湿，妈妈准备推个自行车，刚把你放到自行车后座上，你一个喷嚏鼻涕出来了，随手拿出纸巾擦擦鼻涕，妈妈因为嫌把你从座位上抱下来扔纸巾到前面的垃圾桶麻烦，就将纸巾扔进了旁边的树丛里；你却批评了妈妈，“不可以把纸巾扔到地上，应该扔进垃圾桶”；妈妈顿时感觉很羞愧，将你抱下来，重新捡起纸巾，扔进了垃圾桶。
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
处方药和非处方药六月荷清香
今天上午，我正闲着没事，一位装空调的熟人朋友走了进来。这时节，他可是大忙人，每天在外忙着帮人装空调。我笑问哪阵风将他刮来了！他说今年空调生意没有往年好，这几天也正闲着没事做呢。然后一本正经问我，那个治灰指甲的药叫什么名字来着，他不记得了。我笑道，我又不是医生，治灰指甲找医生啊，电视广告里不是宣传有灰甲，用亮甲吗。他将右手叉开让我看“你看，去年我听了你推荐的那个药，吃了几个疗程后我这手上的灰指甲都好
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
D124:如何训练独立思考力？大栗子_
当我们要判断一个理论或者思想是否正确，需要有三个层次，分别是体验、解释和分析。首先看体验。很多时候，我们会相信“听上去、感觉是对的”的事情。我们之前讲的太空笔的故事之所以大多数人都认为是对的，就是有一些看似真实的关键词，比如美国，NASA，设计等，这些词看起来非常权威，但是离我们又遥远，这时候我们的大脑就会放松警惕了。于是，我们毫不犹豫就接受了。说到这里，你有没有发现之前的电视广告中的各种高让我们
社交电商平台有哪些？社交电商怎么做？氧惠评测
社交电商平台有很多，以下是一些常见的社交电商平台：氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如何1年做到百万团队。氧惠app：氧惠ap
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
绕口令集合（每日练习）蓉女侠
八百标兵奔北坡，炮兵并排北边跑，炮兵怕把标兵碰，标兵怕碰炮兵炮。炮兵攻打八面坡，排排炮弹齐发射。步兵攻打八面坡，歼敌八千八百八十多。调到敌岛打特盗，特盗太刁投短刀，挡推顶打短刀掉，踏盗得刀盗打倒。哥挎瓜筐过宽沟，赶快过沟看怪狗，光看怪狗瓜筐扣，瓜滚筐空哥怪狗。一位爷爷他姓顾，上街打醋又买布。买了布，打了醋，回头看见鹰抓兔。放下布，搁下醋，上前去追鹰和兔。飞了鹰，跑了兔，打翻醋，醋湿布。牛郎恋刘娘，
直返APP的创始人是谁他们的创业背景和经历如何? 氧惠帮朋友一起省
直返的创始人是李明，他是一位富有创新精神的电商专家。他看到了传统电商模式的局限，并决心打破这些局限，为消费者带来更实惠、更便捷的购物体验。于是，他创立了直返这一独特的电商模式，通过省去中间环节、直接返还利润给消费者，实现了购物的简单与实惠。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Android通知(Notification)全面解析：从基础到高级应用
一、Android通知概述通知(Notification)是Android系统中用于在应用之外向用户传递信息的重要机制。当应用需要告知用户某些事件或信息时，可以通过通知在状态栏显示图标，用户下拉通知栏即可查看详细信息。这种机制几乎被所有现代应用采用，用于推送新闻、消息、广告等内容3。与Toast相比，Notification的优势在于：可以长时间停留在通知栏，适合内容较多且需要持久展示的信息支持丰
我应该如何使用直返APP才能获得更多的返利？氧惠好物
要想在直返APP获得更多返利，您可以尝试以下几个方法：氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。首先，注册并完善账户信息。注册后，您将获得新人专享优惠券，以及更多的返利机会。同时，确
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他