forest_open

纵向联邦学习中的线性回归，了解一下

文章目录

背景知识
- 线性回归算法
- 同态加密
联邦学习下线性回归算法
- 偏导怎么算
- Loss 怎么算
- 模型如何应用
关于模型的疑问
参考资料

本篇内容讲一下论文《Federated Machine Learning: Concept and Applications》中的纵向联邦学习中的回归方法，因为在阅读论文的过程中， 我觉得论文当中的写法比较confusing，所以重新梳理了一遍，争取公式的写法上不存在歧义。在阅读的过程中，主要有以下两个困惑的点：

公式7认为 $L]\!] = [\![L_A]\!] + [\![L_B]\!] + [\![L_{AB}]\!]$ ，理解上不存在为了，写成 $[\![L]\!] = [\![L_A]\!] \oplus [\![L_B]\!] \oplus [\![L_{AB}]\!]$ 更好；
公式8与公式9中 $d_i]\!]x_i$ 和求和符号阅读起来比较困惑，一个密文和明文相乘是什么意思，密文求和是什么意思；
当然，细心的同学还会发现个小问题，就是 Loss 函数少了个 $\frac{1}{2}$ ，或者后面的偏导少了个2，好在不影响算法流程。

所以本篇博客重新梳理一下这个问题，首先对线性回归算法和同态加密进行一个简单的回顾，然后按照这篇论文中的思路对纵向联邦学习中的线性回归进行讲解。

背景知识

线性回归算法

线性回归的内容可以参考 [吴恩达机器学习课程(4)-Linear Regression with Multiple Variables](http://forestneo.com/2020/02/26/ML-吴恩达机器学习课程-04-Linear Regression with Multiple Variables/)。为了方便描述，我们采用了论文《Federated Machine Learning: Concept and Applications》中的 loss 函数，当然我们默认这个文章中的 loss 中少写了一个 $\frac{1}{2}$ 的校正，下一节会提到。假如有 $m$ 条数据 $n$ 个特征， loss 函数为：
$\begin{aligned} L &= \sum_{i=1}^{m} \frac{1}{2}\left( h(x_i)-y_i \right)^2\\ &=\sum_{i=1}^{m} \frac{1}{2}\left( \theta_0 \cdot x_{i,0} + \theta_1 \cdot x_{i,1} + ... + \theta_{n} \cdot x_{i,n} - y_i \right)^2 \end{aligned}$
为了得到最优解，我们采用梯度下降方法，给定学习率 $\eta$ ，优化的过程为：
$\theta_j = \theta_j - \eta \cdot \sum_{i=1}^{m} \left(h(x_i)-y_i\right) \cdot x_{i,j}$

同态加密

更为主要的，Paillier 算法系统满足以下性质：

同态加法： $[\![x+y]\!] = [\![x]\!] \cdot [\![y]\!]$
同态乘法： $[\![x\times y]\!] = [\![x]\!] ^ y$

为了使得含义更明确，就这么记一下： $[\![x+y]\!] = [\![x]\!] \oplus [\![y]\!]$ ，以及 $[\![x\times y]\!] = [\![x]\!] \otimes y$ ，这样子根据就可以直接看出来密文上的操作是想做加法还是做乘法了。

关于 Paillier 算法系统是如何实现同态加法和同态乘法的，可以参考：密码学-公钥加密算法 Paillier。

联邦学习下线性回归算法

我们假设 A 端的数据为 $x_i^A$ ，B 端的数据为 $x_i^B, y_i$ ，那么线性回归对应的参数就是 $\Theta_A, \Theta_B$ ，假设归一化参数为 $\lambda$ ，那么优化目标就可以表示为（论文里面少了一个 $\frac{1}{2}$ ）：
$\min _{\Theta_{A}, \Theta_{B}} \sum_{i} \frac{1}{2}\left\|\Theta_{A} x_{i}^{A}+\Theta_{B} x_{i}^{B}-y_{i}\right\|^{2}+\frac{\lambda}{2}\left(\left\|\Theta_{A}\right\|^{2}+\left\|\Theta_{B}\right\|^{2}\right)$
为了方便描述，我们简化一下，令 $u_{i}^{A}=\Theta_{A} x_{i}^{A}, u_{i}^{B}=\Theta_{B} x_{i}^{B}$ ，那么加密之后对应的 Loss 函数就可以写成以下形式。当然，也是为了方便，加密过程用双括号 $[\![\cdot]\!]$ 表示（在 Latex 中，用[\![ ]\!]表示，其中 \!表示一个单位的负距离），正常的括号还是用圆括号表示。
$\mathcal{L}=\sum_{i} \frac{1}{2}\left(u_{i}^{A}+u_{i}^{B}-y_{i}\right)^{2}+\frac{\lambda}{2}\left(\left\|\Theta_{A}\right\|^{2}+\left\|\Theta_{B}\right\|^{2}\right)$
在梯度下降的过程中，对于第 $j$ 个参数有：
$\begin{aligned} \frac{\partial \mathcal{L}}{\partial \theta_{A,j}} &= \sum_i (u_i^A + u_i^B - y_i) \cdot x_j + \lambda \theta_{A,j}\\ \frac{\partial \mathcal{L}}{\partial \theta_{B, j}} &= \sum_i (u_i^A + u_i^B - y_i) \cdot x_j + \lambda \theta_{B,j} \end{aligned}$
根据 SGD 的过程，现在问题就变成了参与方 A 和 B 如何得到 $\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}$ 和 $\frac{\partial \mathcal{L}}{\partial \theta_{B,j}}$ 了。当然，在训练过程中，如果想知道 Loss 是多少，我们也可以算一下 Loss。接下来就面临着这么几个问题了：

偏导怎么算：在训练阶段，数据方 A 和数据方 B 怎么算出 $\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}$ 和 $\frac{\partial \mathcal{L}}{\partial \theta_{B,j}}$ ；
Loss 怎么算：在训练过程中，怎么对 Loss 进行跟踪；
模型如何使用：训练完成之后，怎么对数据进行预测。

当然，以上的三个问题都需要在不知道数据情况下给算出来。为了实现这个需求呢，我们引入一个参与方 C（半诚信的）来计算这些东西，总体思路呢是 A 和 B 把自己能算的加密之后给 C，然后 C 把中间结果利用同态的性质和合并一下，再返还给 A 和 B，这时候 A 和 B 一解密，哎，知道要的结果了，就很美滋滋。然后根据这个流程，我们回头看看上面的三个问题怎么解决。

偏导怎么算

因为数据不能泄露，所以肯定要加密，可以看一下这个过程：
$\begin{aligned} \left[\!\!\left[\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}\right]\!\!\right] &= \left[\!\!\left[\sum_i (u_i^A + u_i^B - y_i) \cdot x_j + \lambda \theta_{A,j}\right]\!\!\right]\\ &= \left[\!\!\left[\sum_i (u_i^A + u_i^B - y_i) \cdot x_j\right]\!\!\right] \oplus [\![\lambda \theta_{A,j}]\!]\\ &= \underbrace{\left[\!\!\left[(u_1^A + u_1^B - y_1) \cdot x_j \right]\!\!\right]} \oplus ... \oplus \underbrace{\left[\!\!\left[(u_m^A + u_m^B - y_m) \cdot x_j\right]\!\!\right]} \oplus [\![\lambda \theta_{A,j}]\!] \end{aligned}$
对于 A 来说，最右边的 $\lambda \theta_{A,j}$ 是可以自己算出来然后再加密的。对于第 $i$ 条数据，自己是有 $u_i^A$ 和 $x_j$ 的，因此我们看上式花括号的咋算
$\begin{aligned} \left[\!\!\left[(u_i^A + u_i^B - y_i) \cdot x_j\right]\!\!\right] &= \left[\!\!\left[u_i^A + u_i^B - y_i \right]\!\!\right]^{x_j}\\ &= \left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j} \end{aligned}$
所以呢，实际上对于 A 来说，偏导就是：
$\begin{aligned} \left[\!\!\left[\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}\right]\!\!\right] &= \left[\!\!\left[\sum_i (u_i^A + u_i^B - y_i) \cdot x_j + \lambda \theta_{A,j}\right]\!\!\right]\\ &= \underbrace{\left[\!\!\left[(u_1^A + u_1^B - y_1) \cdot x_j \right]\!\!\right]} \oplus ... \oplus \underbrace{\left[\!\!\left[(u_m^A + u_m^B - y_m) \cdot x_j\right]\!\!\right]} \oplus [\![\lambda \theta_{A,j}]\!]\\ &= \underbrace{\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j}} \oplus ... \oplus\underbrace{\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j}} \oplus [\![\lambda \theta_{A,j}]\!] \end{aligned}$
所以呢，现在对于 A 来说怎么算偏导，思路就清晰了，大概是这么个流程：

C 作为一个第三方，生成密钥并且把公钥发送给 A 和 B
A 计算 $u_i^A]\!]$ ，发给 C，B计算 $u_i^B - y_i ]\!]$ ，发给C；
C 计算 $[\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]$ ，发给 A；
A 就可以本地计算 $\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j}$ ，算出来之后再把 $[\![\lambda\theta_{A,j}]\!]$ 发送给 C；
C 一通计算，得到了 $[\![\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}]\!]$ ，并且把这个玩意解密之后发给 A；
最终 A 就得到了偏导了。

上述流程看着挺 OK 的，并且 B 也可以进行这些操作得到偏导，但是存在这么一个问题：C 可以解密得到有数据含义的中间数据。这当然是不被接受的。注意到同态的性质，任何一个人都能对密文进行处理。所以我们可以对以上流程这么改进一下：

A 计算 $u_i^A]\!]$ ，发给 B，B计算 $u_i^B - y_i ]\!]$ ，然后 B 计算 $\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)$ ，然后发送给 A；
A 然后就可以计算 $\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j} \oplus ... \oplus\left([\![u_i^A ]\!] \oplus [\![u_i^B - y_i ]\!]\right)^{x_j} \oplus [\![\lambda \theta_{A,j}]\!]$ 了，也就是说到这里偏导 $[\![\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}]\!]$ 就算出来了，然后 A 本地生成随机数 $R_A$ ，计算 $[\![\frac{\partial \mathcal{L}}{\partial \theta_{A,j}}]\!] \oplus [\![R_A]\!]$ ，发送给 C；
C 解密得到 $\frac{\partial \mathcal{L}}{\partial \theta_{A,j}} + R_A$ ，返还给 A；
A 消去 $R_A$ 的影响，得到偏导，用于更新 $\theta_A$ 。

这个过程中，C 只作为中间数据的计算方，是得不到任何原始数据的。对于 A 来说，添加随机数也是为了防止 $C$ 得到偏导。

Loss 怎么算

实际上，知道梯度就可以完成模型参数更新的流程了。但是为了对 Loss 进行跟踪，一般参与方也需要知道每一轮的 Loss 值是多少，要是发现 Loss 不下降了，就知道模型训练的差不多了。回到开头，这个 Loss 为：
$\begin{aligned} [\![\mathcal{L}]\!] &= \left[\!\!\left[ \sum_{i} \frac{1}{2}\left(u_{i}^{A}+u_{i}^{B}-y_{i}\right)^{2} +\frac{\lambda}{2}\left(\left\|\Theta_{A}\right\|^{2}+\left\|\Theta_{B}\right\|^{2}\right) \right]\!\!\right]\\ &= \left[\!\!\left[\sum_{i} \frac{1}{2}\left(u_{i}^{A}+u_{i}^{B}-y_{i}\right)^{2} \right]\!\!\right] \oplus \left[\!\!\left[\frac{\lambda}{2}\left\|\Theta_{A}\right\|^{2} \right]\!\!\right] \oplus \left[\!\!\left[\frac{\lambda}{2}\left\|\Theta_{B}\right\|^{2}\right]\!\!\right]\\ &= \underbrace{\left[\!\!\left[\frac{1}{2}\left(u_{i}^{A}+u_{i}^{B}-y_{i}\right)^{2}\right]\!\!\right]} \oplus ... \oplus \underbrace{\left[\!\!\left[\frac{1}{2}\left(u_{i}^{A}+u_{i}^{B}-y_{i}\right)^{2}\right]\!\!\right]} \oplus \left[\!\!\left[\frac{\lambda}{2}\left\|\Theta_{A}\right\|^{2}\right]\!\!\right] \oplus \left[\!\!\left[\frac{\lambda}{2}\left\|\Theta_{B}\right\|^{2}\right]\!\!\right] \end{aligned}$
然后我们看左边的这一项，为了看着舒服，上面的 $\frac{1}{2}$ 就先不讨论了，因此有：
$\begin{aligned} \left[\!\!\left[(u_i^A+u_i^B-y_i)^2 \right]\!\!\right] &= \left[\!\!\left[(u_i^A)^2 + (u_i^B-y_i)^2 + 2u_i^A(u_i^B-y_i)\right]\!\!\right]\\ &= [\![(u_i^A)^2]\!] \oplus [\![(u_i^B-y_i)^2]\!] \oplus [\![2 u_i^A(u_i^B-y_i)]\!]\\ &= [\![(u_i^A)^2]\!] \oplus [\![(u_i^B-y_i)^2]\!] \oplus \left([\![2(u_i^B-y_i)]\!]^{u_i^A}\right) \end{aligned}$
我们假设 A 要算这个东西，那么可以这么做：

A 计算 $u_i^A)^2]\!]$ ，B 计算 $u_i^B-y_i)^2]\!]$ 和 $2(u_i^B-y_i)]\!]$ ，B 把计算结果发送给 A
A 计算 $[\![(u_i^A)^2]\!] \oplus [\![(u_i^B-y_i)^2]\!] \oplus \left([\![2(u_i^B-y_i)]\!]^{u_i^A}\right)$ 得到 $\left[\!\!\left[(u_i^A+u_i^B-y_i)^2 \right]\!\!\right]$

根据这个原理，A 就能把 $[\![L]\!]$ 计算出来了，然后让 C 把这个解密就好了，当然，为了不让 C 获得中间数据，也可以加上一个随机数 $R_A$ 。当然这个 Loss 不仅仅是 A，B也是可以算的。

有了偏导和 loss 的计算方法，都被 A 和 B 知道了，也就是模型就可以训练成功了。

模型如何应用

由于 A 和 B 是分布式地获得了模型，数据也是分布在 A 和 B 两边，那么这个模型如何应用呢。也就是说，现在有一个新数据 $x=(x^A,x^B)$ ，怎么预测对应的 $y$ ？预测的过程中有（和训练过程一样，常数项已经隐含在 $x^A$ 或者 $x^B$ 中了）：
$y=\theta_A x^A + \theta_B x^B$
所以各自计算然后汇总一下就可以估计出 $y$ 了，更进一步如果想保护 $y$ 的话（我们假设是 B 想算 $y$ ），可以让 B 根据 $[\![y]\!] = [\![\theta_A x^A]\!] \oplus [\![\theta_B x^B]\!] \oplus [\![R_B]\!]$ ，然后让 C 解密之后减去 $R_B$ 来得到 $y$ 。

关于模型的疑问

到这里为止，看上去一开始论文中出现的疑问就都消除了，但是，现在依然有存在着一些问题：

在模型训练的过程中，如果 $u_i^B-y_i$ 是负数怎么办？
在模型预测的过程中，如果 $y$ 是负数怎么办？

这个我目前也没想到好的方法，可能一种潜在的解决方案是把某些特征都加上一个量使得中间结果不出现负数吧。但是感觉这个解决方案不完美，因为 $u_i^B-y_i=\theta_B x^B - y_i$ ，这个 $\theta_B$ 是在训练过程中出现的，不可控的。对于第二个疑问， $y$ 出现负数，这个感觉可以解决，直接对所有的 $y_i$ 加上一个偏移量估计就好了。

参考资料

Federated Machine Learning: Concept and Applications
[吴恩达机器学习课程(4)-Linear Regression with Multiple Variables](http://forestneo.com/2020/02/26/ML-吴恩达机器学习课程-04-Linear Regression with Multiple Variables/)

本篇内容到这里就结束了，若想知道更多和信息安全有关的技术可在公众号留言。识别以下二维码可以成文本公众号的小粉丝，关注更多前沿技术。

论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
基于大模型的短暂性脑缺血发作（TIA）全流程预测与干预系统技术方案 LCG元大模型医疗研究-技术方向技术方案机器学习深度学习人工智能
目录一、系统架构总览二、核心模块详细设计三、系统集成方案四、系统部署拓扑图五、技术验证方案六、健康管理子系统七、安全与合规设计技术指标与性能保障八、HL7FHIR接口规范九、分层蒸馏方案十、多中心RCT研究设计十一、硬件选型成本优化方案跨模块集成工作流一、系统架构总览多源数据采集联邦学习数据湖大模型预测中枢术前预测系统术中决策系统术后管理系统手术方案生成麻醉动态调控并发症预警护理方案优化健康教育引
周三 2020-01-01 09:30 - 23:00 多云 03h35m 么得感情的日更机器
南昌。二〇二〇年一月一日基本科研[1]:1.论文阅读论文--小时2.论文实现论文编写--实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:开题报告--英语能力[2]:1.听力--十分2.单词--三分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正
零基础完整版入门经典深度学习时间序列预测项目实战+最新前沿时间序列预测模型代码讲解学习整理（附完整可运行代码） OverOnEarth 时间序列预测项目实战深度学习学习人工智能
专栏内容本专栏主要整理了作者在时间序列预测领域内的一些学习思路与代码整理，帮助大家在初进入此领域时，可以快速掌握代码进行实战操作，对代码的操作再结合论文阅读肯定是上升更快嘛，作者也愿意和大家一起讨论进步，下面的内容会逐步更新，作者主页的资源列也会放出一些可下载的资源供大家参考学习噢。一、LSTM时间序列预测完整代码示例学习分析（pytorch框架）精选试读文章二、LSTM多变量输入实现多步预测完整
医疗AI跨机构建模实施总结：基于 Flower 联邦学习与差分隐私的实践指南
一、项目背景与目标在医疗人工智能（AI）模型的发展过程中，数据的可获得性和隐私保护始终是两个矛盾的关键点。传统集中式训练方式虽然性能理想，但往往受限于政策法规（如HIPAA、GDPR）无法获取跨机构医疗数据。而单一机构数据量不足、分布偏差等问题，又制约了模型的泛化能力。本项目旨在实现一个可部署、可扩展的联邦学习平台，帮助多个医疗机构在不共享原始数据的前提下共同训练预测模型。我们采用Flower框架
250714脑电分析课题进展——基础知识扩展与论文阅读
脑电分析课题进展目录脑电分析课题进展一、概要二、论文阅读（一）内容（二）创新（三）不足三、书籍阅读四、基础知识学习（一）机器学习（二）代码能力五、总结与展望一、概要本周课题进展聚焦于论文与书籍阅读，以及基础知识的学习（包括机器学习与PyTorch的代码学习）论文阅读以毕明川学姐的学位论文为参考《基于EEG的冥想状态数据挖掘研究》书籍阅读以李颖洁的《脑电信号分析方法及其应用》第一章内容为重点机器学习
[论文阅读] 人工智能 + 软件工程 | LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力张较瘦_ 前沿技术论文阅读人工智能软件工程
LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力论文：OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationarXiv:2507.16587OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationGiuseppeCrupi
[论文阅读] 人工智能 + 软件工程 | LLM优化RTL代码：在时序逻辑面前栽了跟头？—— 一项基于变形策略的实证研究张较瘦_ 前沿技术论文阅读人工智能
LLM优化RTL代码：在时序逻辑面前栽了跟头？——一项基于变形策略的实证研究论文标题：RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorphosisarXiv:2507.16808[pdf,html,other]RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorp
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
可信数据空间（Trusted Data Space）核心能力及行业赋能分析小赖同学啊 test Technology Precious 算法
可信数据空间（TrustedDataSpace）作为新一代数据共享基础设施，通过技术创新和治理框架的结合，为多行业提供安全、可控的数据流通能力。以下是其核心能力及行业赋能分析：一、可信数据空间的六大核心能力能力维度技术实现关键价值数据主权保障基于区块链的分布式身份（DID）属性基加密（ABE）数据所有者保持控制权，实现"数据可用不可见"安全共享计算联邦学习（FL）多方安全计算（MPC）可信执行环境
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
AI人工智能助力联邦学习通信效率优化的解决方案 AI智能应用人工智能 ai
AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案元数据框架标题AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案关键词联邦学习（FederatedLearning）、通信优化（CommunicationEfficiency）、AI赋能（AI-Enabled）、参数压缩（ParameterCompression）、客户端选择（ClientSelection）、联邦蒸馏（Federa
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持