不务正业的土豆

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记

文章目录

- - 网络表示学习（Network Representation Learning，NRL）、Graph Embedding
  - DeepWalk：Online Learning of Social Representations
  - 摘要：
  - 1. Introduction
  - 2. Problem Definition
  - 3. Learning social representations
  - - 3.1 Random Walks
    - 3.2 Connection: Power laws( 连接：幂律 )
    - 3.3 Language Modeling (语言模型)
  - 4. Method
  - - 4.1 DeepWalk
    - 4.2 Hierarchical Softmax
    - 4.3 Optimization
    - 4.4 Parallelizability 并行性
    - 4.5 Algorithm Variants
    - - Streaming
      - Non-random walks
  - 5. Experimental Design
  - - 5.1 DataSets
    - 5.2 Baseline Methods
  - 6. Experiments
  - - 6.1 Multi-Label Classification
    - 6.2 Parameter Sensitivity
    - - Effect of Dimensionality
      - Effect of sampling frequency
    - 8. Conclusions
    - 9. 资料下载

网络表示学习（Network Representation Learning，NRL）、Graph Embedding

们都知道在数据结构中，图是一种基础且常用的结构。现实世界中许多场景可以抽象为一种图结构，如社交网络，交通网络，电商网站中用户与物品的关系等。

目前提到图算法一般指：

经典数据结构与算法层面的：最小生成树(Prim,Kruskal,…)，最短路(Dijkstra,Floyed,…)，拓扑排序，关键路径等
概率图模型，涉及图的表示，推断和学习，详细可以参考Koller的书或者公开课
图神经网络，主要包括Graph Embedding(基于随机游走)和Graph CNN(基于邻居汇聚)两部分。

网络表示学习（Network Representation Learning，NRL）或图表示学习,也称为图嵌入法（Graph Embedding Method，GEM）：目的是希望能够将网络中的节点用比较低维的向量去表达，同时在这个向量空间中，网络结构的一些性质仍能够保持。在原始图中相似(不同的方法对相似的定义不同)的节点其在低维表达空间也接近。得到的表达向量可以用来进行下游任务，如节点分类，链接预测，可视化或重构原始图等。

DeepWalk：Online Learning of Social Representations

论文：DeepWalk: Online Learning of Social Representations
论文作者：B. Perozzi, R. Al-Rfou, and S. Skiena
论文来源：KDD, 2014
论文链接：https://arxiv.org/abs/1403.6652
github链接：https://github.com/phanein/deepwalk

此文是第一个将NLP中的思想用在网络嵌入(Network Embedding,NE)上的。

摘要：

文中提出DeepWalk，一种用于学习网络中顶点的潜在表示的新方法。这些潜在表示将社会关系编码到连续的向量空间中，编码到向量空间后的社会关系，很容易应用到统计模型中。 DeepWalk将语言建模和无监督特征学习（或深度学习）的最新进展，从单词序列推广到图中。

DeepWalk将随机游走得到的节点序列当做句子，从截断的随机游走序列中得到网络的局部信息，再通过局部信息来学习节点的潜在表示。为了展示DeepWalk得到的节点的潜在表示，文中对几个社交网络（BlogCatalog，Flickr和YouTube）进行了多标签分类任务。研究结果显示，DeepWalk能够对网络进行全局的观察，特别是在存在缺失信息的情况下。当已标记数据很少时，DeepWalk的表示得到的F1分数比对比方法高出10％。在一些实验中，当训练数据少于60%时，DeepWalk的表现能够胜过所有对比算法。

DeepWalk也是可扩展的。DeepWalk是可以建立有用的增量结果的在线学习算法，并且是平行的。这些特性使其适用于广泛的实际应用，如网络分类和异常检测。

1. Introduction

文章简介部分介绍了网络嵌入是什么，以社交网络为例，网络嵌入就是将网络中的点用一个低维的向量表示，并且这些向量要能反应原先网络的某些特性，比如如果在原网络中两个点的结构类似，那么这两个点表示成的向量也应该类似。

普通的邻接矩阵在存储的关系很多时，纬度将变得很高，而进行矩阵分解是一个相当费时复杂的过程，因此通过矩阵分解的方法进行网络的表示学习，目前并没有应用到大规模数据集的方案。

在NLP任务中，word2vec是一种常用的word embedding方法，word2vec通过语料库中的句子序列来描述词与词的共现关系，进而学习到词语的向量表示。

本文通过将已经成熟的自然语言处理模型word2vec应用到网络的表示上，做到了无需进行矩阵分解即可表示出网络中的节点的关系。文中提出了一种网络嵌入的方法叫DeepWalk，它的输入是一张图或者网络，输出为网络中顶点的向量表示。DeepWalk通过一串截断随机游走(truncated random walk) 类比于word2vec中对单词的上下文，作为word2vec算法的输入，进而把节点表示成向量，从而学习出一个网络的社会表示(social representation)，在网络标注顶点很少的情况也能得到比较好的效果。输出的结果能够被多种分类算法作为输入应用。并且该方法还具有可扩展的优点，能够适应网络的变化。

DeepWalk的思想类似word2vec，使用图中节点与节点的共现关系来学习节点的向量表示。那么关键的问题就是如何来描述节点与节点的共现关系，DeepWalk给出的方法是使用随机游走(RandomWalk)的方式在图中进行节点采样。
RandomWalk是一种可重复访问已访问节点的深度优先遍历算法。给定当前访问起始节点，从其邻居中随机采样节点作为下一个访问节点，重复此过程，直到访问序列长度满足预设条件。

三点主要贡献：

作者使用深度学习作为工具去分析图，建立了一个适合复杂模型的Robust Representations。DeepWalk根据short random walks来学习结构化表示
作者在考虑稀疏问题上，在多标签分类任务上有很大进步，在MicroF1上有着5%-10%的提升。在一些例子上，即使提取40%的训练数据依然能获得很好的效果
作者通过采用并行的方法构建web-scale graphs（例如youtube）的representations表明了算法的可扩展性。

2. Problem Definition

将社交网络的成员分类问题考虑为一个或多个类别。

设 $G = (V, E)$ ，其中 $V$ 是网络的成员， $E$ 是其边， $E \subseteq (V \times V)$
给定部分标记的社交网络 $G [L] = (V, E, X, Y)$ ，属性 $X ∈ R^{|V|×S}$ ，其中 $S$ 是每个属性向量的特征空间的大小
$Y ∈ R^{|V|×|Y|}$ ， $Y$ 是标签集。

在传统的机器学习分类设置中，目标是学习一个假设 $H$ ，它将 $X$ 的元素映射到标签集 $Y$ 。在文中的例子中，可以利用G的结构中嵌入的例子的依赖性的重要信息，来完成突出的表现。

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第1张图片

输入：一个图的点集和边集
输出：对于（其中X是特征，Y标签集合），一般的机器学习问题，需要学习一个从X映射到Y的hypothesis。而本文的任务就是学习得到X的低维表示。

3. Learning social representations

文中提到，在学习一个网络表示的时候需要注意的几个性质：

适应性，网络表示必须能适应网络的变化。网络是一个动态的图，不断地会有新的节点和边添加进来，网络表示需要适应网络的正常演化。
属于同一个社区的节点有着类似的表示。网络中往往会出现一些特征相似的点构成的团状结构，这些节点表示成向量后必须相似。
低维。代表每个顶点的向量维数不能过高，过高会有过拟合的风险，对网络中有缺失数据的情况处理能力较差。
连续性。低维的向量应该是连续的。

提到网络嵌入，可能会让人联想到NLP中的word2vec，也就是词嵌入(word embedding)。前者是将网络中的节点用向量表示，后者是将单词用向量表示。因为大多数机器学习的方法的输入往往都是一个向量，算法也都基于对向量的处理，从而将不能直接处理的东西转化成向量表示，这样就能利用机器学习的方法对其分析，这是一种很自然的思想。

本文处理网络节点的表示(node representation)就是利用了词嵌入（词向量）的的思想。词嵌入的基本处理元素是单词，对应网络网络节点的表示的处理元素是网络节点；词嵌入是对构成一个句子中单词序列进行分析，那么网络节点的表示中节点构成的序列就是随机游走。

3.1 Random Walks

所谓随机游走(random walk)，就是在网络上不断重复地随机选择游走路径，最终形成一条贯穿网络的路径。从某个特定的端点开始，游走的每一步都从与当前节点相连的边中随机选择一条，沿着选定的边移动到下一个顶点，不断重复这个过程。截断随机游走(truncated random walk)实际上就是长度固定的随机游走。

使用随机游走有两个好处：

并行化，随机游走是局部的，对于一个大的网络来说，可以同时在不同的顶点开始进行一定长度的随机游走，多个随机游走同时进行，可以减少采样的时间。
适应性，可以适应网络局部的变化。网络的演化通常是局部的点和边的变化，这样的变化只会对部分随机游走路径产生影响，因此在网络的演化过程中不需要每一次都重新计算整个网络的随机游走。

3.2 Connection: Power laws( 连接：幂律 )

自然语言已经被证明是复合幂次定律，只需要证明图的数据也符合幂次定律就可以对图的表示应用对自然语言表示的方法。下图比较了对图进行短随机游走中向量出现的频率与单词在文本信息中出现的频率。发现对图的短随机行走也是大致满足幂次定律的。

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第2张图片

3.3 Language Modeling (语言模型)

语言模型主要是学词序列。词序列为： $W_1^n = (w_0,w_1,\cdots ,w_n)$ 。
我们要用前 $n - 1$ 个单词来预测第 $n$ 个单词，也就是最大化 $Pr(w_n | w_0,w_1,\cdots, w_{n-1})$ ，最常见的方法当然是n-gram，现在新兴的是word2vec。

针对社会网络上的随机游走序列，我们自然会想到，要用前 $n - 1$ 个节点来预测第 $n$ 个节点的出现 $Pr(v_n | v_0,v_1,\cdots, v_{n-1})$ 。但是论文的目的是要学习一个隐表示，所以引入了一个映射函数 $\Phi : v\in V \mapsto \mathbb{R}^{|V|\times d}$ 。于是，问题变成估计

$Pr(v_n | \Phi(v_0), \Phi(v_1),\cdots, \Phi(v_{n-1}))$
但是如果随机游走的长度变大，会降低该条件概率估计的效率。自然语言处理领域中，针对这个问题给出了几个解决方案：

把根据上下文预测一个单词的问题，变为根据一个单词预测上下文的问题
在一个给定单词的左边和右边都会出现上下文内容
去除单词出现的顺序约束

于是问题变成了最优化如下式子

$\min \limits_{\Phi} -log Pr (\{w_{i-w},\cdots, v_{i-1},v_{i+1} , \cdots, v_{i+w} \} | \Phi(v_i) )$
由于顺序被忽略了，所以比较适合图学习，因而有了这篇论文。

4. Method

4.1 DeepWalk

该算法由两个主要组件组成：一个随机游走生成器和一个更新程序。

随机游走：对图G，均匀地随机采样一个节点 $v_i$ ，并作为random walk的根节点 $W_{v_i}$ ，然后一直向周围邻居采样，直到达到最大路径长度 $t$ 。
随机游动的长度没有限制，但是在实验中设置最大步长是固定的。

算法如下：

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第3张图片

输出：一个顶点表示矩阵 $\Phi$ ，大小为 $∣ V ∣ \times d$
第2步是构建Hierarchical Softmax
第3步对每个节点做 $γ$ 次随机游走
第4步打乱网络中的节点
第5步以每个节点为根节点生成长度为 $t$ 的随机游走
第7步根据生成的随机游走使用skip-gram模型利用梯度的方法对参数进行更新

SkipGram参数更新的细节如下：

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第4张图片

SkipGram算法是语言模型中，最大化窗口 $w$ 中出现的词的概率的方法（梯度下降），如上图所示。
外层循环是对这个序列中的每个词进行操作，内层循环是对每个词的窗口大小为 $w$ 的词序列进行操作。具体操作是用一个似然函数 $J(\Phi)$ 表示 $\Phi$ ，然后求导，用梯度下降的方法更新（ $\alpha$ 应该是学习率）。

4.2 Hierarchical Softmax

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第5张图片

4.3 Optimization

模型参数集是 $\{\Phi,T \}$ ，使用随机梯度下降算法SGD（一次训练一个样本）进行优化（算法2中的第4行）这些参数。使用反向传播计算所有参数关于代价函数的偏导数。SGD的学习率开始训练时初始化为2.5%,然后随着训练过程中看到的顶点数量的增加线性减少。

4.4 Parallelizability 并行性

图2显示了社交网络中的随机游走的顶点和语言模型中的词的频率分布都符合幂律分布。
这导致罕见的顶点的长尾效应,因此,更新 $\Phi$ 将是稀疏的。这允许在多worker的情况下使用异步版本的随机梯度下降(ASGD)。考虑到文中的更新是稀疏的，并且没有获得一个锁来访问模型共享参数，ASGD将获得一个最优的收敛速度[36]。当使用多线程在一台机器上运行实验时，已经证明该技术具有很高的可扩展性，可以用于非常大规模的机器学习[8]。图4显示了并行化DeepWalk的效果。它显示了处理BlogCatalog和Flickr网络的速度是一致的，因为文中将worker的数量增加到了8个(图4a)。它还表明，与连续运行DeepWalk相比，预测性能没有损失(图4b)。

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第6张图片

4.5 Algorithm Variants

Streaming

这种方法的一个有趣的变体是流方法，它可以在不了解整个图的情况下实现。在这种变体中，图中的small walks直接传递给表示学习代码，并直接更新模型。首先，使用衰减的学习率将不再可能。相反,可以初始化学习速率 $\alpha$ 为小的常数值。这将花费更长的时间来学习，但在某些应用程序中可能是值得的。其次，不能再构建参数树了。如果 $V$ 的基数已知(或可以有界)，就可以为该最大值构建层次结构的Softmax树。当顶点第一次被看到时，可以将它们分配给剩余的叶子之一。如果有能力预先估计顶点频率，还可以使用霍夫曼编码来减少频繁元素访问时间。

Non-random walks

5. Experimental Design

代码和数据集在第一作者的网站上可用。

5.1 DataSets

数据集分别为

BlogCatalog [39]：blogger作者之间的社交关系网络。labels代表了bolg的主题分类。
Flickr [39]：一个图片分享网站，用户之间进行联系的网络。labels代表了用户的兴趣分组，例如“lack and white
photos”
YouTube [40]：视频分享网站，用户之间构成一个网络。labels代表了喜欢相同视频的用户的分组。

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第7张图片

5.2 Baseline Methods

和下面的baseline进行对比

SpectralClustering
Modularity
EdgeCluster
wvRN
Majority

6. Experiments

6.1 Multi-Label Classification

粗体显示了每一列的最高性能

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第8张图片

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第9张图片

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第10张图片

6.2 Parameter Sensitivity

Effect of Dimensionality

【Graph Embedding】DeepWalk：Online Learning of Social Representations论文笔记_第11张图片

参数说明

文中使用固定的window size 和walk length： $w = 10, t = 40$
$d$ :维度
$\gamma$ :每个顶点开始的walk数量
$T_R$ :学习率

实验说明

图5a1和5a3测试了改变维度和学习率的效果。Flickr和BlogCatalog的性能相当一致，表明模型的最佳维数取决于训练实例的数量。(大约1%的Flickr和10%的BlogCatalog中有多标签的样本)
图5a2和5a3研究了改变每个顶点的维数和游走次数的影响。维度之间的相对性能在不同的γ值情况下是相对稳定的。

Effect of sampling frequency

图5显示了增加 $\gamma$ 的影响,random walks的数量从每个顶点开始。

不同维度(图5b1、图5b3)和训练数据量(图5b2、图5b4)的结果非常一致。最初,增加 $\gamma$ 结果有很大影响,但这种影响很快减慢 $(\gamma> 10)$ 。这些结果表明，只有在少量的random walks之后能够学习有意义的顶点的潜在表示。

8. Conclusions

总的来说这篇论文算是network embedding的开山之作，它将NLP中词向量的思想借鉴过来做网络的节点表示，提供了一种新的思路，后面会有好几篇论文使用的也是这种思路，都是利用随机游走的特征构建概率模型，用词向量中Negative Sampling的思想解决相应问题。

Deepwalk是一个非常简单但很有创意的方法，它将基于图的经典方法随机游走和自然语言处理中的skip-gram模型结合，得到了一个简单好用的网络表达学习方法。这也是第一篇将深度学习应用在大规模网络上，因此这个方法具有很强的可拓展性。Deepwalk作为网络表达学习中一个开创性工作，从一个简单的角度切入，用现有的成熟的方法，在一个全新的且尚未成为主流的问题中得到一个行之有效的解，不仅对网络表达这个问题带来极大的发展，同时也为我们做研究提供了一个很好的思路。一个优秀的方法是要建立在前人工作的基础上而不是凭空产生，并且当前最热门的问题并不一定是最值得研究的，冷门的问题也有其潜在的研究价值。

DeepWalk利用截断随机游走的局部信息作为输入，学习了一种能编码网络结构信息的表示方法。对各种不同图的实验证明了这种方法在挑战多标签分类任务的有效性。

作为一种在线学习算法，DeepWalk也是可扩展的。结果表明，可以为太大而无法运行谱方法的图创建有意义的表示。在如此大的图上，这种方法明显优于其他设计用于稀疏操作的方法。文中还展示了这种方法是可并行的，允许works同时更新模型的不同部分。

作者在该领域的未来工作将集中于进一步研究这种对偶性，利用文中的结果改进语言建模，并加强该方法的理论合理性。

9. 资料下载

DeepWalk: Online Learning of Social Representations作者ppt分享

7+纯生信范文，针对肿瘤中某一类细胞，进行了WGCNA+分型+单细胞+建模分析，内容充实，值得模仿！生信小课堂
生信小课堂影响因子：7.3研究概述：透明细胞肾细胞癌（(Clearcellrenalcellcarcinoma,ccRCC)是一种常见的肾癌亚型，复发和预后不良的倾向性高，其肿瘤微环境复杂，显著影响肿瘤进展和免疫治疗反应。近年来研究发现肿瘤浸润性B淋巴细胞（TIL-Bs）可能在ccRCC中具有促肿瘤作用，这与已知的B细胞在多种恶性肿瘤中抗肿瘤反应有所不同，值得深究，可为ccRCC的TME提供新的见
electron 下载过慢解决阿雷由开发 electron
elecetron起步根据elecetron官网上，试了下初始安装，结果第一步安装依赖就挂了2个命令都试过了不行npminstall--save-develectronyarnadd--develectron安装cnpm命令npminstall-gcnpm--registry=https://registry.npm.taobao.org还是回到cnpm吧，最少他告诉你进度条有有了进度条，最少知道
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
6+，基于免疫原性细胞死亡的非肿瘤分型文章，投稿到接收仅一个多月，肿瘤的热点已经传导至非肿瘤生信文章中！生信小课堂
影响因子：6.147本文从投稿到接收仅一个多月关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，机器学习，分子分型等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流！研究概述：脑卒中是世界上死亡和残疾的主要原因之一，缺血性中风占80
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
Gcn符号笔记 happydog007 笔记 python
KeyPoints邻接矩阵A通常表示无向图中结点之间的连接，尺寸为[N,N]，其中N是结点的数量。度矩阵D是对角矩阵，尺寸为[N,N]，对角元素表示每个结点的度。结点特征向量矩阵XXX的尺寸为[N,C]，其中C是每个结点的特征数量，包含结点的额外属性，如年龄或文本特征。邻接矩阵A邻接矩阵A是一个方阵，用于表示图中结点之间的连接关系。对于无向图，A[i,j]=1A[i,j]=1A[i,j]=1表示结
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
豆包编写Java程序小试 tianyatest java python 开发语言
今天下载了一本第四版电气工程师手册，非常棒的一本书，在给PDF添加目录的时候，由于目录有将近60页，使用老马开发的PdgCntEditor有点卡顿，不过补充下，老马这个PdgCntEditor还是非常好的。所以我决定用Java编一个小程序来对目录文件进行缩进处理，然后再导入到PdgCntEditor中进行保存。之前还没试过用AI编写程序，就采用豆包进行了一个程序测试。输入指令如下：作为一名java
GNN--知识图谱（逐步贯通基础到项目实践）峙峙峙图神经网络知识图谱人工智能
原文仓库链接：知识图谱–贯通已有知识地图记录知识关系图谱和跨学科碰撞新启发知识图谱mermaid可能需要下载插件才能渲染线性代数神经网络深度学习框架硬件加速图论GNN框架交叉理解前向理解定义：前向理解：A–>B，A为B的基础铺垫知识，通过深入学习A对B有更好的理解01.LinearAlgebraforLinearLayerofNN从线性代数行列变换的角度看神经网络中的线性层线性代数矩阵乘法，可以理
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
基于图神经网络的ALS候选药物预测模型设计与实现神经网络15044 MATLAB专栏神经网络深度学习神经网络人工智能深度学习机器学习
基于图神经网络的ALS候选药物预测模型设计与实现一、任务背景与意义肌萎缩侧索硬化症（ALS）是一种致命的神经退行性疾病，目前尚无有效治愈方法。传统药物发现流程耗时长、成本高，而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络（GNN）的ALS候选药物预测模型，通过整合分子图结构信息和生物活性数据，实现对潜在治疗ALS化合物的高效筛选。二、系统架构设计
百度7天GNN学习-图与图学习中静静喜欢大白 pgl
目录1链接预测分析图学习的主要任务链接预测（Linkprediction）1.相似度分数2.性能指标(Performancemetrics)完整代码输出2节点标记预测分析完整代码输出3图嵌入图嵌入（GraphEmbedding）1.节点嵌入(NodeEmbedding)2.边嵌入(EdgeEmbedding)3.图嵌入(GraphEmbedding)完整代码输出小结小结参考1链接预测分析图学习的
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
顶会新方向！14篇图神经网络（GNN）最新顶会论文汇总！（含2024） AI科研技术派神经网络人工智能深度学习
图神经网络（GNN）是深度学习领域中备受关注的前沿课题，它在处理图结构数据方面展现出了强大的潜力，随着研究的不断深入，越来越多的优秀论文在顶级学术会议上涌现。今天就给大家整理了14篇顶会中发表的图神经网络优质论文，一起看看这方面的最新研究成果吧！AAAI20241、Fine-tuningGraphNeuralNetworksbyPreservingGraphGenerativePatterns通过
linux 下 jenkins 构建 uniapp node-sass 报错无名前端小白 uni-app sass 前端
背景:jenkins中构建uniapp应用配置:1.将windowsHbuilderX插件目录下的uniapp-cli文件夹复制到服务器/var/jenkins_home/uniapp-cli2.jenkins构建步骤增加执行shell,内容如下echo">>构建中..."#打包前端exportLANG=en_US.UTF-8npminstall-gcnpm--registry=https://r
图神经网络(GNN)模型的基本原理 xiaocai_6666 神经网络人工智能深度学习
一、概述在人工智能领域，数据的多样性促使研究人员不断探索新的模型与算法。传统的神经网络在处理像图像、文本这类具有固定结构的数据时表现出色，但面对具有不规则拓扑结构的图数据，如社交网络、化学分子结构、知识图谱等，却显得力不从心。图神经网络（GraphNeuralNetworks,GNN）是一种直接在图结构数据上运行的神经网络，用于处理节点、边或整个图的特征信息。其核心思想是通过聚合邻域节点的
如果使用npm 命令安装了‘crypto-js’ 但是npm list显示没有的话 Cannot find module ‘crypto-js’——python调用crypto-js报错情况下阿~苏 javascript 开发语言 ecmascript
如果使用npm命令安装了crypto-js但是npmlist显示没有的话，可使用命令行代码如下：npminstall-gcnpm--registry=https://registry.npm.taobao.org这是下载命令cnpminstallcrypto-js同时如果python无法调用crypto-js时，把下载下来的crypto-js文件夹复制到node_modules目录下全局和本地都得
《A Gentle Introduction to Graph Neural Networks》欧先生^_^ 人工智能
这篇《AGentleIntroductiontoGraphNeuralNetworks》是一篇非常经典且对新手友好的图神经网络入门文章。我将为你深入浅出地解读它的核心思想、关键概念和重要性。这篇论文（更像是一篇博客文章或教程）的主要目的不是提出新的模型，而是系统性地、直观地解释GNN到底是什么，为什么需要它，以及它是如何工作的。我会将解读分为以下几个部分：核心动机：为什么我们需要GNN？核心思想：
18 - GCNet Leo Chaw 深度学习算法实现深度学习计算机视觉人工智能 pytorch
论文《GCNet:Non-localNetworksMeetSqueeze-ExcitationNetworksandBeyond》1、作用GCNet通过聚合每个查询位置的全局上下文信息来捕获长距离依赖关系，从而改善了图像/视频分类、对象检测和分割等一系列识别任务的性能。非局部网络（NLNet）首次提出了通过聚合查询特定的全局上下文到每个查询位置来捕获长距离依赖的方法。GCNet在此基础上进行了改
图注意力卷积神经网络GAT在无线通信网络拓扑推理中的应用 zzc921 无线通信网络拓扑推理 cnn 人工智能神经网络无线通信网络拓扑推理 WCNA GCN GAT
如果已经编写好了GCN的程序，改写GAT的程序是很方便的，torch_geometric.nn下既有一般图神经网络GCNConv包,也有图注意力神经网络GATConv包程序：#作者：zhouzhichao#创建时间：25年6月10日#内容：比较GAT和GCN在无线通信网络拓扑推理中的效果importwarningswarnings.simplefilter(action='ignore',cate
图卷积网络：从理论到实践 Morpheon 人工智能深度学习机器学习网络
图卷积网络（GraphConvolutionalNetworks,GCNs）彻底改变了基于图的机器学习领域，使得深度学习能够应用于非欧几里得结构，如社交网络、引文网络和分子结构。本文将解释GCN的直观理解、数学原理，并提供代码片段帮助您理解和实现基础的GCN。图表示法基础定义图G=(V,E)，其中：VVV：节点集合EEE：边集合A∈RN×NA\in\mathbb{R}^{N\timesN}A∈RN
dll找不到dll electron_记录 electron-vue 通过node ffi调用dll文件踩的坑苏承心 dll找不到dll electron
记录踩的坑,防止以后忘记一些注意点1.需要用window电脑2.npm容易出错,建议使用cnpmnpminstall-gcnpm--registry=https://registry.npm.taobao.org3.如果dll是32位的nodejs和electron都要使用对应的版本才可以使用,4.nodejs版本建议9版本以下复制代码拉取electron及依赖安装//首先安装node-gyp1.
[特殊字符] 基于深度强化学习的机器人路径规划优化方案：从理论到实战 2506_92092175 python
摘要本文提出一种融合深度确定性策略梯度（DDPG）与图卷积网络（GCN）的混合架构，针对高动态环境下移动机器人路径规划问题展开研究。通过自研仿真平台验证，该方案在动态障碍物规避、路径平滑度等维度较传统A*算法提升显著，同时兼顾实时性要求。完整代码与训练日志已开源至GitHub，诚邀技术同仁共同探讨。一、核心痛点分析1.1传统算法局限性算法类型优势劣势Dijkstra理论最优性计算复杂度O(V²)，
java 实现仿word2007字数统计功能 e网情深e java
近期做一个阅读app,需要统计字符，为了与word保持一致，在网上找了一番，最终找到一个可以使用的，贡献给大家。/***类似word统计字符数**@paramcontext*@return*/publicstaticintgetMSWordsCount(Stringcontext){intwords_count=0;//中文单词Stringcn_words=context.replaceAll("
【时空图神经网络 & 交通】相关模型2：STSGCN | 时空同步图卷积网络 | 空间相关性，时间相关性，空间-时间异质性追光者♂ 百题千解计划(项目实战案例）STSGCN 空间-时间同步图卷积模块 STSGCM 深度学习人工智能 Traffic 空间-时间异质性
注：仅学习使用~前情提要：【时空图神经网络&交通】相关模型1：STGCN|完全卷积结构，高效的图卷积近似，瓶颈策略|时间门控卷积层：GLU（GatedLinearUnit），一种特殊的非线性门控单元目录STSGCN-2020年1.1背景1.2模型1.2.1问题背景：现有模型存在的问题1.2.2模型1.3问答Q1：STSGCM补充：构造局部时空图的方式（LocalizedSpatial-Tempor
一文解析13大神经网络算法模型架构攻城狮7号 AI前沿技术要闻深度学习神经网络人工智能机器学习
目录一、引言：神经网络的演进脉络二、基础架构：深度学习的基石2.1人工神经网络（ANN）2.2深度神经网络（DNN）三、专项任务架构：领域定制化突破3.1卷积神经网络（CNN）3.2循环神经网络（RNN）3.3图神经网络（GNN）四、生成模型：从数据到创造4.1生成对抗网络（GAN）4.2变分自编码器（VAE）4.3扩散模型（DiffusionModels）五、现代架构：大模型的核心引擎5.1Tr
多模态情感分析论文整理（2021-2023） Musennn 多模态情感分析学习笔记深度学习人工智能论文笔记
MABSA下游任务论文整理一.MASC任务（一）基于注意力模型的相关论文（二）基于图卷积网络(GCN)的相关论文二.ASPE任务（一）PIPELINE-BASEDASPEMETHOD（二）JOINT-BASEDASPEMETHOD（三）UNIFIED-BASEDASPEMETHOD（四）TEXTGENERATION-BASEDASPEMETHOD一.MASC任务（一）基于注意力模型的相关论文‘‘S
BERT-BILSTM-GCN-CRF-for-NER: NER任务中的融合创新傅阳轩
BERT-BILSTM-GCN-CRF-for-NER:NER任务中的融合创新【下载地址】BERT-BILSTM-GCN-CRF-for-NERNER任务中的融合创新BERT-BILSTM-GCN-CRF-for-NER是一款专注于命名实体识别（NER）任务的创新模型，结合了BERT、双向长短期记忆网络（BILSTM）、图卷积网络（GCN）和条件随机场（CRF）的优势。该模型通过引入GCN捕捉实体
C++ 代码覆盖率分析：使用 CMake + Gcovr 生成 HTML/XML/JSON 报告另寻沧海 cmake clean_code c++代码覆盖率
使用CMake和Gcovr进行代码覆盖率分析1.Gcovr的原理1.1编译时插桩(Instrumentation)使用-fprofile-arcs-ftest-coverage选项时，GCC会插入探针(probes)以记录代码执行情况。编译后，会生成：.gcno文件：代码块（BasicBlock）信息。可执行文件（带有探针的代码）。1.2运行时记录(ProfilingData)运行可执行文件后，G
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include