Geometric Vector Perceptron (GVP) 开源项目教程

Geometric Vector Perceptron (GVP) 开源项目教程

gvp 项目地址: https://gitcode.com/gh_mirrors/gvp/gvp

1. 项目介绍

1.1 项目概述

Geometric Vector Perceptron (GVP) 是一个用于从生物分子结构中学习的旋转等变图神经网络(GNN)。该项目由斯坦福大学的 Dror 实验室开发,旨在通过几何向量感知器来处理生物分子结构数据,特别是在蛋白质设计领域。

1.2 主要功能

  • 旋转等变性:GVP 能够处理具有旋转等变性的数据,这在生物分子结构分析中非常重要。
  • 蛋白质设计:提供了用于蛋白质设计的训练管道和预训练模型。
  • 通用架构:GVP 的架构设计灵活,可以适应其他用途,如药物设计等。

2. 项目快速启动

2.1 环境准备

确保你的环境满足以下要求:

  • UNIX 环境
  • Python 3.7.6
  • NumPy 1.18.1
  • SciPy 1.4.1
  • Pandas 1.0.3
  • TensorFlow 2.1.0
  • tqdm 4.42.1

2.2 安装步骤

  1. 克隆项目仓库:

    git clone https://github.com/drorlab/gvp.git
    cd gvp
    
  2. 安装依赖:

    pip install -r requirements.txt
    

2.3 数据准备

获取 CATH 4.2 数据集:

sh data/getCATH.sh

2.4 训练模型

使用以下命令训练 CPD 模型:

python3 src/train_cpd.py /data/chain_set.jsonl

2.5 评估模型

评估模型的困惑度:

python3 src/test_cpd_perplexity.py /models/cath_pretrained

3. 应用案例和最佳实践

3.1 蛋白质设计

GVP 在蛋白质设计中的应用非常广泛。通过使用预训练模型,可以快速生成新的蛋白质序列。以下是一个简单的使用案例:

from src.models import CPDModel
from src.datasets import load_dataset

dataset = load_dataset('/path/to/your/data.json', batch_size=1, shuffle=False)
model = CPDModel.load('/models/cath_pretrained')

for structure, seq, mask in dataset:
    n = 1  # 生成序列的数量
    design = model.sample(structure, mask, n)
    print(design)

3.2 药物设计

GVP 的灵活架构使其可以应用于药物设计。通过调整输入数据和模型参数,可以预测药物与蛋白质的相互作用。

4. 典型生态项目

4.1 PyTorch Geometric 版本

GVP 的 PyTorch Geometric 版本在 gvp-pytorch 仓库中提供,强调易用性和模块化。所有未来的更新将在此仓库中进行。

4.2 相关研究

  • Ingraham, et al. NeurIPS 2019: 该项目的基础研究,提供了蛋白质设计的初始框架。
  • B Jing, S Eismann, P Suriana, RJL Townshend, and RO Dror: 原始论文详细介绍了 GVP 的设计和应用。

通过以上步骤,你可以快速上手并应用 Geometric Vector Perceptron 项目。希望这篇教程对你有所帮助!

gvp 项目地址: https://gitcode.com/gh_mirrors/gvp/gvp

你可能感兴趣的:(Geometric Vector Perceptron (GVP) 开源项目教程)