GDSC数据库使用(分析基因表达量与药物敏感性影响)

  1. 数据下载:不要下载raw data

    • 细胞系注释文件: Cell-line-annotation
    • 药物注释文件:Compounds-annotation
      img
    • 药物IC50以及AUC文件:GDSC1-dataset
      img
    • ANOVA统计文件(可选):GDSC1-ANOVA
      img
    • 基因在各个细胞系表达量的文件:Download from GDSC1000 resourse
    • 或者依此检索后下载
  2. 处理下载后的数据

    • Step 1 - 使用perl程序-整理“expression”和“drug两个数据表格,”将表达数据+药物的IC50数据整理成,横行为细胞COSMIC的ID,列为IC50/基因名字

    • Step 2 - 按基因检索:使用R语言程序提取“某个基因”在不同细胞系的IC50情况,最后会生成一个表:基因与药物IC50的关系,co r>0表示呈现正相关,基因表达越高,IC50越大,表明高表达耐药。(之需要在R脚本中改写文件位置以及基因名称运行R与语言即可。)

      文件位置/Users/xiangyu/Documents/GDSC/GDSC6_geneCor只需要点开R脚本,修改待查找的基因名称就可以查询信息,需要几分钟运行。可以查该基因表达与药物耐药的关系
      /Users/xiangyu/Documents/GDSC/GDSC8_cancer/geneCor可以查该基因表达在特定肿瘤中的与药物耐药的关系只需要更改R脚本中的基因名称

    • Step 3 - 按药物检索:结果会显示一个药物中IC50与哪些基因有关

你可能感兴趣的:(GDSC数据库使用(分析基因表达量与药物敏感性影响))