【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资

2023年8月21日 星期一 癸卯年七月初六
第000005号
请添加图片描述

本文收录于IT资讯速递专栏,本专栏主要用于发布各种IT资讯,为大家可以省时省力的就能阅读和了解到行业的一些新资讯

请添加图片描述

IT资讯速递

  • 一、清华系团队开源多模态生物医药大模型
  • 二、《中国存力白皮书(2023年)》:出现技术演化等六大趋势
  • 三、MIT推出拾物机器人「最强辅助」,少量训练样本实现自然语言控制
    • 3.1 如何利用F3RM帮助机器人工作呢?
      • 3.1.1 Scan Scene
      • 3.1.2 Train NeRF and Distill Features
      • 3.1.3 Language-Guided Manipulation
  • 四、深势科技完成新一轮超7亿元融资,为AI for Science 引入大模型时代

一、清华系团队开源多模态生物医药大模型

  • 据清华大学智能产业研究院微信公众号发文,清华大学智能产业研究院(AIR) 携手大模型初创公司水木分子开源 可商用多模态生物医药百亿参数大模型BioMedGPT-10B
  • 据介绍,该大模型可用于提升药物研发各个环节的效率,包括新药立项评估药物设计和优化临床试验设计适应症拓展等。

该模型在生物医药领域的问答能力号称“比肩人类专家水平”,在多个生物医药问答基准数据集上实现了SOTA(state-of-the-art
model,目前最先进的模型),已成功通过了美国医师资格考试。

【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第1张图片

  • 据悉,该模型已于8月14日上线开源。此外,该团队一同上线了BioMedGPT-LM-7B,号称是“首个可商用、生物医药专用的Llama2大模型”。

  • 水木分子是由清华大学智能产业研究院于今年7月孵化成立的大模型创业公司,致力于打造生物医药行业基础大模型及新一代对话式药物研发助手,目前已完成千万级种子轮融资。清华大学国强教授、AIR首席研究员聂再清教授任首席科学家。

  • 开源地址

OpenBioMed

https://github.com/PharMolix/OpenBioMed

BioMedGPT-LM-7B

https://huggingface.co/PharMolix/BioMedGPT-LM-7B

二、《中国存力白皮书(2023年)》:出现技术演化等六大趋势

  • 2023中国算力大会发布《中国存力白皮书(2023年)》。
  • 白皮书首次阐明了先进存力的特征,并指出当下数据存力发展存在几大趋势:一是闪存技术加速演进,推动全场景闪存化;二是安全可信能力攀升,夯实数据要素安全;三是AI 存储走向专业化,数据处理能力卸载至存储成为 AI 存储的新方向;四是存储多云生态完善,增强数据共享流动;五是存算分离架构创新,提升数据应用效率;六是软硬节能技术成熟,全闪存、风液冷、高密硬件技术正在大幅降低存储能耗

三、MIT推出拾物机器人「最强辅助」,少量训练样本实现自然语言控制

  • MIT的这项新成果,让取物机器人变得更聪明!不仅能理解自然语言指令,还可以拾取没见过的物体。研究人员将2D特征嵌入了三维空间,构建出了用于控制机器人的特征场(F3RM),低训练样本实现轻松取物。

  • 对于场景中的同种物品,可以根据颜色等信息进行区别;不仅如此,还可以要求机器人抓取物体的特定位置;除了拾取问题,还可以让机器人把拾到的东西放到指定位置

  • 从统计结果上看,对不同数据集的成功率均达到了60%,其中在CLIP ResNet数据集上的成功率达到了78%,对于由语言控制的操纵,也有62%的成功率
    【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第2张图片

3.1 如何利用F3RM帮助机器人工作呢?

  • F3RM是一个特征场,要想让它发挥作用,首先要得到有关数据,下图中的前两个环节就是在获取F3RM信息
    【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第3张图片

3.1.1 Scan Scene

  • 首先,机器人通过摄像头对场景进行扫描,扫描过程会得到多个角度的RGB图像,同时得到图像特征

3.1.2 Train NeRF and Distill Features

  • 利用NeRF技术,对这些图像做2D密度信息提取,并投射到三维空间。图像和密度特征的提取使用了如下的算法:
    【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第4张图片
  • 这样就得到了这一场景的3D特征场,可供机器人使用。
  • 得到特征场之后,机器人还需要知道对不同的物体需要如何操作才能拾取,这一过程当中,机器人会学习相对应的六个自由度的手臂动作信息。

【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第5张图片

  • 如果遇到陌生场景,则会计算与已知数据的相似度,然后通过对动作进行优化,使相似度达到最大化,以实现未知环境的操作。
    【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第6张图片

3.1.3 Language-Guided Manipulation

  • 自然语言控制的过程与上一步骤十分相似。

  • 首先会根据指令从CLIP数据集中找到特征信息,并在机器的知识库检索相似度最高的DEMO。

【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第7张图片

  • 然后同样是对预测的姿势进行优化,以达到最高的相似度。

  • 优化完毕之后,执行相应的动作就可以把物体拾起来了。
    【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第8张图片

  • 经过这样的过程,就得到了低样本量的语言控制取物机器人。

四、深势科技完成新一轮超7亿元融资,为AI for Science 引入大模型时代

  • 据深势科技 DP Technology微信公众号发文,深势科技近日完成新一轮超7亿人民币的融资。此轮融资投资人包括众源资本、和玉资本、正心谷资本、Evergreen Scitech Delta等,以及多家产业资本。
  • 深势科技称,此轮融资资金将主要用于继续吸引行业内顶尖人才,深化从算法原始创新到工业软件及行业解决方案的全栈能力,并加强相关技术在生物医药、新能源、化工、半导体等场景的产业化落地及商业化推广。
  • 深势科技致力于运用“AI for Science”科研新范式,为生物医药、能源、材料和信息科学与工程研究打造新一代多尺度模拟仿真平台及工业基础设施。

【IT资讯速递(000005)】清华系团队开源多模态生物医药大模型;《中国存力白皮书(2023年)》:出现技术演化等六大趋势;MIT推出拾物机器人「最强辅助」;深势科技完成新一轮超7亿元融资_第9张图片

  • 深势科技成立于2018年,致力于运用“AI+分子模拟”技术,为基础的生命、能源、材料科学与工程研究打造微尺度工业设计平台,解放行业研发生产力。

和玉资本(MSA Capital)相关负责人表示,深势科技打造新一代科学研究基础设施,解放了过去因算力限制的发展进程,为药物研发、材料探究等领域提供了全新的可能性。团队具有全球领先的科研技术水平,在全球范围内属于AI For Science领域的先行者、引领者。这种基础设施,底层逻辑的创新也是我们一直在核心科技赛道所寻觅的。我们期待与深势科技共同成长,并助力深势科技的科研成果转化,共同打造AI for Science的新时代。

正心谷资本相关负责人表示,深势科技是AI for Science的先行者,是国内首个做出了AI for Science领域世界级的原创性成果的团队。

  • 近年来,深势科技进入规模化及商业化发展加速阶段,已经成长为 AI for Science 行业的重要引领者,推出了一系列面向微观和介观尺度模拟仿真、分子性质预测、实验表征优化等多项科学基本问题的计算引擎和预训练模型,在此基础上打造了科研、药物、电池等行业的新一代AI与计算仿真驱动的研发解决方案,并迅速构建基于 AI for Science 的开放生态及产业协作体系。

✅如果大家觉着内容还算可以,那么就关注一下爱书不爱输的程序猿
也可以加入我的社区一起学习呀
各种专栏,精彩不断

  • SQL应知应会专栏,对于数据库的一些学习,有基础也有进阶,有MySQL也有Oracle
  • UML应知应会专栏,对于UML的一些讲解,应有尽有
  • … … 还有java的专栏算法与数据结构的专栏等其他专栏,快去我的主页关注我吧

请添加图片描述

你可能感兴趣的:(IT资讯速递,人工智能,AI,大数据,UML,自然语言处理)