利用深度学习助力科学文献真实性评估——scite的探索与实践

在当今的科学研究领域,确保研究的可靠性是至关重要的。而scite这家公司,正通过深度学习技术,致力于对科学文献进行全面分析,以更好地衡量科学工作的真实性。

scite的联合创始人兼首席执行官Josh Nicholson介绍说,scite的创意源于对癌症研究中常出现的一个现象的观察,即许多癌症研究在独立测试时无法重现,并且这个问题并不局限于癌症研究领域。为了让科学研究更加可靠,他们选择利用机器学习技术来大规模分析文献。

截至目前,scite已经分析了来自16,158,032篇文章的526,695,986条引用声明,而且这个数字每天都在快速增长。

那么scite是如何帮助读者评估一篇科学文章的呢?scite致力于引入“智能引用”。普通引用往往只关注被引用的次数、浏览量或下载量等指标,但智能引用会给出每条引用的背景及含义。比如,判断该引用是提供支持性证据还是矛盾性证据。通过这种方式,人们可以快速判断一项研究是得到了支持还是遭到了反驳。

为了训练模型并创建引用图,scite的数据来源较为广泛。一方面利用开放获取的文章,另一方面通过与Wiley、IOP、洛克菲勒大学出版社、Karger、BMJ等领先学术出版商合作获取非开放内容。

scite的模型工作流程是,在识别引用及其上下文后,其深度学习模型会将引用声明分为支持、矛盾或提及这三个类别之一。该模型是在来自不同科学领域的数以万计的人工标注片段上进行训练的。

scite的主要模型尽可能全天

你可能感兴趣的:(大数据与人工智能,深度学习,人工智能,个人开发)