离线中英文文字图像相似度特征值检测软件(基于CLIP、Transformers等实现)

中英文文字图像相似度特征值检测软件

与我之前那篇文章:离线中英文文字图像匹配度检测软件(基于CLIP、Transformers等实现)
原理、结构都相似,要想看更具体的描述见该文章,不同之处是输出每句文本对于被检测图片的相似度特征值大小,而不是使用 softmax层进行归一化处理,应用场景不同,这样可以体现出每个文本对应图片的具体相似度的值大小。
离线中英文文字图像相似度特征值检测软件(基于CLIP、Transformers等实现)_第1张图片

你可能感兴趣的:(人工智能,算法,深度学习,qt,python)