神经机器翻译的多模态输入:利用图像和视频

神经机器翻译的多模态输入:利用图像和视频

1.背景介绍

1.1 神经机器翻译的发展历程

1.1.1 统计机器翻译时代
1.1.2 神经机器翻译的崛起
1.1.3 神经机器翻译的优势与局限

1.2 多模态机器翻译的兴起

1.2.1 多模态数据的丰富性
1.2.2 多模态信息的互补性
1.2.3 多模态机器翻译的研究意义

1.3 利用图像和视频进行机器翻译的动机

1.3.1 图像信息对翻译的辅助作用
1.3.2 视频信息对翻译的辅助作用
1.3.3 多模态融合的挑战与机遇

2.核心概念与联系

2.1 神经机器翻译

2.1.1 编码器-解码器框架
2.1.2

你可能感兴趣的:(DeepSeek,R1,&,大数据AI人工智能大模型,AI大模型企业级应用开发实战,计算,计算科学,神经计算,深度学习,神经网络,大数据,人工智能,大型语言模型,AI,AGI,LLM,Java,Python,架构设计,Agent,RPA)