大模型基础

大模型是什么

大模型是一种由大规模语言模型,由大量神经元组成,可以对输入的文本或者其他的类似视频图片语音等进行预测和生成,以便提供更多的信息给用户。这种模型通常基于深度学习技术和大规模语言模型训练,能够模拟人类的对话方式,通过视频,图片以及语音和文本的方式与用户进行交互。比如现在流行的chatgpt,llama,文心一言,都是基于大模型技术开发的。
其中包括几个大类:

  1. prompt 提示词,用于引导模型生成内容,比如chatgpt的prompt,llama的prompt,文心的prompt,都是不同的
  2. 大模型API调用,包括function calling assistant APIs
  3. RAG,也属于embedding的部分,根据向量数据库以及相关的一些相关性进行检索数据库,根据数据库的知识去解决用户的一些问题
  4. agent,也叫做智能体,通过将复杂任务进行子任务的拆解,并通过调用基层大模型进行子任务的求解,然后通过交互的方式将结果进行整合,从而完成复杂任务
  5. finetune,对大模型进行微调,使其能够更好的适应特定的任务和场景,比如我们想要做一个教育类的大模型,需要通过自己收集大量教育类数据,然后进行微调,使其能够更好的适应教育类任务。比如一对一的私教(网易出品的子曰大模型其实就是一个微调模型)。通俗易懂的讲就是让大模型学习专业领域的一些知识,从而让大模型成为某个领域的专家,用于部署和应用。
  6. 多模态大模型,前面提到的大模型其实主要还是以文本的方式作为大模型的输入输出,但是实际生活中我们的输入可以是多种多样的,比如说视频,图片,语音,文本等,所以大模型其实可以支持多种模态的输入输出,从而能够更好的适应多种场景。也是通往通用人工智能的必经之路
  7. 模型压缩,对大模型进行压缩,使其能够更好的适应不同的硬件环境和不同的部署场景,从而能够更好的部署和应用。
  8. 模型部署,将大模型部署到不同的硬件环境和不同的部署场景,从而能够更好的部署和应用。
  9. 模型安全,对大模型进行安全防护,使其能够更好的适应不同的硬件环境和不同的部署场景,从而能够更好的部署和应用

大模型能做什么

  1. 按格式输出:提取数据库或者用户输入的prompt中的内容按照要求的格式输出结果
  2. 分类:将用户输入的prompt按照要求进行分类,比如情感分类,情感分析,情感识别等
  3. 聚类:将用户输入的prompt按照要求进行聚类,比如相似度计算,相似度分析,相似度识别等,比如如果我们想要在数据库中找到我们想要的一些知识,之前的方式可能是百度,google搜索一下,之后可能是直接输入prompt,然后通过大模型进行搜索,从而能够更好的找到我们想要的知识。当然这里的prompt可能是文本也可以是语音,图片,视频等。
  4. 角色扮演:现在很多开源或者闭源的大模型,一般会让大模型扮演某一个角色,比如说你现在是一个专业的设计师,现在让你来回答一些设计师领域相关的问题,那么大模型就可以扮演设计师的角色,从而能够更好的回答设计师领域的问题。具体原因在于大模型训练的过程中一般会给训练数据进行分类打标签,这样如果提示词中有相应的一些类别标签,大模型就可以更好的识别并回答相应的问题。
  5. 问答:这个应该是最基本的一些功能了,大模型本身训练数据就是通过问答的方式去做的,问答包括简单的一问一答,或者类似function calling,assistant APIs的方式去调用大模型进行问答,大模型会根据用户的一些反馈给出一些问题,最后进行整合,从而给出最终的答案。
  6. 生成:包括类似程序员的代码生成,这种确定性的一些输入输出的一些问题可以通过大模型来解决用以提升生产效率。再比如生成文章,ppt,文案,图片,视频等,这些都是可以通过大模型来完成,知识目前看还是有很多需要改进的空间。比如视频生成时间维度上一致性的问题,经常生成的视频变着变着就千奇百怪了。
  7. 翻译:大模型可以进行多语言的翻译,从而能够更好的适应不同语言的用户需求。这个应该已经算是落地了,很多留学生都会用一些翻译软件,这样就可以在上课或者平时交流的时候可以通过这些软件来实现一定程度上的解决语言上的障碍了,再比如一些国内的大厂,比如网易开发的hi echo等通过大模型来扮演私教的方式教别人怎么进行英语的口语练习等。
  8. 鉴定:相当于分类的一种,赵勇在线推出了一款AI鉴宝的功能,这种其实就是之前通过AI来进行古董分类鉴定真伪,很多都只需要上传一张图片就可以给出结果,据说准确率达到95%。
  9. 垂类应用:比如某一程序员只懂C++后端编程,如果自己想要做一款APP出来,就可以通过大模型来辅助自己去完成包括前端,美术视角,后端,以及数据库的一些代码构建然后去实现一定意义上的超级个体,一个人完成整个链路的开发。
  10. 游戏:大模型可以进行一些游戏的开发,比如之前提到的王者荣耀,很多游戏都是通过大模型来辅助完成一些游戏操作的,
  11. 影视:很多特效类或者剪辑类的都是可以通过大模型来提升效率的
  12. 音乐:大模型可以进行一些音乐创作,比如之前提到的AI作词,AI作曲,AI编曲等,
  13. 图像:大模型可以进行一些图像处理,比如之前提到的AI换脸,AI图像修复等,
  14. 在线培训:比如知识付费,这一波应该是很多人都得到了大模型的红利,很多人想要了解自己不了解的一些事情,比如设计师不知道怎么码代码,包工头不知道怎么写PPT,程序员不知道怎么写文案,大模型可以进行一些辅助性的培训,从而能够更好的提升效率。
  15. 虚拟人:大模型可以进行一些虚拟人的开发,比如之前提到的AI主播,AI虚拟形象等,现在很火的数字人直播就是其中一种
    以上的只是个人视角所看到的一些应用,有重复也有一些不太黑的地方,当然也有很多没看到的领域,大家共勉吧,希望大模型能够给我们的生活带来更多的便利。AGI时代存在很多信息差,这就代表这赚钱的机会,最好的方式就是根据自己熟悉的领域去挖掘AI的一些应用,大的应用系统或者大模型微调等,都是需要某一行业大量的数据堆砌出来的,普通人更多的是找到某一个行业的链路中的某一环节去通过AI赋能提升效率,打出自己跟头部企业的差异来,然后去获取自己的第一桶金。

总之一句话,普通人其实大部分还是不知道或者没办法去清晰认识到自己的能力欠缺,没办法一直坚持去做自己擅长的一些事情,赚钱本质是你可以提供价值,而价值来源于你的能力,而能力来源于你的经验,而经验来源于你的经历,所以去做吧,洞察力+执行力才是赚钱的最好方式。

你可能感兴趣的:(大模型,人工智能)