昨天老婆说公司用的一个AI大模型产品 按照Tokens 收费,问我Tokens是什么? 嗯…
给老婆科普一下
在自然语言处理 (NLP) 和大语言模型(如 GPT 系列)中,token 是文本数据的基本单位。一个 token 通常可以是:
对于英语等语言,通常一个 token 大致相当于一个单词或者标点符号。但在一些语言中,token 可能会更小,例如在中文中,每个字符(如一个汉字)通常被视为一个 token。
大型语言模型(如 GPT-3、GPT-4)处理文本时,会将输入文本拆分成 tokens,然后逐个 token 进行处理。在大模型中,生成每个 token 都需要一定的计算资源和时间。根据模型的大小和复杂性,计算这些 tokens 需要的资源不同,因此,模型的计算和处理成本是与输入的 token 数量直接相关的。
收费基于 tokens 主要有以下几个原因:
Tokens 计费:
这种收费方式更细致,直接与计算资源的使用量相关。
API 调用收费:
这种收费方式通常更简洁,但可能忽略了计算资源的精确消耗。
以下是几个关于 Tokens 计费 和 API 调用收费 的实际例子,帮助更好地理解它们的不同。
假设我们使用一个 GPT 模型(例如 OpenAI 的 GPT-3 或 GPT-4),其按 tokens 计费。假设每个 API 请求的费用是基于输入和输出 tokens 数量的。
假设你发出以下请求:
Hello, how are you?
I'm good, thank you! How about you?
Hello, how are you?
):大约 5 tokens
I'm good, thank you! How about you?
):大约 9 tokens
因此,这个请求会消耗大约 14 tokens。
假设 OpenAI GPT-3 的费用为每 1000 tokens 0.02 美元,那么此请求的费用就是:
141000×0.02=0.00028 美元\frac{14}{1000} \times 0.02 = 0.00028 , \text{美元}
如果你提交一个较长的文本:
The quick brown fox jumps over the lazy dog. This is a pangram.
Indeed, this sentence contains all the letters of the alphabet.
因此,这个请求会消耗大约 22 tokens。
同样按照每 1000 tokens 0.02 美元的费率计算:
221000×0.02=0.00044 美元\frac{22}{1000} \times 0.02 = 0.00044 , \text{美元}
假设你使用某个 API 进行语言处理,每次 API 调用的费用固定,不管输入和输出的长度。
Hello, how are you?
I'm good!
尽管这两个文本的 token 数量比较少(大约 5 + 6 tokens),但是因为 API 按照调用次数收费,所以你只需支付 0.01 美元。
The quick brown fox jumps over the lazy dog. This is a pangram.
Indeed, this sentence contains all the letters of the alphabet.
即使文本非常长,总共使用了大约 22 tokens,你仍然需要支付 0.01 美元,因为 API 费用是按每次调用收取的,而不考虑具体的 tokens 数量。
有些服务可能采用混合模式,既按 API 调用次数收费,又根据 tokens 数量加收费用。例如,一个基本 API 调用可能是免费的,但当请求的 tokens 数量超过一定阈值时,会额外收费。
Hello, how are you?
I'm good, thank you! How about you?
此请求大约消耗了 14 tokens,费用为:
0.01+(141000×0.02)=0.01+0.00028=0.01028 美元0.01 + \left( \frac{14}{1000} \times 0.02 \right) = 0.01 + 0.00028 = 0.01028 , \text{美元}
The quick brown fox jumps over the lazy dog. This is a pangram.
Indeed, this sentence contains all the letters of the alphabet.
此请求大约消耗了 22 tokens,费用为:
0.01+(221000×0.02)=0.01+0.00044=0.01044 美元0.01 + \left( \frac{22}{1000} \times 0.02 \right) = 0.01 + 0.00044 = 0.01044 , \text{美元}
通过这些例子,你可以更清晰地理解 tokens 计费 和 API 调用收费 之间的区别,以及它们是如何影响最终费用的。
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份
全面的AI大模型学习资源
,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享
!
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以
微信扫描下方CSDN官方认证二维码
,免费领取【保证100%免费
】