1 | %env OPENAI_API_KEY=sk-XXX |
获取openai开放的模型列表:
1 | import openai |
结果:
| index | id | owner |
|---|---|---|
| 0 | whisper-1 | openai-internal |
| 1 | babbage | openai |
| 2 | davinci | openai |
| 3 | text-davinci-edit-001 | openai |
| 4 | text-davinci-003 | openai-internal |
| 5 | babbage-code-search-code | openai-dev |
| 6 | text-similarity-babbage-001 | openai-dev |
| 7 | code-davinci-edit-001 | openai |
| 8 | text-davinci-001 | openai |
| 9 | ada | openai |
| 10 | babbage-code-search-text | openai-dev |
| 11 | babbage-similarity | openai-dev |
| 12 | code-search-babbage-text-001 | openai-dev |
| 13 | text-curie-001 | openai |
| 14 | code-search-babbage-code-001 | openai-dev |
| 15 | text-ada-001 | openai |
| 16 | text-embedding-ada-002 | openai-internal |
| 17 | text-similarity-ada-001 | openai-dev |
| 18 | curie-instruct-beta | openai |
| 19 | ada-code-search-code | openai-dev |
| 20 | ada-similarity | openai-dev |
| 21 | code-search-ada-text-001 | openai-dev |
| 22 | text-search-ada-query-001 | openai-dev |
| 23 | davinci-search-document | openai-dev |
| 24 | ada-code-search-text | openai-dev |
| 25 | text-search-ada-doc-001 | openai-dev |
| 26 | davinci-instruct-beta | openai |
| 27 | text-similarity-curie-001 | openai-dev |
| 28 | code-search-ada-code-001 | openai-dev |
| 29 | ada-search-query | openai-dev |
| 30 | text-search-davinci-query-001 | openai-dev |
| 31 | curie-search-query | openai-dev |
| 32 | davinci-search-query | openai-dev |
| 33 | babbage-search-document | openai-dev |
| 34 | ada-search-document | openai-dev |
| 35 | text-search-curie-query-001 | openai-dev |
| 36 | text-search-babbage-doc-001 | openai-dev |
| 37 | gpt-3.5-turbo | openai |
| 38 | curie-search-document | openai-dev |
| 39 | text-search-curie-doc-001 | openai-dev |
| 40 | babbage-search-query | openai-dev |
| 41 | text-babbage-001 | openai |
| 42 | text-search-davinci-doc-001 | openai-dev |
| 43 | text-search-babbage-query-001 | openai-dev |
| 44 | curie-similarity | openai-dev |
| 45 | gpt-3.5-turbo-0301 | openai |
| 46 | curie | openai |
| 47 | text-similarity-davinci-001 | openai-dev |
| 48 | text-davinci-002 | openai |
| 49 | davinci-similarity | openai-dev |
输出结果里有 49 个模型。其实顾名思义,你就能够知道这些模型是用来干啥的。比如 text-similarity-babbage-001 肯定就是用来进行相似度匹配的,就会比较适合用在我们 02 讲介绍的零样本分类。而 text-search-davinci-doc-001 肯定就更适合用来搜索文档。尽管有些模型的名字标注了 openai-dev 或者 openai-internal,但是这些模型都是可以使用的。比如,我们在 02 讲里面调用 get_embedding 方法拿到向量,背后用的就是 text-similarity-davinci-001 模型,也是一个 openai-dev 的模型。不过,里面的很多模型都已经老旧了,实际上主要用的模型就是这几类。
GPT-4 家族的模型,包括 gpt-4 和 gpt-4-0314。使用的方式和 ChatGPT 的模型一样,其中带日期的模型表示是一个模型快照。也就是模型不会随着时间迁移不断更新。GPT-4 的模型现在还很昂贵,输入 1000 个 Token 需要 0.03 美分,生成 1000 个 Token 则需要 0.06 美分。一般呢,我都是拿它帮我写代码,准确率会比较高。
GPT-3.5 家族的模型,包括 ChatGPT 所使用的 gpt-3.5-turbo 或者 gpt-3.5-turbo-0301,以及 text-davinci-003 和 text-davinci-002 这两个模型。前者专门针对对话的形式进行了微调,并且价格便宜,无论输入输出,1000 个 Token 都只需要 0.002 美分。后两个里,003 的模型有一个特殊的功能,就是支持“插入文本”这个功能,我们稍后就讲。003 也是基于强化学习微调的,而 002 则是做了监督学习下的微调。text-davinci-003 和 002 模型比 3.5-turbo 要贵 10 倍,但是输出更稳定。你可以根据自己的需要来决定。
剩下的,则是 Ada、Babbage、Curie 以及 Davinci 这四个基础模型。只适合用于下达单轮的指令,不适合考虑复杂的上下文和进行逻辑推理。这四个模型按照首字母排序,价格越来越贵,效果越来越好。而且我们如果要微调一个属于自己的模型,也需要基于这四个基础模型。
最后则是 text-embedding-ada-002、text-similarity-ada-001 这些专门用途模型。一般来说,我们通过这个模型来获取 Embedding,再用在其他的机器学习模型的训练,或者语义相似度的比较上。
所有模型的名字都来自科学史上的名人。Ada 来自人类史上第一位程序员 Ada,她也是著名诗人拜伦的女儿。而 Babadge 则是设计了分析机的巴贝奇,巴贝奇分析机也被认为是现代计算机的前身。Curie 则是指居里夫人,Davinci 是指达芬奇。我们可以挑几个模型,试一下它们 Embedding 的维度数量,你就知道模型的尺寸本身就是不一样的了。
1 |
|
输出结果:
1 |
|
可以看到,最小的 ada-similarity 只有 1024 维,而最大的 davinci-similarity 则有 12288 维,所以它们的效果和价格不同也是可以理解的了。