【蓝萤IM】大模型时代创业给高瞻远瞩的你三个建议202347页

烽火研报•2023年10月12日•阅读 497

今天分享的是大模型系列深度研究报告：《2023大模型时代创业给高瞻远瞩的你三个建议》。（报告出品方：蓝莺）

报告共计：47页

⼤参数意味着⼤成本

私有部署⼀个可⽤⼤模型的成本之⾼昂，训练要求之⾼，并⾮⼀般企业所能承担。如果⼀件事情有更经济更低成本的解决⽅案，那这种⽅案更有可能在竞争中胜出。

胡编乱造的⼤模型⽆法解释

•有幻觉hallucination

•⽆可解释性Interpretability

•需要⼈机协同=>企业知识溯源

使⽤⼤模型服务的三种模式

模式1:纯提示词模式(PromptOnly)

直接使用提示词调用大模型API，这是最容易上手的方式。

模式2:嵌入向量模式(Embedding)

将知识预处理存入向量数据库，在提问时通过相似度查询找到关联知识，然后跟问题一起加入提示词，再调用大模型API。

模式3:精调模型模式(Fine-tune)

将知识通过Fine-tune训练存入大模型，使用时再进行Prompt调用。

错误观点⼀：上下⽂谬误

以扩展到100K上下⽂来算，如果模式⼀每次调⽤都将全部知识⽂本带上，同时模式⼆我们选择4K知识⽚段，那每次调⽤模式⼀都将是模式⼆调⽤成本的25倍。算法上的原因，即OpenAI执⾏Attention的算法复杂度是O(n^2)，这意味着，随着序列⻓度的增加，执⾏Attention计算所需的计算资源呈指数增⻓。

错误观点⼆：精调陷阱

嵌⼊向量模式没有思维链CoT能⼒，回答问题时将不能根据知识做完整推断。先说成本，以OpenAI的调⽤价格来对⽐。Embedding模式：训练时调⽤Adav2模型，费⽤是$0.0001/1Ktokens，使⽤时调⽤ChatGPT模型，费⽤是提问$0.0015/1Ktokens，回答$0.002/1KtokensFine-tune模式：训练时调⽤Davinci模型，费⽤是$0.0300/1Ktokens，使⽤时也是Davinci模型，费⽤是$0.1200/1Ktokens。20230823：训练时调⽤GPT-3.5模型，费⽤是$0.008/1Ktokens，使⽤时也是GPT-3.5模型，费⽤是$0.012/1Ktokens。后者训练成本是前者的300倍，使⽤成本是前者的接近80倍。

参考报告：大模型时代创业给高瞻远瞩的你三个建议202347页.pdf

【蓝萤IM】大模型时代创业给高瞻远瞩的你三个建议202347页

使⽤⼤模型服务的三种模式

最新报告

热门报告