【蓝萤IM】大模型时代创业给高瞻远瞩的你三个建议202347页

今天分享的是大模型系列深度研究报告:《2023大模型时代创业给高瞻远瞩的你三个建议》。(报告出品方:蓝莺)

报告共计:47页

⼤参数意味着⼤成本

私有部署⼀个可⽤⼤模型的成本之⾼昂,训练要求之⾼,并⾮⼀般企业所能承担。如果⼀件事情有更经济更低成本的解决⽅案,那这种⽅案更有可能在竞争中胜出。

胡编乱造的⼤模型⽆法解释

•有幻觉hallucination

•⽆可解释性Interpretability

•需要⼈机协同=>企业知识溯源

使⽤⼤模型服务的三种模式

模式1:纯提示词模式(PromptOnly)

直接使用提示词调用大模型API,这是最容易上手的方式。

模式2:嵌入向量模式(Embedding)

将知识预处理存入向量数据库,在提问时通过相似度查询找到关联知识,然后跟问题一起加入提示词,再调用大模型API。

模式3:精调模型模式(Fine-tune)

将知识通过Fine-tune训练存入大模型,使用时再进行Prompt调用。

错误观点⼀:上下⽂谬误

以扩展到100K上下⽂来算,如果模式⼀每次调⽤都将全部知识⽂本带上,同时模式⼆我们选择4K知识⽚段,那每次调⽤模式⼀都将是模式⼆调⽤成本的25倍。算法上的原因,即OpenAI执⾏Attention的算法复杂度是O(n^2),这意味着,随着序列⻓度的增加,执⾏Attention计算所需的计算资源呈指数增⻓。

错误观点⼆:精调陷阱

嵌⼊向量模式没有思维链CoT能⼒,回答问题时将不能根据知识做完整推断。先说成本,以OpenAI的调⽤价格来对⽐。Embedding模式:训练时调⽤Adav2模型,费⽤是$0.0001/1Ktokens,使⽤时调⽤ChatGPT模型,费⽤是提问$0.0015/1Ktokens,回答$0.002/1KtokensFine-tune模式:训练时调⽤Davinci模型,费⽤是$0.0300/1Ktokens,使⽤时也是Davinci模型,费⽤是$0.1200/1Ktokens。20230823:训练时调⽤GPT-3.5模型,费⽤是$0.008/1Ktokens,使⽤时也是GPT-3.5模型,费⽤是$0.012/1Ktokens。后者训练成本是前者的300倍,使⽤成本是前者的接近80倍。

【蓝萤IM】大模型时代创业给高瞻远瞩的你三个建议202347页【蓝萤IM】大模型时代创业给高瞻远瞩的你三个建议202347页
上一篇

【天猫】童装童鞋2023秋冬趋势白皮书

2023-10-12
下一篇

【自然资源保护协会】2023转型金融支持煤电行业低碳转型的机制研究报告(第二期)

2023-10-12