Claude 3多模态评测结果对比
数据来源:Anthropic 官网、华泰研究
查看原文相关图表
- Claude系列:Haiku、Sonnet、Opus,智能依次升高数据来源:Anthropic 官网、华泰研究2024-07-02
- 国内主流模型的对比(截至24年2月)数据来源:各公司官网、华泰研究2024-07-02
- ScalingLaw最主要的结论:训练时N、D和C增加将带来更好的模型性能数据来源:《Scaling Laws for Neural Language Models》,OpenAI(2020)、华泰研究2024-07-02
- 国内外模型SuperCLUE榜单数据来源:CLUE官网、华泰研究2024-07-02
- Mistral 的模型谱系和价格(截至2024年5月28日)数据来源:Mistral 官网、华泰研究2024-07-02
- OpenAI vs Googlevs Anthropic数据来源:各公司官网、华泰研究2024-07-02
- Top20 GenAI Web产品平均月访问量(截至24年3月)数据来源:a16z、华泰研究2024-07-02
- 重点推荐公司一览表数据来源:Bloomberg,华泰研究预测2024-07-02
- Microsoft Copilot 产品发布时间线梳理(标星代表具备该项能力)数据来源:Microsoft Blog官网、华泰研究2024-07-02
- Adobe系列产品矩阵提价情况数据来源:Adobe官网、华泰研究2024-07-02
- Gemini 1.0在部分测评集上超越GPT-4数据来源:Gemini 1.0技术报告、华泰研究2024-07-02
- UC伯克利大学Chatbot Arena榜单(用户盲选评出)数据来源:LMSYSChatbot Arena、华泰研究2024-07-02
- Claude 3Opus在部分测评集上超越GPT-4数据来源:Claude3技术报告、华泰研究2024-07-02
- 2005-2026年云厂商+Meta的CapEx情况数据来源:各公司官网、VisibleAlpha预测、华泰研究2024-07-02
- Dell AI 服务器积压订单、收入、新增订单情况数据来源:公司公告、华泰研究2024-07-02
- AI PC主要芯片的参数情况数据来源:高通官网、Apple官网、AMD官网、Intel 官网、华泰研究2024-07-02
- AI 手机主要芯片的参数情况数据来源:高通官网、联发科官网、华泰研究2024-07-02
- 微软在财报中公布的Copilot 产品矩阵用户数情况数据来源:公司公告、华泰研究2024-07-02
- Perplexity和You.com的网站访问情况数据来源:SimilarWeb官网、华泰研究2024-07-02
- 搜索引擎市占率情况数据来源:Statcounter 官网、华泰研究2024-07-02
- OpenAI 新VoiceMode与Google Project Astra对比数据来源:各公司官网、华泰研究2024-07-02
- Devin解决真实工程问题正确率显著提高但仍离实用较远数据来源:Cognition官网、华泰研究2024-07-02
- Chinchilla给出的最优训练条件:数据集≈20倍参数数据来源:Training Compute-Optimal Large Language Models,GoogleDeepMind(2022)、华泰研究2024-07-02
- GPT-3.5和4在反思+使用工具+规划+多智能体时能大幅提高模型模型表现数据来源:吴恩达演讲、华泰研究2024-07-02
- RecurrentGemma的吞吐量远高于Gemma数据来源:Google官网、华泰研究2024-07-02
- Jamba架构(左)吸收了Mamba+Transformer+MoE多种技术数据来源:AI21官网、华泰研究2024-07-02
- Jamba模型的测评结果数据来源:AI21官网、华泰研究2024-07-02
- 各个领域的开源与闭源之争数据来源:LinkedIn、华泰研究2024-07-02
- Llama3-70B在多个测评集超越最新闭源模型数据来源:Meta官网、华泰研究2024-07-02
- 根据UC伯克利大学Chatbot Arena分数统计,开源闭源模型间差距在缩小数据来源:LMSYSChatbot Arena、华泰研究2024-07-02
- 2023年开源模型在基础模型中的比重大幅提升数据来源:2023 AI Index 报告、华泰研究2024-07-02
- 国内外典型MoE模型比较数据来源:各公司官网、华泰研究2024-07-02
- Nvidia JimFan看好MoE对AI 发展的重要性数据来源:NvidiaJimFan、华泰研究2024-07-02
- MoE的理念起源(专家和门控网络系统)数据来源:《Adaptive Mixtureof Local Experts》,Jacobs(2021)、华泰研究2024-07-02
- Gemini 1.5Pro核心能力超过1.0Ultra数据来源:Gemini 1.5Pro技术报告、华泰研究2024-07-02
- 人类评判:企业RAG场景下CommandR+优于Claude 3Sonnet数据来源:Cohere官网、华泰研究2024-07-02
- Kalamang语机器翻译评测结果对比(6分为满分)数据来源:Gemini 1.5Pro技术报告、华泰研究2024-07-02
- 全球主流模型厂商的长上下文布局(实线框代表暂未落地,实框代表已经落地)数据来源:各公司官网、华泰研究2024-07-02
- 国内主流大模型或产品访问量情况数据来源:SimilarWeb、华泰研究2024-07-02
- 国内主流大模型App留存率情况(截至23年3月)数据来源:QuestMobile、华泰研究2024-07-02
- Claude 3.5Sonnet 与其他模型在文本测评集的表现数据来源:Anthropic 官网、华泰研究2024-07-02
- GPT-4o在文本上的表现数据来源:OpenAI 官网、华泰研究2024-07-02
- GPT-4o在语音翻译上的表现数据来源:OpenAI 官网、华泰研究2024-07-02
- Gemma的测试结果:超过同参数模型数据来源:Google官网、华泰研究2024-07-02
- 提及公司列表数据来源:Bloomberg、华泰研究2024-07-02
- 2020Q1-2024Q1云业务收入同比增速变化数据来源:各公司官网、华泰研究2024-07-02
- Mixtral-8x7B-MoE的基准测试结果数据来源:Mistral 官网、华泰研究2024-07-02
- 大模型幻觉的类别和解决方法数据来源:《ASurvey onHallucination inLarge Language Models》,Lei(2023)、华泰研究2024-07-02
- 全球主流模型厂商旗舰模型的大参数发展趋势数据来源:各公司官网、华泰研究2024-07-02
图表属性
- 数据类型:其他
- 行业分类:科技传媒
- 发布日期:2024-07-02
- 文件格式:PNG、XLSX