登录 / 注册

Claude 3多模态评测结果对比

Claude 3多模态评测结果对比的图片

数据来源：Anthropic 官网、华泰研究

查看原文

相关图表

Claude系列：Haiku、Sonnet、Opus，智能依次升高
数据来源：Anthropic 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
国内主流模型的对比（截至24年2月）
数据来源：各公司官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
ScalingLaw最主要的结论：训练时N、D和C增加将带来更好的模型性能
数据来源：《Scaling Laws for Neural Language Models》，OpenAI（2020）、华泰研究2024-07-02
其他 | 科技传媒查看原文
国内外模型SuperCLUE榜单
数据来源：CLUE官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Mistral 的模型谱系和价格（截至2024年5月28日）
数据来源：Mistral 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
OpenAI vs Googlevs Anthropic
数据来源：各公司官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Top20 GenAI Web产品平均月访问量（截至24年3月）
数据来源：a16z、华泰研究2024-07-02
其他 | 科技传媒查看原文
重点推荐公司一览表
数据来源：Bloomberg，华泰研究预测2024-07-02
其他 | 科技传媒查看原文
Microsoft Copilot 产品发布时间线梳理（标星代表具备该项能力）
数据来源：Microsoft Blog官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Adobe系列产品矩阵提价情况
数据来源：Adobe官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Gemini 1.0在部分测评集上超越GPT-4
数据来源：Gemini 1.0技术报告、华泰研究2024-07-02
其他 | 科技传媒查看原文
UC伯克利大学Chatbot Arena榜单（用户盲选评出）
数据来源：LMSYSChatbot Arena、华泰研究2024-07-02
其他 | 科技传媒查看原文
Claude 3Opus在部分测评集上超越GPT-4
数据来源：Claude3技术报告、华泰研究2024-07-02
其他 | 科技传媒查看原文
2005-2026年云厂商+Meta的CapEx情况
数据来源：各公司官网、VisibleAlpha预测、华泰研究2024-07-02
其他 | 科技传媒查看原文
Dell AI 服务器积压订单、收入、新增订单情况
数据来源：公司公告、华泰研究2024-07-02
其他 | 科技传媒查看原文
AI PC主要芯片的参数情况
数据来源：高通官网、Apple官网、AMD官网、Intel 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
AI 手机主要芯片的参数情况
数据来源：高通官网、联发科官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
微软在财报中公布的Copilot 产品矩阵用户数情况
数据来源：公司公告、华泰研究2024-07-02
其他 | 科技传媒查看原文
Perplexity和You.com的网站访问情况
数据来源：SimilarWeb官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
搜索引擎市占率情况
数据来源：Statcounter 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
OpenAI 新VoiceMode与Google Project Astra对比
数据来源：各公司官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Devin解决真实工程问题正确率显著提高但仍离实用较远
数据来源：Cognition官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Chinchilla给出的最优训练条件：数据集≈20倍参数
数据来源：Training Compute-Optimal Large Language Models，GoogleDeepMind（2022）、华泰研究2024-07-02
其他 | 科技传媒查看原文
GPT-3.5和4在反思+使用工具+规划+多智能体时能大幅提高模型模型表现
数据来源：吴恩达演讲、华泰研究2024-07-02
其他 | 科技传媒查看原文
RecurrentGemma的吞吐量远高于Gemma
数据来源：Google官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Jamba架构（左）吸收了Mamba+Transformer+MoE多种技术
数据来源：AI21官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Jamba模型的测评结果
数据来源：AI21官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
各个领域的开源与闭源之争
数据来源：LinkedIn、华泰研究2024-07-02
其他 | 科技传媒查看原文
Llama3-70B在多个测评集超越最新闭源模型
数据来源：Meta官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
根据UC伯克利大学Chatbot Arena分数统计，开源闭源模型间差距在缩小
数据来源：LMSYSChatbot Arena、华泰研究2024-07-02
其他 | 科技传媒查看原文
2023年开源模型在基础模型中的比重大幅提升
数据来源：2023 AI Index 报告、华泰研究2024-07-02
其他 | 科技传媒查看原文
国内外典型MoE模型比较
数据来源：各公司官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Nvidia JimFan看好MoE对AI 发展的重要性
数据来源：NvidiaJimFan、华泰研究2024-07-02
其他 | 科技传媒查看原文
MoE的理念起源（专家和门控网络系统）
数据来源：《Adaptive Mixtureof Local Experts》，Jacobs（2021）、华泰研究2024-07-02
其他 | 科技传媒查看原文
Gemini 1.5Pro核心能力超过1.0Ultra
数据来源：Gemini 1.5Pro技术报告、华泰研究2024-07-02
其他 | 科技传媒查看原文
人类评判：企业RAG场景下CommandR+优于Claude 3Sonnet
数据来源：Cohere官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Kalamang语机器翻译评测结果对比（6分为满分）
数据来源：Gemini 1.5Pro技术报告、华泰研究2024-07-02
其他 | 科技传媒查看原文
全球主流模型厂商的长上下文布局（实线框代表暂未落地，实框代表已经落地）
数据来源：各公司官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
国内主流大模型或产品访问量情况
数据来源：SimilarWeb、华泰研究2024-07-02
其他 | 科技传媒查看原文
国内主流大模型App留存率情况（截至23年3月）
数据来源：QuestMobile、华泰研究2024-07-02
其他 | 科技传媒查看原文
Claude 3.5Sonnet 与其他模型在文本测评集的表现
数据来源：Anthropic 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
GPT-4o在文本上的表现
数据来源：OpenAI 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
GPT-4o在语音翻译上的表现
数据来源：OpenAI 官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
Gemma的测试结果：超过同参数模型
数据来源：Google官网、华泰研究2024-07-02
其他 | 科技传媒查看原文
提及公司列表
数据来源：Bloomberg、华泰研究2024-07-02
公司分析 | 科技传媒查看原文
2020Q1-2024Q1云业务收入同比增速变化
数据来源：各公司官网、华泰研究2024-07-02
公司分析 | 科技传媒查看原文
Mixtral-8x7B-MoE的基准测试结果
数据来源：Mistral 官网、华泰研究2024-07-02
公司分析 | 科技传媒查看原文
大模型幻觉的类别和解决方法
数据来源：《ASurvey onHallucination inLarge Language Models》，Lei（2023）、华泰研究2024-07-02
产业概述 | 科技传媒查看原文
全球主流模型厂商旗舰模型的大参数发展趋势
数据来源：各公司官网、华泰研究2024-07-02
产业概述 | 科技传媒查看原文

图表属性

数据类型：其他
行业分类：科技传媒
发布日期：2024-07-02
文件格式：PNG、XLSX