Claude3与GPT4的巅峰对决!Open AI最强竞争对手惊险瞬间,完整解析附图!
发布于2024-12-11 阅读(0)
出品 | 51CTO技术栈(微信号:blog51cto)
深夜,OpenAI最强对手Anthropic一口气发布了三个SOTA新品,其中包括:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。业界惊呼:Claude 3带来了一系列的新的行业基准。
其中,Opus寓意史诗级乐章,Sonnet是十四行诗,Haiku是俳句,三行短诗。
据悉(图9),Haiku是AI市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读 arXiv上包含图表和图形的信息和数据密集的研究论文(约 10k tokens)。
图8,对于绝大多数工作负载,Sonnet的速度比Claude 2和 Claude 2.1快2倍,且智能水平更高。它擅长执行需要快速响应的任务,例如知识检索或销售自动化。Opus 的速度与 Claude 2 和2.1相似,但智能水平更高。
Opus 是目前Anthropic最智能的模型,在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类水平的理解力和流畅性,引领通用智能的前沿。
以上三个Claude 3模型都显示出在分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的更强的能力。
此外,Claude 3 系列拥有近乎完美的记忆能力和超长文本窗口,将提供 200K 上下文窗口。而且能够接受超过 100 万个tokens的输入,后续会按客户需求逐步放开。
整体上看,Claude3,有三个震撼之处:
1.领域专家的基准。分别选择了金融/医学/哲学三个专家领域来作为测试基准,英伟达Research Manager Jim Fan称“建议所有的LLM都遵循这一点,以便不同的下游应用程序知道会发生什么”。
2.拒绝率分析。LLM对许多“无辜问题”做出了过于谨慎的回答成为了一种流行病,Claude一直致力于安全的AI研究,并做出了该方面的努力。
3.与其他领先模型相媲美的复杂视觉功能。可以处理各种视觉格式,包括照片、图表、图形和技术图表,PDF、流程图或演示幻灯片皆可。
实际测评如何?
一位网友分别让GPT4、Claude3编写一个登陆界面的代码,实际运行测试效果(图13)显示,后者在App界面设计方面更加出色。















本文转载于:https://www.51cto.com/article/782895.html 如有侵犯,请联系admin@zhengruan.com删除
-
正版软件
- 马斯克访华行程开启,北京今日迎来FSD谈判之旅
- 4月28日消息,特斯拉CEO埃隆·马斯克今日将抵达中国,开启他对这个特斯拉第二大市场的访问。据内部消息人士透露,马斯克此行的重要任务之一是与中国政府高级官员进行会晤,探讨自动驾驶软件FSD在中国市场的落地可能性,并寻求将中国区域内收集的汽车数据转移至海外,以供自动驾驶算法训练之用。最近,特斯拉公司宣布将在中国市场推出一项新技术,即自动驾驶辅助系统Autopilot的最高版本FSD。自2021年起,特斯拉已开始在中国境内收集的车辆数据存储于上海,并未向美国转移。特斯拉的自动驾驶辅助系统FSD,虽已在全球发布
-
47分钟前
0
-
正版软件
- 三星电子公布 2024 年合作公司名单:新增天马、华星光电印度子公司
- 本站7月3日消息,据thelec报道,三星电子公布了2024年合作公司名单,这份名单占三星电子零部件采购额的80%以上,共有113家公司,其中新增11家公司,另有11家公司被剔除。在这份名单中,新增了天马(TianmaMicroelectronicsCo.,Ltd.)等公司,印度PanelOptodisplayTechnology公司也被列入,该公司是华星光电(CSOT)的印度子公司。不过即使一个特定年度的名单中不再包含某家公司,这并不意味着该公司与三星电子的交易关系会立即终止。例如,去年未包括在三星电子
-
58分钟前
三星电子
0
-
正版软件
- Uniswap创始人认为Meme有价值!澳洲女歌手反击V神名人Meme币无用论
- 近期不少名人争相加入发币行列,包括美国媒体名人CaitlynJenner、美国饶舌歌手RichTheKid、澳洲饶舌歌手IggyAzalea、尼日利亚音乐家Davido..等人都相继推出Meme币,虽然一些人借此发财,但也有许多用户在购买代币后不久就蒙受巨额亏损。以太坊共同创办人VitalikButerin在昨日就公开批评名人Meme币热潮,表示金融化只是达到目的的一种手段,如果这些目的是有价值的,例如医疗保健、开源软件、艺术等,他会尊重,但如果金融化被作为最终产品,他很难认同。V神提出名人发币至少要满足
-
1小时前 22:24
MEME币
0
-
正版软件
- 性价比之选!小米Redmi G Pro 2024游戏本i7-14650HX版本,7月12日正式开售
- 7月5日消息,小米RedmiGPro2024游戏本在今年3月以i9-14900HX搭配RTX4060的强大配置震撼上市,定价8999元,引起了广泛关注。然而,小米通讯技术有限公司产品行销总监马志宇近日表示,尽管这款高端配置的游戏本在性能上达到了极致,但部分米粉对其性价比表示担忧。为满足更广泛的消费者需求,小米决定推出新配置的i7-14650HX版本。据小编了解,新款RedmiGPro2024游戏本将保持:210W整机性能释放2.5K240Hz电竞显示屏丰富的接口炫酷的RGB氛围灯这款新品预计将于7月12日
-
1小时前 22:09
0
-
正版软件
- Runes毫无价值、名字太长、发行中心化,大家到底在FUD什么?
- 上周六Runes协议上线的当天,就刷到了很多FUD符文的帖子。其实FUD也没什么,说明符文的热度实在太高了,自然吸引了大量眼球。只是大部分FUD的维度实在有点无厘头,所以还是想做下说明。整体来说,FUD符文的内容主要可以分为两类:1️⃣对于Runes协议设定的FUD;2️⃣对于符文资产价值的FUD。X/推:@portal_kay对于Runes协议设定的FUD1、符文是不是让资产发行越来越中心化了?4月20号上午协议上线后,被讨论的最多的就是前10号符文。但是当大家看完一遍之后,才发现好像无从下手啊,这不是
-
1小时前 21:54
0