查看原文
其他

Claude 3 强势来袭,OpenAI 从容应对!

lencx 浮之静 2024-03-10

Claude 迎来一大波重磅更新,而 GPT-5 却迟迟没有消息,只是更新了一个文字朗读功能,让人哭笑不得(OpenAI 也不知道在憋什么大招)...

对比之下,略显尴尬 😅...

Claude 3

Blog:Introducing the next generation of Claude[1]
论文:The Claude 3 Model Family: Opus, Sonnet, Haiku[2]

Anthropic 宣布最新模型 Claude 3 优于 Gemini(Gemini 时代:迈向通用人工智能的第一步!)和 ChatGPT,其能力更是超越以往版本,能回答之前 Claude 2.1 拒绝的“无害”问题。Claude 3 模型家族有三个型号:Claude 3 HaikuClaude 3 SonnetClaude 3 Opus,它们按能力递增排序。这些模型在广泛的认知任务中树立了新的行业标准,每个模型都提供了不同层次的智能、速度和成本,以满足用户的特定应用需求。

所有 Claude 3 模型均具备视觉处理能力,能够处理各种视觉格式的数据。它们还在分析、预测、内容创作、代码生成以及多语言对话方面展现出了卓越的能力。在处理长上下文和准确回忆信息方面也表现出色(尤其是 Opus 模型)。

模型家族

Opus 和 Sonnet 的 API 现已可用,Haiku 也很快会推出。Sonnet 可在 claude.ai 上免费体验,Opus 则需订阅 Claude Pro。

Claude 3 Haiku 是这一家族中最快速且最具成本效益的模型。它专为那些需要快速响应的应用而设计,能够在不到三秒的时间内处理和理解大量的数据和信息。

Claude 3 Sonnet 在速度和智能之间提供了平衡,比 Claude 2 和 Claude 2.1 快两倍,同时提供更高的智能水平。它适用于需要快速响应的任务,例如知识检索和销售自动化。

Claude 3 Opus 是家族中最智能的模型,具有行业领先的性能,特别擅长处理高度复杂的任务。它在多个 AI 系统评估基准上超越了同行,展现了接近人类的理解和流畅度。在 Needle In A Haystack (NIAH)评估中更是展现了近乎完美的召回率(超过 99%)。

📌 Needle In A Haystack

"Needle In A Haystack"(NIAH,大海捞针)在机器学习中通常指的是一种评估机制,用来测试模型从大量数据中准确检索特定信息的能力。这个比喻用来形容在庞大的数据集中找到特定信息的难度,就像在一堆干草中找到一根针一样困难。

在机器学习和特别是自然语言处理(NLP)领域,NIAH 评估通常涉及给定一个或一系列具体的问题(针),模型需要在一个广泛的文档集合(干草堆)中找到答案。这项评估测试了模型的信息检索能力,即能否在大量无关信息中准确地识别和提取相关信息。

例如,一个 NIAH 任务可能包括从数百万篇文章中找到回答特定问题的准确信息。模型需要展现出强大的理解能力、信息提取和搜索能力,以在众多文档中定位到包含答案的特定段落或句子。

通过 NIAH 评估来展示 Opus 模型在处理长上下文和大量数据时的准确回忆和检索能力。也证明了 Opus 能够在广泛的数据中准确地识别和回忆信息,即使是在信息量极大的环境中。这种能力对于许多应用场景都是至关重要的,如法律研究、医学诊断、科学研究等,其中需要从大量数据中快速准确地提取信息。

Claude 3 模型具有与其他领先模型相媲美的复杂视觉处理能力,可以处理广泛的视觉格式,如照片、图表、图形和技术图表等。

在安全和可靠性方面,Claude 3 模型家族取得了显著进展,减少了不必要的拒绝响应,并在保持高准确性的同时减少了错误答案。这些模型还将启用引用功能,以便验证它们的答案。

在未来几个月内,Anthropic 计划高频更新 Claude 3 模型系列,来进一步增强其功能,特别是对于企业用例和大规模部署。这些新功能将包括工具使用(Tool Use,又名 function calling)、交互式编码(interactive coding,又名 REPL)和更高级的代理功能(more advanced agentic capabilities)。

ChatGPT

很遗憾的是 ChatGPT 暂未迎来重大更新(比如 GPT-4.5/5、Q* 或 Sora),只是增加了一个“文字朗读”的开胃小菜。(了解更多:Sam 重回 OpenAI,Q-star 被曝光!AGI 里程碑:OpenAI Sora 从文字图像到视频

ChatGPT 现在可以朗读回复了。在 iOS 或 Android 上,长按消息然后点击“朗读”(Read Aloud)。

同时也已经开始在网页上推出这一功能,点击消息下方的“朗读”按钮即可使用,在设置中可以选择音色。

References

[1]

Introducing the next generation of Claude: https://www.anthropic.com/news/claude-3-family

[2]

The Claude 3 Model Family: Opus, Sonnet, Haiku: https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

继续滑动看下一个

Claude 3 强势来袭,OpenAI 从容应对!

lencx 浮之静
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存