2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。 自从 GPT-3.5 推出以来,业界对标 OpenAI 的企业很多,但 Claude 3 一经推出便得到了社会广泛的关注, 因为 Claude 3 在多项测评中都展现出优秀的水平,交付了“高分答卷”。 同时, 亚马逊对 Anthropic 进行高达 40 亿美元 的 投资 也引发了社会关注和讨论。
不过,亚马逊对 Anthropic 的支持不止于此。亚马逊云科技还为 A nthropic 提供了 强大的 云服务 能力以及 Amazon Trainium 和 Amazon Inferentia 芯片 能力,帮助 Anthropic 建构 Claude 3 模型 。
近日,亚马逊云科技举办了以“ 亚马逊云科技携手 Anthropic 推进生成式 AI 创新 ”为主题的媒体沟通会。在会上, 亚马逊云科技大中华区产品部总经理陈晓建 详细介绍了 Claude 3 的优势、应用场景,以及 Amazon Bedrock 如何将大模型的能力提供给企业。
Claude 3 强在哪里?为何能得到亚马逊的大力支持?
首先从客观、权威的多项 AI 系统评估基准测试 结果 来看, Claude 3 表现出了高超的水平,尤其是 Claude 3 Opus , 在本科生水平专业知识(MMLU)、研究生水平专业推理(GPQA)、基础数学(GSM8K)等测试中表现优异, 创 造 了 模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型 。不仅如此, Claude 3 Opus 能够 在复杂任务中表现出优秀的理解能力和流畅性,走在 了 通用智能的最前沿。
在大模型价格高昂的时代,性能高也意味着价格高。但 Claude 3 不仅做到了性能优越,还做到了价格实惠。 Claude 3 并不只有一个模型,而是 系列模型 ,一共有三种 :
- 具有几乎即时响应能力的 Claude 3 Haiku;
- 在技能与速度之间达到理想平衡的 Claude 3 Sonnet;
- 为处理高度复杂任务设计的最智能模型 Claude 3 Opus。
用 户可以根据自己的商业需求,从中选择最合适的 功能 、速度和价格组合 。其中 Claude 3 Haiku 和 Claude 3 Sonnet 的价格低于 业界同等智能模型 ,且 并非一倍或两倍的差别 。
除了价格、推理、数学方面的优势, Claude 3 在理解内容方面也有了很大的突破。
Claude 3 可以接收基于图像的输入,能力与其他前沿模型大致相同, 但 Claude 3 更加 擅长理解图片、图表、图形、技术图解及光学字符识别 (OCR) , 理解速度优于业界其他多模态模型 的同时, 延迟 更低 。 根据 评估显示,Claude 3 Haiku的速度优于所有 同一水平 的前沿模型。
除了擅长理解图形、图表, Claude 3 在理解文字内容时也展现出惊人的准确性。 Claude 3 系列模型均 提供 200K 超长上下文准确召回 , 针对某些特殊场景,Claude 3 开放支持 1M token 的上下文窗口 。并且 Claude 3 在“ 大海捞针 ” (Needle In A Haystack, NIAH) 中的 召回率表现优异 。“大海捞针”是一种测试,能够反映大模型 长文本 的 理解能力 。在媒体沟通会的现场,亚马逊云科技技术专家为大家演示了这一能力——在《流浪地球》的节选内容中插入一句《三体》的内容, Claude 3 Sonnet 精准地找到了《三体》的内容。
而在大家比较关心的 AI 幻觉方面,C laude 3 目前能够有效 降低幻觉, 尤其是 在处理挑战性开放问题 (100Q Hard) 时 准确性明显提升,减少错误答案。
以上都是 C laude 3 在理论层面上的优势,而在实际的场景应用中, Claude 3 也更加贴近人类的思考方式。比如 Claude 3 的代码辅助能力会更加 贴近程序员的 编写 习惯 。 Claude 3 不仅 能够 提供建议的代码,还能给出详细的步骤, 使 程序员可以按照建议进行操作 的同时轻松掌握该项代码 技能。
除此之外, Claude 3 能够模仿指定作者的风格进行内容续写;可以为 根据 电商 商品的模特展示图精准捕捉产品细节生成更准确的产品描述 ;还可以 根据提供的相关服务文档,准确回答该服务在不同区域的价格且信息提取更完整。
1+1>2, Amazon Bedrock + Claude 3 为企业提供超强 AI 能力
Claude 3 模型 一经问世, 亚马逊云科技便在 第一时间 将 Claude 3 集成 在 Amazon Bedrock ,从而帮助企业更好地利用生成式 AI 进行业务创新。 既然 Claude 3如此强大,为什么 还 要 集成在 Amazon Bedrock 上 ? 原因也很简单, Amazon Bedrock + Claude 3 可以为企业提供更强大的 AI 能力。
首先, 亚马逊云科技认为“没有一个模型可以适用于所有业务场景” , 所以 亚马逊云科技在生成式 AI 领域提供三层技术栈,从最 底 层的高性能基础设施,到中间层提供最广泛的基础模型选择, 再到 上层应用 GenAI 技术的开箱即用的云服务 ,全方位帮助企业更好地使用 AI 能力 。 而 Amazon Bedrock 处于中间层, 被视为云计算时代的 “ AI 操作系统 ” , 集成 了 多种先进的大模型和工具链 ,企业 可以在此基础上定制模型,同时保持数据私有和安全,并与其他在亚马逊云科技上的工作负载无缝集成。
其次, 模型能力 与实际 运营生产之间需要 更多的 辅助能力。Amazon Bedrock 能够 提供除了大模型以外的能力, 比如 Provisioned Throughput (预置吞吐量) ,企业可以独享大模型能力的 后台资源, 并在 业务需要支持时 享受 稳定的服务保障。 还有 模型微调(fine-tunning) 。企业要想产生业务 差异化价值 ,则不能只是 简单 地 使用完全标准化的大模型 ,而是要 将自身的业务数据与大模型结合 ,因此需要模型微调的能力来实现。 除此之外,Guardrails 能够全面监管大模型使用情况, 不仅能够 通过适当的配置降低幻觉, 还能 提供全方位日志。
最后 , 企业 使用大模型 的目的是与自身业务 结合 产生更大的价值,这就 意味着 企业 需要 将自己的知识库与 大模型 结合 。目前,业界通常使用向量数据库, 也就是 通过向量的方式存储知识库 ,这就需要 非常强的数据底座 来支撑 。亚马逊云科技 能够帮 助 企业 管理自身的业务数据,并建立坚实的数据基石 —— Data Foundation。除此之外, 亚马逊云科技还能为企业 大量 提供针对 构建数据库的服务, 并 通过 zero-ETL 帮助 企业 无缝 打通 OLTP 数据和 OLAP 数据。
在当今快速发展的 AI 时代,大模型技术无疑是推动企业创新和转型的关键力量。然而,企业面临的挑战远不止于简单地引入和应用的 大模型,还 需要 如何正 确、合理、安全、高效地使用大模型。亚马逊云科技通过 自身 综合的产品和服务,为企业提供了一个坚实的技术基础,使得企业不仅能够引入大模型,还能确保模型在 企业 实际 业务 中发挥最大的效用。而 Claude 3 与 Amazon Bedrock 的结合,无疑将进一步推动企业级AI技术的发展,为企业带来前所未有的价值和机遇。