2023年11月30日,亚马逊云科技在2023 re:Invent全球大会上宣布推出Amazon Bedrock更多模型选择和强大功能,帮助客户更轻松地构建和规模化针对其业务定制的生成式AI应用程序。Amazon Bedrock是一项全面托管的服务,用户可轻松访问来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和亚马逊的多种行业领先大语言模型和其他模型,以及客户构建生成式AI应用程序所需的广泛的功能,包括确保隐私和安全的同时简化开发。此次发布进一步降低了生成式AI应用的门槛——为客户提供了更多行业领先的模型选择和评估模型新功能,以简化客户使用相关和专有数据定制模型的方式;提供自动执行复杂任务的工具;并为客户配备了提供负责任地构建和部署应用程序的保障。Amazon Bedrock的这些新功能为千行百业、各种规模的企业应用生成式AI的方式都带来改变,助力企业激发创新并重塑客户体验。
亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian博士表示:“生成式AI有望成为我们这个时代最具变革性的技术。客户积极应用生成式AI创造新机遇、应对业务挑战,这给我们带来了启发。当客户将生成式AI融入其业务时,他们会利用Amazon Bedrock以全托管的方式获取领先模型、定制功能、代理功能以及企业级安全和隐私保障。有了更多触手可及的工具,客户可以使用Amazon Bedrock充分发挥生成式AI的潜力,创新用户体验、重塑业务并加速生成式AI之旅。”
企业希望在各种场景中应用生成式AI,例如提高生产效率,创新用户体验和开启全新工作方式。然而,生成式AI技术正快速发展,每天都有新的服务和创新发生。在日新月异的当下,客户的适应能力至关重要。企业需要能够使用最新、最好的可用模型进行试验、部署、迭代和调整,并时刻准备好迎接变化。为了应对这些挑战,亚马逊云科技开发了Amazon Bedrock,使一系列模型的构建和移动就像API调用一样简单,让所有开发人员都可以获得模型定制的最新技术,并确保客户的安全和数据隐私。包括Alida、Automation Anywhere、Blueshift、宝马集团、Clariant、Coinbase、Cox Automotive、dentsu、Druva、Genesys、Gilead、GoDaddy、Hellmann Worldwide Logistics、INRIX、KONE、LexisNexis Legal & Professional、Lonely Planet、NatWest、Nexxiot、OfferUp、宏盟集团、The PGA Tour、Proofpoint、Salesforce、西门子、竹中公司和Verint在内的众多企业已率先采用Amazon Bedrock应用生成式AI。此次发布引入了新的模型和功能,使客户能够更轻松地构建和规模化生成式AI应用。
Anthropic、Cohere、Meta和Stability AI的最新模型以及亚马逊Titan的新增功能为客户提供了更多模型选择
没有一个模型适合所有场景。模型的功能、价格和性能都不尽相同。客户需要轻松访问各种模型选择,多次尝试和切换模型,最终选出最匹配需求的模型。借助Amazon Bedrock,客户可以利用最新版本的模型快速创新,包括新推出的Anthropic Claude 2.1和Meta Llama 2 70B以及最近推出的Stability AI Stable Diffusion XL 1.0、Meta Llama 2 Chat 13B、Cohere Command Light、Cohere Embed English和Cohere Embed多语言模型——全部可通过API访问。除了Amazon Titan Text Embeddings和Amazon Titan Text模型(现已全面可用)之外,亚马逊云科技还提供了Titan Multimodal Embeddings和Amazon Titan Image Generator为客户使用模型构建生成式AI应用程序提供更多选择和灵活性。Amazon Titan模型由Amazon Bedrock独家提供,由亚马逊云科技在适用于各种用例的大型且多样化的数据集上创建和预训练,并内置对负责任地使用AI的支持。如果正式可用的Amazon Titan模型或其输出的内容侵犯了第三方版权,亚马逊将对使用这些模型的客户进行赔偿。
- Amazon Bedrock上的Anthropic Claude 2.1:Anthropic是一家从事AI安全和科研的公司,致力于构建可靠、可解释和可控的AI系统。Anthropic已将其最新版本的语言模型Claude 2.1引入Amazon Bedrock。Claude 2.1提供了长达200,000个token的上下文窗口,并且提高了长文档的准确性。客户可以处理文本密集型文档,例如财务报表和内部数据集。Claude 2.1能够总结和对比文档、进行问答等。Anthropic报告称,与此前模型相比,Claude 2.1在开放式对话中的错误陈述减少了50%,错误陈述率减少了一半。
- Amazon Bedrock上的Meta Llama 2 70B:Llama 2是Meta的下一代语言模型。Llama 2 的训练数据比Llama 1多40%,上下文长度是Llama 1的两倍。除了最近发布的Llama 2 130亿参数模型之外,Llama 2 700亿参数模型也已在Amazon Bedrock上提供。Llama 2 Chat建立在预训练的Llama模型之上,通过指令数据集和超过100万条人工注释进行调优,针对对话场景进行了优化。这些模型在多个外部基准测试中的表现卓越,包括推理、编码、熟练程度和知识测试,并在Amazon Bedrock上提供了极高的性能价格组合。
- 新的Amazon Titan Image Generator现已推出预览版:Amazon Titan Image Generator可帮助广告、电子商务、媒体和娱乐等行业的客户通过使用自然语言提示生成高质量、逼真的图像或增强现有图像,以便以低成本快速构思和大量迭代图像。这一模型可以理解复杂的提示词并生成相关图像,且准确度较高很少失真,也不易含有有害内容,减少错误信息传播。客户可以在Amazon Bedrock控制台中使用该模型,在配置维度参数并指定模型应生成变化图像的数量之前,可以直接输入自然语言提示来生成图像或上传图像进行自动编辑。在编辑过程中,客户可以隔离图像的某些部分以添加或替换细节(例如,将冲浪板插入海滩场景或将汽车广告背景中的高山替换为森林),或者他们可以使用其他与原作风格相同的细节扩展图像的边界。为了兑现亚马逊云科技今年早些时候在白宫做出的承诺,所有Amazon Titan生成的图像都包含不可见水印,以通过建立严谨的识别AI生成图像的机制来帮助减少错误信息的传播,促进AI技术的安全、可靠和透明发展。亚马逊云科技是首批广泛发布内置隐形水印的模型提供商之一,这些水印集成到输出的图像中,并设计为拒绝更改。
- 新的Amazon Titan Multimodal Embeddings现已正式可用:Amazon Titan Multimodal Embeddings可帮助客户为最终用户提高多模态搜索和推荐体验,让输出结果更准确且与上下文相关。模型可以将图像和短文本转换为embedding数字表示形式,使模型能够轻松理解语义以及数据之间的关系。最终用户可以使用图像和文本提示的任意组合进行搜索查询。该模型将为搜索查询生成嵌入,并将它们与已有的嵌入相匹配,以产生更相关的搜索和推荐结果。例如,拥有数亿张图像的图库摄影公司可以使用该模型来增强其搜索功能,这样用户就可以使用短语、图像或图像和文本的组合来搜索图像(例如,“我要和这张照片类似的图像,但天空是晴朗的”)。一般情况下,使用该模型生成向量非常适合于需要高准确度和快速响应的搜索场景。然而,客户也可以生成更小的维度来优化速度和性能。Amazon Titan Text Embeddings模型可以将词语、短句、长文档等文本输入转化为嵌入(embeddings),用于搜索和个性化推荐等场景,这一模型加入了Amazon Titan Text Embeddings。
新功能可帮助客户高效评估、比较和选择最适合其应用场景和业务需求的模型
如今,企业拥有广泛的模型选项来为其生成式AI应用程序提供支持。在具体应用场景中,为了在准确性和性能之间取得适当的平衡,企业必须有效地比较模型并根据其首选指标找到最佳选择。为了比较模型,企业必须首先花几天时间确定基准、设置评估工具并运行评估,所有这些都需要深厚的数据科学专业知识。此外,这些测试无法用于主观标准的评估(例如,品牌声量、相关性和风格),因为主观标准需要通过繁琐、耗时的人工审核进行判断。对于每个新场景模型,这些比较所需的时间、专业知识和资源使企业望而却步,从而限制了他们对生成式AI的使用。
Amazon Bedrock中的模型评估功能现已推出预览版,可帮助客户使用自动或人工评估来评估、比较和选择适合其特定应用场景的最佳模型。在Amazon Bedrock控制台中,客户可以选择他们想要针对给定任务(例如问答或内容摘要)进行比较的模型。如需自动评估,客户可以选择预定义的评估标准(例如准确性、鲁棒性和是否含有有害内容)并上传自己的测试数据集或从内置的公开数据集中进行选择。对于需要复杂判断的主观标准或细微内容,客户只需点击几下即可轻松设置基于人工的评估工作流程。这些工作流程利用客户的内部员工队伍或使用亚马逊云科技提供的员工队伍来评估模型响应。在基于人的评估过程中,客户可以定义特定的指标(例如,相关性、风格和品牌声量)。客户完成设置后,Amazon Bedrock就会运行评估并生成报告,以便客户可以轻松了解模型在关键标准上的表现,并可以做出最佳权衡,从而快速选择最适合其应用场景的模型。
扩展的全新模型定制功能可帮助客户在亚马逊云科技上私密且安全地释放数据价值
企业希望最大限度地释放数据价值,以大规模提供卓越的用户体验,这些体验经过独特定制,能够反映公司的风格、声音和服务。Amazon Bedrock中提供的新的专门构建的功能可帮助客户使用自己的数据私密且安全地定制模型,以构建差异化的生成式AI驱动的应用程序。
- 知识库功能使用上下文和相关公司数据定制模型响应:组织希望使用专有数据补充现有模型,以获得更相关和更准确的响应。为了给模型配备最新信息,组织转向RAG,这种技术通过从多个来源(例如资源池、数据库和API)获取数据,将数据与提示词结合。Amazon Bedrock知识库功能现已全面可用,可将模型安全地连接到公司内部数据源用于RAG,以便为聊天机器人和问答系统等用例提供更准确、针对特定上下文的响应。知识库是完全托管的,因此客户只需指明数据位置,然后知识库就会获取文本文档,并将数据保存到向量数据库或代表客户设置一个向量数据库。当用户进行查询时,Amazon Bedrock会自动编排RAG,通过模型获取相关文本来增强提示词,将提示词发给模型,最终返回响应。Amazon Bedrock知识库支持数据库用于向量功能,包括Amazon OpenSearch、Pinecone和Redis Enterprise Cloud的向量引擎,Amazon Aurora和MongoDB也即将推出。
- Cohere Command、Meta Llama 2和Amazon Titan模型现在可以在Amazon Bedrock上进行微调,并且即将推出对Anthropic Claude 2的支持:除了RAG之外,企业还可以利用微调功能在具体任务(例如,文本生成)中进一步训练模型,使用标记数据集调整模型参数,使其适合业务需求,将掌握的知识扩展到组织和终端用户使用的词汇库。例如,零售客户可以在产品描述数据集上微调模型,以帮助其了解品牌风格,从而为网站生成更准确的描述。Amazon Bedrock现在支持对Cohere Command和Meta Llama 2,以及Amazon Titan Text Express、Amazon Titan Text Lite、Amazon Titan Multimodal Embeddings和Amazon Titan Image Generator(预览版)的完全托管微调,因此客户可以使用带标签的数据集提高特定任务的模型准确性。此外,亚马逊云科技客户很快就能够利用自己的数据源微调Anthropic Claude 2的性能。要微调模型,客户可以选择模型,使用Amazon Bedrock制作副本。之后,客户可以在Amazon Simple Storage Service(Amazon S3)中的标记示例。Amazon Bedrock(利用新信息增强复制模型)对其进行训练,在保证隐私的情况下返回结果。模型越是经过精准调优,返回的结果越是相关且定制化。客户数据在传输过程中和静态时都经过加密,因此所有有价值的客户数据都是始终安全且私密的。亚马逊云科技和第三方模型提供商不会使用Amazon Bedrock的任何输入或输出来训练其基本模型。
借助Amazon Bedrock代理功能,生成式AI应用程序可以使用公司系统和数据源执行多步骤任务
虽然模型能够有效地进行对话和创建新内容,但如果能够执行复杂的操作,例如解决问题以及与公司系统交互以完成任务(例如,旅行预定或订购替换零件),它们可以提供更多价值。然而,这需要定制化地将模型与公司数据源、API以及内部和外部系统集成起来。开发人员必须编写代码来协调模型、系统和用户之间的交互,以便应用程序可以按逻辑顺序执行一系列API调用。为了将模型与数据源连接起来,开发人员必须部署RAG,以便模型可以根据任务调整其响应。最后,开发人员必须配置和管理必要的基础设施,并制定数据安全和隐私策略。这些步骤非常耗时且需要专业知识,从而减慢了生成式AI应用程序的开发速度。
现在正式可用、完全托管的Amazon Bedrock代理功能使生成式AI应用程序能够跨公司系统和数据源执行多步骤任务。代理可以计划和执行大多数业务任务,例如回答有关产品可用性的问题或接受订单。客户可以使用简单的设置过程创建代理——首先选择所需的模型,用自然语言编写一些说明(例如,“你是一位友好的客户服务代理”,和“在库存系统中检查产品库存情况”),并开放其对公司企业系统和知识库的访问;代理自动分析请求并将其分解为逻辑序列,使用模型的推理功能来确定所需的信息;然后,代理通过识别要调用的API并决定何时调用它们来采取行动、满足请求。代理还可以从专有数据源检索所需信息,以提供准确且相关的响应。代理每次都会在后台安全、私密地执行此过程,使客户无需设计提示、管理会话上下文或手动编排系统。借助适用于Amazon Bedrock的代理,客户可以提升准确性,加速生成式AI应用程序的开发。
借助Amazon Bedrock的Guardrails功能,客户可以根据应用程序要求和负责任的AI策略跨模型实施保护措施
企业认识到需要管理生成式AI应用程序中的交互,以提供所答即所问的用户体验并确保安全。虽然许多模型使用内置控件来过滤不良和有害内容,但企业希望进一步定制交互,以保证话题始终与业务相关,符合公司政策,并遵守“负责任的AI”的原则。例如,银行可能希望这样设置其在线助手:避免查询竞争对手、避免提供投资建议、以及限制有害内容。此外,应用户要求,可能要变换或隐去用户的个人身份信息(PII)以保证安全。企业可能需要更改模型、使用多个模型或跨应用程序复制策略,他们需要一种简单的方法来同时在所有这些领域一致地部署他们的要求。这需要深厚的专业知识来构建具有此类保护措施的定制保护系统并将其集成到应用程序中,并且该过程可能需要数月时间。企业希望以一种简化的方式在生成AI应用程序中强化关键策略和规则,以提供所答即所问的用户体验并支持更安全地使用该技术。
Amazon Bedrock的Guardrails功能现已推出预览版,使客户能够为生成式 AI 应用程序实施保护措施。这些应用程序根据客户应用场景和“负责任的AI”原则进行定制,因此这一功能可以增强用户交互的安全性和隐私性。Guardrails功能可以提高Amazon Bedrock上的模型对应用程序中不良和有害内容的响应方式的一致性。客户可以将Guardrails功能应用于Amazon Bedrock上的所有大型语言模型,以及微调模型并与 Amazon Bedrock代理功能结合使用。要在Amazon Bedrock控制台中创建一个Guardrail,客户首先使用自然语言描述来定义其应用程序中需要被拒绝的话题。客户还可以配置仇恨言论、侮辱、性语言和暴力的阈值,以将有害内容过滤到他们想要的水平。在2024年初,客户还可以设定模型响应中的个人身份信息(PII)的变换方法以保证安全、设置脏话过滤器,并提供自定义单词列表来阻止用户和模型之间的交互。Guardrails自动评估用户查询和模型响应,以检测并防止出现属于受限类别的内容。客户可以创建多个Guardrails来支持不同的用例,也可以在多个模型中应用相同的Guardrail。Amazon Bedrock的Guardrails功能通过提供一致的用户体验并标准化生成型AI应用程序的安全和隐私控制,使客户能够安全地进行创新。
电通是全球最大的整合营销和技术服务提供商之一。电通创新与新兴技术执行副总裁Brian Klochkoff表示:“我们致力于将营销、技术和咨询整合起来,助力那些希望造福社会的品牌实现以人为本的转型。生成式AI能够让我们以更大规模、更快速地为客户提供服务。这项技术不会取代我们的员工,而是为我们全球72000名员工提供助力。具体来说,Amazon Bedrock为我们提供了企业级的控制能力和便捷部署第三方模型的能力,以便我们的产品和技术团队能够跨团队分散使用。这让团队能够在一个安全和负责任的环境下,借助最新、最前沿的生成式AI技术进行革新,为客户打造创新机遇。”
MongoDB的使命是通过释放软件和数据的力量,帮助创新者创造、变革和颠覆行业。MongoDB首席产品官Sahir Azam表示:“各行各业越来越多的客户希望利用生成式AI来构建下一代应用程序,但许多人担心数据隐私以及人工智能驱动的系统输出的准确性。为了满足客户的需求,我们将MongoDB Atlas作为Amazon Bedrock的知识库,以便我们的共同客户可以利用其运营数据安全地构建生成式AI应用程序,以符合最终用户期望的信任度和准确性来创建个性化体验。通过这种集成,客户可以访问行业领先的基础模型,并使用MongoDB Atlas Vector Search处理过的数据来创建应用程序,在正确的上下文中提供更多相关的输出。利用Amazon Bedrock知识库中内置的数据隐私最佳实践,客户可以节省在生成式AI运营上花费的时间,从而更专注于技术部署,以在 亚马逊云科技上提供更有吸引力的最终用户体验。”
Salesforce是领先的AI客户关系管理(CRM)平台,通过AI、CRM和数据的力量实现高效和可信赖的客户体验。Salesforce产品高级副总裁Kaushal Kurapati表示:“我们致力于帮助企业以全新、个性化的方式与客户建立连接,AI对实现这一承诺来说不可或缺。Amazon Bedrock是我们开放模型生态战略的重要组成部分,能够将模型与客户的数据无缝整合,并集成到Salesforce工作流程当中。新增的评估能力可以从多维度对比基础模型,包括从友好性、风格和品牌相关性等定性方面进行比较,从而让模型落地变得前所未有的简单、快捷。”