Claude AI:揭示未来对话的奥秘
Claude是由Anthropic开发的对话型AI服务,其背后得到亚马逊与Google等科技巨头的鼎力支持。Claude这一名称不仅仅代表了该服务本身,更象征了支撑其运作的先进AI模型。用户可以通过访问其官网,类似于与ChatGPT互动的方式来使用Claude;而开发者则能够通过Claude API,将其整合到企业内部应用中。
根据Anthropic的官方说明,Claude具备处理各类文字任务的能力,从文档生成、信件撰写到问答应对,它无所不能。Claude不仅能够进行编辑、重写、摘要提炼和分类处理,还能在对话中扮演各种角色,使交流过程愈加自然与真实。凭借其对大量数据的深度训练,Claude精通多种语言,并具备编程能力,能够应对文化、技术及专业领域的复杂挑战。此外,Claude还具备根据用户指令自动化执行工作流的能力,有条不紊地解决各类任务。
值得注意的是,Claude无法直接访问网页,因此用户需手动输入相关信息以与其互动。Claude遵循Anthropic的核心理念,即“HHH”(Helpful, Honest, and Harmless),致力于生成有益、诚实且无害的内容。为确保这一标准,Anthropic采用了特有的训练方法。
Anthropic明确指出,Claude 3模型的网络训练数据截止日期为2023年8月,而Claude 3.5模型的数据则更新至2024年4月。Claude的训练数据不仅包括公开网络信息,还涉及第三方未公开的数据、Anthropic自有用户数据以及专业标记公司提供的数据。
如何注册Claude账户?手机端亦可使用?
随着Claude的不断迭代更新,用户现在可以在网页端、Android手机及Apple手机上使用Claude。然而,目前Anthropic尚未推出计算机端的应用程序。
Anthropic表示,用户可以在不同平台上继续之前的对话,并支持拍摄照片及上传图像的视觉功能,同时具备多语言支持如翻译功能,并以“进阶推理”来描述Claude的能力。
若使用网页版,用户只需访问Claude的官网,输入电子邮箱或使用Google账户,即可启动注册过程。
国内无法注册Claude账号,可以直接免注册使用Claude镜像站:Sonnet、Haiku、Opus全系列模型免费使用
除了输入姓名外,还需提供手机号码以接收认证短信,认证通过后方能使用Claude。
在使用之前,Anthropic会提醒用户可能遇到的情况,如生成误导性或冒犯性内容。
注册完成后,即可开始使用Claude。当前,Claude默认使用的是最新的Claude 3.5模型。除了基本问答功能外,Claude还提醒用户可以上传照片和图像,并从中提取有用信息;首次使用时,Claude还会询问是否启用Artifacts功能。
如何使用Claude?
实测1:解析长文
如同ChatGPT,Claude也可以展开问答交流,但其显著优势在于其卓越的记忆能力,能处理比ChatGPT更为庞大的上下文长度(context window)。
当需要解析长篇文献时,尤其是诸如论文、研究报告或冗长作品的PDF文件,可以将其上传至Claude进行处理。
然而,作为一款大型语言模型,即便Claude具备强大的处理能力,由于未开启网络功能,它仍难以完全规避虚构信息的生成。虽然ChatGPT在近期已付出诸多努力以减少虚假信息的出现,Claude的更新也显示其幻觉发生的频率有所下降,模型会明确拒绝无根据的信息,或与用户确认问题内容,以防止虚构内容的产生。
实测2:迅速洞察图表
在检验Claude 3.5的多模态能力时,其表现令人印象深刻。上传了一张杂乱的桌面图示,Claude不仅精准地解析了图表的意义,还能够辨识图上的说明文字和图例中的色彩尺度及其对应的数值。
本次更新中的一个显著亮点是Artifacts,实际测试效果也非常出色。
实测3:瞬时复制网页
上传了官网首页截图后,请求Claude生成前端代码。尽管由于无法联网,Claude未能复刻照片,其余内容如标题、摘要和日期等均被成功复制,连同网站顶部的文章频道和列表也一并再现。
此外,即使截图尺寸极小,Claude亦能毫无畏惧地面对文字难以辨认的挑战,准确无误地再现内容。
由于再现的页面缺乏订阅功能,要求Claude补充该功能,它也顺应要求,圆满完成了任务。
目前Claude的付费版本Claude Pro,每月费用为20美元,已经向全球用户开放。相较于免费版的使用次数限制,Claude Pro用户享有五倍的对话额度,并且能够更快地调用Claude 3 Haiku和之前性能最优异的Claude 3 Opus模型。
类似于ChatGPT Plus,当网站流量高峰时,Claude Pro用户也拥有优先使用权,并能够抢先体验未来的新功能。
实测4:方案比较
生活中经常需要进行“比较”,无论是手机资费,还是保险公司的方案差异,这次我们以Claude不同的收费方案为对象进行了测试。
打开Anthropic官网的收费页面,截取了网页画面,并将其直接上传到Claude对话中。
Claude迅速从图像中识别出四种方案的权益,并且它能够将“优于免费版”的信息自动延展为新的栏目,这对于撰写表格极为有助。
Claude 企业版推出:与 ChatGPT Team 和 Copilot 一较高下?
2024年9月,Anthropic 宣布发布 Claude 企业版(Claude for Enterprise),这款新产品旨在赋能团队在协作中的应用。
Anthropic 的战略重点主要集中在两个方面:**第一,提升团队的工作效率;第二,保障团队在开发过程中的安全性。**
在提高效率方面,Claude 企业版与OpenAI 的 ChatGPT、Google Workspace和微软 Copilot相似,Anthropic 强调 Claude 的核心优势在于能够整合组织内部的知识,从而扩展其能力。这种跨项目和团队的整合将大大促进决策过程,避免了信息孤岛的问题。
相较于面向小型团队的 Claude Team,Claude 企业版的主要亮点在于其大幅提升的上下文窗口(context window),可达500k,而个人和团队版仅为200k,这一设计便于团队成员上传大量公司内部文档,使 Claude 能够更有效地学习。此外,Claude 企业版还整合了 GitHub,方便开发者同步其代码仓库(repo)。
根据 Claude 官网介绍,目前已有 Midjourney、GitLab 和 Airtable 等企业在使用 Claude 企业版。
除了提升效率,团队开发过程中的安全性也是重中之重。Anthropic 列出了一些 Claude 企业版的功能,包括单点登录(SSO)和域名获取:这些功能确保了用户访问的安全管理和集中控制、跨域身份管理系统(SCIM)、以及基于用户角色的权限设置等。
Claude 免费版与付费版(Pro、Team、Enterprise)的区别是什么?
Claude 免费版与付费版的 Pro、Team 和 Enterprise 之间的差异体现在模型和使用优先级上。
计划类型 | 免费 | Pro | Team | Enterprise |
每月费用 | 0 美元 | 20 美元/月 | 每人 25 美元/月 | 联系业务 |
适用对象 | 初学者 | 高级用户 | 快速成长的团队 | 大型企业 |
平台访问 | 网页、iOS、Android | 网页、iOS、Android | 网页、iOS、Android | 网页、iOS、Android |
查询文档和图片 | ✓ | ✓ | ✓ | ✓ |
Claude 版本 | Claude 3.5 Sonnet | Claude 3.5 Sonnet, Claude 3 Opus, Haiku | Claude 3.5 Sonnet, Claude 3 Opus, Haiku | Claude 3.5 Sonnet, Claude 3 Opus, Haiku |
使用量 | 标准 | 高于免费版 | 高于 Pro 版 | 高于 Team 版 |
上下文窗口 | 按使用量而定 | 200k+ | 200k+ | 500k |
使用优先权 | 标准 | 优先使用,免费版五倍 | 优先使用 | 更优先使用 |
早期功能访问 | - | ✓ | ✓ | ✓ |
中央账单管理与行政功能 | - | - | ✓ | ✓ |
Claude 3.5 的强大之处:Artifacts 新功能的意义
2024年3月,Anthropic 推出了三款 Claude 3 系列模型,分别是 Claude 3 Haiku(俳句)、Claude 3 Sonnet(十四行诗)和 Claude 3 Opus(古典乐的编号作品)。
2024年6月,Anthropic 发布了 Claude 3.5 Sonnet 模型,并表示稍后将推出 Claude 3.5 Haiku 和 Claude 3.5 Opus 模型。
根据 Anthropic 自行检测,Claude 3.5 Sonnet 在推理能力、数学运算及大学水平的知识表现上全面超越了 Meta、Google 和 OpenAI 等竞争对手,无论是 OpenAI 春季发布的 GPT-4o、Google 的 Gemini 1.5 Pro,还是 Meta(Facebook 母公司)的 Llama-400B,都无法与 Claude 3.5 Sonnet 相媲美。
在多模态技术日益显著的趋势下,Anthropic 进一步将 Claude 3.5 Sonnet 的视觉能力纳入比较范围,并声称其在图像中的文字处理方面同样超越了所有竞争者。特别是在处理图像中的缺陷文字时,Claude 3.5 Sonnet 仍能精确转录,这项功能对物流、零售和金融等行业的应用场景极具价值。
以某于物流案例为例,过去使用光学字符识别(OCR)技术处理大量手写的出货单据,现在可以借助具备视觉能力的基础 AI 模型完成。这是大语言模型技术进步推动垂直领域应用的明确案例。
物流业的工作流程中会产生大量文件,但并非所有文件都是结构化数据,因此许多数据转换的准确性挑战亟需解决。曾子轩摄
对于熟悉各大企业生成式 AI 服务的用户来说,“最强模型”的自我标榜已不再稀奇,但实际效果仍需市场验证。
就模型表现而言,2024年9月初访问国际间评比大语言模型的知名榜单,由伯克利大学运营的 LMSYS 时,Claude 3.5 Sonnet 的综合能力排名第六,落后于 8 月推出的 GPT-4o 最新版本、8 月推出的 Gemini 1.5 Pro 最新版本、8 月推出的 Grok-2 最新版本,也不及 5 月推出的 GPT-4o 版本。考虑到 Claude 3.5 Sonnet 是 6 月才上榜,若更新版本上线,谁胜谁负尚难预料。
在改写与翻译代码上颇具亮点
对比Anthropic于三月和六月发布的两次更新,前者在提升回答准确性、精确判断用户意图、增强多模态能力、提供结构化输出格式以及函数调用功能等方面作出改进;而此次更新则加入了Artifacts功能,提升了回答速度,并在生成、改写和“翻译”代码方面下了不少工夫。
Claude自始至终强调其模型具备超长的上下文处理能力以及极快的响应时间。
对于客服和电子商务领域的企业用户而言,如果对话机器人在调用API时延迟过长,导致客户久等并感到焦躁,那么这样的服务价值将大打折扣。因此,Anthropic坚信,知识检索和自动化销售将成为未来的重要竞技场。
然而,在Google I/O上,Google向公众介绍了调整架构后的Gemini 1.5 Flash模型,其尽管规模较小但响应速度更快,并且在符元(token,以下将交替使用符元和token)处理上首次开放100万的长度,未来将拓展至200万,而研究进度已达1000万。OpenAI的GPT-4o同样追求低延迟(latency),对Anthropic构成了极大的挑战。
Anthropic指出,目前Claude 3.5 Sonnet提供20万个符元的上下文长度。这意味着什么呢?token指的是计算机理解文字的最小单元,词汇、句子和段落都可以成为token。而Claude 3.5和GPT-4的说明文件中提到的token,实则为比词汇更小的单元。根据OpenAI介绍,每个token大约等于4个英文字母的长度,或0.75个单词。至于中文,每个字即为一个token。
因此,假设以一篇500字的英文文章或一篇1000字的中文文章为例,Claude 3.5 Sonnet能够处理300篇英文文章,或200篇中文文章,其能力令人惊叹。而且,Anthropic之前提到,单论模型能力,Claude 3实际上能够处理超过100万个token,因此可以预期最强大的Claude 3.5 Opus也具备处理百万级token的能力。
在实际使用付费版ChatGPT和Claude 3.5时,后者处理长文的速度极快,并且不会遗漏文章的中段与末段,非常适合处理学术研究、行业报告等长篇文献;此外,添加Artifacts功能后,用户能够更精细地调整代码,大大提升生产力。
ChatGPT、Gemini 与 Claude 各模型 API 上下文脉络比较
推出者 | 模型 | API 处理 token 数量(万) |
---|---|---|
Anthropic | Claude 3.5 Sonnet | 20 |
Anthropic | Claude 3 Opus | 20 |
Anthropic | Claude 3 Sonnet | 20 |
OpenAI | GPT-4o-mini | 12.8 |
OpenAI | GPT-4o | 12.8 |
OpenAI | GPT-4-turbo | 12.8 |
OpenAI | GPT-4 | 8 或 12.8 |
Gemini 1.5 Pro | 200 | |
Gemini 1.5 Flash | 100 |
注:模型能够处理的 token 数量可能会随企业推出新版本而改变;Claude 主要以 context window 称呼
当[大型语言模型的回答速度和上下文长度已经成为竞争激烈的领域,价格战的硝烟也已经点燃,Anthropic推出了新功能:Artifacts(直译为人工物、人工制品)。
Artifacts新功能的三大优势
根据Anthropic的介绍,当用户利用Claude生成代码、网站设计或文本时,Claude将独立生成一个动态界面,使得团队成员在会议中可以更快地完成以下任务:
1. 利用Claude讨论网页或文章的构思,同时通过Artifacts预览生成的网页或文章
2. 在独立界面中呈现,方便团队成员进行参考和讨论,增加理解和沟通的效率
3. 如果结果已足够理想,可以直接一键下载,无需在混杂的聊天信息中寻找答案并进行复制
Anthropic强调,这一功能使Claude不仅仅是一个对话式AI服务,更向协作工作环境(collaborative work environment)迈进,提升了团队合作的可能性。可以预见,除了付费版Claude Pro和支持AWS及Google Cloud的开发者调用外,Claude还可能推出类似Copilot或ChatGPT Team的服务,在多人合作场景中与其他工具展开竞争,使Claude成为团队的得力助手(teammate)。
当用户利用Claude生成代码、网站设计或文本时,Claude会独立生成一个动态界面,立即展示生成成果,让用户能实时调整生成内容。图取自Claude对话页面。
Anthropic推陈出新,Claude之背后是OpenAI旧将
Anthropic的创始人达里奥·阿莫代(Dario Amodei)和丹尼耶菈·阿莫代(Daniela Amodei)兄妹,在创立Anthropic之前,曾在开发ChatGPT的OpenAI担任高层管理职务。哥哥达里奥曾担任研发副总裁,而妹妹丹尼耶菈则担任安全与政策副总裁。
据Venture Beat报道,兄妹二人因对OpenAI接受微软10亿美元投资,并大幅向产业化转型的方向感到不满,于2021年离开公司,并带走9名员工,共同创建了Anthropic。他们旨在构建一个更具透明度和可信赖性的人工智能体系。与他们有相似遭遇的还有特斯拉创办人马斯克,他同样因不满OpenAI的资本化路径,选择退出OpenAI。
现今观之OpenAI的发展轨迹,确实与达里奥和丹尼耶菈兄妹的初衷渐行渐远。
The Information报道称,OpenAI首席执行官萨姆·奥特曼(Sam Altman)正在考虑对OpenAI原有的复杂组织架构进行彻底改革,从非营利性完全转变为营利性,以便使公司的盈利部门不再受非营利董事会的约束,力图与Anthropic及马斯克的xAI展开竞争。
目前尚未上市的OpenAI估值高达860亿美元,根据过去半年收入数据计算,其年化收入已经达到34亿美元。
此外,曾对奥特曼发起逼宫的前首席科学家伊利亚·苏茨克维(Ilya Sutskever)也在上周(6月19日)宣布创立了一家名为“安全超级智能”(Safe Superintelligence,SSI)的公司,旨在开发安全的超智能系统。
与OpenAI不同,Anthropic始终把安全与信任作为其核心使命。达里奥和丹尼耶菈双双入选了《时代》杂志的“AI百大影响人物”榜单,对于他们而言,确保人工智能系统与人类价值观的对齐(human value alignment)是最为重要的。这一点使得他们在众多致力于AI技术与应用的企业中尤为显著。
在机器学习领域,AI的决策过程经常被比喻为“黑箱”(black box)。因此,许多研究者致力于揭开这一黑箱,解析AI决策的原因,推出能够解释的AI(explainable AI),并增加机器的可解释性(mechanistic interpretability)。达里奥和丹尼耶菈正是这些研究者之一。
从Anthropic的发展历程来看,它与OpenAI有一定程度的相似性。Anthropic自我定位为一个专注于AI安全研究的实验室(AI safety-research lab)。然而,为了开发先进的模型,他们需要大量的算力。因此,Anthropic也进行了募资,并将模型使用权授权给投资者和客户,其做法与OpenAI类似。
不同之处在于,Anthropic的企业结构并不像OpenAI那样。Anthropic是一家公益公司(public benefit corporation,PBC),优先考虑社会和公共利益,这与传统的营利性企业不同。这意味着,他们不必过多担忧投资者对财务回报的要求,也不会受到强大合作伙伴的过度影响。
Google、Amazon皆投巨资开发Claude的Anthropic
根据Crunchbase资料,包括Google、Amazon、FTX创始人SBF(Sam Bankman-Fried)、前Google首席执行官施密特(Eric Schmidt)、脸书共同创办人莫斯科维茨(Dustin Moskovitz)等人均对Anthropic进行了投资。
2021年5月,Skype开发工程师贾安·塔林(Jaan Tallinn)领投了A轮融资,注资约1.24亿美元。塔林曾投资孕育出AlphaGo和AlphaFold,后者被Google收购,塔林如今已成为Google发展人工智能技术核心的DeepMind的参与者,并对人工智能对人类存在的风险(existential risk)极为关注,他参与创立了剑桥大学的存在风险研究中心以及美国的未来生命研究所。后者即是马斯克(Elon Musk)日前参与签署的“暂停先进AI系统开发六个月”倡议的组织。
2022年4月,臭名昭著的加密货币交易所FTX创始人兼首席执行官SBF领投了B轮融资,注资约5.8亿美元。2023年2月,Google宣布投资Anthropic 3亿美元,获得约10%的股份,除了发展自家的Bard(现已更名为Gemini)外,也希望Claude能够与ChatGPT展开竞争。
2023年5月,由Spark Capital领投的C轮融资中,Google和Zoom也参与,共投4.5亿美元。2023年8月,韩国电信公司SK电信也投资1亿美元,希望能打造适合电信公司的大型语言模型。
2023年9月,Amazon宣布将投资Anthropic高达40亿美元。对于Anthropic而言,AWS将成为公司依赖的云端服务商,类似于OpenAI利用微软的算力与资金,Anthropic能够将这些新资源用于提升模型的稳定性与性能。Amazon则如同微软,通过AWS将Anthropic的模型开放给客户使用。
2024年6月,在Anthropic发布Claude 3.5 Sonnet模型后,Google Cloud和AWS各自迅速宣布,其生成式AI开发平台Vertex AI和Amazon Bedrock,已经开始开放Claude 3.5 Sonnet的使用。
AWS表示,美国餐饮外送巨头DoorDash已经利用Claude 3模型,建立了基于生成式AI技术的客服中心(customer support center)。目前此类AI代理(AI agent,也可译作AI智能体、AI助理或AI专员)正在客服行业逐渐扩展,预计将应用于更多领域。
Claude AI训练过程的独特特征
Claude的设计彰显了其创办人深思熟虑的原则,充分体现了高度的系统性和逻辑性。
在Claude的训练程序中,开发团队首先确立了一套称为“Constitutional AI”的原则,作为模型行为的规范。在初始阶段,Anthropic允许模型自行生成内容,接着进行自我反思与评判,基于自我评估来修正输出,从而调整生成内容的方向。这一阶段本质上是监督式学习,模型依据人类设定的原则对自身回答进行评估。在第二阶段,微调后的模型生成内容后,会由其他模型进行“二选一”判断,这些辅助模型用来评估生成内容的优劣,进一步训练出具有偏好性的模型。
若您熟悉OpenAI训练ChatGPT的过程,或许会记得其中的“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,简称RLHF)阶段,即通过人类标记者对生成内容进行评价。而Anthropic则采用了“从AI反馈中强化学习”(Reinforcement Learning from AI Feedback,简称RLAIF)的方式,让AI代替人类进行内容评价。
实际上,Claude的训练流程与ChatGPT相似,都是通过标记数据和反馈信息来进行学习与优化。然而,Claude从一开始便设立了明确的原则,为AI提供了行为准则,使生成的内容能更好地体现制定者的价值观,从而减少了人为标记者可能存在的偏见。
无害的AI助手
通过这一训练模式,Anthropic培养出了一款既不会造成伤害也不会回避问题的AI助手。即便在用户故意提出潜在危险问题的情况下,例如ChatGPT明确禁止涉及犯罪与暴力的内容,Claude仍能提出有力的反驳。Anthropic强调,他们提升了AI决策过程的透明度,使人类能够更精确地控制AI行为,同时避免了过多的人工干预,堪称一举多得。