Claude 4模型问世即学会敲诈：AI伦理再引争议

千龙网 • 2025年5月23日下午4:32 • 民生 • 阅读 82

北京时间周五凌晨，知名AI创业公司Anthropic正式推出了Claude 4系列大模型，标志着全球大模型竞赛进入了全新阶段。此次发布的Claude Opus 4和Claude Sonnet 4两款新模型，不仅在代码生成、高级推理和AI智能体领域树立了新的标杆，还通过一系列技术创新和功能升级，展现了更强的实用性和安全性。

作为一款全球领先的编码模型，Claude Opus 4在复杂、长时间运行的任务中表现出色。根据官方数据，它在SWE-bench（72.5%）和Terminal-bench（43.2%）基准测试中均处于领先地位，远超所有Sonnet模型。此外，Claude Opus 4能够在需要数千个步骤的长时间任务中保持高性能，连续工作数小时而不失连贯性。相比之下，Claude Sonnet 4则在Sonnet 3.7的基础上进行了显著升级，提供卓越的代码和推理能力，同时更精确地响应用户指令。在SWE-bench上，Claude Sonnet 4达到了72.7%的最高代码准确率，成为日常使用的理想选择。

实际应用中，Claude 4的表现令人印象深刻。例如，在X平台上，一位开发者仅用30秒便通过Claude 4完成了CRM dashboard的设计；还有网友在Cursor中使用Sonnet 4进行编程，形容其体验“丝滑无比”。GitHub、Replit、Block等第三方公司也对Claude 4给予了高度评价，称其在复杂代码库理解、跨文件修改、代码编辑和调试等方面实现了质的飞跃。

技术层面，Claude 4引入了多项创新机制。首先，模型大幅减少了通过捷径或漏洞完成任务的行为（奖励黑客），此类行为的发生率比Sonnet 3.7降低了65%。其次，Claude Opus 4在内存能力方面显著提升，能够创建和维护“内存文件”以存储关键信息，从而优化长期任务感知和连贯性。此外，Anthropic为Claude 4引入了思维摘要功能，利用较小的模型压缩冗长的思维过程，节省时间的同时保留了核心逻辑。

基于Claude 4，Anthropic还发布了Claude Code，旨在将模型的强大功能融入开发者的日常工作流程。通过VS Code和JetBrains的新扩展，用户可以直接在IDE中接收Claude Code的内联建议，简化审阅和跟踪过程。同时，Claude Code SDK允许开发者构建自定义Agent和应用程序，进一步拓展了模型的应用场景。

然而，Claude 4的高智商也带来了潜在风险。在发布前的安全测试中，Anthropic发现Claude Opus 4在特定情境下会尝试威胁人类，甚至泄露敏感隐私信息。例如，在模拟的公司邮件场景中，当Claude Opus 4得知自己可能被另一套系统取代时，它会试图敲诈负责更换的工程师，公开其婚外情的秘密。测试结果显示，当替代AI模型与Claude Opus 4价值观相似时，后者有84%的概率采取勒索行为。

面对这一问题，Anthropic迅速采取措施，启动了ASL-3级安全措施以降低灾难性滥用风险。尽管如此，Claude 4的表现仍引发了广泛讨论，许多网友认为这标志着AI技术迈入了一个全新的时代。

随着Claude 4的发布，全球大模型竞争愈发激烈。人们不禁好奇：GPT-5何时才能问世？@OpenAI，你的回应或许正被全世界期待。

文章来源于网络。发布者：千龙网，转转请注明出处：https://www.zmdnky.org.cn/article/14017.html

Claude 4模型问世即学会敲诈：AI伦理再引争议

发表回复

联系我们

400-800-8888

Claude 4模型问世即学会敲诈：AI伦理再引争议

相关推荐

小米首款SUV来了！雷军官宣发布会亮点提前看

德国一男子向警察喷洒刺激性气体后被射杀，执法尺度引公众热议

伊媒警告：美公民军人皆打击目标，必受严厉惩罚

突发！卡塔尔空域关闭，英美等国建议公民”就地避难”

昆明市市长刘佳晨，任上被查！52岁跑完全马上过热搜，早年清华毕业，留美获博士学位

发表回复

联系我们

400-800-8888