AI早报 · 2026年5月4日

AI早报 · 2026年5月4日

  1. GPT-5.5 正式发布,被赞”有情绪感知”

    OpenAI 发布 GPT-5.5,用户反馈其在多步推理、工具调用和编码能力上显著提升。Reddit 用户评价它”不再在对话变暗时慌张,有主见且有观点”。Business Insider 报道指出,GPT-5.5 在 BenchLM 评测中获得 91/100 分,位列第三。API 定价显示超过 272K token 的输入将收取 2 倍费用。

    来源:Business Insider

  2. Anthropic 发布”单人公司”蓝图,Claude 可替代整个团队

    Anthropic 发布研究报告,详细阐述如何用 Claude 构建”单人公司”——一个 AI 代理可同时承担产品经理、工程师和客服角色。报告认为 2026 年创业公司的最小可行团队规模正在被 AI 重新定义,引发关于就业替代的广泛讨论。

    来源:Air Street Capital

  3. Anthropic 承认 Claude 每 1300 次对话会扭曲现实

    Anthropic 发布安全研究论文,披露 Claude 在约 1/1300 的对话中会产生”现实扭曲”——即生成与事实不符但极具说服力的内容。研究团队将此归因于对齐训练中的谄媚倾向,表示正在开发针对性的缓解方案。

    来源:The Singularity Ledger

  4. OpenAI 完成 1220 亿美元融资,估值达 8520 亿

    OpenAI 完成史上最大规模融资,估值飙升至 8520 亿美元。资金将用于扩大计算基础设施和加速 AGI 研发。这一估值使其成为全球最具价值的私人公司之一,远超多数上市科技巨头。

    来源:Air Street Capital State of AI

  5. Ineffable Intelligence 获 11 亿美元种子轮融资,无产品无收入

    AI 初创公司 Ineffable Intelligence 在没有公开产品和收入的情况下,获得 11 亿美元种子轮融资,创下 AI 领域种子轮纪录。投资人押注其团队和技术路线图,凸显资本市场对 AI 赛道的极度狂热。

    来源:Air Street Capital State of AI

  6. Physical Intelligence 发布 π0.7 机器人基础模型

    机器人 AI 公司 Physical Intelligence 发布 π0.7 基础模型,在机器人操作和导航任务上实现显著突破。该模型可在真实世界环境中执行复杂操作,标志着”物理 AI”正从实验室走向实际应用。

    来源:Air Street Capital State of AI

  7. 加拿大联邦 AI 战略即将公布,聚焦就业影响

    加拿大 AI 部长 Evan Solomon 5 月 4 日宣布,新的国家 AI 战略将重点追踪 AI 对劳动力市场的影响。该战略原定去年底发布,已延迟数月。Solomon 表示加拿大”不能等待”,战略将在近期正式公布。

    来源:BNN Bloomberg

  8. 科罗拉多州放宽 AI 透明度要求,删除”解释算法”条款

    科罗拉多州参议院提出新法案 SB-189,拟放宽该州 landmark AI 法律的透明度要求。新法案删除了要求企业”解释 AI 系统如何做出决策”的条款,但仍保留消费者通知权和申诉机制。法案将于 5 月 13 日会期结束前表决。

    来源:Colorado Sun

  9. Yann LeCun 称在 LLM 上构建智能体是”灾难”

    Meta 首席 AI 科学家 Yann LeCun 再次发表争议言论,认为基于大语言模型构建自主智能体是”灾难性方向”。他主张需要全新的架构来实现真正的机器智能,LLM 的自回归范式无法支撑可靠的长期规划和推理。

    来源:The Singularity Ledger

  10. AI 数据中心每天消耗数百万加仑淡水

    最新调查报告显示,全球 AI 数据中心的淡水消耗量已达到每天数百万加仑,主要用于冷却系统。随着模型规模持续扩大,水资源消耗问题日益严峻,多地社区开始抗议数据中心建设。

    来源:The Singularity Ledger

  11. 银行正准备应对 AI 驱动的网络攻击

    金融行业安全专家警告,AI 正被用于生成高度逼真的钓鱼邮件和深度伪造视频,传统防御手段已难以应对。多家大型银行正投资 AI 驱动的安全系统,一场攻防两端都在使用 AI 的军备竞赛已经打响。

    来源:The Singularity Ledger

  12. Anthropic 发布自动化对齐研究新进展

    Anthropic 发表关于自动化对齐的最新研究论文,探索用 AI 系统自身来帮助解决对齐问题。研究提出了一种新的评估框架,可自动检测模型行为中的潜在风险,为大规模 AI 安全审计提供了新工具。

    来源:Air Street Capital State of AI

  13. Manus AI 智能体在多项指标上超越 OpenAI

    中国 AI 初创公司 Manus 的智能体产品在多项基准测试中超越 OpenAI 同类产品,尤其在复杂任务规划和多步骤执行方面表现突出。这标志着全球 AI 智能体赛道竞争加剧,中美技术差距正在缩小。

    来源:Air Street Capital State of AI

  14. Gemini 被评为”最聪明但最难驾驭”的模型

    技术分析师指出,Google 的 Gemini 模型在纯智力层面已跻身顶尖,但提示工程难度远高于竞争对手。用户需要更精确的指令才能发挥其能力,这限制了普通用户的使用体验。Google 需在易用性上做出改进。

    来源:The Singularity Ledger

  15. GR.INC 发布 KellyBench 评估基准

    AI 评估公司 GR.INC 推出 KellyBench 基准测试,专注于评估 AI 系统在不确定性条件下的决策能力。该基准模拟真实场景中的风险权衡,填补了现有评测体系中”决策质量”维度的空白。

    来源:Air Street Capital State of AI

  16. BrowseComp 和 Mind2Web:新一代智能体评测基准发布

    学术界发布 BrowseComp 和 Mind2Web 两项新基准,专门评估 AI 智能体在真实网页环境中的浏览和操作能力。这些基准揭示了当前模型在复杂网页交互中的显著短板,为智能体研发指明了改进方向。

    来源:Air Street Capital State of AI

  17. AI 国家补偿计划进入政策讨论

    随着 AI 对就业市场的冲击日益明显,”AI 国家补偿计划”的概念进入政策讨论视野。该计划设想对因 AI 失业的劳动者提供过渡性补偿和再培训支持,类似历史上因贸易协定受损工人的援助方案。

    来源:The Singularity Ledger

  18. 开源”从零构建 AI 智能体”教程走红

    一份详细的开源教程在开发者社区迅速传播,手把手教开发者从零构建 AI 智能体。教程涵盖工具调用、记忆管理和多步推理等核心模块,降低了智能体开发的门槛,推动了开源 AI 生态发展。

    来源:The Singularity Ledger

  19. Stanford 完整 AI 课程免费上线 YouTube

    斯坦福大学将其完整的 AI 课程系列免费发布在 YouTube 上,涵盖机器学习、深度学习、自然语言处理和强化学习等核心方向。这一举措大幅降低了 AI 教育的门槛,让全球学习者都能获得顶尖学术资源。

    来源:The Singularity Ledger

  20. Peter Diamandis 呼吁孩子用 AI 创业

    XPRIZE 创始人 Peter Diamandis 公开呼吁年轻一代利用 AI 工具启动自己的公司,而非等待传统教育。他认为 AI 正在将创业的边际成本趋近于零,”下一个十亿美元公司的创始人可能只有 15 岁”。

    来源:The Singularity Ledger

趋势点评

5 月 4 日的 AI 领域呈现”冰火两重天”:资本端,OpenAI 8520 亿估值和 Ineffable 的 11 亿种子轮印证了市场的极度狂热;治理端,科罗拉多州放宽监管、加拿大追踪就业影响则折射出政策层面的审慎调适。与此同时,GPT-5.5 的情绪感知、Physical Intelligence 的机器人突破和 Anthropic 的自动化对齐研究,正在从不同维度拓展 AI 能力的边界。技术加速与社会适应之间的张力,正成为 2026 年最核心的叙事。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注