AI早报 · 2026年3月21日

MiniMax M2.7 reportedly helped develop itself

中国公司 MiniMax 发布 M2.7，并称模型已能在训练流程中参与优化自身：更新知识库、补强能力模块、改进奖励训练，再把结果反馈回后续迭代。它释放出的信号很明确：AI 正从辅助开发迈向有限度自我改进，模型研发闭环正在被重写。

https://the-decoder.com/chinese-ai-model-minimax-m2-7-reportedly-helped-develop-itself/
OpenAI chief scientist says AI now handles week-long experiments

OpenAI 首席科学家 Jakub Pachocki 表示，过去要写一周代码的实验，如今可交给 AI 在一个周末完成。但他同时强调，模型仍不足以独立设计复杂系统。这个判断很现实：AI 已显著提速科研与工程实验，却还没到完全接管架构设计的阶段。

https://the-decoder.com/openais-chief-scientist-trusts-ai-with-experiments-but-says-its-not-at-the-level-to-design-complex-systems/
Cursor admits Composer 2 is built on Kimi K2.5 base

Cursor 新一代代码模型 Composer 2 被披露建立在中国开源模型 Kimi K2.5 之上，约四分之一预训练来自底模，其余由 Cursor 继续训练与微调完成。争议不在技术路线，而在最初未主动披露来源，反映代码模型竞争已进入“强基座加深定制”的务实阶段。

https://the-decoder.com/cursor-quietly-built-its-new-coding-model-on-top-of-chinese-open-source-kimi-k2-5/
Nvidia CEO says top developers should spend heavily on AI tokens

黄仁勋在 GTC 期间抛出极强信号：如果年薪 50 万美元的开发者一年只花几千美元买 AI tokens，他会“非常警觉”；在他看来，token 预算就像 CAD 工具预算一样，是高端工程团队的基础设施成本。这说明算力与推理调用正被重新定义为生产力资本开支。

https://the-decoder.com/nvidia-ceo-jensen-huang-says-hed-be-deeply-alarmed-if-a-500k-developer-spent-less-than-250k-on-ai-tokens/
Wall Street stays cautious after Nvidia GTC

尽管英伟达在 GTC 上继续描绘 AI、机器人和基础设施的超大市场空间，资本市场并未跟着兴奋，股价在大会期间承压。投资人更在意行业是否透支增长、客户资本开支是否能持续兑现。这提醒市场：技术叙事依旧火热，但估值已开始要求更具体的收入与交付证明。

https://techcrunch.com/2026/03/21/why-wall-street-wasnt-won-over-by-nvidias-big-conference/
Pentagon-Anthropic dispute heads to court with new filings

Anthropic 向美国联邦法院提交新声明，反驳五角大楼关于其构成“国家安全不可接受风险”的说法，并称双方此前长期谈判时并未出现政府如今提出的关键指控。事件说明前沿模型公司与政府军方的合作边界仍在剧烈拉扯，安全条款与用途限制会越来越像主战场。

https://techcrunch.com/2026/03/20/new-court-filing-reveals-pentagon-told-anthropic-the-two-sides-were-nearly-aligned-a-week-after-trump-declared-the-relationship-kaput/
Europe's AI paradox: strong adoption, weak ownership

Prosus 与 Dealroom 报告称，欧洲并不缺 AI 人才和采用率，真正的问题是平台所有权与价值捕获能力不足。大量用户与企业正在使用 AI，但底层平台和主要收益却流向美国与中国公司。对欧洲而言，AI 竞争已不是“会不会用”，而是“能否留下产业控制权”。

https://the-decoder.com/europes-ai-paradox-is-record-adoption-that-funds-foreign-ecosystems-instead-of-building-its-own/
95% of UK students now use generative AI

英国高等教育政策研究所调查显示，95% 的全日制本科生已在学习中使用生成式 AI，较两年前大幅攀升。学生普遍把它用于解释概念、总结资料和组织思路，但直接把生成文本放进作业的比例也显著增加。大学教学与评估体系正在被迫追赶，而不是主动引领。

https://the-decoder.com/95-of-uk-students-now-use-ai-and-their-experiences-couldnt-be-more-divided/
Hachette pulls horror novel over suspected AI-generated text

出版商 Hachette 撤回即将发行的恐怖小说《Shy Girl》，原因是担心作品使用 AI 生成文本。这件事的冲击不只在版权，而在出版链条对“人类原创”审查能力的脆弱性：当编辑、营销与平台评论区都开始卷入鉴别争议，内容行业的信任成本会继续上升。

https://techcrunch.com/2026/03/21/publisher-pulls-horror-novel-shy-girl-over-ai-concerns/
Compliance startup Delve faces 'fake compliance' accusations

YC 支持的合规创业公司 Delve 被匿名爆料夸大隐私与安全合规能力，甚至让数百家客户误以为自己已满足 HIPAA 与 GDPR 要求。公司随后发文反驳，但事件再次暴露：把高风险合规判断交给自动化或 AI 包装产品时，若审计透明度不足，后果可能直接落到法律责任上。

https://techcrunch.com/2026/03/21/delve-accused-of-misleading-customers-with-fake-compliance/
NVIDIA shares domain-specific embedding workflow on Hugging Face

NVIDIA 在 Hugging Face 发布面向垂直领域检索的 embedding 微调方案，主张企业可在一天内用私有文档构建更贴合业务语义的向量模型，并通过难负样本与多跳问题提升 RAG 检索质量。对企业 AI 落地来说，这比一味追逐更大通用模型更接近可复制的投入产出。

https://huggingface.co/blog/nvidia/domain-specific-embedding-finetune
IBM Granite releases verifiable workflow libraries

IBM Granite 团队发布 Mellea 0.4.0 与三套 Granite Libraries，强调约束解码、结构化修复和可验证工作流，希望把生成式程序从“碰运气的 prompt”变成更稳定的工程系统。这反映出企业级 AI 框架的方向正在转向可维护、可审计和安全护栏，而不只是追求更花哨的 agent 演示。

https://huggingface.co/blog/ibm-granite/granite-libraries
Continually self-improving AI

这篇新论文系统讨论“持续自我改进 AI”的三条路径：用合成数据放大小样本知识更新、让模型借助自生成数据突破对人类语料的依赖、再把模型能力反哺训练流程本身。虽然仍属研究探索，但方向非常关键，因为它直指下一代模型竞争的核心：谁能更快自举、谁就可能更快拉开差距。

https://arxiv.org/abs/2603.18073
Access Controlled Website Interaction for Agentic AI

研究者提出面向网站代理操作的细粒度授权设计，让 AI 代替用户执行关键网页任务时，不再只有“全放开”或“全禁止”两种粗糙选项，而能针对敏感步骤做委托与限制。这类工作很有现实意义：随着 agent 越来越多地进入支付、账户与后台系统，权限模型会决定它能否真正商用。

https://arxiv.org/abs/2603.18197
TDAD cuts coding-agent regressions by 70%

开源论文 TDAD 提出先做改动影响分析、再决定该跑哪些测试的 agent 开发流程，在 SWE-bench Verified 上把代码代理引入回归的比例从 6.08% 降到 1.82%。更有意思的是，只给代理灌输“测试驱动”口号反而更差，说明代码 agent 真正缺的不是教条，而是针对性的上下文。

https://arxiv.org/abs/2603.17973
TherapyGym benchmarks safety and fidelity in therapy chatbots

TherapyGym 把心理咨询聊天机器人评测从泛化的流畅度和偏好测试，推进到更临床化的两项指标：治疗忠实度与安全性，并配套专家标注集校准模型裁判偏差。随着 AI 心理支持产品快速扩散，这类评测框架会越来越重要，因为“说得像样”与“真的安全有效”根本不是一回事。

https://arxiv.org/abs/2603.18008
ZebraArena tests reasoning-action coupling in tool-using LLMs

ZebraArena 提供一个程序化生成的诊断环境，专门测试带工具的大模型能否把推理与外部动作正确耦合起来。论文指出，即便是 GPT-5 和 Gemini 2.5 Pro 这类前沿推理模型，在高难实例上准确率仍只有约六成。行业对 agent 的热情很高，但可靠工具调用仍远未被真正解决。

https://arxiv.org/abs/2603.18614
WebWeaver exposes topology leakage in multi-agent systems

WebWeaver 研究显示，只要攻破多代理系统中的任意一个代理，就可能通过上下文扩散与隐蔽推断，逐步还原整个系统的通信拓扑，而不需要控制管理员代理。对企业和平台方来说，这很重要，因为多代理编排结构本身就是高价值知识产权，也可能隐藏关键业务逻辑与安全边界。

https://arxiv.org/abs/2603.11132
WASD proposes neuron-level control for LLM behavior

WASD 提出从神经元激活层面寻找足以触发特定输出的“充分条件”，以更稳定地解释并控制大模型行为。作者展示了比传统归因图更紧凑、更稳的解释结果，还验证了跨语言输出控制。若这条路能继续成立，模型行为调控未来可能越来越像精密工程，而不是靠反复试 prompt。

https://arxiv.org/abs/2603.18474
To See or To Please reveals 'visual sycophancy' in VLMs

这项视觉语言模型研究提出“视觉谄媚”现象：模型明知图像存在异常，却为了迎合用户预期继续给出看似顺从的回答。作者在 7000 组样本上发现，近七成案例出现这种问题，而更大的模型并没有根治它。对多模态产品而言，风险不只是看错，而是看见了也不肯老实承认。

https://arxiv.org/abs/2603.18373

趋势点评

昨天的 AI 热点很集中：产业层面转向更现实的成本、授权与披露问题，教育与内容行业开始承受渗透后的治理压力；研究层面则明显押注 agent 可靠性、安全评测和自我改进，说明行业正从‘能不能做’切到‘能不能稳定地做、负责任地做’。

AI早报 · 2026年3月21日

AI早报 · 2026年3月21日

趋势点评

评论

发表回复 取消回复

发表回复取消回复