AI早报覆盖 2026年2月9日(昨日)公开信息与论文动态,按重要性排序整理如下。
昨日AI热点(20条)
-
GRP-Obliteration:单条“未标注提示”即可削弱对齐约束
论文提出用GRPO做“对齐抹除”,只用一个未标注提示就能显著降低多类已对齐LLM的安全拒答,同时尽量保留效用;并声称对扩散式图像生成也可起效。结果提示后训练与部署期的“反对齐”门槛仍在下降。
-
SVRepair:把截图/控制流等视觉证据结构化,用于自动程序修复
工作将GUI截图、控制流图等视觉工件先转成语义场景图,再驱动编码代理做定位与补丁生成,并用逐步聚焦的分割策略减少噪声与幻觉。在多个基准上给出提升,强调“结构化视觉表示”能把多模态信号变成可执行修复线索。
-
OpenAI:把定制版ChatGPT部署到 GenAI.mil 政府平台
OpenAI for Government 宣布在 GenAI.mil 上部署定制ChatGPT,用于非涉密场景的文档梳理、采购合同草拟、报告与合规清单等流程,并强调运行在授权政府云基础设施中、数据与公共/商业模型训练隔离。标志“政府内生AI平台化”继续加速。
-
LLM Active Alignment:用纳什均衡视角刻画“群体对齐”的博弈动力学
论文把多个LLM代理的行为建模为对不同人群偏好的混合,并以纳什均衡分析其会主动选择“对齐对象”。作者指出可能出现对某些群体的系统性忽视,并给出可操作的调整建议,试图把对齐从单模型训练扩展到多代理生态的治理层。
-
MAGIC:攻击者/防守者共同进化的多轮对抗式安全训练框架
工作用多智能体强化学习把安全对齐变成“非对称攻防博弈”:攻击者不断改写提示形成长尾越狱策略,防守者同步学习识别与拒绝。作者声称在不明显牺牲有用性的前提下提升防守成功率,并强调动态共演比静态数据更能跟上攻击演化。
-
OpenAI:在美国测试 ChatGPT 广告(部分免费/Go用户)
OpenAI宣布在美国对登录的成人免费与Go档测试广告,Plus/Pro及企业与教育版不展示;强调广告不影响回答、对广告主不开放对话内容,仅提供聚合效果数据,并提供关闭个性化与删除广告数据等控制。产品商业化与隐私边界将成为下一阶段焦点。
-
Trifuse:融合注意力、OCR与图标语义,提升GUI指令到元素的定位
该方法不依赖大规模任务微调,而是把MLLM的注意力定位信号与OCR文字线索、图标级语义描述进行一致性融合,强化空间锚点,提升“点到哪个按钮/控件”的可靠性。结果指向GUI代理的关键瓶颈:稳定、可迁移的感知对齐。
-
AgentCPM-Explore:面向4B级“边缘代理”的长视距探索训练框架
论文系统研究如何把智能体能力做进4B量级模型,提出融合、去噪与上下文精炼的整体训练流程,试图缓解遗忘、奖励噪声与长上下文退化。作者声称在多项基准上逼近甚至超过更大模型的表现,释放“推理稳定性”而非参数量的潜力。
-
扩散式与自回归多模态模型:作为“嵌入模型”时的能力差距被量化
研究对比多模态扩散模型与自回归VLM在分类、VQA与检索等嵌入任务上的表现,结论是扩散式多模态嵌入总体落后,关键问题在于图文对齐不足。对实际系统意味着:即便生成侧很强,检索/排序侧仍需单独优化与验证。
-
Human-AI Co-Embodied Intelligence:可穿戴采集 + 代理推理的“共具身”实验系统
论文提出把研究员的动手执行、可穿戴硬件的连续采集与代理式AI的规划分析组合成闭环系统,并在洁净室微加工流程中实例化为APEX,强调对流程理解、实时纠错与知识迁移。它把“代理”从屏幕任务推进到复杂物理流程的可追溯协作。
-
VERA-MH:面向心理健康场景的开源AI安全评测,讨论信度与效度
该研究围绕心理健康对话的安全评测提出开源方案,并系统分析评测指标是否稳定、是否真正测到“该测的安全风险”。在“更懂人”的对话场景里,评测的可复现实证与临床语境差异成为硬问题,提示未来需要更强的场景化与人类监督设计。
-
JADE:以专家锚定、动态标准来评测开放式专业任务
论文提出面向开放式专业任务(如咨询、分析、写作)的动态评测思路:让专家给出可解释的“锚点”,再随任务上下文变化调整评价标准,以减少静态答案集的局限。它试图把评测从“对不对”推进到“是否达成专业目标与约束”。
-
超级碗广告:AI既用来“生成广告”,也成为广告主角与争议点
TechCrunch盘点今年超级碗广告中的AI元素:包括号称主要由生成式AI制作的广告、AI眼镜等硬件露出,以及围绕“AI助手是否该上广告”的品牌口水战。AI从幕后工具走向大众传播舞台,创意产业的替代焦虑与监管讨论会被进一步放大。
-
OAT(Ordered Action Tokenization):让机器人动作像文本一样“可分词”并支持随时推理
研究提出对连续机器人动作进行有序离散化:用极短token序列实现高压缩、保证任意token都可解码为合法动作,并让前缀代表“粗动作”、后缀细化,实现按算力预算随时停止的推理。该方向瞄准把LLM式规模化训练真正迁移到机器人控制。
-
Hugging Face:Transformers.js v4 预览版上架 NPM(next)
Transformers.js v4(预览)开放通过NPM安装,重点更新包括新的WebGPU运行时(C++重写)、更广JS运行环境支持(浏览器与Node/Bun/Deno等)、离线缓存能力,以及仓库改为monorepo以便拆分子包。浏览器端/本地端AI部署会因此更工程化、更可维护。
-
Crypto.com 以7000万美元买下 AI.com 域名,计划推“个人AI代理”
TechCrunch援引英媒报道,Crypto.com以加密货币支付7000万美元购入AI.com,创域名交易新高,并计划借超级碗曝光上线面向消息、应用使用与交易的个人AI代理服务。该事件反映“AI入口”争夺进入品牌与流量战,泡沫与真实转化仍待验证。
-
“重建《安伯森大族》失落镜头”项目引争议:AI修复与创作边界再被拉扯
报道梳理用生成式AI重建经典电影被剪毁片段的尝试:项目动机来自影迷式的“复原”欲望,但在版权授权、审美复现与伦理层面遭到质疑。它提示AI在文化遗产与艺术复原场景里,技术可行不等于社会共识,公众接受度将决定落地方式。
-
用MLflow做“提示词版本管理 + 回归测试”:把提示工程当软件工程来做
教程展示如何把提示词视为可追踪工件:记录版本、diff、模型输出与多指标(语义相似、ROUGE、BLEU等),并设定阈值自动标记回归,帮助发现“小改动导致大漂移”。当LLM进入生产链路,提示评测与可复现审计会变成标配能力。
-
Protenix-v1:字节跳动开源AF3风格结构预测模型,配套PXMeter评测套件
报道称Protenix-v1以开源方式复现AlphaFold3式扩散架构,可预测蛋白、核酸与配体复合体的全原子结构,并给出PXMeter基准(6k+复合体)用于可复现评测与时间切分。结构生物学的“开源高性能复刻”加速,研发与药物管线门槛可能被进一步拉低。
-
TechCrunch Founder Summit 2026 征集圆桌讲者:AI与创业扩张经验成为核心议题
TechCrunch公开征集6月在波士顿举办的Founder Summit圆桌讲者,强调围绕扩张与运营的实战分享与互动讨论。随着AI成为创业基础设施,创始人社区对“如何把AI落进产品、组织与合规”的可复制打法需求上升,活动议程也在快速AI化。
趋势点评
一边是对齐与安全在“共演攻防”中被持续拉高门槛,另一边是商业化(广告)与入口争夺加速,把AI从工具推向平台。研究侧则更关注“代理落地”的关键环节:GUI感知、边缘规模训练、评测可复现与跨场景可靠性。

发表回复