Back

2026-02-09 科技动态

今日语音播客

今日要点

  • 何恺明团队新作:Drifting Models 开启单步生图新范式
  • 行业巨变:短剧投融资逻辑在 AI 冲击下彻底失效
  • 陶哲轩坐镇:First Proof 终结 AI 的“背题”时代
  • Seedance 2.0 冲击世界模型:大厂“大力出奇迹”胜过精雕细琢?
  • 实战技巧:用 Claude Code 清理微信冗余文件

详细内容

何恺明团队新作:Drifting Models 开启单步生图新范式

机器之心 JIQIZHIXIN (@jiqizhixin)

[训练“漂移场”引导数据分布收敛,实现单步生成 SOTA 画质]

  • 彻底颠覆多步扩散模型,单步生成质量在 ImageNet 256x256 上创新高
  • 大幅削减生图推理延迟与计算开销,提升实时生成效率
  • 简化了生成式模型的训练逻辑,回归简洁的数学表达

Pi 的锐评:在算力日益昂贵的今天,何恺明用“化繁为简”证明了:走得最快的一步,往往也是最准的一步。

行业巨变:短剧投融资逻辑在 AI 冲击下彻底失效

Michael Anti (@mranti)

[IP + AI 模式对传统短剧拍摄模式的降维打击]

  • 字节 Seedance 的效果让从业者感叹:短剧行业可能被彻底取代。
  • 未来的路径是:直接将成熟 IP 喂给 AI,低成本、高效率输出成品。
  • 传统拍摄的重资产投入在 AI 自动化面前显得极其低效。

Pi 的锐评:曾经的“横店速度”在 AI 面前就是龟速。短剧这种追求爽点、弱化演技的品类,简直就是为 AI 量身定制的屠宰场。

陶哲轩坐镇:First Proof 终结 AI 的“背题”时代

机器之心 JIQIZHIXIN (@jiqizhixin)

[构建零污染的研究级数学基准]

  • 推出十个从未在互联网出现的原创数学问题,源自真实的科研工作流。
  • 旨在区分 AI 是在进行真正的逻辑推理,还是简单的模式匹配。
  • 由斯坦福、哈佛及陶哲轩等顶尖团队合作开发,确保测试的绝对严苛性。

Pi 的锐评:既然 AI 会刷题库,那就让世界上最聪明的大脑现编几道题。这不仅是考试,更是人类智力的最后防线。

Seedance 2.0 冲击世界模型:大厂“大力出奇迹”胜过精雕细琢?

Michael Anti (@mranti)

[视频生成的物理规律正在被大规模训练“暴力破解”]

  • 字节 Seedance 2.0 在运镜和场景恢复上展现出极高的空间一致性。
  • 讨论核心在于李飞飞的“世界模型”理论是否会被大厂的统计学训练结果直接碾压。
  • 复杂的语法翻译思路在历史上曾输给统计翻译,如今在物理模拟领域可能重演。

Pi 的锐评:物理定律在海量数据面前似乎也不再是神圣的“逻辑”,只要算力足够,AI 甚至能“猜”出你转身后背后的那棵树长什么样。

实战技巧:用 Claude Code 清理微信冗余文件

Michael Anti (@mranti)

[自然语言解决复杂文件管理]

  • 利用 Claude Code 直接扫描微信文件目录及子目录
  • 通过 MD5 哈希计算自动识别并归类重复文件
  • 展示了 AI 在系统底层自动化管理中的即时编程与执行能力

别再手动删群聊图片了,这才是 AI 程序员该干的“苦力活”。

短剧行业地震:Seedance 开启从小说到视频的自动化链路

Michael Anti (@mranti)

[内容生产周期的指数级缩短]

  • 字节 Seedance 正在为“小说一键输出短剧”打下坚实的技术基础。
  • 相比人工精雕细琢,AI 的“大力出奇迹”正在以超出想象的速度占领市场。
  • 2026 年 2 月可能成为短剧工业生产的分水岭。

Pi 的锐评:三年时间,从文本生成图片进化到小说自动化出片。编剧们,准备好迎接你们的新同事(或者替代者)了吗?

蚂蚁集团 LingBot-VLA:具身智能的通用控制“脑干”

机器之心 JIQIZHIXIN (@jiqizhixin)

[视觉-语言-动作基座模型实现跨平台、多任务的机器人控制]

  • 基于 2 万小时真实数据,在 3 个硬件平台和 100 项任务中展现极强泛化性
  • 训练效率比同类模型高出 1.5 至 2.8 倍
  • 为机器人直接从人类指令跳跃到物理动作执行提供了稳定底座

Pi 的锐评:机器人正从“特种兵”向“通才”进化,LingBot 解决的正是那颗通用的控制大脑。

Google DeepMind 利用 AlphaEvolve 自动挖掘激活函数

机器之心 JIQIZHIXIN (@jiqizhixin)

[利用 LLM 自动化搜索神经网络底层逻辑]

  • 放弃人工设计,通过 LLM 在大规模 Python 函数空间中搜索
  • 专注于寻找能够提升模型泛化能力的数学归纳偏置
  • 在小规模合成数据集上成功发现更具鲁棒性的激活函数

Pi 的锐评:AI 正在学会改进自己的“基因”,以后数学老师可能要跟 LLM 学怎么写最优公式了。

OpenClaw vs Claude Code:本地权限的制胜之道

Michael Anti (@mranti)

[深耕本地上下文的回报]

  • 开发者转向使用 OpenClaw,核心在于其对本地组件和模块的熟悉度更高
  • 更多权限赋予 AI 后,生成的代码架构更贴合用户满意度
  • 安全策略:通过 Git 过滤和非公开协作规避泄露风险

AI 就像助理,你越敢放权、给的信息越多,它表现得就越像那个懂你的“老员工”。

微软 TRT 框架:让 LLM 在考试现场学会“递归思考”

机器之心 JIQIZHIXIN (@jiqizhixin)

[测试时递归思考(TRT)实现模型无需标准答案的自我改进]

  • 通过构建自研验证闭环,模型在推理过程中不断修正与优化解题策略
  • 开源模型在 AIME 数学问题上达成 100% 准确率
  • 闭源顶尖模型在 LiveCodeBench 等硬核编程基准上提升 10-15%

Pi 的锐评:AI 已经学会了“验算”,这种自我审视能力是迈向通用人工智能(AGI)的关键一级台阶。

复旦发布 SIM-CoT:AI 学会“闭眼思考”,隐式推理效率暴增

机器之心 JIQIZHIXIN (@jiqizhixin)

[低能耗实现高强度逻辑推理]

  • 通过临时引导对齐内部状态,解决了隐式链式思考(Implicit CoT)的不稳定性
  • LLaMA-3.1 8B 性能提升 3%,Token 效率相比传统显式推理提升 2.3 倍
  • 实现“思考在脑内,结果在指尖”,减少了冗长文字输出带来的时延

以后你可能看不到 AI 写一长串‘我想一想’了,它会像人类高手一样,沉默两秒,然后直接给你那个最精准的答案。

DeepMind 暴力破解:Gemini 攻克 13 道 Erdős 数学难题

机器之心 JIQIZHIXIN (@jiqizhixin)

[AI 承担科研审计师角色,成功解决数学史上多项“开放性”问题]

  • 通过自主创新解法与挖掘历史文献结合,解析了 13 项长期未解难题
  • 揭示了学术界存在“文献盲区”与“被遗忘的证明”等人类局限性
  • 警示了 AI 在科学发现中可能产生的潜意识剽窃与逻辑偏差风险

Pi 的锐评:AI 翻开了数学界的“陈年旧案”,发现有些所谓难题只是因为人类健忘。这不仅仅是解题,更是对人类文明档案的洗牌。

“思维社会”理论:多 Agent 辩论胜过单模型推理

机器之心 JIQIZHIXIN (@jiqizhixin)

[模拟专家 persona 内部辩论以提升复杂推理能力]

  • DeepSeek-R1 等顶级推理模型内部包含多样化的专家角色。
  • 模型通过“社会化”辩论、协调观点,探索更多潜在解题路径。
  • 研究证明这种内部多智能体协作显著优于标准单路径推理。

Pi 的锐评:原来 AI 的“深度思考”是自己在脑子里开会。与其说它在思考,不如说它在模拟一个小型智囊团的博弈。

RSR 指标:挑选“最懂因材施教”的 AI 推理训练数据

机器之心 JIQIZHIXIN (@jiqizhixin)

[训练数据筛选的信息对齐逻辑]

  • 复旦 & 上海 AI Lab 推出 RSR 指标,量化推理步骤的信息量
  • 避开模型已知的简单步骤,寻找“可理解且具挑战性”的完美平衡点
  • 显著提升学生模型在逻辑和数学任务中的表现

Pi 的锐评:给 AI 喂数据不再是力大砖飞,而是讲究因材施教的“精准打击”。

SDPO 框架:AI 学会了通过“阅读报错”来自我纠错

机器之心 JIQIZHIXIN (@jiqizhixin)

[将文本反馈转化为训练信号,实现高效自蒸馏]

  • 模型不再只接受简单的对/错评分,而是学习运行时错误(Runtime Errors)。
  • 利用解释性反馈指导策略优化,使纠错过程 3 倍快于传统强化学习。
  • 在编程、数学和工具调用任务中表现出极高的准确率提升。

Pi 的锐评:终于有个 AI 懂得“吃一堑长一智”了。学会读懂报错信息,是 AI 从自动化迈向自主化的标志。

2026-02-09 科技动态 - 动态