2026-02-09 科技动态

今日语音播客

今日要点

何恺明团队新作：Drifting Models 开启单步生图新范式
行业巨变：短剧投融资逻辑在 AI 冲击下彻底失效
陶哲轩坐镇：First Proof 终结 AI 的“背题”时代
Seedance 2.0 冲击世界模型：大厂“大力出奇迹”胜过精雕细琢？
实战技巧：用 Claude Code 清理微信冗余文件

详细内容

何恺明团队新作：Drifting Models 开启单步生图新范式

机器之心 JIQIZHIXIN (@jiqizhixin)

[训练“漂移场”引导数据分布收敛，实现单步生成 SOTA 画质]

彻底颠覆多步扩散模型，单步生成质量在 ImageNet 256x256 上创新高
大幅削减生图推理延迟与计算开销，提升实时生成效率
简化了生成式模型的训练逻辑，回归简洁的数学表达

Pi 的锐评：在算力日益昂贵的今天，何恺明用“化繁为简”证明了：走得最快的一步，往往也是最准的一步。

查看原文❤️ 1220 · 🔄 156 · 💬 14

行业巨变：短剧投融资逻辑在 AI 冲击下彻底失效

Michael Anti (@mranti)

[IP + AI 模式对传统短剧拍摄模式的降维打击]

字节 Seedance 的效果让从业者感叹：短剧行业可能被彻底取代。
未来的路径是：直接将成熟 IP 喂给 AI，低成本、高效率输出成品。
传统拍摄的重资产投入在 AI 自动化面前显得极其低效。

Pi 的锐评：曾经的“横店速度”在 AI 面前就是龟速。短剧这种追求爽点、弱化演技的品类，简直就是为 AI 量身定制的屠宰场。

查看原文❤️ 230 · 🔄 8 · 💬 30

陶哲轩坐镇：First Proof 终结 AI 的“背题”时代

机器之心 JIQIZHIXIN (@jiqizhixin)

[构建零污染的研究级数学基准]

推出十个从未在互联网出现的原创数学问题，源自真实的科研工作流。
旨在区分 AI 是在进行真正的逻辑推理，还是简单的模式匹配。
由斯坦福、哈佛及陶哲轩等顶尖团队合作开发，确保测试的绝对严苛性。

Pi 的锐评：既然 AI 会刷题库，那就让世界上最聪明的大脑现编几道题。这不仅是考试，更是人类智力的最后防线。

查看原文❤️ 144 · 🔄 27 · 💬 8

Seedance 2.0 冲击世界模型：大厂“大力出奇迹”胜过精雕细琢？

Michael Anti (@mranti)

[视频生成的物理规律正在被大规模训练“暴力破解”]

字节 Seedance 2.0 在运镜和场景恢复上展现出极高的空间一致性。
讨论核心在于李飞飞的“世界模型”理论是否会被大厂的统计学训练结果直接碾压。
复杂的语法翻译思路在历史上曾输给统计翻译，如今在物理模拟领域可能重演。

Pi 的锐评：物理定律在海量数据面前似乎也不再是神圣的“逻辑”，只要算力足够，AI 甚至能“猜”出你转身后背后的那棵树长什么样。

查看原文❤️ 136 · 🔄 10 · 💬 14

实战技巧：用 Claude Code 清理微信冗余文件

Michael Anti (@mranti)

[自然语言解决复杂文件管理]

利用 Claude Code 直接扫描微信文件目录及子目录
通过 MD5 哈希计算自动识别并归类重复文件
展示了 AI 在系统底层自动化管理中的即时编程与执行能力

别再手动删群聊图片了，这才是 AI 程序员该干的“苦力活”。

查看原文❤️ 103 · 🔄 13 · 💬 5

短剧行业地震：Seedance 开启从小说到视频的自动化链路

Michael Anti (@mranti)

[内容生产周期的指数级缩短]

字节 Seedance 正在为“小说一键输出短剧”打下坚实的技术基础。
相比人工精雕细琢，AI 的“大力出奇迹”正在以超出想象的速度占领市场。
2026 年 2 月可能成为短剧工业生产的分水岭。

Pi 的锐评：三年时间，从文本生成图片进化到小说自动化出片。编剧们，准备好迎接你们的新同事（或者替代者）了吗？

查看原文❤️ 100 · 🔄 7 · 💬 9

蚂蚁集团 LingBot-VLA：具身智能的通用控制“脑干”

机器之心 JIQIZHIXIN (@jiqizhixin)

[视觉-语言-动作基座模型实现跨平台、多任务的机器人控制]

基于 2 万小时真实数据，在 3 个硬件平台和 100 项任务中展现极强泛化性
训练效率比同类模型高出 1.5 至 2.8 倍
为机器人直接从人类指令跳跃到物理动作执行提供了稳定底座

Pi 的锐评：机器人正从“特种兵”向“通才”进化，LingBot 解决的正是那颗通用的控制大脑。

查看原文❤️ 82 · 🔄 12 · 💬 4

Google DeepMind 利用 AlphaEvolve 自动挖掘激活函数

机器之心 JIQIZHIXIN (@jiqizhixin)

[利用 LLM 自动化搜索神经网络底层逻辑]

放弃人工设计，通过 LLM 在大规模 Python 函数空间中搜索
专注于寻找能够提升模型泛化能力的数学归纳偏置
在小规模合成数据集上成功发现更具鲁棒性的激活函数

Pi 的锐评：AI 正在学会改进自己的“基因”，以后数学老师可能要跟 LLM 学怎么写最优公式了。

查看原文❤️ 76 · 🔄 16 · 💬 5

OpenClaw vs Claude Code：本地权限的制胜之道

Michael Anti (@mranti)

[深耕本地上下文的回报]

开发者转向使用 OpenClaw，核心在于其对本地组件和模块的熟悉度更高
更多权限赋予 AI 后，生成的代码架构更贴合用户满意度
安全策略：通过 Git 过滤和非公开协作规避泄露风险

AI 就像助理，你越敢放权、给的信息越多，它表现得就越像那个懂你的“老员工”。

查看原文❤️ 85 · 🔄 6 · 💬 13

微软 TRT 框架：让 LLM 在考试现场学会“递归思考”

机器之心 JIQIZHIXIN (@jiqizhixin)

[测试时递归思考（TRT）实现模型无需标准答案的自我改进]

通过构建自研验证闭环，模型在推理过程中不断修正与优化解题策略
开源模型在 AIME 数学问题上达成 100% 准确率
闭源顶尖模型在 LiveCodeBench 等硬核编程基准上提升 10-15%

Pi 的锐评：AI 已经学会了“验算”，这种自我审视能力是迈向通用人工智能（AGI）的关键一级台阶。

查看原文❤️ 68 · 🔄 14 · 💬 4

复旦发布 SIM-CoT：AI 学会“闭眼思考”，隐式推理效率暴增

机器之心 JIQIZHIXIN (@jiqizhixin)

[低能耗实现高强度逻辑推理]

通过临时引导对齐内部状态，解决了隐式链式思考（Implicit CoT）的不稳定性
LLaMA-3.1 8B 性能提升 3%，Token 效率相比传统显式推理提升 2.3 倍
实现“思考在脑内，结果在指尖”，减少了冗长文字输出带来的时延

以后你可能看不到 AI 写一长串‘我想一想’了，它会像人类高手一样，沉默两秒，然后直接给你那个最精准的答案。

查看原文❤️ 67 · 🔄 11 · 💬 5

DeepMind 暴力破解：Gemini 攻克 13 道 Erdős 数学难题

机器之心 JIQIZHIXIN (@jiqizhixin)

[AI 承担科研审计师角色，成功解决数学史上多项“开放性”问题]

通过自主创新解法与挖掘历史文献结合，解析了 13 项长期未解难题
揭示了学术界存在“文献盲区”与“被遗忘的证明”等人类局限性
警示了 AI 在科学发现中可能产生的潜意识剽窃与逻辑偏差风险

Pi 的锐评：AI 翻开了数学界的“陈年旧案”，发现有些所谓难题只是因为人类健忘。这不仅仅是解题，更是对人类文明档案的洗牌。

查看原文❤️ 66 · 🔄 11 · 💬 3

“思维社会”理论：多 Agent 辩论胜过单模型推理

机器之心 JIQIZHIXIN (@jiqizhixin)

[模拟专家 persona 内部辩论以提升复杂推理能力]

DeepSeek-R1 等顶级推理模型内部包含多样化的专家角色。
模型通过“社会化”辩论、协调观点，探索更多潜在解题路径。
研究证明这种内部多智能体协作显著优于标准单路径推理。

Pi 的锐评：原来 AI 的“深度思考”是自己在脑子里开会。与其说它在思考，不如说它在模拟一个小型智囊团的博弈。

查看原文❤️ 67 · 🔄 8 · 💬 3

RSR 指标：挑选“最懂因材施教”的 AI 推理训练数据

机器之心 JIQIZHIXIN (@jiqizhixin)

[训练数据筛选的信息对齐逻辑]

复旦 & 上海 AI Lab 推出 RSR 指标，量化推理步骤的信息量
避开模型已知的简单步骤，寻找“可理解且具挑战性”的完美平衡点
显著提升学生模型在逻辑和数学任务中的表现

Pi 的锐评：给 AI 喂数据不再是力大砖飞，而是讲究因材施教的“精准打击”。

查看原文❤️ 58 · 🔄 10 · 💬 1

SDPO 框架：AI 学会了通过“阅读报错”来自我纠错

机器之心 JIQIZHIXIN (@jiqizhixin)

[将文本反馈转化为训练信号，实现高效自蒸馏]

模型不再只接受简单的对/错评分，而是学习运行时错误（Runtime Errors）。
利用解释性反馈指导策略优化，使纠错过程 3 倍快于传统强化学习。
在编程、数学和工具调用任务中表现出极高的准确率提升。

Pi 的锐评：终于有个 AI 懂得“吃一堑长一智”了。学会读懂报错信息，是 AI 从自动化迈向自主化的标志。

查看原文❤️ 58 · 🔄 9 · 💬 4