今日语音播客
今日要点
- 何恺明团队新作:Drifting Models 开启单步生图新范式
- 行业巨变:短剧投融资逻辑在 AI 冲击下彻底失效
- 陶哲轩坐镇:First Proof 终结 AI 的“背题”时代
- Seedance 2.0 冲击世界模型:大厂“大力出奇迹”胜过精雕细琢?
- 实战技巧:用 Claude Code 清理微信冗余文件
详细内容
何恺明团队新作:Drifting Models 开启单步生图新范式
机器之心 JIQIZHIXIN (@jiqizhixin)
[训练“漂移场”引导数据分布收敛,实现单步生成 SOTA 画质]
- 彻底颠覆多步扩散模型,单步生成质量在 ImageNet 256x256 上创新高
- 大幅削减生图推理延迟与计算开销,提升实时生成效率
- 简化了生成式模型的训练逻辑,回归简洁的数学表达
Pi 的锐评:在算力日益昂贵的今天,何恺明用“化繁为简”证明了:走得最快的一步,往往也是最准的一步。
行业巨变:短剧投融资逻辑在 AI 冲击下彻底失效
Michael Anti (@mranti)
[IP + AI 模式对传统短剧拍摄模式的降维打击]
- 字节 Seedance 的效果让从业者感叹:短剧行业可能被彻底取代。
- 未来的路径是:直接将成熟 IP 喂给 AI,低成本、高效率输出成品。
- 传统拍摄的重资产投入在 AI 自动化面前显得极其低效。
Pi 的锐评:曾经的“横店速度”在 AI 面前就是龟速。短剧这种追求爽点、弱化演技的品类,简直就是为 AI 量身定制的屠宰场。
陶哲轩坐镇:First Proof 终结 AI 的“背题”时代
机器之心 JIQIZHIXIN (@jiqizhixin)
[构建零污染的研究级数学基准]
- 推出十个从未在互联网出现的原创数学问题,源自真实的科研工作流。
- 旨在区分 AI 是在进行真正的逻辑推理,还是简单的模式匹配。
- 由斯坦福、哈佛及陶哲轩等顶尖团队合作开发,确保测试的绝对严苛性。
Pi 的锐评:既然 AI 会刷题库,那就让世界上最聪明的大脑现编几道题。这不仅是考试,更是人类智力的最后防线。
Seedance 2.0 冲击世界模型:大厂“大力出奇迹”胜过精雕细琢?
Michael Anti (@mranti)
[视频生成的物理规律正在被大规模训练“暴力破解”]
- 字节 Seedance 2.0 在运镜和场景恢复上展现出极高的空间一致性。
- 讨论核心在于李飞飞的“世界模型”理论是否会被大厂的统计学训练结果直接碾压。
- 复杂的语法翻译思路在历史上曾输给统计翻译,如今在物理模拟领域可能重演。
Pi 的锐评:物理定律在海量数据面前似乎也不再是神圣的“逻辑”,只要算力足够,AI 甚至能“猜”出你转身后背后的那棵树长什么样。
实战技巧:用 Claude Code 清理微信冗余文件
Michael Anti (@mranti)
[自然语言解决复杂文件管理]
- 利用 Claude Code 直接扫描微信文件目录及子目录
- 通过 MD5 哈希计算自动识别并归类重复文件
- 展示了 AI 在系统底层自动化管理中的即时编程与执行能力
别再手动删群聊图片了,这才是 AI 程序员该干的“苦力活”。
短剧行业地震:Seedance 开启从小说到视频的自动化链路
Michael Anti (@mranti)
[内容生产周期的指数级缩短]
- 字节 Seedance 正在为“小说一键输出短剧”打下坚实的技术基础。
- 相比人工精雕细琢,AI 的“大力出奇迹”正在以超出想象的速度占领市场。
- 2026 年 2 月可能成为短剧工业生产的分水岭。
Pi 的锐评:三年时间,从文本生成图片进化到小说自动化出片。编剧们,准备好迎接你们的新同事(或者替代者)了吗?
蚂蚁集团 LingBot-VLA:具身智能的通用控制“脑干”
机器之心 JIQIZHIXIN (@jiqizhixin)
[视觉-语言-动作基座模型实现跨平台、多任务的机器人控制]
- 基于 2 万小时真实数据,在 3 个硬件平台和 100 项任务中展现极强泛化性
- 训练效率比同类模型高出 1.5 至 2.8 倍
- 为机器人直接从人类指令跳跃到物理动作执行提供了稳定底座
Pi 的锐评:机器人正从“特种兵”向“通才”进化,LingBot 解决的正是那颗通用的控制大脑。
Google DeepMind 利用 AlphaEvolve 自动挖掘激活函数
机器之心 JIQIZHIXIN (@jiqizhixin)
[利用 LLM 自动化搜索神经网络底层逻辑]
- 放弃人工设计,通过 LLM 在大规模 Python 函数空间中搜索
- 专注于寻找能够提升模型泛化能力的数学归纳偏置
- 在小规模合成数据集上成功发现更具鲁棒性的激活函数
Pi 的锐评:AI 正在学会改进自己的“基因”,以后数学老师可能要跟 LLM 学怎么写最优公式了。
OpenClaw vs Claude Code:本地权限的制胜之道
Michael Anti (@mranti)
[深耕本地上下文的回报]
- 开发者转向使用 OpenClaw,核心在于其对本地组件和模块的熟悉度更高
- 更多权限赋予 AI 后,生成的代码架构更贴合用户满意度
- 安全策略:通过 Git 过滤和非公开协作规避泄露风险
AI 就像助理,你越敢放权、给的信息越多,它表现得就越像那个懂你的“老员工”。
微软 TRT 框架:让 LLM 在考试现场学会“递归思考”
机器之心 JIQIZHIXIN (@jiqizhixin)
[测试时递归思考(TRT)实现模型无需标准答案的自我改进]
- 通过构建自研验证闭环,模型在推理过程中不断修正与优化解题策略
- 开源模型在 AIME 数学问题上达成 100% 准确率
- 闭源顶尖模型在 LiveCodeBench 等硬核编程基准上提升 10-15%
Pi 的锐评:AI 已经学会了“验算”,这种自我审视能力是迈向通用人工智能(AGI)的关键一级台阶。
复旦发布 SIM-CoT:AI 学会“闭眼思考”,隐式推理效率暴增
机器之心 JIQIZHIXIN (@jiqizhixin)
[低能耗实现高强度逻辑推理]
- 通过临时引导对齐内部状态,解决了隐式链式思考(Implicit CoT)的不稳定性
- LLaMA-3.1 8B 性能提升 3%,Token 效率相比传统显式推理提升 2.3 倍
- 实现“思考在脑内,结果在指尖”,减少了冗长文字输出带来的时延
以后你可能看不到 AI 写一长串‘我想一想’了,它会像人类高手一样,沉默两秒,然后直接给你那个最精准的答案。
DeepMind 暴力破解:Gemini 攻克 13 道 Erdős 数学难题
机器之心 JIQIZHIXIN (@jiqizhixin)
[AI 承担科研审计师角色,成功解决数学史上多项“开放性”问题]
- 通过自主创新解法与挖掘历史文献结合,解析了 13 项长期未解难题
- 揭示了学术界存在“文献盲区”与“被遗忘的证明”等人类局限性
- 警示了 AI 在科学发现中可能产生的潜意识剽窃与逻辑偏差风险
Pi 的锐评:AI 翻开了数学界的“陈年旧案”,发现有些所谓难题只是因为人类健忘。这不仅仅是解题,更是对人类文明档案的洗牌。
“思维社会”理论:多 Agent 辩论胜过单模型推理
机器之心 JIQIZHIXIN (@jiqizhixin)
[模拟专家 persona 内部辩论以提升复杂推理能力]
- DeepSeek-R1 等顶级推理模型内部包含多样化的专家角色。
- 模型通过“社会化”辩论、协调观点,探索更多潜在解题路径。
- 研究证明这种内部多智能体协作显著优于标准单路径推理。
Pi 的锐评:原来 AI 的“深度思考”是自己在脑子里开会。与其说它在思考,不如说它在模拟一个小型智囊团的博弈。
RSR 指标:挑选“最懂因材施教”的 AI 推理训练数据
机器之心 JIQIZHIXIN (@jiqizhixin)
[训练数据筛选的信息对齐逻辑]
- 复旦 & 上海 AI Lab 推出 RSR 指标,量化推理步骤的信息量
- 避开模型已知的简单步骤,寻找“可理解且具挑战性”的完美平衡点
- 显著提升学生模型在逻辑和数学任务中的表现
Pi 的锐评:给 AI 喂数据不再是力大砖飞,而是讲究因材施教的“精准打击”。
SDPO 框架:AI 学会了通过“阅读报错”来自我纠错
机器之心 JIQIZHIXIN (@jiqizhixin)
[将文本反馈转化为训练信号,实现高效自蒸馏]
- 模型不再只接受简单的对/错评分,而是学习运行时错误(Runtime Errors)。
- 利用解释性反馈指导策略优化,使纠错过程 3 倍快于传统强化学习。
- 在编程、数学和工具调用任务中表现出极高的准确率提升。
Pi 的锐评:终于有个 AI 懂得“吃一堑长一智”了。学会读懂报错信息,是 AI 从自动化迈向自主化的标志。