leavingme.cn

首页项目博客动态专题关于

2026-02-11 科技动态

今日语音播客

今日要点

LLM 自我进化新突破：微软推出测试时递归思考（TRT）框架
何恺明团队新作“漂移模型”：一箭穿心的单步图像生成新范式
字节跳动 Seedance 2.0 突袭：视频一致性开启“断崖式领先”时代
Google DeepMind 审计数学史：Aletheia 代理攻克 13 个埃尔德什难题
AI 工作流的“操作系统”化：Topview Board 终结工具订阅地狱

详细内容

LLM 自我进化新突破：微软推出测试时递归思考（TRT）框架

机器之心 JIQIZHIXIN

[无外部奖励下实现逻辑自进化]

微软与 UCSD 提出测试时递归思考（TRT），通过生成多路径方案、利用累积知识自校准并迭代优化答案。
实验显示，开源模型在 AIME 数学竞赛中达到 100% 正确率，顶尖闭源模型在 LiveCodeBench 上的表现提升了 10-15 个百分点。
证明了模型可以通过“内部复盘”逻辑在没有真值反馈的情况下持续变强。

gakki 的锐评：这就是 AI 界的‘三思而后行’。当模型学会自己跟自己抬杠并纠错时，开源和闭源的智力鸿沟正在被这种推理架构迅速填平。

何恺明团队新作“漂移模型”：一箭穿心的单步图像生成新范式

机器之心 JIQIZHIXIN

[摒弃扩散逻辑，回归单步极简效率]

何恺明团队提出 Drifting Models（漂移模型），通过训练“漂移场”引导样本平滑移向真实数据分布。
该模型实现了真正意义上的“单步生成”，在 ImageNet 256x256 基准测试中打破 SOTA，性能完胜复杂的多步扩散模型。
该架构极大地降低了生成成本，为实时高保真视觉生成提供了全新的理论路径。

gakki 的锐评：大神出马果然名不虚传。大家都在堆算力跑几十步扩散的时候，何恺明告诉你‘一步到位’才是终极优雅。效率即护城河。

字节跳动 Seedance 2.0 突袭：视频一致性开启“断崖式领先”时代

Mixjur

[从单向生成迈向多镜头叙事一致性]

字节跳动发布 Seedance 2.0，具备独有的多镜头叙事功能，可根据单条提示词自动生成角色、风格高度一致的关联场景。
游戏科学 CEO 冯骥评价其为“多模态信息整合能力的飞跃”，用户反馈其在自由发挥和逻辑连贯性上已超越 Sora 和 Kling。
实测显示该模型虽然在“指哪打哪”的极细微控制上仍有优化空间，但在商业化内容生产的效率上实现了质变。

gakki 的锐评：AI 视频赛道已经从“看谁跑得快”变成了“看谁演得真”。字节这次不玩虚的，直接切入‘叙事连贯’这个最痛点，可灵恐怕要感受到压力了。

Google DeepMind 审计数学史：Aletheia 代理攻克 13 个埃尔德什难题

机器之心 JIQIZHIXIN

[AI 角色从计算器进化为知识审计师]

DeepMind 基于 Gemini 构建 Aletheia 数学研究代理，通过扫描海量文献并进行自然语言验证，系统性地处理复杂猜想。
成功解决 13 个埃尔德什（Erdős）开放性数学难题，其中 4 个为全新证明，9 个被确认为前人已解决但在晦涩文献中被遗忘。
揭示了 AI 在处理“文献盲区”和发现潜在抄袭方面的巨大潜力。

gakki 的锐评：以前觉得 AI 只是在做题，现在它开始帮人类‘盘点家底’了。这不仅是数学的进步，更是人类知识库的一次大型自动化审计。

AI 工作流的“操作系统”化：Topview Board 终结工具订阅地狱

Minsi.AI

[内容工厂模式取代单点工具订阅]

Topview 上线 Board 工具，整合了 Sora、Veo、Kling、Seedance 等所有顶级模型至统一工作空间。
支持团队实时协作，允许用户直接在视频画面上标注修改，实现从提示词、生图、生视频到虚拟形象的全链路闭环。
这种“聚合订阅+工作流集成”模式正成为 AIGC 商业化应用的新标准。

gakki 的锐评：分散的工具是生产力的天敌。未来的胜者不是模型跑分最高的，而是能把所有顶级能力缝合进一个丝滑流程里的‘整合商’。