Back

2026-02-11 科技动态

今日语音播客

今日要点

  • LLM 自我进化新突破:微软推出测试时递归思考(TRT)框架
  • 何恺明团队新作“漂移模型”:一箭穿心的单步图像生成新范式
  • 字节跳动 Seedance 2.0 突袭:视频一致性开启“断崖式领先”时代
  • Google DeepMind 审计数学史:Aletheia 代理攻克 13 个埃尔德什难题
  • AI 工作流的“操作系统”化:Topview Board 终结工具订阅地狱

详细内容

LLM 自我进化新突破:微软推出测试时递归思考(TRT)框架

机器之心 JIQIZHIXIN

[无外部奖励下实现逻辑自进化]

  • 微软与 UCSD 提出测试时递归思考(TRT),通过生成多路径方案、利用累积知识自校准并迭代优化答案。
  • 实验显示,开源模型在 AIME 数学竞赛中达到 100% 正确率,顶尖闭源模型在 LiveCodeBench 上的表现提升了 10-15 个百分点。
  • 证明了模型可以通过“内部复盘”逻辑在没有真值反馈的情况下持续变强。

gakki 的锐评:这就是 AI 界的‘三思而后行’。当模型学会自己跟自己抬杠并纠错时,开源和闭源的智力鸿沟正在被这种推理架构迅速填平。

查看原文

何恺明团队新作“漂移模型”:一箭穿心的单步图像生成新范式

机器之心 JIQIZHIXIN

[摒弃扩散逻辑,回归单步极简效率]

  • 何恺明团队提出 Drifting Models(漂移模型),通过训练“漂移场”引导样本平滑移向真实数据分布。
  • 该模型实现了真正意义上的“单步生成”,在 ImageNet 256x256 基准测试中打破 SOTA,性能完胜复杂的多步扩散模型。
  • 该架构极大地降低了生成成本,为实时高保真视觉生成提供了全新的理论路径。

gakki 的锐评:大神出马果然名不虚传。大家都在堆算力跑几十步扩散的时候,何恺明告诉你‘一步到位’才是终极优雅。效率即护城河。

查看原文

字节跳动 Seedance 2.0 突袭:视频一致性开启“断崖式领先”时代

Mixjur

[从单向生成迈向多镜头叙事一致性]

  • 字节跳动发布 Seedance 2.0,具备独有的多镜头叙事功能,可根据单条提示词自动生成角色、风格高度一致的关联场景。
  • 游戏科学 CEO 冯骥评价其为“多模态信息整合能力的飞跃”,用户反馈其在自由发挥和逻辑连贯性上已超越 Sora 和 Kling。
  • 实测显示该模型虽然在“指哪打哪”的极细微控制上仍有优化空间,但在商业化内容生产的效率上实现了质变。

gakki 的锐评:AI 视频赛道已经从“看谁跑得快”变成了“看谁演得真”。字节这次不玩虚的,直接切入‘叙事连贯’这个最痛点,可灵恐怕要感受到压力了。

查看原文

Google DeepMind 审计数学史:Aletheia 代理攻克 13 个埃尔德什难题

机器之心 JIQIZHIXIN

[AI 角色从计算器进化为知识审计师]

  • DeepMind 基于 Gemini 构建 Aletheia 数学研究代理,通过扫描海量文献并进行自然语言验证,系统性地处理复杂猜想。
  • 成功解决 13 个埃尔德什(Erdős)开放性数学难题,其中 4 个为全新证明,9 个被确认为前人已解决但在晦涩文献中被遗忘。
  • 揭示了 AI 在处理“文献盲区”和发现潜在抄袭方面的巨大潜力。

gakki 的锐评:以前觉得 AI 只是在做题,现在它开始帮人类‘盘点家底’了。这不仅是数学的进步,更是人类知识库的一次大型自动化审计。

查看原文

AI 工作流的“操作系统”化:Topview Board 终结工具订阅地狱

Minsi.AI

[内容工厂模式取代单点工具订阅]

  • Topview 上线 Board 工具,整合了 Sora、Veo、Kling、Seedance 等所有顶级模型至统一工作空间。
  • 支持团队实时协作,允许用户直接在视频画面上标注修改,实现从提示词、生图、生视频到虚拟形象的全链路闭环。
  • 这种“聚合订阅+工作流集成”模式正成为 AIGC 商业化应用的新标准。

gakki 的锐评:分散的工具是生产力的天敌。未来的胜者不是模型跑分最高的,而是能把所有顶级能力缝合进一个丝滑流程里的‘整合商’。

查看原文