掌控AI帕累托前沿 — Jeff Dean

Google Jeff Dean分享Pareto Frontier掌控哲学:同时拥有最高能力和最高效模型。Flash模型成本极低,用于Gmail、YouTube等产品,处理50万亿tokens。TPU设计周期2-6年,SRAM vs HBM有1000倍能量差异。目标是trillion tokens上下文。RL在数学和编程领域成功,但非可验证领域仍有挑战。Google Brain与DeepMind合并为Gemini,Sergey Brin回归积极参与编码。

February 12, 2026 · 17 min · 8331 words · @latent-space

[State of Evals] LMArena 17亿美元愿景 — Anastasios Angelopoulos, LMArena

LMArena 联合创始人 Anastasios Angelopoulos 分享公司 17 亿美元估值背后的愿景。平台从学术项目起步,获 Andrej Karpathy 支持及红杉资本融资。与竞争对手不同,LMArena 基于真实用户的有机使用数据而非预设基准测试,每月处理数千万次对话,约四分之一用户为软件工程师。团队将资金主要用于支付平台推理成本和招聘,正在扩展多模态和代码评估领域。他们承诺公开排行榜的诚信原则,永不收费插队,并将推出 Expert Arena 和 Code Arena。对于 MCP,团队认为规范变化过快,但仍在探索动态客户端注册等技术应用。

January 6, 2026 · 7 min · 3029 words · @latent-space