原始标题: These 3 AI Browsers make Chrome Feel useless
发布日期: 2026-01-29 | 来源频道: @growproduct
📝 深度摘要
1. 对话背景与核心主题
growproduct频道聚焦AI工具测评,本期视频深入评测Atlas、Perplexity Comet和DIA三款AI浏览器。传统浏览器依赖用户手动完成表单填写、数据抓取、跨平台比价等重复性操作,效率低下。本视频探讨的核心元问题是:AI浏览器如何通过自主理解用户模糊意图并执行多步骤操作,直接操作真实网页,从而填补人机交互中的效率鸿沟,推动浏览器从被动工具向主动助手进化。
1. 核心干货概览 (Key Takeaways & Stack)
| 类别 | 名称 | 核心用途 / 战略意义 |
|---|---|---|
| 工具/模型 | Atlas | 自动化表单填写、LinkedIn 数据抓取、Gmail 订阅管理 |
| 工具/模型 | Perplexity Comet | 多标签页内容整合、比价研究、历史价格追踪 |
| 工具/模型 | DIA | 上下文感知任务处理、Jira 集成、视频内容深度分析 |
| 思维模型 | Agentic Browser | AI 自主操作网页,填补用户请求中的模糊空白 |
| 关键指标 | Token 消耗 | 免费账户已可完成深度研究任务,ROI 极高 |
2. 深度逻辑拆解 (Deep Dive / SOP)
核心挑战
传统浏览器需要用户手动完成大量重复性操作:填写表单、复制粘贴数据、跨平台比价、管理订阅。AI 浏览器通过自主理解用户意图并执行多步骤操作来解决这一痛点。
步进 SOP
Atlas 使用流程
- Step 1: 准备/输入
- 打开目标网站(如招聘平台)
- 上传简历 PDF 或提供网站链接(如播客官网)
- Step 2: 核心转换
- 使用自然语言指令:“帮我填写这个申请表”
- AI 自动解析简历内容,填补表单字段
- 对开放性问题(如"为什么想加入我们")自动生成符合简历背景的回答
- LinkedIn 场景:AI 会点击"联系信息"按钮,提取邮箱和电话
- Step 3: 交付/结果
- 自动生成 Excel 表格,包含潜在嘉宾联系信息
- 实时观察 AI 填写表单的全过程
Perplexity Comet 使用流程
- Step 1: 准备/输入
- 打开多个标签页(亚马逊商品页、电子表格、文档)
- 输入模糊指令:“给我10岁侄子找礼物”
- Step 2: 核心转换
- 并发扫描亚马逊商品
- 跨平台比价(连接 Honey、Capital One Shopping 插件获取历史价格)
- 识别最大折扣及最优购买渠道
- 自动打开新标签页抓取商品信息
- Step 3: 交付/结果
- 生成带有价格、折扣比例、购买链接的清单
- 可直接填入 Google Sheets
DIA 使用流程
- Step 1: 准备/输入
- 打开 YouTube 视频标签页(无需播放)
- 输入创作需求:“基于这两个视频,帮我写一个 AIPM 视频脚本”
- Step 2: 核心转换
- 跨标签页理解上下文
- 提取视频内容、标题、元数据
- 生成结构化脚本(含 Hook、要点、总结)
- Step 3: 交付/结果
- 输出完整视频创作大纲
- 支持 Jira 集成:扫描 GitHub Bug,自动创建 Jira 工单
案例/细节支撑
- 招聘表单自动化:用户仅上传简历,AI 实时填写完所有字段,包括"为什么想加入我们"等自定义问题
- 播客嘉宾挖掘:提供播客网站链接,AI 自动访问 LinkedIn 并生成潜在嘉宾名单及联系方式
- 订阅账单审计:通过 Gmail 授权,AI 扫描历史邮件识别所有订阅服务,列出每月支出及取消链接
- 礼物比价:56分钟视频演示中,AI 在亚马逊和 Barnes & Noble 之间自动选择最优价格
- 视频脚本生成:DIA 在视频未播放的情况下,仅凭页面信息生成详细脚本大纲
3. 核心干货运用 (Hard Assets / Prompts)
典型 Prompt 模式
Atlas 表单填写
"上传我的简历,帮我填写这个职位申请表"
Perplexity 商品研究
"给我10岁侄子找礼物,对比亚马逊和其他平台的价格"
DIA 上下文创作
"基于这两个 YouTube 视频,帮我写一个关于如何成为 AIPM 的视频脚本,包含强 Hook"
逻辑注释
- 模糊指令设计:故意使用最少的提示词(如"找礼物"),测试 AI 填补意图空白的能力
- 多插件桥接:Perplexity 通过 Honey 插件获取历史价格数据,实现"现在便宜还是往年便宜"的判断
- Agent Mode 触发:Atlas 在拒绝"爬虫"术语后,用户需明确说"使用 Agent Mode",AI 即可突破限制
- 上下文复用:DIA 记住已打开的标签页内容,无需重复加载即可跨窗口推理
4. PM 避坑与实战洞察 (Insights & Reflections)
反直觉结论
- AI 浏览器幻觉率极低:由于直接操作真实网页,返回的链接、价格、内容均可验证,而非模型自行生成
- 免费版足够强大:Perplexity 免费账户已可完成深度研究,付费 Pro 仅提升速度
- Agentic 能力是关键:传统 AI 助手需要精确提示词,而 AI 浏览器能自主填补模糊请求中的空白
适用边界
- Atlas:适合需要登录操作的场景(如招聘平台、LinkedIn),但隐私敏感用户需谨慎
- Perplexity:适合比价、历史数据研究、多文档整合,不适合需要实时交互的任务
- DIA:适合企业级 Jira 工作流,但在非 Atlassian 生态中价值有限
实战陷阱
- 初次使用会被拒绝:Atlas 对"爬取 LinkedIn"等术语有防护,需说"使用 Agent Mode"绕过
- Token 消耗极大:深度研究类任务token消耗量惊人,免费用户可能遇到限流
- DIA 模型版本旧:演示中透露使用 GPT-4 模型(2025年11月),未使用最新模型
- Gmail 授权不可逆:首次授权后 AI 可永久访问邮件,需确认隐私边界
5. 金句 (Golden Quotes)
- “这些工具是免费的,但这应该是付费的功能——你现在能免费用到这些功能是很不可思议的。”
- “AI 浏览器几乎不产生幻觉,因为它直接操作真实网页,所有返回的链接都是可验证的。”
- “设置好扩展程序后,AI 浏览器的能力远超各个部分的总和——它变成了一个全新的物种。”
- “管理多个 AI Agent 的技能将成为核心能力:派发任务、去做其他事、回来快速接手。”
- “这是 AI 最差的时刻——以后只会越来越强。”
📺 视频原片
视频ID: vJvSPW9_0Hw