RAG 后的检索:混合搜索、智能体与数据库设计
TurboPuffer 是一家专注于搜索的数据库公司,结合全文搜索与向量搜索。其创始人 Simon Eskildsen 曾于 Shopify 从事基础设施工作十年,期间发现 Elasticsearch 难以扩展,促使他思考构建更高效的搜索方案。2023 年 ChatGPT 出现后,他在 Readwise 做推荐引擎时意识到向量搜索成本过高(每月 5 千美元增至 3 万美元),由此萌生创建 TurboPuffer 的想法。该公司采用全栈 NVMe SSD 和 S3 对象存储架构,摒弃传统共识层,依赖 S3 强一致性实现数据安全。目前主要客户包括 Cursor 和 Notion,后者因跨云延迟问题甚至采用了暗光纤解决方案。Simon 提出"P99 工程师"概念,强调招聘应选择顶尖人才。未来规划包括强化全文搜索功能及支持百亿级向量规模查询。