Google Gemini Agentic Vision 教程 - 如何使用 Google Gemini Agentic Vision

Google发布Gemini 3 Agentic Vision,开启视觉AI的"代理时代"。该模型突破传统静态图像分析限制,能够从复杂图像中自动识别并提取目标物体,一键生成数据可视化图表。演示中模型从39种动物的图像中逐一提取并生成了寿命排序条形图。更强大的是,它可以直接在图像上绘制标注元素,精确完成垃圾分类指导,还能识别金融图表中的摆动高低点并标注箭头。模型具备高级推理能力,能发现图像中的细微异常,如识别两把标注相同刻度尺子中的错误。用户可通过Gemini AI Studio启用代码执行功能,选择Gemini 3 Flash Preview版本体验完整能力。这是视觉AI从被动识别向主动做事转型的重要里程碑。

February 4, 2026 · 6 min · 2879 words · AIcan