图像分析 | AI 产品洞察与技术趋势 Feeds

Google发布Gemini 3 Agentic Vision，开启视觉AI的"代理时代"。该模型突破传统静态图像分析限制，能够从复杂图像中自动识别并提取目标物体，一键生成数据可视化图表。演示中模型从39种动物的图像中逐一提取并生成了寿命排序条形图。更强大的是，它可以直接在图像上绘制标注元素，精确完成垃圾分类指导，还能识别金融图表中的摆动高低点并标注箭头。模型具备高级推理能力，能发现图像中的细微异常，如识别两把标注相同刻度尺子中的错误。用户可通过Gemini AI Studio启用代码执行功能，选择Gemini 3 Flash Preview版本体验完整能力。这是视觉AI从被动识别向主动做事转型的重要里程碑。