谷歌宣布对其 Gemini AI 平台进行一系列更新,为开发人员提供增强的功能和更强大的工具。这家科技巨头向所有开发人员开放了 Gemini 1.5 Pro 的 200 万个令牌上下文窗口,引入了代码执行功能,并在 Google AI Studio 中添加了 Gemma 2。
之前处于等待状态的 200 万个 token 上下文窗口现在可供所有使用 Gemini 1.5 Pro 的开发人员使用。这个广泛的上下文窗口允许更全面的分析和生成内容。
为了解决与较大输入相关的潜在成本问题,Google 为 Gemini 1.5 Pro 和 1.5 Flash 实现了上下文缓存。此功能旨在降低在多个提示中重复使用令牌的任务的成本。
代码执行能力
为了提高数学和数据推理任务的准确性,Google 已为 Gemini 1.5 Pro 和 1.5 Flash 启用代码执行。此功能允许模型生成和运行 Python 代码,从结果中迭代学习。执行环境是沙盒式的,无需互联网访问,并包含多个数值库。开发人员根据模型的输出令牌付费。
谷歌表示:“这是我们将代码执行作为模型功能的第一步,目前可通过 Gemini API 和 Google AI Studio 的‘高级设置’使用。”
Gemma 2 集成和 Gemini 1.5 Flash 投入生产
为了进一步实现 AI 开发的民主化,Google 正在 Google AI Studio 中提供其开放模型 Gemma 2 以供实验。此举使开发人员能够探索并将 Gemma 2 与 Gemini 模型集成在一起。
此外,谷歌还重点介绍了 Gemini 1.5 Flash 在生产中的几个用例,展示了其速度和经济性:
- Envision:一款为视力低下人士提供实时环境描述的应用程序。
- Plural:一个总结复杂立法的自动化政策分析平台。
- Zapier:利用视频推理功能实现视频编辑的自动化。
- Dot:一种利用 1.5 Flash 进行长期记忆系统中的信息压缩任务的人工智能。
该公司还宣布,Gemini 1.5 Flash 的文本调优目前处于红队测试阶段,并将逐步向开发人员推出。预计到 7 月中旬,开发人员将能够通过 Gemini API 和 Google AI Studio 全面访问 Gemini 1.5 Flash 调优。
有兴趣探索这些新功能的开发者可以加入 Google开发者论坛的讨论。我们鼓励企业开发者探索 Vertex AI,Google 称其为最适合企业的 genAI 平台。