OpenAI 宣布推出GPT-4o mini,这是一款小型模型,旨在让 AI 更易于开发者使用且价格更实惠。GPT 家族的这一新成员有望以比之前型号(包括常规GPT-4o)低得多的价格提供卓越的性能。
GPT-4o mini 仍然拥有令人印象深刻的功能,在 MMLU 基准测试中得分为 82%,在LMSYS排行榜上聊天偏好方面的表现优于 GPT-4。该模型的定价仅为每百万输入代币 15 美分,每百万输出代币 60 美分,与前代产品相比具有显著的成本效益。
主要特征:
- 低成本和低延迟
- 128K 令牌上下文窗口
- 每个请求最多 16K 个输出令牌
- 知识截止日期:2023 年 10 月
- 改进的标记器可高效处理非英语文本
- API 中支持文本和视觉(未来将扩展至视频和音频)
GPT-4o mini 在各种基准测试中都胜过其他小型模型:
- MMLU(文本智能):82.0%
- MGSM(数学推理):87.0%
- HumanEval(编码性能):87.2%
- MMMU(多模态推理):59.4%
这些分数证明了与 Gemini Flash 和 Claude Haiku 等竞争对手相比,GPT-4o mini 在推理任务、数学、编码和多模式理解方面的优势。
开发人员可以利用 GPT-4o mini 实现广泛的应用,包括:
- 链接或并行化多个模型调用
- 传递大量上下文(例如,完整的代码库或对话历史记录)
- 构建实时文本响应系统(例如客户支持聊天机器人)
OpenAI 在 GPT-4o mini 的开发中将安全性放在首位,通过实施训练前内容过滤、使用 RLHF 等技术进行训练后对齐,以及创新的“指令层次结构”方法来抵御越狱和提示注入。
GPT-4o mini 现在可通过 Assistants API、Chat Completions API 和 Batch API 访问。开发人员预计每 100 万个输入令牌支付 15 美分,每 100 万个输出令牌支付 60 美分。微调功能将在未来几天推出。
OpenAI 解释道:“我们设想的未来是模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员以更高效、更经济的方式构建和扩展强大的 AI 应用程序铺平了道路。”
随着人工智能的不断发展,GPT-4o mini 朝着让所有背景的开发人员更容易使用高级语言模型迈出了一步。凭借其令人印象深刻的性能和成本效益,这款新型号将有助于开启人工智能驱动的应用程序和服务的新时代,而我们热切期待 GPT-5。