两天前,微软宣布 GPT-4.1 系列模型已登陆 Azure OpenAI 服务和 GitHub。今天,微软正式宣布 OpenAI 的 o 系列模型最新版本 — o3 和 o4-mini 模型现已登陆 Azure OpenAI 服务和 GitHub 。
o3 和 o4-mini 模型在 AI 推理能力方面取得了重大突破,在质量、安全性和性能方面相较于前代模型有了显著提升。以下是有关 o3 和 o4-mini 模型的详细信息:
主要功能与增强特性
o3 和 o4-mini 模型在保留 o1 和 o3-mini 所支持功能的同时,进一步提升了推理质量和安全性,并通过对最新 API 和推理功能的支持,实现了更强的性能表现。
此外,o3 和 o4-mini 模型还引入了以下新特性:
- 多种 API 支持:两个模型均可通过 Responses API 和 Chat Completions API 使用。其中,Responses API 支持与多种工具的无缝集成,并在模型输出中增加推理摘要,使推理过程更加透明。
- 推理摘要功能:在 Responses API 中,o3 和 o4-mini 这两个模型支持生成推理摘要,为用户提供更多模型思考过程中的洞见,有助于提高结果的可解释性,也能进一步优化工具和流程的使用效果。
- 多模态能力:o3 拥有增强的视觉分析能力,而 o4-mini 引入了全新的视觉支持功能,两者均可处理并分析视觉数据,提取关键洞见并生成详细的文本输出。这项功能在 Responses API 和 Chat Completions API 中均已支持。
- 全面工具支持与并行调用能力:这两个模型是 o 系列中首批具备完整工具支持(如主线模型)并支持“并行工具调用”的推理模型。客户可以利用这些模型构建新一代智能代理解决方案。这一能力在 Responses API 和 Chat Completions API 中均可使用。
安全性新突破
o 系列推理模型采用了“深思熟虑的对齐(deliberative alignment)”训练策略,该方法教授模型安全规范,并让模型在作答前进行显式的安全推理。o3 和 o4-mini 均在安全性方面达到了新高度。
全新音频模型现已上线
Azure OpenAI 服务还同步上线了三款功能强大的新音频模型,目前已可在 East US2 区域的 Azure AI Foundry 部署使用:
- GPT-4o-Transcribe 和 GPT-4o-Mini-Transcribe:这两款语音转文本模型性能超越以往基准,准确率更高。
- GPT-4o-Mini-TTS:一款可自定义语音特征的文本转语音模型,支持更细致的语音参数控制。
各位开发者可以赶紧前往 Azure Open AI 和 GitHub Copilot 上体验这两款新模型。祝大家体验愉快~
Via Microsoft