RLHF 标签
0

Azure AI 更新:GPT-4.1 支持 DPO 技术,并推出全新 Responses API

微软最近对 Azure AI 进行了一系列重要更新,特别是支持 GPT-4.1 和 GPT-4.1-mini 的直接偏好优化(DPO)技术。这些更新不仅提高了模型微调的速度和个性化程度,还增强了数据主权和隐私保护。

具体的更新细节如下: 阅读全文