
Azure AI Foundry 模型微调功能的增强
微软在 Azure AI Foundry 的最新更新中,在模型微调方面取得了重大进展,新增了对强化微调 (RFT) 的高级支持。这项新的增强功能旨在提升模型性能,利用了针对不同领域量身定制的创新技术,例如思路链推理和面向任务的评分。
强化微调简介
RFT 最初由 OpenAI 于去年 12 月在其 alpha 计划中发布,自发布以来取得了令人瞩目的成果,与传统的开箱即用模型相比,其模型效率提升高达 40%。微软透露,RFT 将很快与 Azure 平台上的 OpenAI o4-mini 模型兼容,这将为各种应用领域的组织提供强大的支持。
何时利用强化微调
微软建议在特定情况下实施 RFT,因为增强决策能力和适应能力至关重要。以下是利用这项强大技术的三种最佳场景:
- 自定义规则实现:在传统训练数据或静态提示无法有效捕捉组织独特决策逻辑的环境中,RFT 尤为优势。它使模型能够适应不断变化的灵活规则,从而反映现实世界的复杂性。
- 特定领域运营标准:此技术非常适合内部流程与行业标准实践差异巨大,且成功取决于是否遵守这些定制规范的情况。RFT 能够有效地将这些细微差别融入模型行为中。
- 高决策复杂性: RFT 在以复杂的决策树和多层面逻辑为特征的领域表现出色。在需要处理众多子案例并动态权衡不同输入的环境中,RFT 能够使模型泛化并生成更一致、更准确的决策。
监督微调的新支持
除了 RFT 之外,微软还宣布推出针对 OpenAI 最新 GPT-4.1-nano 模型的监督式微调 (SFT) 功能,该功能专为成本敏感的 AI 实现量身定制。这项微调功能预计将在未来几天内上线,为各组织提供经济实惠的 AI 模型增强方案。
Llama 4侦察兵模型集成
最后,微软推出了对 Meta 的 Llama 4 Scout 模型进行微调的支持,该模型拥有 170 亿个参数,并支持 1000 万个 token 上下文窗口。此微调选项将成为 Azure 托管计算服务的一部分。用户可以通过 Azure AI Foundry 和 Azure Machine Learning 组件访问经过微调的 Llama 模型,从而增强其利用尖端 AI 技术的能力。
更多详情,请观看公告视频
这里
。
访问此处的官方来源,了解最新创新。
发表回复