AI Model Selection Guide¶

状态: 📦 已归档

创建日期: 2026-02-10
最后更新: 2026-02-21

📅 日历事件¶

事件名称	开始	结束	地点	日历	备注
-	-	-	-	-	-

日历状态说明: ✅=已加入 / 📄=仅文档

基于 2026-02 的官方信息，重新给出四个模型的优缺点与选型策略：

模型	定位	官方状态
GPT-5.2	OpenAI 通用旗舰推理模型	API 已可用；`gpt-5.2`/`gpt-5.2-chat-latest`/`gpt-5.2-pro`
GPT-5.3-Codex	OpenAI 最新 agentic coding 模型	Codex surfaces 可用；官方说明 API 正在推进
Claude Sonnet 4.6	Anthropic 速度/智能平衡主力	Claude 与 API 已可用；Sonnet 默认推荐型号
Claude Opus 4.6	Anthropic 最强智能型号	Claude 与 API 已可用；复杂任务优先推荐

模型	优点	缺点/边界
GPT-5.2	通用能力强，工具调用与长链路任务明显增强；支持 `reasoning.effort` 与 `verbosity`；官方强调编码、视觉、长上下文与专业知识工作能力	高质量模式成本较高（如 Pro 档）；厂商基准强但需本地复测；对纯编码代理场景不一定优于专门 Codex 模型
GPT-5.3-Codex	定位为最强 agentic coding；官方称较 5.2-Codex 约快 25%；在 SWE-Bench Pro/Terminal-Bench/OSWorld-Verified 等代理编码与计算机操作任务有优势	当前重点在 Codex 生态；官方写明 API 仍在推进，接入路径不如通用 API 模型直接；高风险网络/安全任务会触发更严格防护与路由
Claude Sonnet 4.6	速度与智能平衡好，价格维持 Sonnet 档；200K 上下文并提供 1M beta；官方强调在编码、computer use、长上下文与指令跟随上显著提升	默认高 effort 可能带来额外延迟/成本；部分旧接口用法需迁移（如 prefill 不再支持、参数行为变化）
Claude Opus 4.6	Anthropic 官方最高智能模型；适合复杂推理、长链路代理、多约束任务；200K 上下文 + 1M beta，最高 128K 输出	成本和延迟高于 Sonnet；对于中等复杂任务性价比可能不如 Sonnet 4.6；同样存在 4.6 代际迁移注意项

模型	价格信号	结论
GPT-5.2	OpenAI 公布 `gpt-5.2` 约 $1.75 / $14 (input/output, 每百万 tokens)	通用旗舰里偏“可用但不低价”
Claude Sonnet 4.6	Anthropic 公布 $3 / $15 (每百万 tokens)	作为默认生产模型较稳
Claude Opus 4.6	Anthropic 公布 $5 / $25 (每百万 tokens)	为质量付费，适合关键任务
GPT-5.3-Codex	官方主打 Codex 订阅/产品侧能力，API 定价信息需以正式发布为准	预算评估需结合实际接入形态

Claude 4.6 迁移需重点检查：
- assistant prefill 方案（4.6 上会报错）
- tool 参数转义解析（应使用标准 JSON 解析）
- 旧 beta header 与旧参数迁移（如 output_format 到 output_config.format）
OpenAI 侧建议优先走 Responses API 并明确控制 reasoning/verbosity，避免把旧模型提示词原样搬迁。
所有基准成绩都不能直接替代业务验收，必须做任务集回放（accuracy、latency、cost 三维一起看）。

Introducing GPT-5.2 (2025-12-11): https://openai.com/index/introducing-gpt-5-2/
Using GPT-5.2 (OpenAI API Docs): https://developers.openai.com/api/docs/guides/latest-model/
Introducing GPT-5.3-Codex (2026-02-05): https://openai.com/index/introducing-gpt-5-3-codex/
Model Release Notes (Help Center): https://help.openai.com/en/articles/9624314-model-release-notes

Models overview (Claude API Docs): https://platform.claude.com/docs/en/about-claude/models/overview
What's new in Claude 4.6: https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-6
Introducing Claude Opus 4.6 (2026-02-05): https://www.anthropic.com/news/claude-opus-4-6
Introducing Claude Sonnet 4.6 (2026-02-17): https://www.anthropic.com/news/claude-sonnet-4-6
Migration guide (Claude 4.6): https://docs.anthropic.com/en/docs/about-claude/models/migrating-to-claude-4

注: 本文中的性能描述优先引用官方原文。涉及 benchmark 的结论，默认视为厂商公布结果，生产决策请配合自有任务集验证。