DeepSeek-R1 正式开源
推理模型成本骤降,算力焦虑首次得到结构性缓解。
OpenAI Operator (预览版)
AI 开始接管计算机 UI 操作,从“对话”转向“执行”。
OpenAI o3-mini 发布
将高阶推理能力引入轻量模型,API 响应进入毫秒时代。
Vibe Coding 概念提出
Andrej Karpathy 确立了“意图大于语法”的新共识。
Claude 3.7 Sonnet 发布
凭借极强的逻辑严密性,成为 2025 上半年口碑最强的编码模型。
GPT-4.5 突然发布
大幅降低模型幻觉,复杂逻辑链的断裂率下降 60%。
Manus AI 正式推出
首个能独立完成多步、跨应用复杂任务的中国智能体。
NVIDIA GTC 2025
Blackwell Ultra 芯片发布,为万亿参数模型提供硬件支撑。
Gemini 2.5 Pro 最终版
1M 上下文稳定商用,支持分析一整个微服务架构库。
Meta Llama 4 系列预览
开源 MoE 架构首次在多个基准测试中追平闭源旗舰。
GPT-4.1 家族更新
重点解决环境鲁棒性,API 稳定性与成本效益显著提升。
Docker MCP 工具市场开启
打破代理调用工具的壁垒,Agent 进入“即插即用”时代。
Google I/O 2025
发布 Veo 3 和 Imagen 4,视频/图像生成与推理深度融合。
Claude 4 Opus 抢跑发布
在复杂软件工程评测中达成神级评分,确立首席编程 AI 地位。
DeepSeek-R1-0528 更新
国产模型在代码生成基准上持续领跑,蒸馏版横扫端侧市场。
Apple Intelligence 集成
AI 代理正式进入数十亿用户的移动操作系统底层。
Trae SOLO 模式发布
字节跳动推出具备极强自主能力的 AI 编程模式。
ChatGPT Agent 嵌入
用户无需编程即可在 Web 端构建垂直领域的编码代理。
xAI Grok 4 发布
推理能力登上新高度,上下文窗口扩展至 2M 超长规模。
GPT-OSS (开源权重)发布
OpenAI 罕见的开源举动,标志着闭源巨头防线的全面调整。
OpenAI GPT-5
引入“动态思考”,极大提升了复杂 Agent 任务的成功率。
OpenAI Sora 2 公测
实现物理规律的一致性,长视频生成进入工业可用阶段。
DeepSeek-V3.2 发布
提出 DSA 机制,长上下文推理成本再次实现断崖式下跌。
Waymo & Tesla Robotaxi
Robotaxi 服务在多个主要城市正式取消安全员,真正无人化。
OpenAI DevDay / Codex
Codex 正式版与 AgentKit 发布,支持 MCP 协议的原生应用。
ChatGPT Atlas 浏览器
推出首款 AI 原生浏览器,支持在网页内直接执行代理任务。
Adobe MAX / Firefly 5
引入“分层提示词编辑”,实现设计流的文本级精确控制。
DeepMind 自动化实验室
DeepMind 与英国政府合作的 AI 材料实验室产出首批新型超导材料。
Google Gemini 3 旗舰版
模型具备自我审查与反思能力,逻辑推导接近人类水平。
Claude Opus 4.5 发布
在极度复杂的工程重构任务中展现出统治级实力。
GPT-5.2 & Codex 代理
AI 代理自主管理从需求到 CI/CD 部署的全生命周期。
Gemini 3 Flash 极速版
极低延迟响应,实时视觉翻译与增强现实 (AR) 应用爆发。
人形机器人安全公约
全球主要机器人厂商签署“红色按钮”安全标准,迈向通用商用。
Meta 收购 Manus
全球社交巨头押注 Agentic AI 商业化,标志着 2025 完美收官。