📰 AI 大事件與新知 — Living Document
⚡ 本筆記資料更新至:2026-06-24(以 WebSearch 查證後寫入;速度型主題,請定期回來補)。 性質:活文件(living doc),倒序時間線,最新事件在最上方。
📌 如何更新本筆記(給未來的 AI / 使用者)
每次更新請遵守以下規則,保持格式一致、可長期維護:
- 位置:新事件加在「時間線」對應年份 → 季/月區段的最上方(最新在最上面,倒序)。若該季區段不存在就新建一段。
- 每條格式:
日期 — 🏷️分類 — **事件** — 一句話意義。([來源](URL))- 日期用
YYYY-MM-DD;不確定確切日就寫YYYY-MM。 - 「一句話意義」只寫為什麼重要,不要展開細節。
- 日期用
- 重大里程碑加 ⭐(世代級模型、改變產業/法規格局的事件)。
- 分類標籤(每條挑 1 個最貼切):
- 🧠 模型發布(frontier model / 新世代)
- 🛠️ 工具/agent(coding agent、產品、API、框架)
- 📜 政策法規(法律、行政命令、標準)
- 🔬 研究突破(論文、benchmark、科學應用)
- 🏢 產業動態(募資、併購、市場、人事、地緣)
- 絕不捏造:事件、日期、產品名、版本號一律先 WebSearch 查證才寫;查不到/不確定 → 標
(待查證),寧可少寫。每條盡量附來源連結。 - 更新完改本檔頂端「資料更新至」日期與 frontmatter
updated。 - 太舊(>2 年)且非里程碑的瑣事可下沉到「歷史里程碑(精選)」區,避免時間線無限膨脹。
🗓️ 時間線(最新在上)
2026
Q2(4–6 月)
- 2026-06-09 — 🧠 模型發布 — ⭐ Anthropic 發表 Claude Fable 5 / Mythos 5(Mythos-class 新層級) — 在新的 Mythos 級(位於 Opus 之上)登場,宣稱在近乎所有 reasoning benchmark 達 SOTA;代表前沿模型再往上分層。(scriptbyai 時間線、tygartmedia)
- 2026-06-08 — 🧠 模型發布 — Microsoft 推出 MAI 自研模型家族(七款) — 涵蓋影像、語音、轉錄、coding、reasoning;目標降低對 OpenAI 的依賴並壓低開發者成本(宣稱 Excel 微調版可比肩 GPT-5.4 但效率高達 10×)。(Microsoft AI、CNBC)
- 2026-06 — 📜 政策法規 — White House 發布「Promoting Advanced AI Innovation and Security」行政動作 — 延續美國以創新/安全為核心、反監管碎片化的 AI 政策方向。(whitehouse.gov)
- 2026-05-28 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.8 — 較 4.7 在 coding、agentic、reasoning 與知識型工作再進步。(tygartmedia 現行版本)
- 2026-05-07 — 📜 政策法規 — EU「Digital Omnibus」達成政治協議 — 將 Annex III 高風險 AI 系統的合規期限自 2026-08-02 延後至 2027-12-02,放緩部分上路時程。(artificialintelligenceact.eu、EU 官方)
- 2026-04-24 — 🧠 模型發布 — OpenAI GPT-5.5 / GPT-5.5 Pro 進入 API — 官方定位為「最聰明、最直覺」的世代,能更快理解使用者意圖、承擔更多工作。(OpenAI)
- 2026-04-16 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.7 — 軟體工程、長時間 coding 與 vision(更高解析度看圖)進步;一度於 SWE-bench 領先。(tygartmedia)
Q1(1–3 月)
- 2026-03-24 — 🛠️ 工具/agent — Claude Code 推出 Auto Mode — 讓 AI 自動核可安全動作、攔阻高風險動作,agentic coding 朝更自主推進。(MLQ News)
- 2026-02-05 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.6 — 引入 agent teams、Claude in PowerPoint 等工作流功能。(tygartmedia)
- 2026-01 — 🏢 產業動態 — DeepSeek「一週年」效應趨於平淡 — 相較 2025 年初的市場震撼,2026 年初新一代雖受關注但未再引發投資恐慌,顯示市場已內化「低成本前沿模型」敘事。(CNBC、IT Pro)
2025
Q4(10–12 月)
- 2025-12 — 📜 政策法規 — ⭐ Trump 簽署行政命令挑戰各州 AI 法律(國家政策框架) — 主張以聯邦統一框架壓制州級「監管碎片化」,牽動全美 AI 法遵格局。(whitehouse.gov、Mayer Brown)
- 2025-11-24 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.5 — coding 與職場任務(如試算表生成)大幅改善。(scriptbyai 時間線)
- 2025-11-19 — 📜 政策法規 — EU 通過「AI Omnibus」立法提案 — 啟動對 AI Act 部分義務的簡化/調整程序(後續 2026-05 達政治協議)。(EU 官方)
- 2025-11-18 — 🧠 模型發布 — ⭐ Google 發表 Gemini 3(Gemini 3 Pro) — 首次跨產品 day-one 上線;多模態(文/圖/影/音/PDF)、~1M token context、Deep Think 模式,LMArena 一度居首。(InfoQ、Google Cloud)
Q3(7–9 月)
- 2025-09-30 — 🧠 模型發布 — OpenAI 推出 Sora 2(含 iOS app) — 文生影片在物理一致性、同步音效/對白上躍進;多模態生成走向消費級(註:app 已於 2026-04-26 關閉)。(OpenAI、Wikipedia)
- 2025-08-07 — 🧠 模型發布 — ⭐ OpenAI 發表 GPT-5 — 首個「統一」模型,整合 o 系列 reasoning 與 GPT 系列快速回應;同步進 ChatGPT / Copilot / API。(TechCrunch、Wikipedia)
- 2025-08-02 — 📜 政策法規 — ⭐ EU AI Act:GPAI(通用 AI 模型)治理義務上路 — AI Office 正式運作、成員國須訂罰則;對 GPAI 提供者的執法權則設一年緩衝(至 2026-08-02)。(artificialintelligenceact.eu、DLA Piper)
- 2025-07-23 — 📜 政策法規 — White House 發布「America’s AI Action Plan」+ 三道行政命令 — 90 項政策,三支柱:加速創新、建設 AI 基建、國際外交與安全;定調美國去監管、追求 AI 主導地位。(白宮 PDF、Sidley)
Q1–Q2(1–6 月)
- 2025-05-25 — 🧠 模型發布 — Anthropic 發表 Claude 4(Opus 4 / Sonnet 4) — 顯著提升 coding 能力,強化 Claude Code 表現。(Built In)
- 2025-05 — 🛠️ 工具/agent — ⭐ Claude Code 一般可用(GA) — 終端機內的自主 coding agent(讀 codebase、跨檔修改、跑測試、commit);六個月內衝上 $1B run-rate,帶動 agentic coding 浪潮。(Anthropic、deeplearning.ai The Batch)
- 2025-04-16 — 🧠 模型發布 — OpenAI 釋出 o3 / o4-mini — reasoning 模型全面進化(coding/數學/科學),ARC-AGI 較 o1 約 3 倍準確度。(OpenAI、Wikipedia o3)
- 2025-02 — 🛠️ 工具/agent — Claude Code 首次亮相(research preview) — agentic coding 工具登場,揭開 2025「agent 之年」序幕。(Built In)
- 2025-01-31 — 🧠 模型發布 — OpenAI 開放 o3-mini 給全體 ChatGPT 使用者 — reasoning 模型首度下放至免費層。(Wikipedia o3)
- 2025-01-10 — 🧠 模型發布 — ⭐ DeepSeek R1 發布 — 中國開源 reasoning 模型,宣稱以 ~$6M 達前沿水準;引爆市場震撼(1/27 登 App Store 第一、NVIDIA 單日市值蒸發近 $600B),改寫「前沿模型成本曲線」認知。(Britannica、Wikipedia DeepSeek)
🏛️ 歷史里程碑(精選,2022–2024)
較早但影響深遠的事件,僅留標誌性者;細節不在此展開。
- 2024-12-20 — 🧠 OpenAI 公布 o3(命名跳過 o2 避商標衝突)— reasoning 模型路線確立。(Wikipedia o3)
- 2024-12-05 — 🧠 OpenAI o1 正式版上線 — 首個「先思考後回答(chain-of-thought)」reasoning 模型系列。(Wikipedia o1)
- 2024-09-12 — 🔬 OpenAI o1-preview — 推理時 inference-time compute 成為新 scaling 維度。(Wikipedia o1)
- 2023-03 — 🧠 OpenAI GPT-4 / Anthropic Claude 首發 — 多模態與大型對話模型進入主流。(待查證確切日期)
- 2022-11-30 — 🧠 ⭐ ChatGPT 上線 — 生成式 AI 走入大眾,開啟整波浪潮。(待查證確切日期)
註:2022–2023 早期條目部分日期待查證(本次未逐一 WebSearch 核實確切日),補充時請查證後移除標記。
🧭 觀察主軸(持續追蹤的主題)
- 前沿模型世代競賽:OpenAI(GPT-5.x)、Anthropic(Opus 4.x / Mythos)、Google(Gemini 3.x)、xAI、DeepSeek、Microsoft MAI 等多家並進;2026 年差距快速縮小。
- Reasoning 模型:o1 → o3 → GPT-5 統一架構;inference-time compute 成主流 scaling。
- Agent / agentic coding:2025 為「agent 之年」,Claude Code、Auto Mode 等推動自主執行。
- 多模態:文/圖/影/音/PDF 統一;Sora 2、Gemini 3 等。
- 開源/低成本衝擊:DeepSeek、GLM、Llama 系列壓低 API 與自架成本(部分數據待逐一查證)。
- 法規:EU AI Act 分階段上路(GPAI 2025-08、執法 2026-08、Omnibus 延後高風險條款);美國轉向去監管、聯邦統一框架。
🔗 相關筆記
📚 Key References(本次查證主要來源)
- OpenAI 官方:GPT-5.5、Sora 2、o3/o4-mini
- Anthropic:Claude Code
- Google:Gemini 3 (Cloud)、InfoQ Gemini 3
- Microsoft:MAI 模型家族
- EU AI Act:implementation timeline、EU 官方框架
- White House:America’s AI Action Plan (PDF)、2025-12 EO
- DeepSeek:Britannica、Wikipedia
- 模型時間線整理(次級來源,已交叉比對):scriptbyai Claude、tygartmedia