📰 AI 大事件與新知 — Living Document

⚡ 本筆記資料更新至:2026-06-24(以 WebSearch 查證後寫入;速度型主題,請定期回來補)。 性質:活文件(living doc),倒序時間線,最新事件在最上方。


📌 如何更新本筆記(給未來的 AI / 使用者)

每次更新請遵守以下規則,保持格式一致、可長期維護:

  1. 位置:新事件加在「時間線」對應年份 → 季/月區段的最上方(最新在最上面,倒序)。若該季區段不存在就新建一段。
  2. 每條格式日期 — 🏷️分類 — **事件** — 一句話意義。([來源](URL))
    • 日期用 YYYY-MM-DD;不確定確切日就寫 YYYY-MM
    • 「一句話意義」只寫為什麼重要,不要展開細節。
  3. 重大里程碑加 ⭐(世代級模型、改變產業/法規格局的事件)。
  4. 分類標籤(每條挑 1 個最貼切):
    • 🧠 模型發布(frontier model / 新世代)
    • 🛠️ 工具/agent(coding agent、產品、API、框架)
    • 📜 政策法規(法律、行政命令、標準)
    • 🔬 研究突破(論文、benchmark、科學應用)
    • 🏢 產業動態(募資、併購、市場、人事、地緣)
  5. 絕不捏造:事件、日期、產品名、版本號一律先 WebSearch 查證才寫;查不到/不確定 → 標 (待查證),寧可少寫。每條盡量附來源連結
  6. 更新完改本檔頂端「資料更新至」日期與 frontmatter updated
  7. 太舊(>2 年)且非里程碑的瑣事可下沉到「歷史里程碑(精選)」區,避免時間線無限膨脹。

🗓️ 時間線(最新在上)

2026

Q2(4–6 月)

  • 2026-06-09 — 🧠 模型發布 — ⭐ Anthropic 發表 Claude Fable 5 / Mythos 5(Mythos-class 新層級) — 在新的 Mythos 級(位於 Opus 之上)登場,宣稱在近乎所有 reasoning benchmark 達 SOTA;代表前沿模型再往上分層。(scriptbyai 時間線tygartmedia
  • 2026-06-08 — 🧠 模型發布 — Microsoft 推出 MAI 自研模型家族(七款) — 涵蓋影像、語音、轉錄、coding、reasoning;目標降低對 OpenAI 的依賴並壓低開發者成本(宣稱 Excel 微調版可比肩 GPT-5.4 但效率高達 10×)。(Microsoft AICNBC
  • 2026-06 — 📜 政策法規 — White House 發布「Promoting Advanced AI Innovation and Security」行政動作 — 延續美國以創新/安全為核心、反監管碎片化的 AI 政策方向。(whitehouse.gov
  • 2026-05-28 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.8 — 較 4.7 在 coding、agentic、reasoning 與知識型工作再進步。(tygartmedia 現行版本
  • 2026-05-07 — 📜 政策法規 — EU「Digital Omnibus」達成政治協議 — 將 Annex III 高風險 AI 系統的合規期限自 2026-08-02 延後至 2027-12-02,放緩部分上路時程。(artificialintelligenceact.euEU 官方
  • 2026-04-24 — 🧠 模型發布 — OpenAI GPT-5.5 / GPT-5.5 Pro 進入 API — 官方定位為「最聰明、最直覺」的世代,能更快理解使用者意圖、承擔更多工作。(OpenAI
  • 2026-04-16 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.7 — 軟體工程、長時間 coding 與 vision(更高解析度看圖)進步;一度於 SWE-bench 領先。(tygartmedia

Q1(1–3 月)

  • 2026-03-24 — 🛠️ 工具/agent — Claude Code 推出 Auto Mode — 讓 AI 自動核可安全動作、攔阻高風險動作,agentic coding 朝更自主推進。(MLQ News
  • 2026-02-05 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.6 — 引入 agent teams、Claude in PowerPoint 等工作流功能。(tygartmedia
  • 2026-01 — 🏢 產業動態 — DeepSeek「一週年」效應趨於平淡 — 相較 2025 年初的市場震撼,2026 年初新一代雖受關注但未再引發投資恐慌,顯示市場已內化「低成本前沿模型」敘事。(CNBCIT Pro

2025

Q4(10–12 月)

  • 2025-12 — 📜 政策法規 — ⭐ Trump 簽署行政命令挑戰各州 AI 法律(國家政策框架) — 主張以聯邦統一框架壓制州級「監管碎片化」,牽動全美 AI 法遵格局。(whitehouse.govMayer Brown
  • 2025-11-24 — 🧠 模型發布 — Anthropic 釋出 Claude Opus 4.5 — coding 與職場任務(如試算表生成)大幅改善。(scriptbyai 時間線
  • 2025-11-19 — 📜 政策法規 — EU 通過「AI Omnibus」立法提案 — 啟動對 AI Act 部分義務的簡化/調整程序(後續 2026-05 達政治協議)。(EU 官方
  • 2025-11-18 — 🧠 模型發布 — ⭐ Google 發表 Gemini 3(Gemini 3 Pro) — 首次跨產品 day-one 上線;多模態(文/圖/影/音/PDF)、~1M token context、Deep Think 模式,LMArena 一度居首。(InfoQGoogle Cloud

Q3(7–9 月)

  • 2025-09-30 — 🧠 模型發布 — OpenAI 推出 Sora 2(含 iOS app) — 文生影片在物理一致性、同步音效/對白上躍進;多模態生成走向消費級(註:app 已於 2026-04-26 關閉)。(OpenAIWikipedia
  • 2025-08-07 — 🧠 模型發布 — ⭐ OpenAI 發表 GPT-5 — 首個「統一」模型,整合 o 系列 reasoning 與 GPT 系列快速回應;同步進 ChatGPT / Copilot / API。(TechCrunchWikipedia
  • 2025-08-02 — 📜 政策法規 — ⭐ EU AI Act:GPAI(通用 AI 模型)治理義務上路 — AI Office 正式運作、成員國須訂罰則;對 GPAI 提供者的執法權則設一年緩衝(至 2026-08-02)。(artificialintelligenceact.euDLA Piper
  • 2025-07-23 — 📜 政策法規 — White House 發布「America’s AI Action Plan」+ 三道行政命令 — 90 項政策,三支柱:加速創新、建設 AI 基建、國際外交與安全;定調美國去監管、追求 AI 主導地位。(白宮 PDFSidley

Q1–Q2(1–6 月)

  • 2025-05-25 — 🧠 模型發布 — Anthropic 發表 Claude 4(Opus 4 / Sonnet 4) — 顯著提升 coding 能力,強化 Claude Code 表現。(Built In
  • 2025-05 — 🛠️ 工具/agent — ⭐ Claude Code 一般可用(GA) — 終端機內的自主 coding agent(讀 codebase、跨檔修改、跑測試、commit);六個月內衝上 $1B run-rate,帶動 agentic coding 浪潮。(Anthropicdeeplearning.ai The Batch
  • 2025-04-16 — 🧠 模型發布 — OpenAI 釋出 o3 / o4-mini — reasoning 模型全面進化(coding/數學/科學),ARC-AGI 較 o1 約 3 倍準確度。(OpenAIWikipedia o3
  • 2025-02 — 🛠️ 工具/agent — Claude Code 首次亮相(research preview) — agentic coding 工具登場,揭開 2025「agent 之年」序幕。(Built In
  • 2025-01-31 — 🧠 模型發布 — OpenAI 開放 o3-mini 給全體 ChatGPT 使用者 — reasoning 模型首度下放至免費層。(Wikipedia o3
  • 2025-01-10 — 🧠 模型發布 — ⭐ DeepSeek R1 發布 — 中國開源 reasoning 模型,宣稱以 ~$6M 達前沿水準;引爆市場震撼(1/27 登 App Store 第一、NVIDIA 單日市值蒸發近 $600B),改寫「前沿模型成本曲線」認知。(BritannicaWikipedia DeepSeek

🏛️ 歷史里程碑(精選,2022–2024)

較早但影響深遠的事件,僅留標誌性者;細節不在此展開。

  • 2024-12-20 — 🧠 OpenAI 公布 o3(命名跳過 o2 避商標衝突)— reasoning 模型路線確立。(Wikipedia o3
  • 2024-12-05 — 🧠 OpenAI o1 正式版上線 — 首個「先思考後回答(chain-of-thought)」reasoning 模型系列。(Wikipedia o1
  • 2024-09-12 — 🔬 OpenAI o1-preview — 推理時 inference-time compute 成為新 scaling 維度。(Wikipedia o1
  • 2023-03 — 🧠 OpenAI GPT-4 / Anthropic Claude 首發 — 多模態與大型對話模型進入主流。(待查證確切日期)
  • 2022-11-30 — 🧠 ⭐ ChatGPT 上線 — 生成式 AI 走入大眾,開啟整波浪潮。(待查證確切日期)

註:2022–2023 早期條目部分日期待查證(本次未逐一 WebSearch 核實確切日),補充時請查證後移除標記。


🧭 觀察主軸(持續追蹤的主題)

  • 前沿模型世代競賽:OpenAI(GPT-5.x)、Anthropic(Opus 4.x / Mythos)、Google(Gemini 3.x)、xAI、DeepSeek、Microsoft MAI 等多家並進;2026 年差距快速縮小。
  • Reasoning 模型:o1 → o3 → GPT-5 統一架構;inference-time compute 成主流 scaling。
  • Agent / agentic coding:2025 為「agent 之年」,Claude Code、Auto Mode 等推動自主執行。
  • 多模態:文/圖/影/音/PDF 統一;Sora 2、Gemini 3 等。
  • 開源/低成本衝擊:DeepSeek、GLM、Llama 系列壓低 API 與自架成本(部分數據待逐一查證)。
  • 法規:EU AI Act 分階段上路(GPAI 2025-08、執法 2026-08、Omnibus 延後高風險條款);美國轉向去監管、聯邦統一框架。

🔗 相關筆記


📚 Key References(本次查證主要來源)