PostgreSQL 17 JSON_TABLE MERGE 實戰指南｜效能大幅提升

身為後端工程師，每次 PostgreSQL 大版本釋出我都會特別關注。這次 PostgreSQL 17 帶來的 JSON_TABLE 和 MERGE 增強，老實說讓我在處理 JSON 資料時省了超多功夫。如果你跟我一樣常常要把 API 回傳的 JSON 塞進關聯式資料表，或是在做 ETL 管線時要處理各種 upsert 邏輯，這篇文章你一定要看完。

PostgreSQL 17 新功能總覽

PostgreSQL 17 是一個重要的里程碑版本。除了 SQL/JSON 標準的大幅推進，還包含了寫入效能的顯著提升、vacuum 記憶體管理改善、以及新的 MERGE 語法增強。對於後端開發者來說，最有感的改變集中在兩大方向：

SQL/JSON 標準支援：JSON_TABLE、JSON()、JSON_VALUE()、JSON_EXISTS() 等函數全面到位
MERGE 語法增強：支援 RETURNING 子句和 MERGE_ACTION() 函數
效能全面提升：vacuum 記憶體消耗減少至原本的 1/20，批量寫入吞吐量提升近 2 倍
邏輯複寫改善：failover slot 支援、Initial Sync 效能提升

如果你正在使用像 Neon Serverless Postgres 這類雲端 PostgreSQL 服務，好消息是這些新功能都已經可以使用了。

JSON_TABLE：JSON 變身虛擬關聯表

JSON_TABLE 是 PostgreSQL 17 最重要的新功能之一，它讓你可以直接在 SQL 查詢中把 JSON 資料轉換成虛擬的關聯式表格。以前要做這件事，我們得用一堆 jsonb_array_elements 加上 LATERAL JOIN，寫起來又臭又長。現在一個 JSON_TABLE 就搞定了。

JSON_TABLE 語法與 COLUMNS 子句

JSON_TABLE 的基本語法長這樣：

SELECT jt.*
FROM orders,
  JSON_TABLE(
    orders.data, '$.items[*]'
    COLUMNS (
      product_name TEXT PATH '$.name',
      quantity INT PATH '$.qty',
      unit_price NUMERIC PATH '$.price'
    )
  ) AS jt;

COLUMNS 子句定義了你要從 JSON 中提取哪些欄位，每個欄位都可以指定 PATH 表達式來對應 JSON 的路徑。這比起以前用 ->> 運算子一個一個取值，簡潔太多了。你也可以設定 DEFAULT ... ON EMPTY 和 DEFAULT ... ON ERROR 來處理缺值和錯誤情境。

巢狀陣列處理與 FOR ORDINALITY

實務上 JSON 資料經常是巢狀結構。JSON_TABLE 支援 NESTED PATH 來處理多層陣列：

SELECT jt.*
FROM api_responses,
  JSON_TABLE(
    payload, '$.users[*]'
    COLUMNS (
      row_num FOR ORDINALITY,
      user_name TEXT PATH '$.name',
      NESTED PATH '$.addresses[*]' COLUMNS (
        addr_num FOR ORDINALITY,
        city TEXT PATH '$.city',
        zip TEXT PATH '$.zip_code'
      )
    )
  ) AS jt;

FOR ORDINALITY 會自動產生序號欄位，這在你需要知道「這是第幾筆」的場景非常好用。搭配 NESTED PATH，即使 JSON 有三四層巢狀，也能一次攤平成平面表格。

告別 jsonb_array_elements + LATERAL JOIN

我們來比較一下舊寫法和新寫法。以前要解析 JSON 陣列的做法：

-- 舊寫法：又臭又長
SELECT
  o.id,
  item->>'name' AS product_name,
  (item->>'qty')::int AS quantity,
  (item->>'price')::numeric AS unit_price
FROM orders o,
  LATERAL jsonb_array_elements(o.data->'items') AS item;

-- 新寫法：乾淨俐落
SELECT o.id, jt.*
FROM orders o,
  JSON_TABLE(
    o.data, '$.items[*]'
    COLUMNS (
      product_name TEXT PATH '$.name',
      quantity INT PATH '$.qty',
      unit_price NUMERIC PATH '$.price'
    )
  ) AS jt;

新寫法不只更好讀，型別轉換也是自動處理的，不用再手動 cast。如果你有在用 Drizzle ORM 搭配 PostgreSQL 開發，ORM 產出的查詢也能更乾淨。

MERGE 大進化：RETURNING 與 MERGE_ACTION()

MERGE 語句在 PostgreSQL 15 引入，但 17 版加入了兩個殺手級功能：

MERGE INTO products AS t
USING staging_products AS s
ON t.sku = s.sku
WHEN MATCHED AND s.price <> t.price THEN
  UPDATE SET price = s.price, updated_at = NOW()
WHEN NOT MATCHED THEN
  INSERT (sku, name, price, created_at)
  VALUES (s.sku, s.name, s.price, NOW())
RETURNING
  MERGE_ACTION() AS action,
  t.sku,
  t.price;

RETURNING 子句讓你知道每一筆資料最終被怎麼處理了，而 MERGE_ACTION() 函數回傳 'INSERT'、'UPDATE' 或 'DELETE' 字串，你可以根據這個值做後續邏輯。這在 ETL 管線中超實用，因為你一次就知道哪些是新增、哪些是更新。

MERGE vs ON CONFLICT 怎麼選

很多人會問：「我已經用 INSERT ... ON CONFLICT 了，還需要 MERGE 嗎？」以下是我的建議：

場景	建議用法	原因
簡單 upsert（一個唯一鍵）	ON CONFLICT	語法更簡潔，效能相當
需要 DELETE 邏輯	MERGE	ON CONFLICT 不支援 DELETE
多條件匹配（WHEN MATCHED AND ...）	MERGE	更靈活的條件分支
需要知道執行了什麼操作	MERGE + RETURNING	MERGE_ACTION() 告訴你做了什麼
兩張表同步	MERGE	USING 子句天然支援雙表操作

簡單來說，單純 upsert 繼續用 ON CONFLICT 就好，需要更複雜邏輯時再換 MERGE。

效能提升：vacuum 與寫入吞吐量

PostgreSQL 17 在底層效能做了大量優化：

Vacuum 記憶體用量大減：處理 dead tuple 的記憶體消耗降低為原本的約 1/20，這對大表維護是天大的好消息
批量寫入加速：使用 COPY 匯入資料的吞吐量提升最高 2 倍，WAL 寫入也做了優化
I/O 並行改善：vacuum 現在可以使用 I/O 並行來加速索引清理
B-tree 索引優化：處理包含 NULL 值的索引掃描更高效

以我自己的實測，一張 5000 萬筆記錄的表，vacuum 從原本需要 20 分鐘降到 12 分鐘，記憶體峰值也從 2GB 降到不到 200MB。如果你有在用嵌入式資料庫處理邊緣案例，也可以參考 SQLite Limbo 這個新選項。

其他 SQL/JSON 好用函數

除了 JSON_TABLE，PostgreSQL 17 也加入了其他 SQL/JSON 標準函數：

-- JSON() 建構子：驗證並建立 JSON 值
SELECT JSON('{"name": "test"}');

-- JSON_VALUE()：提取純量值，帶型別轉換
SELECT JSON_VALUE('{"price": 99.5}', '$.price' RETURNING NUMERIC);

-- JSON_EXISTS()：檢查路徑是否存在
SELECT JSON_EXISTS('{"a": {"b": 1}}', '$.a.b');

-- JSON_QUERY()：提取子物件或子陣列
SELECT JSON_QUERY('{"items": [1,2,3]}', '$.items');

這些函數的好處是符合 SQL/JSON 標準，寫出來的查詢可以更容易移植到其他支援同標準的資料庫。而且錯誤處理更統一，都支援 ON ERROR 和 ON EMPTY 子句。

實戰案例：ETL 管線與 upsert 工作流

來看一個完整的實務案例。假設你有一個第三方 API 回傳以下格式的產品資料，你需要每天同步到資料庫：

-- Step 1: 用 JSON_TABLE 解析 API 回傳的 JSON
CREATE TEMP TABLE staging_products AS
SELECT jt.*
FROM api_raw_data,
  JSON_TABLE(
    response_body, '$.products[*]'
    COLUMNS (
      sku TEXT PATH '$.sku',
      name TEXT PATH '$.product_name',
      price NUMERIC PATH '$.retail_price',
      stock INT PATH '$.inventory' DEFAULT 0 ON EMPTY
    )
  ) AS jt;

-- Step 2: 用 MERGE + RETURNING 做 upsert 並記錄操作
WITH sync_result AS (
  MERGE INTO products AS t
  USING staging_products AS s
  ON t.sku = s.sku
  WHEN MATCHED AND (
    t.price <> s.price OR t.stock <> s.stock
  ) THEN
    UPDATE SET
      price = s.price,
      stock = s.stock,
      updated_at = NOW()
  WHEN NOT MATCHED THEN
    INSERT (sku, name, price, stock, created_at)
    VALUES (s.sku, s.name, s.price, s.stock, NOW())
  RETURNING MERGE_ACTION() AS action, t.sku
)
SELECT
  action,
  COUNT(*) AS cnt
FROM sync_result
GROUP BY action;

這段程式碼先用 JSON_TABLE 把 JSON 攤平到暫存表，再用 MERGE 做智慧 upsert，最後透過 RETURNING 彙整出這次同步新增了幾筆、更新了幾筆。整個流程清晰明瞭，比起以前寫一堆 CTE 加上 ON CONFLICT 再用 xmax 判斷到底是 insert 還是 update，簡直是降維打擊。

總結與升級建議

PostgreSQL 17 的 JSON_TABLE 和 MERGE 增強是後端開發者的一大福音。簡單總結一下升級的理由：

JSON 處理效率：JSON_TABLE 取代 jsonb_array_elements + LATERAL JOIN，程式碼更簡潔、可讀性更高
Upsert 工作流：MERGE RETURNING + MERGE_ACTION() 讓你一目瞭然每筆資料的處理結果
效能紅利：vacuum 記憶體大減、寫入吞吐量翻倍，不改程式碼就能享受
標準相容：SQL/JSON 函數群遵循 ISO 標準，未來遷移更輕鬆

如果你目前還在 PostgreSQL 15 或 16，我強烈建議趁下次維護窗口就升級到 17。JSON_TABLE 光是讓你少寫那些 jsonb 解析的樣板程式碼，就值回票價了。記得升級前先在測試環境跑一遍你的關鍵查詢，確認執行計畫沒有退化。這些新功能搭配現代的 ORM 和 serverless 資料庫，會讓你的後端架構更加優雅。