前言:Hello World 是什麼?
Hello World Dev Conference(HWDC) 是 iThome 與台灣開發者社群共同主辦的年度技術盛會。
2025 年以 「Building the Future Together」 為主題,聚焦人類與 AI 協作、開發流程自動化、資料驅動產品設計等議題。
LINE 同樣積極參與這場屬於開發者的舞台。今年,我們派出三位講者帶來從 AI 到 EC 的真實落地經驗:
- Vila Lin:以 LLM 打造商品規格萃取系統,讓非結構化資料重獲秩序。
- Winter:用 Playwright + MCP 建構 AI 驅動測試流程,讓自動化測試從腳本走向智能。
- Rei:開發 LINE EC 商品目錄平台,為比價與推薦奠定資料基礎。
現場精彩回顧
在滿場開發者的熱烈掌聲中,三位講者輪番上台,從 AI 實作、測試自動化到資料工程,
展現了 LINE 團隊如何讓技術不只是概念,而是真正流動於產品的血脈。
這不只是一場分享,更像是一段從「資料清洗」到「系統穩定」、「從模型原型」到「量產運行」的工程旅程。
以下為三場分享的重點精華與現場故事。
Vila Lin:LLM 商品規格萃取大冒險

在 LINE 電商平台上,商品數量超過 2,000 萬筆,資料來源繁雜、格式各異。如何讓 AI 自動讀懂商品名稱與描述,萃取出「品牌、型號、尺寸、容量」等規格?
Vila 的分享以「冒險遊戲」為主題,描繪了他團隊從 PoC 到量產的完整旅程。
挑戰:在雜訊裡找出訊號
商品資料中常夾雜促銷語、表情符號與人為輸入錯誤。
Vila 以「訊號雜訊比(SNR)」概念說明,若不清洗資料,模型再強也會陷入幻覺。
因此,她設計了三層前處理機制:
- 建立 領域詞庫 與 Stop List,過濾非規格詞。
- 統計出現頻率,分流長尾商品進行人工審視。
- 移除 HTML 標籤與無意義符號,還原語義。
萃取流程:從邏輯到流程
在 Prompt 設計上,Vila 強調「來源優先序」與「規格優先序」的雙序列邏輯:
- 商品名稱 → 簡述 → 長述 → 頁面附註。
- 品牌 → 型號 → 系列 → 尺寸 → 容量。
為了讓 LLM 辨識不同寫法,她引入「同義異寫映射表」,解決「成分/成份」與「長寬高/L×W×H」等混亂情形。
後處理與量產:讓 LLM 變成一條產線
團隊以 Airflow + Spark 建立批次與增量處理管線,搭配 Prompt 版本控管與自動告警。
若模型信心值低於 threshold ,就會自動進入人工驗證流程,確保品質穩定。
Winter:用 Playwright + MCP 打造 AI 驅動測試流程

在 AI 與 Web 應用快速演進的時代,測試腳本往往跟不上產品變化。
Winter 的演講以「AI 如何成為測試夥伴」為核心,展示如何利用 Playwright 與 MCP (Model Context Protocol)讓測試自動生成、即時執行、持續優化。
Playwright:快速又可靠的自動化基礎
Playwright 支援多瀏覽器(Chromium、Firefox、WebKit),具備強大的選取器與自動等待機制。
Winter 指出,它不僅適合前端 E2E 測試,也能整合 API 驗證、截圖與回歸測試,形成「全棧型測試平台」。
MCP 整合:讓 AI 理解測試語言
藉由 MCP 介面,LLM 可直接呼叫 Playwright API。
這讓測試流程出現革命性改變:
- PM 或 QA 可用自然語言輸入:「開啟登入頁 → 輸入錯誤密碼 → 檢查錯誤訊息」。
- 模型即時轉換為可執行腳本,執行並回報結果。
- 測試失敗時,AI 還能根據 log 建議修正腳本。
實務挑戰與經驗
Winter 強調,AI 雖能生成腳本,但仍須工程紀律支撐:
- 明確的測試資料控制與權限邊界。
- 對語意模糊、欄位命名衝突的監控與版本管控。
- 人工審查關鍵業務流程的邏輯正確性。
透過這場分享,Winter 讓聽眾看到測試自 動化的新可能:AI 成為維運流程的共同開發者。
Rei:LINE EC Product Catalog Development
Rei 從產品工程角度出發,揭示「商品目錄(Catalog)」是 LINE 電商的心臟。
它串聯搜尋、推薦、比價、行銷等所有核心服務,而一旦資料錯誤,整條生態鏈都會受影響。
挑戰:跨商家、跨格式的混亂世界
- 不同商家以各自命名與格式上傳商品。
- 品牌、型號、容量、包裝數量常缺漏。
- 傳統規則比對維護成本高、支援新品與長尾商品困難。
解法:建立標準化商品目錄平台
Rei 介紹了他們從零打造的 Product Catalog Platform:
- 資料接入層:從多來源蒐集商品資料,統一格式。
- 清洗與標準化層:結合 LLM 與 正規化詞庫,轉換單位、統一品牌名。
- 服務層:將目錄 API 化,支援搜尋、推薦、行銷模組快速調 用。
這樣的設計讓平台能即時更新、降低重工,並支援自動化上架與比價群組功能。
成果與持續優化
導入平台後:
- 商品上架時間縮短 50%。
- 屬性完整度提升 40%。
- 分類錯誤率顯著下降。
團隊下一步計畫導入 Clustering 與 Embedding 模型,進一步強化「同款商品比對」的精度。
活動收穫與未來展望
三位講者的分享橫跨 AI 應用、流程自動化、資料工程 三個維度,串成一條完整的落地鏈:
| 主題 | 關鍵價值 | 核心精神 |
|---|---|---|
| LLM 商品規格萃取 | 提升資料品質與結構化程度 | 資料治理是 AI 成功的起點 |
| AI 驅動測試流程 | 提高測試效率與可維運性 | 把 AI 納入工程流程 |
| EC 商品目錄開發 | 建構產品資料基礎設施 | 讓 AI 成果真正回饋使用者 |
這次 Hello World 不僅是一場展示,更是一場「工程反思」。
我們從三個方向體悟到共同結論:
- 資料為根本 — 沒有乾淨的資料,AI 只是幻覺。
- 流程化即落地 — 從開發到測試,每一步都需制度化。
- 社群即動能 — 分享能讓經驗轉化為知識,形成正循環。
結語:從分享經驗,到啟發更多交流
在 Hello World 2025 的舞台上,我們三位講者分別 從資料治理、測試自動化與產品工程的角度,
分享了 LINE 在 AI 與電商領域的實務探索。
這不僅是一次技術展示,更是一場與社群互相啟發的對話。
我們深刻體會到——AI 不只是模型,而是流程、資料與文化的總和。
唯有在真實環境中落地,技術才能產生價值;唯有透過開放分享,經驗才能被更多人複製、延伸。
未來,我們將持續參與開發者社群,將這些經驗轉化為更多交流與合作的契機,
一起推動技術生態更穩健、更具創造力地前進。



