LY Corporation Tech Blog

支持 LY Corporation 和 LY Corporation Group (LINE Plus, LINE Taiwan and LINE Vietnam) 服務,宣傳技術和開發文化。

Hello World 2025 活動紀錄

image

前言:Hello World 是什麼?

Hello World Dev Conference(HWDC) 是 iThome 與台灣開發者社群共同主辦的年度技術盛會。
2025 年以 「Building the Future Together」 為主題,聚焦人類與 AI 協作、開發流程自動化、資料驅動產品設計等議題。

LINE 同樣積極參與這場屬於開發者的舞台。今年,我們派出三位講者帶來從 AI 到 EC 的真實落地經驗:

  1. Vila Lin:以 LLM 打造商品規格萃取系統,讓非結構化資料重獲秩序。
  2. Winter:用 Playwright + MCP 建構 AI 驅動測試流程,讓自動化測試從腳本走向智能。
  3. Rei:開發 LINE EC 商品目錄平台,為比價與推薦奠定資料基礎。

現場精彩回顧

在滿場開發者的熱烈掌聲中,三位講者輪番上台,從 AI 實作、測試自動化到資料工程,
展現了 LINE 團隊如何讓技術不只是概念,而是真正流動於產品的血脈。
這不只是一場分享,更像是一段從「資料清洗」到「系統穩定」、「從模型原型」到「量產運行」的工程旅程。
以下為三場分享的重點精華與現場故事。


Vila Lin:LLM 商品規格萃取大冒險

image

在 LINE 電商平台上,商品數量超過 2,000 萬筆,資料來源繁雜、格式各異。如何讓 AI 自動讀懂商品名稱與描述,萃取出「品牌、型號、尺寸、容量」等規格?
Vila 的分享以「冒險遊戲」為主題,描繪了他團隊從 PoC 到量產的完整旅程。

挑戰:在雜訊裡找出訊號

商品資料中常夾雜促銷語、表情符號與人為輸入錯誤。
Vila 以「訊號雜訊比(SNR)」概念說明,若不清洗資料,模型再強也會陷入幻覺。
因此,她設計了三層前處理機制:

  • 建立 領域詞庫 與 Stop List,過濾非規格詞。
  • 統計出現頻率,分流長尾商品進行人工審視。
  • 移除 HTML 標籤與無意義符號,還原語義。

萃取流程:從邏輯到流程

在 Prompt 設計上,Vila 強調「來源優先序」與「規格優先序」的雙序列邏輯:

  1. 商品名稱 → 簡述 → 長述 → 頁面附註。
  2. 品牌 → 型號 → 系列 → 尺寸 → 容量。
    為了讓 LLM 辨識不同寫法,她引入「同義異寫映射表」,解決「成分/成份」與「長寬高/L×W×H」等混亂情形。

後處理與量產:讓 LLM 變成一條產線

團隊以 Airflow + Spark 建立批次與增量處理管線,搭配 Prompt 版本控管與自動告警。
若模型信心值低於 threshold ,就會自動進入人工驗證流程,確保品質穩定。


Winter:用 Playwright + MCP 打造 AI 驅動測試流程

image

在 AI 與 Web 應用快速演進的時代,測試腳本往往跟不上產品變化。
Winter 的演講以「AI 如何成為測試夥伴」為核心,展示如何利用 Playwright 與 MCP (Model Context Protocol)讓測試自動生成、即時執行、持續優化。

Playwright:快速又可靠的自動化基礎

Playwright 支援多瀏覽器(Chromium、Firefox、WebKit),具備強大的選取器與自動等待機制。
Winter 指出,它不僅適合前端 E2E 測試,也能整合 API 驗證、截圖與回歸測試,形成「全棧型測試平台」。

MCP 整合:讓 AI 理解測試語言

藉由 MCP 介面,LLM 可直接呼叫 Playwright API。
這讓測試流程出現革命性改變:

  • PM 或 QA 可用自然語言輸入:「開啟登入頁 → 輸入錯誤密碼 → 檢查錯誤訊息」。
  • 模型即時轉換為可執行腳本,執行並回報結果。
  • 測試失敗時,AI 還能根據 log 建議修正腳本。

實務挑戰與經驗

Winter 強調,AI 雖能生成腳本,但仍須工程紀律支撐:

  • 明確的測試資料控制與權限邊界。
  • 對語意模糊、欄位命名衝突的監控與版本管控。
  • 人工審查關鍵業務流程的邏輯正確性。

透過這場分享,Winter 讓聽眾看到測試自動化的新可能:AI 成為維運流程的共同開發者。


Rei:LINE EC Product Catalog Development

image

Rei 從產品工程角度出發,揭示「商品目錄(Catalog)」是 LINE 電商的心臟。
它串聯搜尋、推薦、比價、行銷等所有核心服務,而一旦資料錯誤,整條生態鏈都會受影響。

挑戰:跨商家、跨格式的混亂世界

  • 不同商家以各自命名與格式上傳商品。
  • 品牌、型號、容量、包裝數量常缺漏。
  • 傳統規則比對維護成本高、支援新品與長尾商品困難。

解法:建立標準化商品目錄平台

Rei 介紹了他們從零打造的 Product Catalog Platform

  • 資料接入層:從多來源蒐集商品資料,統一格式。
  • 清洗與標準化層:結合 LLM 與 正規化詞庫,轉換單位、統一品牌名。
  • 服務層:將目錄 API 化,支援搜尋、推薦、行銷模組快速調用。

這樣的設計讓平台能即時更新、降低重工,並支援自動化上架與比價群組功能。

成果與持續優化

導入平台後:

  • 商品上架時間縮短 50%。
  • 屬性完整度提升 40%。
  • 分類錯誤率顯著下降。
    團隊下一步計畫導入 Clustering 與 Embedding 模型,進一步強化「同款商品比對」的精度。

活動收穫與未來展望

三位講者的分享橫跨 AI 應用、流程自動化、資料工程 三個維度,串成一條完整的落地鏈:

主題關鍵價值核心精神
LLM 商品規格萃取提升資料品質與結構化程度資料治理是 AI 成功的起點
AI 驅動測試流程提高測試效率與可維運性把 AI 納入工程流程
EC 商品目錄開發建構產品資料基礎設施讓 AI 成果真正回饋使用者

這次 Hello World 不僅是一場展示,更是一場「工程反思」。
我們從三個方向體悟到共同結論:

  1. 資料為根本 — 沒有乾淨的資料,AI 只是幻覺。
  2. 流程化即落地 — 從開發到測試,每一步都需制度化。
  3. 社群即動能 — 分享能讓經驗轉化為知識,形成正循環。

結語:從分享經驗,到啟發更多交流

在 Hello World 2025 的舞台上,我們三位講者分別從資料治理、測試自動化與產品工程的角度,
分享了 LINE 在 AI 與電商領域的實務探索。
這不僅是一次技術展示,更是一場與社群互相啟發的對話。

我們深刻體會到——AI 不只是模型,而是流程、資料與文化的總和。
唯有在真實環境中落地,技術才能產生價值;唯有透過開放分享,經驗才能被更多人複製、延伸。

未來,我們將持續參與開發者社群,將這些經驗轉化為更多交流與合作的契機,
一起推動技術生態更穩健、更具創造力地前進。