LINEヤフー Advent Calendar 2024の参加記事です。
こんにちは。LINEヤフーのFoundation Models開発担当チームです。われわれのチームでは、画像と言語のマルチモーダル基盤モデルの開発を行っています。
この記事では、われわれが開発したLINEヤフー独自の基盤モデルを用いた事業貢献事例を紹介したいと思います。われわれの基盤モデルの一部は社外公開されており、どなたでも使えるのでぜひ試してみてください。また、公開モデルは過去のテックブログで紹介してるので、興味のある方は読んでいただける と幸いです。
- LINEヤフー Tech Blog: https://techblog.lycorp.co.jp/ja/20240514b
- 公開モデル: https://huggingface.co/line-corporation/clip-japanese-base
はじめに
弊社が運用するYahoo!オークションはインターネット上でオークションに参加できるサービスで、個人が気軽に出品・入札できます。みなさまにお買い物やお取引を安心・安全に楽しんでいただくために多種多様な商品を取り扱う一方で、弊社が不適切と考える商品についてはガイドラインを定めルールに基づいて削除しております。全ての出品物は機械学習を援用したシステムでガイドラインを満たすか審査されており、常時出品数は9,300万点となっています。
この度、出品禁止物判定の一部でわれわれの基盤モデルが導入されることになり、2024年8月から実運用が開始されています。今回は従来モデルの課題と基盤モデル導入による効果を紹介します。
従来モデルの課題
出品禁止物では多岐に渡る商品(例. たばこ、医薬品、警察関連品、アダルト…)が指定されており、出品審査における目視検査の負荷を低減するため、前処理として機械学習モデルを用いた禁止物の判定が実施されています。
基盤モデル導入前のシステムでは、多様な禁止物に対して個別のモデルを学習して運用していました(下図の左側)。しかしながら、従来モデルでは学習データの収集とモデル作成に多大な時間を要しており、新規の禁止物が登録された場合に即座に対応できないという課題を抱えていました。
基盤モデルによる対策
上記の課題は大規模データで学習した画像-言語のマルチモーダル基盤モデルを用いることで解決できます(下図の右側)。われわれの基盤モデルは画像だけではなく言語も理解できるため、テキストを用いて禁止物を柔軟に指定・追加できます。また、大規模データで学習されていることから、特殊なケースを除けば追加学習なし(zero-shot)で正確な禁止物判定が可能となっています。
しかし、テキストでの禁止物の指定は柔軟性が高い一方で、適切なテキストを指定しないと高い検出精度が得られないという課題があります。今回の導入にあたっては、サービスの担当者が試行錯誤しながらテキストを決めましたが、その中にはドメイン知識を活かしたものも含まれています。このようなテキストは開発者が簡単に思いつけるものではなく、実応用におけるドメイン知識の重要性を再認識しました。
効果
われわれの基盤モデルは教師有学習を用いた従来モデルと同等の精度を達成しており、サービス品質を維持しながら運用コストの大幅削減に貢献しました。具体的には以下の効果を挙げることができ、基盤モデルを用いて想像以上の事業貢献ができたと考えています。
- 禁止物1項目で約70時間を要していたモデル作成の工数削減
- これまで未対応だった項目への対応
- モデル内製化(従来モデルでは社外サービスを利用)による固定費の削減: 約2千万円/年
おわりに
今回はLINEヤフー独自の基盤モデルを用いた事業貢献の事例を紹介しました。弊社は多くの自社サービスを抱えており、社内でしか手に入らないデータを用いた独自の基盤モデル開発に携わることができます。また、高性能な基盤モデルを開発できれば事業貢献できるチャンスが多く、開発と実応用の両面で基盤モデル開発の環境が整っています。われわれのチームでは基盤モデルの高度化にむけた研究開発を継続しており、今後も新たなモデル公開や事例紹介をしていきたいと考えています。最後までお読みいただきありがとうございました。