一橋大学ソーシャルデータサイエンス研究科修士1年の日高逸稀です。2025年10月2日から10月31日まで4週間、分析ユニット内のソーシャルコマースディビジョンにて、インターンに参加させていただきました。本記事では、インターンシップ期間中に私が取り組んだこととその成果についてご紹介します。
背景・課題
LINEギフトとは
LINEギフトとは、LINEアプリを通じて友だちや家族に、さまざまなプレゼントを贈ることができるサービスです。2015年にサービスを開始し、累計ユーザー数は2024年7月時点で3,500万人を超 えています。年間利用者数は、贈った人が約1,000万人、もらった人が約1,500万人と多く、現在も成長し続けているサービスです。
LINEギフトのサービス概要については、以下のページをご参照ください。
取り組んだテーマ
急速に成長を続けるLINEギフトでは、これまでに大量の商品レビューが蓄積されています。しかし、これらのデータは十分に分析・活用されておらず、意思決定への反映が限定的であるという課題がありました。
一般的なECサービスにおいては、レビュー(星評価、件数、テキスト内容、画像の有無、いいね数など)が購買(CV)に影響を与えることが知られています。しかし、LINEギフトは「贈り手/受け手」という二者関係や、「季節性」「カジュアル価格帯」「即時〜後日受け取り」といったギフト特有の購買文脈を持つため、どの要素がどの程度購買行動に寄与しているかは明らかになっていませんでした。
その結果として、レビューの表示仕様(露出位置・並び順・ハイライトなど)やレビュー獲得施策(購入後リマインド、インセンティブ付与など)の優先度設定が属人的になり、改善施策に定量的な根拠を欠く状況にありました。
そこで本インターンでは、レビューデータの基礎的な構造を明らかにし、さらにレビューがCVに与える影響を定量的に評価することをテーマに取り組みました。具体的には、レビュー分布の可視化 や、特徴量(平均評価値、レビュー数、上位表示されているレビューの内容など)がCVに及ぼす影響分析を通じて、レビュー活用の方向性を検討しました。
分析のゴール
まず、最初に本分析におけるゴールを定義しました。これによりどのような分析やアウトプットが必要になるかを前もって明確化でき、見通しよく分析を進めていくことができるため、インターン先の部署ではプロセスが標準化されていました。
今回は、以下の状態をゴールとして定義しました。
- LINEギフトにおけるレビュー改善施策において、定量的な指標に基づいて意思決定ができる状態
分析結果
Q. LINEギフトにおけるレビューにはどういった内容が多く含まれている?
結論として、「梱包」「配送」「デザイン」「シーン」といったテーマが、全商品に共通して多く見られるトピックとして抽出されました。また、これらに加えて、商品カテゴリごとに固有の話題も確認されました。
特に「シーン」に関するトピックは、LINEギフト特有の特徴的な内容です。たとえば「母の日でプレゼントをいただきました」「誕生日にもらいました」といった、ギフトを受け取った状況やイベントに言及するレビューが多く見られ、サービスのコンセプトとレビュー内容が一致している点が興味深い結果となりました。
全商品を対象としたトピック分析
まず、全商品のレビューを対象に BERTopic を用いてトピック分布を可視化しました。
分析の目的が「全商品に共通する話題の把握」であったため、特定カテゴリ(例:Topic 0 の「フラワー・グリーン」単独)に偏るトピックではなく、複数カテゴリにまたがるトピック(例:Topic 1、Topic 4)に着目しました。
その結果、全商品に共通する主要トピックとして以下が確認されました。
- 梱包
- 配送
- デザイン
- シーン
これらのトピックは、後述するカテゴリ別分析においても再現性が見られ、LINEギフト全体に共通する関心領域であることが示唆されます。
各商品カテゴリごとのトピック分析
LINEギフトにおいて利用数の多い主要商品カテゴリである、チケット・金券/食/ビューティー/フラワー・グリーン/インテリア雑貨についてそれぞれのレビューを対象にトピック分析を可視化しました。
ここでは、その中から特に特徴が顕著に見られた チケット・金券 と ビューティー の2カテゴリを取り上げて紹介します。
チケット・金券


チケット・金券カテゴリでは、利用体験や使用制約に関する話題が多く見られました。主なトピックは以下の通りです。
- コード決済・アプリ操作体験
- 例)「〇〇でのコード入力が手間なので、バーコードかQRコードにしてもらいたいです」
- ギフト対象外商品への不満
- 例)「タバコを買ってねとプレゼントしてもらったが、タバコの購入には使えず、お釣りも貰えない。コンビニでタバコ以外に一度に3,000円も使わないので困りました」
- 金額・チケット使用に関する意見
- 例)「700円だと使いづらい。500円を2枚とか、400円くらいの方が気軽に使えると思います」
これらのトピックから、金券系ギフトでは“使用体験のスムーズさ”や“金額設定の柔軟性”が満足度に直結することが分かりました。
ビューティー


ビューティーカテゴリでは、ギフトとしての体験価値やデザイン性に関する話題が中心となりました。主なトピックは以下の通りです。
- ラッピング・デザイン選択
- 例)「誕生日プレゼントでもらいました。2日後に届きました。好きな色を選べてとても嬉しかったです!」
- 梱包・包装に関する不満
- 例)「ラッピングはかなり大きな箱に入っていました。もう少し小さい箱でも良かったかな?」「物に対して箱が大きかったのが残念です。」
- 香り・サイズのバリエーション
- 例)「サイズは小さいですが4種類入っていて、それぞれ香りやテクスチャーが違い、自分の好みを試せました。」
- 携帯しやすさ
- 例)「コンパクトでバッグに入れて持ち運べて便利。保湿もしながらUV効果もあって良いです。」
これらのトピックから、ビューティー商材では“見た目や体験の心地よさ”が評価の中心であり、ラッピングや香りなどの感性価値が購買満足度を左右していることが分かりました。
Q. 全商品に共通して多く見られるトピックについて、各切り口ごとに特徴はある?
結論としてはYESで、商品カテゴリ、利用シーン(母の日、父の日、クリスマス、バレンタイン、ホワイトデー、誕生日)、宛先区分(友だち宛or自分宛)の切り口ごとに特徴が見られました。
以下の7つの観点 を設定し、レビュー内にそれらが 含まれているか/ポジティブかネガティブか をLLMで自動判定し、切り口別に比率で比較しました。
- 商品の質:味・見た目・機能・量など商品の中身に関する評価
- 配送面:到着の速さ・受け取り体験
- 梱包面:破損有無、包装・ラッピングの丁寧さ
- デザイン:見た目・パッケージ
- 送り手への言及:贈ってくれた人への感謝・関係性・文脈
- シーンへの言及:贈答シーン(母の日、誕生日、季節行事など)
- ギフトとしての評価:ギフト適性や再利用意向に関する評価
ここでは、利用シーンと宛先区分の分析結果を紹介します。
利用シーン
上図から、父の日/母の日のレビューでは「送り手への言及」を記載するレビューが多いことが分かります。この傾向は、他のシーンに比べて「誰から貰ったか」を明示しやすい(=子どもからの贈り物である)ことが影響していると考えられます。
下図では、父の日/母の日において配送面のネガティブレビューがやや多い傾向が見られました。これは物流繁忙期に伴う配送遅延の影響と考えられますが、実際の文面を確認すると、「早く届きすぎた」ケースもネガティブとして分類されていたことが分かりました。例1)普段と違った志向で選んでくれて、気遣いの余裕も感じられ気持ちよい贈り物でした。父の日は物流がタイトだったのか、最短期日には届かず、早めに時間指定に変更が適策のようでした。例2)娘が私がアイス好きだと思ってアイスのギフトにしてくれました。娘は母の日に届くようにと思って送っていたようですが、前々日から宅急便でお届けの不在票があったことを伝えたら残念に思ったようです。
宛先区分別


下図の結果から、友だち宛(to_friend)よりも自分宛(to_self)の方がネガティブなレビュー比率が高い傾向が見られました。
これは、ギフトの特性上、友だち宛のレビューは受け取り手による投稿のため、ネガティブな内容を避ける傾向があるためと考えられます。一方で、自分宛の場合は購入者本人がレビューを書くため、商品の質や配送面に対してより客観的・批判的な評価が現れやすいことが分かりました。
この傾向は星評価値にも一致しており、友だち宛のギフトレビューは自分宛よりも平均評価が高く、レビュー内容と評価スコアの整合性が確認できた点も興味深い結果です。

Q. レビューはCVに影響を与えるか?
結論としては 「Yes」。レビューの件数や、上位表示されるレビュー内容は、商品カテゴリごとに異なる形でCV(購入)に影響を与えることが確認されました。
分析概要
レビューがCVにどのような影響を与えるのかを検証するため、LINEギフトのセッションデータを用い、LightGBM によるモデルを構築しました。目的変数を「CV有無」とし、特徴量の寄与度をSHAP(Shapley Additive exPlanations)値によって解釈しました。
分析は以下の2軸で実施しました。
- (1) 全体モデル:LINEギフト全体の傾向を把握
- (2)カテゴリ別モデル:商品カテゴリごとの違いを分析
また、レビューデータの純粋な効果を推定するために、モデルには交絡要因を含む複数の制御変数を導入しました。これにより、たとえば「購買数の多いアイテムほどレビュー数も多い」といった人気や露出の影響をできるだけ統制しつつ、レビュー関連特徴量がCVに与える純粋な影響を推定できると考えました。
| 特徴量群 | 変数 |
|---|---|
| アイテム関連 | セッション時点でのアイテム累計購買数, レビュー累計総数, 平均レーティング |
| ユーザー関連 | セ ッション時点でのユーザー累計購買数, ユーザー属性 |
| レビュー内容関連 | 上位表示レビュー5件の内容特徴(観点の有無・感情スコア), 観点別(配送・梱包・デザインなど)の有無および感情極性 |
| その他交絡変数 | その他交絡変数時期・キャンペーンなどの影響を制御 |
レビュー数とCVの関係

SHAP値とレビュー数の散布図から、レビュー数の増加に伴いCV率が上昇する傾向が見られました。ただし、一定件数(約300件前後)を超えると効果は頭打ちとなり、単純なレビュー数の増加ではCV向上が限定的であることが示唆されました。
さらに、点の色分けで示したユーザー属性(購買経験数)を見ると、
- 新規ユーザー:およそ150件付近から効果が顕著に
- 既存ユーザー:300件付近で効果の分岐点
という傾向が確認されました。つまり、新規ユーザーはレビュー数の影響を早期に受ける一方で、既存ユーザーはより多くのレビュー情報を求める傾向があることがわかりました。
星評価値とCVの関係

評価値が高いほどCV率は上昇する傾向が見られましたが、単純な線形関係ではないことも明らかになりました。特に、4.0〜4.5帯 と4.5〜5.0帯の間にCV率の差が顕著であり、4.5以上の商品が購買意欲を強く後押ししている一方、4.0〜4.5帯では相対的にCV率が低下する傾向が見られました。
また、LINEギフトのレビュー分布は全体的に評価5に集中しており、1〜4の評価はごく少数です。このため、高評価帯(4.0〜5.0)の中でのわずかな評価差が、CVの差を生み出している可能性があると考えられます。
レビュー上位表示内容とCVの関係
レビューの上位表示内容が購買行動(CV)に与える影響を詳しく見ると、カテゴリによってその要因が異なることが分かりました。ここでは、代表的な例として「ビューティー」と「食」の2カテゴリを取り上げます。
ビューティー

ビューティー商品においては、レビューの本文内容そのものがCVを大きく左右していました。特に、配送面や梱包面に関するポジティブな記述を含むレビューが上位に表示されている場合、購買率が高まる傾向が確認されました。たとえば「注文から配達まで2日間。めっちゃスムーズ、開封後、商品は黒い紙で包まれてて高級感がすごい」「まず、梱包がかわいい!箱を開けた際にテンションが上がります」といったレビューは、購買意欲を強く喚起する方向に働いていました。
興味深いのは、これらのレビューに多く見られる見た目や開封体験へのこだわりです。ビューティーカテゴリの購入・贈答者は女性が多く、レビューの内容からも、商品の中身以上に「開けた瞬間の印象」「贈り物としての華やかさ」などの感性的価値を重視している傾向が読み取れます。つまり、「機能的な良し悪し」よりも「自分や相手がどう感じるか」という情緒的体験が購買判断に直結していると言えるのではないかと思います。
一方で、上位レビュー内に「ギフトとしての評価」へのポジティブな言及が存在しない場合、CV率が低下する傾向も確認されました。これは、ビューティー商品が「自分用」よりも「誰かに贈る」文脈で選ばれるケースが多いためであり、贈り物として喜ばれるかどうかが購入検討時の最終判断材料となっていることを示しているのではないかと考えられます。
総じて、ビューティーカテゴリでは、デザイン・ラッピング・体験の美しさといった外面的・感性的要素が購買の主要因となっており、これは他カテゴリとは異なる顕著な特徴といえます。
食

食カテゴリにおいても、レビュー本文の内容はCVに顕著な影響を与えていました。特に、配送面、送り手への言及、シーンへの言及がポジティブであるレビューが上位に表示されている場合、購買率が高まる傾向が確認されました。
たとえば「注文してすぐ届き、フルーツがどれも綺麗で美味しかった」といった配送体験に対する満足や、「母から誕生日にもらいました。自分では買わないものをもらえて嬉しかった」といった送り手への感謝を含むレビューが、購 買意欲を高める方向に働いていました。さらに、「母の日のご褒美スイーツとして嬉しかった」など、特定のイベントや贈答シーンへの言及もCVを押し上げる要素として機能していました。
また、前段のトピック分析の結果でも、レビュー内に「母の日」や「誕生日」など特定のシーンに関する言及が多いことが特徴的でした。こうしたシーンの記述が購買率に寄与していることからも、購入検討者にとっては「他の人がどんな場面でどのように贈っているか」という情報が、ギフト選定時の具体的なイメージ形成や安心感につながる重要な判断材料となっていることが分かりました。
まとめ
本インターンでは、LINEギフトにおけるレビューデータを対象に、構造的な特徴の把握とCV(購買率)への影響分析を行いました。分析を通じて、レビューには「梱包」「配送」「デザイン」「シーン」といった共通トピックが多く含まれること、さらにカテゴリ・シーン・宛先といった切り口ごとに特徴的な傾向が存在することが明らかになりました。
また、LightGBMとSHAP値を用いた定量分析により、レビュー数や上位レビューの内容がCVに有意な影響を与えていることを確認しました。特に、
- 新規ユーザーはレビュー数150件付近から購買率が上昇
- 既存ユーザーは300件付近で効果が頭打ちといったユーザー属性別の差異が見られ、レビュー情報が購買意思決定に果たす役割の大きさを示しました。
これらの結果をもとに、事業部には以下のような改善・施策案を提案することまでインターン期間中に行うことができました。
- レビュー数に基づいた投稿リマインドおよび獲得施策
- 分析結果のレビュー数に基づいてレビュー投稿リマインドおよび獲得施策を打つことで効果を効率化。
- レビュー投稿時のトピック提案機能
- 「梱包」「デザイン」「シーン」など主要観点を提示し、書き漏らしを減らすとともに入力負担を軽減。
- レビュー表示におけるトピック選択・要約機能
- 閲覧ユーザーが関心のある観点別にレビューを絞り込み・要約できる仕組みを検討。
- レビュー上位表示アルゴリズムの改善
- CVに寄与するポジティブな観点(配送・体験・贈答シーンなど)を重視した並び替えロジックを導入。
これらの提案はいずれも、当初掲げたゴールである「レビュー改善施策を、定量的な指標に基づいて意思決定できる状態にすること」を具体化するものでした。分析の過程では、自分の力不足や検討の浅かった部分も多くありましたが、レビューデータを定量的に捉え、意思決定に結びつける一歩を示せたのではないかと思います。
感想
4週間という短い期間でしたが、分析設計から発表まで一貫してサポートしてくださった分析ユニットの皆さん、事業部の皆さん、本当にありがとうございました。特にメンターの山下さん、上長の橋本さん、岡田さんには、日々的確なアドバイスやご指摘をいただき、タイトなスケジュールの中で分析を形にすることができました。心から感謝しています。
LINEヤフーという大規模サービスを支えるDS(データサイエンス)チームの一員として、分析の一連の流れを実践的に学べたこの4週間は、自身の成長を強く感じると ても濃密な時間でした。また、内部レビューや共有会で前向きな反応をいただき、4週間の頑張りが報われたようで本当に嬉しかったです。
この4週間で学んだことを活かして、これからも成長していきたいです。支えてくださった皆さん、本当にありがとうございました!
メンターからの一言
本インターンで日高さんのメンターを務めました、山下皓太郎です。日高さんには、DSとして、分析設計からデータ整形・分析実施、結果のレポーティング、そして事業側への共有・施策提案までを一気通貫で担当していただきました。
インターン期間はわずか4週間でしたが、事前学習や環境構築、ブログ記事の作成も含めると、実際に課題に取り組めたのは約10営業日ほど。非常にタイトなスケジュールで、正直、私自身も完遂できるか不安を感じていました。しかし、日高さんは高い理解力と粘り強さ、そして何より強い熱意を持って課題に臨んでくださり、見事に最後までやり遂げてくれました。
最終発表では、約30名の関係者が参加し、日高さんの報告に熱心に耳を傾け、活発な議論が交わされました。その場の雰囲気からも、非常に質の高いアウトプットが生まれたと実感しています。
日高さんが今回の経験を糧に、今後さらに多くの場でご活躍されることを心より期待しています。また、いつか一緒にお仕事できる日を楽しみにしています。


