LINEヤフー Tech Blog

LINEヤフー株式会社のサービスを支える、技術・開発文化を発信しています。

そのデータ活用、もういちどチェック!

こんにちは、プラットフォームエンジニアの中山です。

みなさまのサービスや社内業務において、データを活用して課題を解決する機会は少なくないと思います。一方で個人データを取り扱う際には法律やパートナーとの契約を順守することに加えて、プライバシーへの配慮もかかせません。そこで今回は「安心安全のデータ活用」の留意点についてまとめてみました。

ただし、記事の内容がすべてではないことにご注意ください。法律観点はもとより、データのライフサイクル観点でも記載は不十分です。それをふまえ、各章ごとに設けた「Check!」の項目を、データ活用におけるスクリーニングの観点として参考にしてもらえますと幸いです。

(1)自サービスで取得する際の目的説明

表:安心安全のデータ活用のための留意点

個人情報保護法によれば、取得した情報(例えばユーザーがフォームに入力した情報やトラッキングログなど)を個人データ化する際、何の情報をどのような目的で活用するのか 具体的に特定ユーザーに説明 することが必要になります。

【Check!】

  • 規約やプライバシーポリシーなどで目的を説明してるか?
  • 目的は具体的に特定されているか?

(2)自サービスで取得する際の同意

表:安心安全のデータ活用のための留意点

個人情報保護法によれば、ユーザーの同意を得ずに要配慮個人情報(例えば人種、病歴、健康診断の結果、犯罪歴)を取得することは できません 。とはいえ、入力フォーム等で適正に取得する限りにおいては、あらためての同意ポップアップは不要です。

他方、要配慮個人情報ならずとも最近は Cookie に関する同意ポップアップを目にする機会が増えました。この背景には EU の ePrivacy Regulation における Cookie 規制 …

  • マーケティング用途のトラッキング Cookie の利用にはユーザー同意が必要
  • ただしサービス提供に必須(例えばログインセッションの管理)となる Cookie の利用にはユーザー同意は不要

があります。しかし、この同意ポップアップについてはプライバシー保護の観点で実効性を疑う意見(例えば Reflecting on 18 years at Google)もあります。

one of the most annoying is the prevalence of pointless cookie warnings we have to wade through today

すでに Safari の 3rd-party Cookie は廃止され、Mozilla Firefox はドメインごとに Cookie を分離して管理するため 3rd-party Cookie による名寄せができません。そして今年はいよいよ Google Chrome の 3rd-party Cookie が 段階的に廃止 されます。ますます実効性が失われてゆくこの規制(そしてポップアップ)は今後どうなってゆくのでしょうか?

【Check!】

  • 要配慮個人情報を取得しているか?
  • EU 域内ユーザー(そこに住む日本人も含め)にも利用されるサービスか?

(3)他事業者からの第三者提供の際の同意や法律対応

表:安心安全のデータ活用のための留意点

個人情報保護法によれば、他事業者から個人データが提供されるのか、もしくは

  • ウェブサイトやアプリで発生したイベント情報
    (例えば閲覧、クリック、購入、インストールなどの情報や検索キーワードなど)

のような 個人関連情報 が提供され、さらにそれを受領側で個人データ化するのか、によってやるべきことが異なります。

表:提供側と受領側でそれぞれ何をすべきか

改正個人情報保護法の施行(2022 年 4 月)以前は個人関連情報、例えばウェブサイトの閲覧情報を個人データとして取得する場合、ユーザー同意は不要でした。このとき、ユーザーは自身が関与できないところで 3rd-party Cookie に紐づけられたウェブサイトの閲覧情報によってスコアリングされ、スコア次第で社会的に不利な扱いを受けてしまうかもしれません(例えば 個人情報保護法に基づく勧告)。こうした背景からユーザー同意(表の右下)が必要になりました。

また、今後該当するユースケースの増加を見込んでいる場合、ガバナンスの強化と効率化を目的として記録の内容、保持期間、そして開示請求への対応について標準化~仕組化することを検討してみましょう。余談ですが私も関連する社内プラットフォームの開発を担当しており、一緒に働く仲間も 募集中 です。

【Check!】

  • 他事業者から提供されるコンバージョン情報を会員データベースに蓄積しているか?
  • 記録を作成しているか?それは仕組化すべきか?

(4)自社でデータ活用する場合の配慮

表:安心安全のデータ活用のための留意点

ユーザーの権利利益を侵害しないため、そしてユーザー体験を悪化させないために配慮すべきことはいろいろとあります。

  • 位置情報は慎重に扱う
    (例えば病院や介護施設など、人がどこに所在するかという情報から個人の健康状態や思想信条などが推測できてしまう場合がある)
  • その他センシティブな情報も慎重に扱う
    (例えば要配慮個人情報や、経済状況、人間関係など)
  • 適切な活用のタイミングを考える
    (例えば閲覧後すぐに関連メールが届くとユーザーは気持ち悪さを感じてしまうかもしれない)
  • 統計活用の場合は十分な N を担保する

また、個人情報保護法によれば、自サービスで取得する個人データについて(1)の目的外の活用は できません 。例えば問い合わせ対応を目的して取得したメールアドレスを、広告のオーディエンス連携や類似拡張に活用することはできません。

さらに、他事業者から第三者提供された個人データについて、個別契約によって活用に制約が生じる場合もあります。加えて、プラットフォーマーが定める規約も守らなければなりません。例えば IDFA / GAID にはこのような規約があります。

表:IDFA / GAIDの要件

これらをふまえ、利用目的、個別契約、規約を強制できるような、もしくは逸脱を防げるようなデータの分類や管理方法、プロセスなどを検討しましょう。その定着に向けては データマネージャーが事業部のデータガバナンス意識改善に取り組んだお話 もご参考まで。

あとは、活用されるべきではないデータの混入(例えばリファラやクエリパラメータから誤って混入してしまった個人情報や、データ処理契約書の定めやユーザーからの請求により、本来削除されるべきはずのものが削除されずに残ってしまった個人情報)を検知する仕組みがあれば、さらなる「安心安全のデータ活用」を実現できそうです。関連する取り組みとして アナリストがデータ管理を自動化した話 もご参考まで。

【Check!】

  • 自身に関する情報の使われ方に不安を感じたことはないか?
    (同じことをみなさまのサービスのユーザーは感じているかもしれません)
  • そのデータ、マーケティングに活用してもよいものなのか?
  • 削除漏れの可能性はないか?

(5)委託提供と AI 活用

表:安心安全のデータ活用のための留意点

個人情報保護法によれば、国内の事業者への委託提供の際のユーザー同意は不要です(第三者に該当しない場合)。ただし、委託提供された個人データは 委託された業務の範囲内 でしか扱えません。例えば、営業組織が活用しているホワイトペーパー、掲載された統計情報の元データはこの観点で問題ないでしょうか?

さらに AI モデル登載のマルチテナント SaaS を提供する場合、課題解決力は高く、かつクライアントの負担は少ないことが理想的です。とはいえ、クライアントの個人データを使ってモデルを改善する場合、黄色のセルのような整理は可能でしょうか?

表:クライアント企業の個人データの扱い

この点については

  • サービスの規約に AI での価値提供も含めた委託提供が読み込めること
  • サービスを利用するクライアントのプライバシーポリシーに記載された個人データ利用目的の範囲内であること
  • 上記を前提として 個人情報保護法の FAQ 7-43 などをよりどころとしてロジックを検討

のような提案をしたいのは山々ですが、まずは社内外の専門家にご相談ください。

【Check!】

  • その分析、委託された業務なのか?
  • AI をどのように提供するのか?

(6)他事業者にデータが渡る場合の対応

表:安心安全のデータ活用のための留意点

個人データ、もしくは個人関連情報を第三者提供する場合、個人情報保護法観点で前述(3)と逆の立場での対応が必要になります。なお、個人データを第三者提供する場面において、優越的地位の乱用による強制力の高いユーザー同意が問題視されることがあります。第三者提供がユーザーの権利利益に少なからず影響を与える場合、ユーザーに対して複数の選択肢を提示することも検討しましょう。

技術観点では、外部にユーザー識別子を第三者提供する場合、セクトラル型の識別子(例えば PPID = Pairwise Pseudonymous Identifier のような)を使うことで、外部での名寄せを防止するとともに、漏えいなどのインシデント発生時には識別子の洗い替えが可能になります。

表:提供側と受領側でそれぞれ何をすべきか

ところで、最近データクリーンルームについて耳にすることが多くなりました。データクリーンルームとは

  • 所有者の異なるデータをマッチキーで突合する
  • 突合結果に対しクロス集計などを通じてインサイトを得る
  • ユーザー単位の情報は出力できず、統計値のみを出力する
  • 差分プライバシー技術などを導入しプライバシーに配慮している

のようなソリューションです。例えば事業者Aがアカウントに紐づくメールアドレスとアプリの課金額を持っていて、データクリーンルームを提供する事業者Bがメールアドレスとデモグラ情報を持っていたとします。事業者Aはメールアドレスをマッチキーとしたデータクリーンルームを使うことで、デモグラに応じたアプリの課金傾向を把握し、広告出稿の方針を改善できます。

データクリーンルーム

なお、このケースで事業者Aから事業者Bへの(もしくはその逆方向への)個人データの委託提供と整理した場合、クロス集計ゆえに 混ぜるな危険 に抵触してしまいます。なのでユーザー同意にもとづく第三者提供、といった整理も検討が必要であり、プライバシーに配慮したソリューションとはいえまだハードルも残っています。LINEヤフー株式会社ではこうしたハードルの解消も含め、さらなる「安心安全のデータ活用」促進のため、プライバシーテックの研究 にも積極的に取り組んでいます。

その他の留意点として 外部送信規律 について補足します。改正電気通信事業法の施行(2023 年 6 月)から、利用者の利益に及ぼす影響が少なくない電気通信役務に対し、利用者に関する情報の内容や送信先について、当該利用者に確認の機会を付与する義務が生じました。例えば LINEヤフーでは このように公表 しています。外部送信規律に対応するための調査や、意図せぬ違反を回避するための手段として CSP の活用(例えば こちらの記事 の「他の事業者に対する情報送信調査への活用」など)もご検討ください。

【Check!】

  • ユーザーに複数の選択肢を提示すべきか?
  • 外部に提供する識別子は名寄せ可能か?
  • データクリーンルームは誰がどのような同意をとっているのか?
  • その問題はプライバシーテックで解決できないか?
  • 外部送信規律への対応は必要か?

(7)越境アクセスに関する対応

表:安心安全のデータ活用のための留意点

越境アクセスについて、私たち LINEヤフーの事例を交えてご紹介しますので、他山の石としてください。

個人情報保護法によれば、国内の事業者への委託提供については(5)で述べた通りですが、一方で海外の事業者に対しては 外国にある第三者への提供の制限 が適用されるため、一部の国を除いて委託提供であっても同意が必要とされています。以前、私たちの海外開発拠点からの 越境アクセス について、ユーザーのみなさまにご心配をおかけしてしまいましたが、再発防止に努めております。

また、電気通信事業法の観点でも越境アクセスに対して十分な 利用者周知と安全管理措置 が求められ、さらに 不正アクセス問題 を受けての行政指導もふまえ、全社を挙げてセキュリティーとガバナンスの強化に向けて取り組んでいます。

蛇足ですが、海外ユーザー向けのサービスを提供する場合、海外のルールをふまえ逆方向の越境アクセスについて気にする必要があります。

【Check!】

  • QA や開発における越境アクセスに対して適切な対応はとれているか?

おわりに

いかがでしたか。この記事を通じてみなさまの「安心安全のデータ活用」に少しでも貢献できれば幸いです。蛇足になりますが、グローバルな多言語の協業体制の場合、この記事で用いたレベルの用語(例えば第三者提供 = provision to a third party など)については英訳をチーム内で共有しておくことで、認識齟齬の削減(その結果として「安心安全のデータ活用」)が期待できます。

【Check!】

  • グローバル協業体制か?

ところで LINEヤフーでは「安心安全のデータ活用」を推進するための組織づくり、社内教育、プロセス構築、環境構築、仕組化、プライバシーテックの研究などに取り組んでおります。興味をお持ちの方、同様の取り組みに携わっている方、ぜひ情報交換させてください!