LINEヤフーの技術カンファレンス「Tech-Verse 2026」の公式記事です。
はじめに
こんにちは。LINEヤフーで大規模データ基盤の運用を担当している平山、沼田、小笠原、小川です。
LINEヤフーでは、検索・ポータル、eコマース、メッセンジャー、広告など幅広いサービスを支えるため、大規模なデータ基盤を運用しています。その中核となるHDFS(Hadoop Distributed File System)は、旧LINEと旧ヤフーそれぞれの主要なクラスタを合わせて、総容量1エクサバイト(EB)を超える規模に達しています。
このような規模のHDFSを運用する中で、私たちは大きく2つのテーマに向き合ってきました。
1つ目は、HDFSを中心とした大規模データ基盤の運用における課題です。
データ増加に伴うスケーリング上の制約や、運用上のボトルネックに対してどのように対応してきたのか、またその過程でどのような構成や利用形態が形成されてきたのかを整理します。
2つ目は、組織統合に伴うデータ基盤の連携です。
異なる設計思想で構築されたデータ基盤をどのように接続し、データの相互利活用を実現するかという課題です。