ユーザインタフェース操作のパフォーマンスを公平に計算するには？（CHI 2026採択論文解説）

こんにちは。LINEヤフー研究所でヒューマンコンピュータインタラクション（HCI）分野の研究をしている山中です。

みなさんが新しいマウスを買うとしたら、どんなことを重視するでしょうか。価格や持ちやすさ、ボタン数など、マウスを評価する指標は多岐にわたります。また、マウスを使うゲーマーであれば、少しでも操作性のよい製品を見つけたいと思うかもしれません。

私は以前から、その「マウスの操作性のよさ」に関する研究をしてきました。

私たちは日常的に、マウスカーソルをボタンに合わせてクリックしたり、スマートフォンでアイコンをタップするなど、画面上の目標物を選択する操作をしています。これらの操作は、HCI研究では「ポインティング」と呼ばれます。HCI分野ではポインティングに関する長い研究の歴史があり、その代表例が「ポインティング操作の成績（パフォーマンス）をどのように数値化するべきか」というものです。

LINEヤフーのサービス改善を支えるユーザインタフェース（UI）評価の基盤研究の一環として、私たちはマウスやタッチスクリーンなどを操作するときのパフォーマンスを公平に比較するための手法を検討してきました。

このたび、ポインティングのパフォーマンス数値化に関する研究論文「Normalizing Speed-accuracy Biases in 2D Pointing Tasks with Better Calculation of Effective Target Widths」が、HCI分野のトップカンファレンスであるCHI 2026に採択されました。本記事では、ポインティングのパフォーマンスを適切に数値化する方法を紹介します。

1. 研究背景：速く操作できたらハイパフォーマンスなのか？

2種類のマウスのパフォーマンスを比較するために、ボタンやリンクなどのUI要素をクリックするユーザ実験を考えます。比較指標としてまず思い浮かぶのは所要時間でしょう。たとえば「マウス〔1〕では平均1.2秒でボタンをクリックできたが、マウス〔2〕では平均0.8秒だった」という結果であれば、マウス〔2〕の方がよさそうです。

しかし、この比較には注意が必要です。マウス〔1〕を使うときには、実験参加者が「ミスしないように慎重に操作しよう」と考えていた一方で、マウス〔2〕を使うときには「所要時間を短くすることを意識しよう」と考えていたなら、単純に所要時間だけを比べるのは不公平です。なぜなら、もしマウス〔1〕のミスクリック率が2％、マウス〔2〕は10％だったとすると、必ずしもマウス〔2〕の方がハイパフォーマンスだとは言えないからです。

HCIのポインティング研究では、実験参加者に「できるだけ速く、かつ正確に操作してください」と指示することがよくあります。しかし実際には、同じ人でもその時々で速さを重視したり、正確さを重視したりするなど、優先事項が変化する可能性があります。このような状況は「速さと正確さの一方にバイアスがかかっている」と説明されます。

本研究の目的は、このバイアスの影響をなるべく取り除いて、ポインティング操作のパフォーマンスを公平に比較する方法を見つけることです。

2. フィッツの法則とスループット

ポインティングの研究では、以下のフィッツの法則がよく使われます。

$\mathit{MT} = a + b \log_2\left(\frac{A}{W}+1\right)$

$\mathit{MT}$ は1回のクリック操作にかかる所要時間、 $A$ はボタン中心までの移動距離、 $W$ はボタンの幅、 $a$ と $b$ は回帰分析で決まる係数です。ここでは単純化のために、下図のようにボタンは縦方向に十分大きくて、x軸方向への移動だけを考えればよい状況を想定します。これは「1次元ポインティング」と呼ばれます。

1次元ポインティングにおける移動距離A、ボタンの大きさW、x軸の定義。

フィッツの法則の式のうち、対数項の

$\mathit{ID} = \log_2\left(\frac{A}{W}+1\right)$

は難易度指標（index of difficulty、 $\mathit{ID}$ ）を表します。距離 $A$ が長くてボタン幅 $W$ が小さいほど難易度 $\mathit{ID}$ が高くなり、所要時間 $\mathit{MT}$ が長くなる、という関係があります。

HCI分野では、ポインティングのパフォーマンスを表す指標としてスループット $\mathit{TP}$ がよく使われます。

$\mathit{TP} = \frac{\mathit{ID}}{\mathit{MT}}$

スループット $\mathit{TP}$ は「単位時間あたりに、どれくらいの難易度のポインティングをこなせたか」を表します。

しかし、「所要時間を短くすることを意識しよう」というバイアスがかかると、難易度 $\mathit{ID}$ が同じでも所要時間 $\mathit{MT}$ が短くなるため、スループット $\mathit{TP}$ が高くなってしまう問題があります。実際には、素早く操作するバイアスがかかった状態ではミスクリックが増えるため、それを考慮してスループット $\mathit{TP}$ を低く補正する必要があります。

3. 実効幅による難易度の補正

実験参加者が慎重さを重視すると、所要時間 $\mathit{MT}$ は長くなるデメリットがありますが、クリック座標がボタンの中心付近に集まりやすくなり、ミスが少なくなります。逆に速さを重視すると、所要時間 $\mathit{MT}$ は短くなりますが、それにともなってクリック座標のばらつきが大きくなり、ミスクリックが増えます（下図）。

速さと正確さのいずれにバイアスがかかっても、実効幅を調整してミスクリック率が4パーセントになるようにすると、公平なスループットが算出できる。

HCI研究では、実験後にクリック座標のばらつきに基づいてボタン幅 $W$ を補正し、ミスクリック率を統一する方法が使われてきました。この補正後のボタンの大きさを、実効幅 $W_e$ と呼びます。

$W_e = 4.133\sigma$

ここで $\sigma$ はクリック座標の標準偏差（ばらつきの度合い）です。

正確さを優先して慎重に操作すると、ボタンの中心付近を狙ってミスを減らそうとするので、 $\sigma$ が小さくなり、結果的に実効幅 $W_e$ は小さくなります。逆に素早く操作すると、クリック座標が大きくばらつくので実効幅 $W_e$ は大きくなります。標準偏差 $\sigma$ に $4.133$ をかけることで、「ミスクリック率が4％になる幅」に相当する実効幅 $W_e$ を事後的に推定できます。

この実効幅 $W_e$ を使って補正した実効難易度 $\mathit{ID}_e$ を、

$\mathit{ID}_e = \log_2\left(\frac{A}{W_e}+1\right)$

と定義します。これを使ってスループットを $\mathit{TP} = \frac{\mathit{ID}_e}{\mathit{MT}}$ で計算すれば、実験参加者が速さ重視・正確さ重視のいずれで操作した場合も、「ミスクリック率が4％の公平な条件下で、単位時間あたりどれくらいの難易度のポインティングをこなせたか」が計算できます。

4. 2次元のポインティングタスクにおける標準偏差とスループットの計算

前述の例のような1次元のポインティングであれば、クリック座標のばらつき（標準偏差 $\sigma$ ）はx軸方向だけを見ればよいです。

$\sigma_x = \sqrt{\frac{1}{n-1} \sum\nolimits_{i=1}^{n} (x_i - \overline{x})^2}$

しかし現実的なUIでは、ボタンは円形や四角形などの2次元形状であり、上下左右さまざまな方向に配置されています。そのような状況でのポインティングパフォーマンスを測定するために、国際標準化機構（ISO標準）では下図のように「環状に並んだ円形ボタンを順番にクリックする」という2次元ポインティングタスクを使うことを推奨しています（ISO 9241-411）。

2次元ポインティングタスクで、円形ボタンを環状に配置する例。

このような2次元ポインティングでは、クリック座標の標準偏差 $\sigma$ をどのように測るべきでしょうか。HCI研究では、伝統的に2つの方法が採用されてきました。

1つ目は、1次元タスクのときと同様に、必要な移動方向に沿ったばらつきだけを見る方法です。本研究ではこれを $\sigma_x$ と呼びます。たとえば左下から右上のボタンに向かって移動する場合は、その移動方向を $x$ 軸とみなし、その方向に沿ったクリック座標のばらつきを計算します。

2次元ポインティングではさまざまな方向へ移動しますが、下図のように毎回のクリックに必要な移動の向きを「x軸正の方向」と定義して、 $\sigma_x$ を算出します。下図（右）におけるクリック座標のy軸の値は考慮しません。

2次元ポインティングタスクにおけるx軸のとり方。

2つ目は、クリック座標のx軸・y軸の両方を含めて、2変量標準偏差を計算する方法です。本研究ではこれを $\sigma_\mathit{xy}$ と呼びます。

$\sigma_\mathit{xy} = \sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} \left\lbrace (x_i - \overline{x})^2 + (y_i - \overline{y})^2 \right\rbrace }$

直感的には、 $\sigma_x$ が移動方向に沿ったばらつきだけを見るのに対して、 $\sigma_\mathit{xy}$ はクリック座標が2次元平面上でどれくらい広がっているかを見る指標です。

ある先行研究では、2次元ポインティングタスクでは $\sigma_\mathit{xy}$ を使う方が適切だと主張されていました（https://dl.acm.org/doi/10.1145/1978942.1979181）。近年のHCI分野では、それにならって $\sigma_\mathit{xy}$ を使ってスループット $\mathit{TP}$ を計算している論文が多いです。

しかし、その先行研究よりも古くに策定されたISO標準では $\sigma_x$ を使う方法が推奨されており、それを参照して $\sigma_x$ を使っている研究論文も多くあります。つまり、2次元ポインティングにおけるスループット $\mathit{TP}$ の計算方法は、研究コミュニティ内で統一されていませんでした。

さらに、研究論文によっては「ボタンまでの距離 $A$ ではなく、クリック座標までの平均移動距離 $A_e$ を測定して使うべきだ」と主張されています。また、クリックのために必要な移動方向（x軸）を考えるときに、ISO標準では下図（a）のように「直前のボタンの中心から、今クリックしたいボタンの中心への向き」と定義されています。しかし、連続でボタンをクリックするタスクでは、下図（b）のように「直前のクリック座標から、今クリックしたいボタンの中心への向き」の方が、より現実に即した移動方向と考えられます。

2種類のx軸の定義。直前のボタンの中心点を使うか、または直前のクリック座標を使うかによって、クリック座標の標準偏差の計算結果は変わりうる。

まとめると、スループット $\mathit{TP}$ の計算には以下のバリエーションがあり、本研究では公平にパフォーマンスを比較するために最もよい方法を検証しました。

クリック座標の標準偏差は、 $\sigma_x$ と $\sigma_\mathit{xy}$ のどちらで測るべきか？
移動距離は、ボタン中心までの距離 $A$ と平均移動距離 $A_e$ のどちらを使うべきか？
x軸は、直前のボタン中心と、直前のクリック座標のどちらを使って定義すべきか？

このように2種類の $\sigma$ 計算方法、2種類の距離定義、2種類のx軸定義があり、 $\mathit{ID}_e$ の計算方法は以下のように $2\times 2\times 2=8$ 種類あります。

$\mathit{ID}_e$ の計算方法
$\sigma_\mathit{x}$ を使った $W_e$ 、ボタン中心までの距離 $A$ 、直前ボタン中心からのx軸
$\sigma_\mathit{x}$ を使った $W_e$ 、ボタン中心までの距離 $A$ 、直前クリック座標からのx軸
$\sigma_\mathit{xy}$ を使った $W_e$ 、ボタン中心までの距離 $A$ 、直前ボタン中心からのx軸
$\sigma_\mathit{xy}$ を使った $W_e$ 、ボタン中心までの距離 $A$ 、直前クリック座標からのx軸
$\sigma_\mathit{x}$ を使った $W_e$ 、平均移動距離 $A_e$ 、直前ボタン中心からのx軸
$\sigma_\mathit{x}$ を使った $W_e$ 、平均移動距離 $A_e$ 、直前クリック座標からのx軸
$\sigma_\mathit{xy}$ を使った $W_e$ 、平均移動距離 $A_e$ 、直前ボタン中心からのx軸
$\sigma_\mathit{xy}$ を使った $W_e$ 、平均移動距離 $A_e$ 、直前クリック座標からのx軸

それに加えて、もともとの $\mathit{ID}$ の定義である $\mathit{ID} = \log_2\left(A/W+1\right)$ もあります。

5. 2次元ポインティング実験

Yahoo!クラウドソーシングを用いて、マウス操作による2次元ポインティング実験を実施しました。実験参加者（342名）は、環状に配置された25個の円形ボタンを順次クリックしていきます。

前述のように、実験参加者が速さ・正確さのいずれを優先した場合であっても、そのバイアスの影響を受けないようなスループット $\mathit{TP}$ が算出される計算方法が望ましいです。言い換えると、ある人が「速さを重視して操作しよう」「慎重に操作しよう」と意識しても、その人自身のパフォーマンスの高低が変化するわけではないため、一定のスループット $\mathit{TP}$ が算出されるのが理想的です。

そこで本実験では、以下の3種類のバイアス条件を用意し、参加者には各条件で意識的に速さと正確さを変えて操作するように依頼しました。

正確さ優先：所要時間を気にせず、できるだけミスクリックしないように操作してください。
ニュートラル：できるだけ速く、かつミスクリックしないように操作してください。
速さ優先：ある程度はミスクリックしてよいので、できるだけ速く操作してください。

実験参加者は前もって「次のセッションでは、速さ重視で操作してください」というように指示されます。そして各参加者が上記3つの条件をすべて体験しました。

6. 実験結果

まず、実験参加者が3種類の指示に従ってバイアスを変えてくれたかを確認します。ボタンを1つクリックするのにかかった平均所要時間とミスクリック率は下図のようになりました。

操作時のバイアス条件ごとの所要時間とミスクリック率の結果。

正確さ優先のときは所要時間が長いですがミスクリックが少なく、速さ優先のときは短時間ですがミスが多いという、指定したとおりの操作をしてもらうことができました。

次に、3種類のバイアス条件におけるスループット $\mathit{TP}$ を、8種類の $\mathit{ID}_e$ の計算方法、およびもともとの $\mathit{ID}$ の定義を使って算出したのが下図です。

難易度指標の計算方法ごとの、各バイアス条件におけるスループットの値。

$\mathit{ID}$ の計算方法ごとにスループット $\mathit{TP}$ の値が異なることが読み取れます。さらに、同一の $\mathit{ID}$ 計算方法であっても、3種類のバイアス条件の間でスループット $\mathit{TP}$ の値が異なります。特に、「正確さ優先」条件においてスループット $\mathit{TP}$ の値が低めに算出される傾向があるようです。

さて、3種類のバイアス条件間で、より安定的なスループット $\mathit{TP}$ の値を算出できた $\mathit{ID}$ 計算方法はどれでしょうか。ここでは安定性の指標として、変動係数（coefficient of variation）を使います。変動係数は、3種類のバイアス条件におけるスループット $\mathit{TP}$ の標準偏差を平均値で割った値をパーセンテージで表したものです。

たとえば上図の「元の定義どおりの $\mathit{ID}$ 」は、スループット $\mathit{TP}$ の値が3.960、4.411、4.757なので、標準偏差は0.3997、平均は4.376です。よって変動係数は9.132％となります。この値が小さいほど、3種類のバイアス条件間で近いスループット $\mathit{TP}$ の値が算出されたことになり、望ましい結果です。

$\mathit{ID}$ の計算方法ごとの、スループット $\mathit{TP}$ の変動係数を下図に示します。

難易度指標の計算方法ごとの、スループットの変動係数。

最も変動係数が小さかったのは、緑色のバーで示した「 $\sigma_x$ 、平均移動距離 $A_e$ 、直前ボタン中心からのx軸」を使って計算する方法でした。そして、 $\sigma_\mathit{xy}$ よりも $\sigma_x$ を使った方が、一貫して変動係数が小さいことがわかります。一方で、距離およびx軸の定義はあまり変動係数には影響しておらず、いずれを採用しても問題ないことも読み取れます。

7. おわりに

本記事では、2次元ポインティングタスクにおいて、速さと正確さのバイアスにかかわらず公平なパフォーマンス指標（スループット）を算出する方法を紹介しました。

近年の研究では、クリック座標の2変量標準偏差 $\sigma_\mathit{xy}$ を使うことが提唱され、その方法を採用した論文が多くありました。しかし本論文では、バイアスの影響をより低減して公平な比較をするためには、従来の1変量標準偏差 $\sigma_x$ を使うことを推奨しています。これはISO標準で定められている計算方法を支持する結果でした。

この結論は、マウスやタッチ入力、バーチャルリアリティ空間でのコントローラ操作など、さまざまな環境におけるUI操作パフォーマンスを比較する研究に関係します。たとえばHCI分野の研究論文では、「従来の入力機器〔1〕よりも、我々の提案する新しい入力機器〔2〕の方がパフォーマンスが高かった」と報告されることが多くあります。しかし、もし入力機器〔1〕を使うときには実験参加者が正確さを優先しており、入力機器〔2〕を使うときには速さを優先していたなら、そのパフォーマンス差は入力機器〔2〕のよさを示しているのではなく、単に実験時のバイアスのかかり方の違いを反映しているだけかもしれません。

UI操作のパフォーマンス評価では、「速ければよい」と単純に言えない場面が多くあります。速さと正確さのバイアスをどう扱うかによって、研究の結論は変わりえます。本研究が、今後さまざまな入力機器や操作手法をより公平に比較するために役立てば幸いです。

なお、本論文のプレプリントはarXivで公開されているので、興味のある方はぜひご覧ください（https://arxiv.org/abs/2602.04432）。