「普通じゃない」ことが普通

自分が「普通じゃない」というように思ったことってありますか?もしそのように思ったことがあるならば、あなたは普通です。

 


 

人間を評価する際にはどのようなものさしで評価すればいいだろうか?性格だったり、外見だったり、頭の良さだったり、収入だったりといろいろある。結局何が重要かというと、人間を評価する際の評価基準はたくさんあるということである。もし「ものさし」が{N}個あるならば、一人の人間は{N}次元ベクトルの値として評価できるはずである。言い忘れていたが、ここではパラメータの値は実数値であると仮定する。

つまり人間は{\mathbb{R}^N}の元として表すことができる。

ここで、{N}の具体的な値は不明である。100かもしれないし、100万かもしれないし、1無量大数かもしれない。ただ、ここでは{N}は有限の値を取るものとする。理由は、ヒトはせいぜい原子の集まりで、恐らくヒトを構成する原子の数も高々有限だろうからである。(メタ的なことを言うと、無限だと以降の議論か面倒くさいから有限だということにしておく。)

すると、世の中に人間はたくさんいるので、パラメータの分布を取ることが出来る。すると、以下のような確率変数で表すことができる。

$$(X_1,\ldots,X_N)$$

ここで、{X_i}{\mathbb{R}}値確率変数である。

 

ここで以下のような仮定をする:この確率変数は多次元正規分布に従っている。

このとき、確率密度関数は以下のようになる。

$$p(x)=\frac{1}{\sqrt{(2\pi)^N\det{C}}}\exp\left(-\frac{1}{2}(x-m)^tC^{-1}(x-m)\right)$$

ここで、 {C}は分散共分散行列である。具体的には、{N}次正方行列であって、{i,j}成分が{E[(X_i-E[X_i])(X_j-E[X_j])]}であるようなものとする。

{m}は平均ベクトルである。具体的には、{m=(E[X_1],\ldots,E[X_N])^t}である。以降は{m=0}とする。パラメータを平行移動して平均が0になるようにすればいいので自然な仮定である。

 

さらに、以降は{C=I_N}{I_N}単位行列、つまり、{X_1,\ldots,X_N}は互いに独立で同分布である)と仮定する。「〇〇と××には相関関係があるじゃないか」みたいな考えが浮かびそうだが、その点については心配する必要はない。

{C}は対称行列であるため、直交対角化することができる。{C=P\Lambda P^{t}}とする。このとき、{(Y_1,\ldots,Y_N)^t=P^t(X_1,\ldots,X_N)^t}と定める。
すると、

$$ p(Py)=\frac{1}{\sqrt{(2\pi)^N\det{C}}}\exp\left(-\frac{1}{2}y\Lambda^{-1}y\right)$$

となる。これは、{C}固有値{\lambda_1,\ldots,\lambda_N}とおくと(注意:{C}は正定値行列であるため{\lambda_i\geq 0}である。)

$$=\prod_{i=1}^{N}\frac{1}{\sqrt{2\pi\lambda_i}}\exp\left(-\frac{1}{2\lambda_i}{y_i}^2\right)$$

というようになる。つまりパラメータをうまく取り直せば{Y_1,\ldots,Y_N}は独立であるとみなせる。{\lambda_i=0}となっているものについては除外しても問題ない。独立に取ったあとで{Y_i\to \frac{Y_i}{\sqrt{\lambda_i}}}と変換すれば{\lambda_i=1}とみなすことができる。*1

 
{X}の表記は例えば(ルックス,性格,知能,...)みたいな表記かもしれないが、{Y}はそう単純な表記ではない。いくつかの要素の線形結合で新しくパラメータを作っているため、人間にとって直感的な形をしていないことに注意である。
 
結局、仮定により人間を評価するパラメータは{(X_1,\ldots,X_N)}であり、{X_i}は平均0・標準偏差1の正規分布であり、{i\neq j}のときに{X_i}{X_j}は独立である。何度も言うが、{X_i}が具体的にどのような形をしているかについては、「人間にとって直感的な形をしていない」である。係数決定するということは結局『「人間を評価するパラメータ群」がそれぞれどのような相関関係を持っているか』を調査することになるため議論の本筋から外れてしまうのである。
 

 

ここで、{(x_1,\ldots,x_N)}というパラメータで表記できるような人間{x}の「普通度」をユークリッドノルムの2乗{\left\|x\right\|^2}で定める。具体的には

$$\left\|x\right\|^2={x_1}^2+\cdots+{x_N}^2$$

 ここで、「普通度」というパラメータが小さければ小さいほど、その人間は、各パラメータの値が平均値に近づくため、「普通」であると言える。逆に、普通度が大きいほど、平均から大きく離れたパラメータを持っているため、普通ではないと言える。

 

人間をパラメータで表記して前述のような正規分布となったときに、普通の分布はどうなるだろうか?正解はカイ二乗分布 (Wikipediaのリンク)である。

このとき、平均は{N}であり、分散は{2N}である。

 

また、これは独立同分布の和で表記することが出来るから、{N}が大きい時は中心極限定理により正規分布で近似することができる。つまり{N}が十分大きい時は平均{N}標準偏差{\sqrt{2N}}正規分布に近似できるということである。

 

{N}は十分大きい数である。{N\to\infty}の極限を取ってみた場合、約95%の人間は普通度が{N-2\sqrt{2N}}以上{N+2\sqrt{2N}}以下になる。逆に普通度が0以上{4\sqrt{2N}}以下であるような人の存在確率はそれよりももっと低くなる。

「普通度」は0に近いほどありふれているかと思えば実は違って、ある程度のずれがある場合のほうがより普遍的なのである。

つまり、以下のようなことが言える。「「普通じゃないこと」は至って普通のことである。

これに名前をつけるとするならば、「普通のパラドックス」辺りだろうか。

 


 

まず、{X_i}というパラメータがあったとき、それが「大きいほうがいい」だったり、「小さいほうがいい」だったり、そのようなことは一切ない。結局ここでは平均からどれだけ離れているかを考えているので{X_i}{-X_i}に変換してもそれほど影響は出ない。ざっくりで言えば「偏差値30と偏差値70は、平均から2σ離れているという点で本質的に同じ」という感じである。もっとも、{X_i}というパラメータ群の中に人の考える「偏差値」が入っているかどうかは神のみぞ知るところである。

 

「人間を評価する物差し」というものをベクトルとの内積で考えることもできる。{a=(a_1,\ldots,a_N)}を物差しベクトルとして、人間{x}{a}という物差しで測ると{\langle a,x\rangle}という値が出るというように定める。

 


 

逆に「人間にとって{N}の値が異なる」という解釈をしてみる。

このような状況では以下のようなことが言える

  • {N}が小さい人にとっては、「普通」がありふれたものである。
  • {N}が大きい人にとっては、「普通じゃないこと」がありふれたものである。

つまり言い換えると以下のようになる。

 

人間を評価するパラメータが多ければ多くなるほど、「普通」というものはより珍しい存在になる。

 

逆に、評価するためのパラメータが少なければ少ないほど「普通」というものはありふれたものである。

 

パラメータの大小で良し悪しを決めるような価値基準を導入した場合、もっといろんな解釈ができると思われるが、荒れそうなのでここではやめておく。