厳密さに拘る癖に用語の無責任な用法を好み、感覚の庭を耕している

仮説検定

 「標識くん,これからの時代,統計学ぐらい知っていないと生きていけないよ」

漁師みたいな名前の著者の本を,いつも持ち歩いていそうな友人がこんな風に声をかけてくる.『生きていけない』というが,一体君は何処を生きようとしているのだろう,といった疑問が即座に浮かぶが,直接訊ねることは滅多にない.僕には時代に追い付かなければならないという観念はないし,流れに逆行しようという意思もない.自身の内部で不明瞭な領域に,納得のいく解釈を与えられればそれでいい.ここでいう『納得のいく解釈』とは,べつに正しさを追求したものではないから,世間一般で間違っているとされていることも多い.もちろん,認識は可塑的であるから,より納得のできる解釈によって上書きする場合もある.こうやって蓄えていった知識の全体が個人という一つの宇宙を構成するはずなのだが,正確さを第一に考える人々が多く,死ぬまで構造に埋没している,というのが現代である.一度ぐらい,酷く狭い部屋のなかで長い期間一人で暮らしてみてほしい.そうすれば,正しさに拘ることがどれだけ虚しいか,よく分かるだろうに.

 

 このように独善的な態度を取り続ける僕には,科学は向いていない.何かを正確に捉えようとする気力を持たないと公言する人間が,たとえ科学的に正確なことを主張していたとしても,一体誰が信じてくれるだろうか.患者の治療に全く関心のない医者の診断書など,誰も必要としていないのである.とはいえこの医者,何事にも無関心というわけでもない.彼は,ジョゼフ・ババンスキーという名前の医学者であり,バビンスキー反射という反射作用の発見者である.これは簡単に説明すると,足の裏を細い棒状の物体でゆっくり強く擦り上げると,足の親指が反り返る,という現象である.と,説明すると何故このような反射が起きるのか明確にしたくなるのが通常の感性なのだろうが,彼がこの反射を調べ上げた経緯を想像するほうがはるかに有益,愉快だと思われる.頭痛や動悸,外傷などで病院に訪れた患者に対し,真に解決すべき問題を差し置いて足の裏に棒を突き立て,現象の解釈のためにのみ熱意を燃やし,診察は他人にでも任せてしまえばいいとまで思っていたようだ.おそらく僕も,彼と同質なのだと思っている.仮説という名の壁の創造と破壊を繰り返すひとときには,愛と喜びがある.

 

 実をいうと,ここまで書き下してみるまでは,殆ど興味のない統計学についてなんらかの文章を書くことなど出来るのだろうかと心配していたのだが,仮説という単語が自然に現れたのでようやく安心できた.統計手法自体に興味がないとはいえ,普段よくやっていることの単純な理論化であるとするならば,一度くらい目を通してみてもいいのかもしれない.統計学には『仮説検定』という用語がある.これについて思うところを書いてみよう.

 

 仮説検定について,手元の資料にはこのように書いてある.

『未知母数θの特定の値θ'にとくに関心があって,θ=θ'が成り立っているかどうかを知りたいときに,θ=θ'という仮説をたてて,それを標本または標本から計算された統計値に照らして,仮説が成り立っているか,成り立っていないかを判断するために用いる手法のことを,仮説検定という.』

これだけだと,よく分からない.まずはよく分からない言葉を列挙するところから始めよう.僕の場合は母数,標本,統計値という三つの単語の定義,あるいは雰囲気が分からなかった.そもそも,僕らは何をしようとしていたんだっけ.したいことを確認するのが先だった.

 

 実際に興味があるかは別として,僕らはいま,日本人男性の平均の身長に関心があるものとしよう.日本人男性が五人目の前にいるとすれば,その五人の平均身長を算出することは,測定器があれば容易である.百人いれば百人の平均身長も,大変ではあるが求められる.このように考えを敷衍すれば,全ての日本人男性の身長を調べ上げれば,その平均身長を求められるといえるが,手間を考えれば現実的ではない.要は,手間をかけずに平均値を推測したい,という話である.これが一つの目的である.もう一つは未来を予測することである.くじ引きを例にするのであれば,適当に選んだ数枚のくじの当選結果から,次に引いたときの当選率や,そもそもの抽選率,確率について予想したくなるかもしれない.もちろん全部引けるほどの予算がない人には,真の確率を知ることはできないが,先にある程度予想出来るのであれば意思決定に大きく影響してくるだろう.そこで予想した確率が,どの程度正しいと認められるか検証できれば,より嬉しい.

 

 まとめると

1.厳密でなくとも,全体のなかのある一部分を用いて,全体に関する情報を許容できる範囲で推測したい.

2.自身の予想が真の事実とどの程度合致しているか検証したい.

 

 前者を『推定』といい,後者を『(仮説)検定』という.仮説検定の定義に現れた三つの未定義語に『雰囲気』を与えよう.母数とは全体の情報の全てから得られる真の情報に対応しており,標本とは部分的に取り出した情報のことを指し,統計値とはその標本から得られた情報を加工して得られる値のことを指す.このことを踏まえて,仮説検定の定義を雰囲気で翻訳すると

『興味のある真の情報をθとし,このθがθ'である,という仮説をたてて,それを全体の一部から取り出せる情報から,仮説が成り立っているか,成り立っていないかを判断するために用いる手法のことを,仮説検定という.』

ここまで書いてようやく,仮説検定の欲望を認識できたような気がする.認識しただけで,価値判断の尺度が二転三転するような僕には全く適さない道具なのだろうと思ってしまった.悪意はあるが,刃物のような美しさや鋭さはなく,欺瞞に満ちていて,どこか不誠実な印象を覚えた.

 

 これら統計学に関する本を読んでいると,品質管理や均一化などの話題をよく目にする.統計手法を携えた学生の中に,人間を対象に品質管理や均一化を施した社会を本気で目指している者がいるのであれば,僕はそのような統計学徒の話を聞いてみたいな.きっと彼らは誠実だから.そうしたら統計学全般に対する印象が大きく変わるかもしれない.