散歩道<283>

                          統計について(2)・データーの諮問
                 (1)〜(3)続く

1、データーの諮問:統計学者は他人の収集したデータの分析を要求される。統計学者が最初にすべきことはデータの諮問を行うことである。そのためのリストは@データはどのように収集されたか。Aデータに測定誤差や記録の誤りが含まれていないか?測定値について概念や定義は明確であるか?観測値間に質的な違いはないか?Bデータは本物であるか、捏造されたり、編集されたり、修正されたり、観測者の歳量によっていくつかのデータが破棄されていることはないか?統計的推測において不適切な影響を及ぼす外れ値を含んでいないか?C観測デ−タが情報を提供している母集団は何か?調査対象と見られる母集団全体、又はその一部において無反応は存在しないか?データは等質の集団から得られたものか?又は、いくつかの母集団の混合から得られたものか?抽出単位の識別や分類のための関連事項は全て記述されているか?D研究課題、又は観測データの性質に関しての事前情報は存在するか?

2、左利き:右巻きに対する左巻きの割合は親の全ての組み合わせにおいて殆ど同一であり、その結果は右巻き、左巻きのなんらの遺伝的形質は存在していない。しかし右巻きの子孫の優位性はなぜ存在するのであろう。北半球の標本からは左巻きの割合は0.515、南半球の標本からの標本における左巻きの割合は0.473と判明した。この差は地球が一方的に回転することの影響であろう。農園において左巻きと右巻きの木の収量の平均値を比較、左巻きの木の方が10%多くの収穫量を上げる。左利きの人:非常に創造的で見栄えがいい、誇ることができる著名人(ベンジャミン・フランクリン、レオナルド・ダ・ビンチ、アルベルト。アインシュタイン、アレキサンダー大王。ジュリアス・シザー)右脳の優越者は創造的能力によって、左脳の優越者は倫理的能力によって特徴ずけられる。全ての生物は生物学的構成において左利きである。グリシンを除く全てのアミノ酸L(levo左旋)、とD(dextro右旋)という2つの形で存在する。それぞれ左巻き分子、右巻き分子、植物タンパク質と動物タンパク、そしてバクテリア、かび、ウイルス、といった単純有機物など見られる24の全てのアミノ酸は左巻である。

3、特定の問題:特に野外観測や非実験データなど実際自然界において生じるあらゆる事象を標本抽出するの枠の中に取り入れることを困難である。例えばある現象を観測されず、したがって記録されないということが起こり得る。この場合所謂切断(truncated)、打ち切り(censored) 又は不完全標本と呼ばれる標本が生じてしまう又、事象が事象特有の性質や用いた方法に依存する確立で観測される場合には不等確立抽出となってしまう。さらに事象が時間とともに、もしくわ観測過程の間にランダムに変化することもある。この場合は記録されたものは修正された事象であり統計解析においては、このような変化や損傷を適当にモデル化する必要がある。又事象はが異なる確立メカニズムを持つ、2つまたはこれ以上の原因によって生じたこともありこの場合これらの事象が混合されて同一の記録として扱われ混合標本と呼ばれるものと成る、これらの場合には、当初の事象に対する特定化は観測された事象に対して適当でなく何らかの調整が必要である。