データの順序効果が有意であるかを調べるには

データの順序効果,例えば,薬剤A,Bがあったとき,
A→Bと投与する場合,B→Aと投与する場合を考えたとき,
A→Bと投与したほうが効果があるのか,
B→Aと投与したほうが効果があるのか,
それとも,どちらの場合でも同程度の効果なのか,
その順序に意味(効果)があるのかどうかを知りたい.

そのとき,順序効果が有意であるかを検定する.

順序効果を検定する方法としては,
データをどのように扱うかによって,
様々な検定方法が考えられると思う.

ここでは,主な検定方法として,カイ二乗検定分散分析を考える.

カイ二乗検定はノンパラメトリック検定であり,
データの確率分布に正規性を仮定したり,
等分散性を仮定する必要が無いため,
非常に便利な検定手法である.

また,分散分析はF統計量を用いたパラメトリック検定であるが,
F統計量はロバストな統計量であることが知られているため,
パラメトリック検定でありながら,データが多少正規分布からずれていたり,
仮定がちょっと外れていたとしても,結果の妥当性を損なわない強みがある.

さて,これら2種類の検定を使って,順序効果を調べる方法だが,
これは,データのまとめ方によって使い分けることができる.

例えば,データを以下の表1のようにクロス集計表にまとめた場合,

表1 薬剤A, Bの投与順における効果
投与順 効果あり 効果なし 合計
A→B 20 10 30
B→A 12 18 30
合計 32 28 60

順序効果があるのか,有意検定にはカイ二乗検定を用いることができる.
具体的には,帰無仮説:「順序効果は無い(投薬順に差は無い)」と仮定して,
上記観測度数に対して,期待度数を算出し(下記表2),

表2 薬剤A, Bの投与順における期待度数
投与順 効果あり 効果なし 合計
A→B 16 (30 x 32/60) 14 (30 x 28/60) 30
B→A 16 (30 x 32/60) 14 (30 x 28/60) 30
合計 32 28 60

観測度数(表1)と期待度数(表2)から,カイ二乗値を算出する.
カイ二乗値は以下の式で導出される.

           (観測度数 – 期待度数)2
カイ二乗値χ2 = Σ—————————-
         期待度数

今の場合だと,

カイ二乗値χ2 = (20 – 16)2 / 16 + (20 – 16)2 / 16 + (10 – 14)2 / 14 + (10 – 14)2 / 14
          = 30/7 = 4.2857……

というわけで,有意水準5 [%]として考えた場合,
カイ二乗分布表から,自由度1(行数-1 x 列数-1)のところを参照すると,
有意確率5 [%]に対応するカイ二乗値は「3.841」となる.

そのため,今回の例では,

 カイ二乗値χ2 = 4.2857… > 3.841(p=0.05)

となるため,帰無仮説:「順序効果は無い」としたときの有意確率は,
有意水準5 %よりも小さく,棄却域に入るため,この帰無仮説は棄却される.
その結果,対立仮説「順序効果はある」が採択される.

つまり,上記例では,薬剤A,Bの投与順における順序効果が認められる.

これは,カイ二乗検定を用いた適合度検定とも呼ばれる.

データをある確率分布にあてはめたとき,
そのあてはまりのよさを検定する.
言い換えれば,データの分布にある仮定(理論分布)をおいたとき,
それが正しいかどうか(理論分布と同じかどうか)を検定する.

この他,カイ二乗検定は独立性検定にも用いられる.
けっきょくのところ,やっていることは適合度検定と同じなのだが,
仮定として,データが2変数であったとき,互いに独立かどうかを検定する.
これも,けっきょくのところはそれぞれの分布を仮定して,
それが同じである(独立でない)のか,異なる(独立である)のかを調べるため,
考え方もやっていることも,適合度検定も独立性検定もほとんど同じである.

そして,更に,有意であることが分かれば,「オッズ比」を用いることで,
その傾向や傾向の大きさなどを数値化することができる.

さて,もう一つ,順序効果を調べるには分散分析を用いる方法がある.
具体的には,A→BとB→Aというのをそれぞれ群と見なし,2群のデータに,
二元配置の分散分析(二元配置ANOVA)を用いるという方法である.

このとき,順序効果というのは,交互作用の結果によって判断できる.

これは,以下リンク先に具体例があるので,詳しくは述べない.

 めん羊生産物の有効利用及び活用方法に関する調査報告書 – 社団法人畜産技術協会

このように,データの見方によって,様々な検定手法,統計解析の方法が考えられる.

関連:
[1] 2元配置の分散分析(two-way layout ANOVA)について
[2] 勘違いしやすい確率・統計 – 精度99.9 [%]の検査で陽性の意味
[3] お薦め書籍「統計でウソをつく法」

カテゴリー: 統計学 パーマリンク