doing baysian data analysis chapter19

25
+ Chapter 19 Metric Predicted Variablewith Multiple Nominal Predictors

Upload: tadatoshi-kawabe

Post on 13-Jul-2015

125 views

Category:

Education


4 download

TRANSCRIPT

+

Chapter 19

Metric Predicted Variablewith

Multiple Nominal Predictors

+Contents

19.1 Bayesian Multifactor ANOVA

19.2 Repeated Measures, a.k.a. Within-Subject Designs

19.3 R Code

19.4 Exercises

1

+Poem

Sometimes I wonder just how it could be, that Factors aligned

so you’d end up with me. All of the priors made everyone think,

that Our interaction was destined to shrink.

あなたが一直線に並べた要因が私と一緒になってしまったら、いったいどの様になってしまうのか、私は時々不思議に思う。全ての事前分布のために、私たちの交互作用が縮小する運命にあると誰もが考える。

2

+Outline

複数の名義尺度の説明変数を用いたモデル

多変量ANOVAと同様、説明変数間での交互作用を想定

ただし、F分布ではなく、階層事前分布を使用

支持政党や民族によって収入を予測するモデル

用いる腕が利き腕か否かや刺激の種類によって反応時間を予測するモデル

3

+Outline

4

+19.1 Bayesian Multifactor ANOVA

ぞれぞれの名義尺度変数のβの合計は0という制約条件はイキ

各変数(の水準)の効果をベースラインと足し合わせる

5

+19.1.1 Interaction of Nominal Predictors

同じグラフでも異なる解釈が存在、左のグラフの矢印は交互作用を示す

一方の変数の水準を固定した時、もう一方の変数の各水準の交互作用の逸脱度の和はゼロ

6

+19.1.1 Interaction of Nominal Predictors

中央のグラフは、X2に依存したX1の効果

右のグラフは、X1に依存したX2の効果

7

+19.1.1 Interaction of Nominal Predictors

ベースラインからの平均逸脱度は“主効果”

他の変数を固定した時の平均逸脱度は“単純効果”

交互作用がある場合、“主効果”と“単純効果”は等しくない

8

+19.1.2 The Hierarchical Prior

各変数と交互作用に対して、それぞれ超事前分布を置く

9

+19.1.2 The Hierarchical Prior

Yiは正規分布、簡略化のためとANOVAと比較しやするするために、分散の均一性を仮定

各変数と交互作用に対して、個別に超事前分布を置くため、一つの変数の効果が分かったとしても、他の変数の効果に関する情報は得られない

一方で、変数内の各水準の逸脱度は、同変数内の他の水準の逸脱度に対する情報を与える(超事前分布、事前分布が共通のため)

10

+19.1.3 An Example in R and BUGS

4つの学部と3つの職階で平均給与のモデルを作る

Y:平均給与 X1:学部 X2:職階

各水準の組み合わせでサンプル数が大きく異なると、通常のANOVAでは計算上問題が生じるが、BANOVAでは問題ない

11

+19.1.3 An Example in R and BUGS

非線形の交互作用が認められる

化学先攻の准教授の例)$89,117 → $78,179

12

+19.1.4 Interpreting the Posterior

BFIN vs CEDP : 95%HDIがゼロから大きく乖離 → 有意な差

CEDP vs THTR : 95%HDIがゼロを含む→ 有意な差はない

同様に、FT1 vs FT2、FT2 vs FT3も有意な差

13

+19.1.4 Interpreting the Posterior

ただし、各変数の主効果は、あくまでも“平均の効果”

全ての学部においてFT2とFT3の差異は同じではなく、実際には交互作用の影響がある

そのため、相互作用を無視して各水準の効果を語るのは誤り

14

+19.1.4.1 Combining Metric and Nominal

Predictors : ANCOVA

勤続年数を加味した上で、学部や職階による影響を評価したい

そこで“共変量”を加味した“共分散分析 : ANCOVA”を行う

ANCOVA : 線形回帰とANOVAの合わせ技、ANOVAと同様に各水準の逸脱度の和はゼロ

共変量の係数は、水準毎に変えることが可能

総合的な傾きと水準毎の傾きに分離

水準毎の傾きの和はゼロ

水準毎の傾きは正規分布(もしくはt分布)

繰り返しのある線形回帰と本質的には同質、しかし多変量への拡張の方法が異なる(逸脱度の和がゼロ)

15

+19.1.4.2 Interaction Contrasts

“交互作用の比較”: 差異の差異、“主効果の比較”の外積

16

+19.1.4.2 Interaction Contrasts

(CHEM.FT1−CHEM.FT3)−(THTR.FT1−THTR.FT3)は有意

(BFIN.FT1−BFIN.OTHER)−(OTHER.FT1−OTHER.OTHER)は有意ではない

17

+19.1.5 Noncrossover Interactions,

Rescaling, and Homogeneous Variances

データを非線形変換した場合、非加算的な項も変化するため、交互作用を考える際、スケールが重要になる

政党と性別による収入の例)対数変換により交互作用はなくなる

スケールは単一ではなく、慣例的に決められる

18

+19.1.5 Noncrossover Interactions,

Rescaling, and Homogeneous Variances

左のグラフでは、対数変換により交互作用が消失

交互作用から非交互作用への変換は、線分が交わらず、傾きの符号が同じ場合にのみ可能

中央のグラフの様に線分が交差する場合は、交互作用は残る

右のグラフは、中央のグラフのX1とX2を入れ替えたもので、傾きの符号が異なるため、相互作用は残る

水準内の分散を変えることでも交互作用は消失する

変換により分散の均一性を担保できるかは不明

担保できない場合は、均一とみなせる様にデータを変換するか、不均一な分散を許容できる様にモデルを変更する必要がある

19

+19.2 REPEATED MEASURES, A.K.A.

WITHIN-SUBJECT DESIGNS

同じ被験者に条件を変え、繰り返しテストを行う方法を“繰り返し測定デザイン”もしくは“被験者内デザイン”と呼ぶ

説明変数に個々の被験者の効果を3番目の効果として追加

刺激の種類と利き腕か否かの例)

2次、3次の相互作用も加味、ただし計算が大変

20

+19.2 REPEATED MEASURES, A.K.A.

WITHIN-SUBJECT DESIGNS

被験者のパラメータを推定するための事前分布を与えるため、他の被験者の推定値に関する情報を得ることができる

また、被験者間をまたいだ“グループレベル”での超事前分布と事前分布を与えることで、被験者レベルではなく、グループレベルでの“shrinkage”が実現可能

21

+19.2 REPEATED MEASURES, A.K.A.

WITHIN-SUBJECT DESIGNS

一方、被験者への負荷の観点からデータ収集には制約があり、被験者一人から一つのデータしか収集できないケースがある

その場合でも、BANOVAは実行可能だが、データ数よりもパラメータ数の方が多くなってしまい、パラメータ推定が極めて困難になるため、モデルのパラメータ数を削減する必要がある

被験者の効果がベースラインにのみ影響するモデルに修正

被験者の効果と処理パターンの効果の交互作用を削除

22

+19.2.1 Why Use a Within-Subject

Design? And Why Not?

“被験者内デザイン”は“被験者間デザイン”より精度が高い

同じ被験者からテスト条件を変えて、繰り返しデータ取得した方が精度が高くなる

他の被験者からデータ取得した場合、被験者間での水準効果の差異はランダムサンプリングの影響を強く受けるため、制度が落ちる

しかしながら、“被験者内デザイン”にも問題がある

同じ被験者でも常に同じ状態にある訳ではなく、同じ被験者と言いがたい(学習効果や疲労などの影響)

学習効果や疲労の影響が全ての実験条件で等しい場合、実験条件(の順番)をランダマイズすることで、その影響は排除可能

しかしながら、実際には影響が全ての実験条件で等しいとは限らず、影響が比較可能とは言い切れない

23

+19.2.1 Why Use a Within-Subject

Design? And Why Not?

さらに、次の実験への持ち越し効果も考えられる

持ち越し効果を数学的に解明することは不可能

持ち越し効果が強く疑われる場合、“被験者間デザイン”に立ち戻り

つつ、被験者間のノイズを極力排除するために多くの被験者で実験を行うようにする

一般的に全てのモデルは観察の独立性を仮定しているが、繰り返し測定の場合、この仮定の正当性は弱いため、実験条件をランダマイズして、持ち越し効果を最小化する様に努める必要がある

24