gam(一般化加法モデル...

48
GAM(一般化加法モデル)による生存時間解析 大阪電気通信大学 情報通信工学部 辻谷将明 1

Upload: others

Post on 22-Sep-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

GAM(一般化加法モデル)による生存時間解析

大阪電気通信大学 情報通信工学部 辻谷将明

1

Page 2: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

2

● ●

● ●

0 1c xcy = +回帰モデル

1ln ⎛ ⎞⎜ ⎟−⎝ ⎠発症率

発症率

x

y

31

10

112

n

ii

icy x x xc θ=

= + + −∑平滑化スプライン

平滑化スプラインとは

Page 3: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( ) ( ) ( )1 1 2 2, , , ,..., ,n nx y x y x yデータ:

3

11

1

031

12

ˆ

ˆ

n

i

t

ii

n

y x x xc c

λ

θ=

= + + −

⎛ ⎞ ⎛ ⎞+ ⎛ ⎞=⎜ ⎟ ⎜ ⎟ ⎜ ⎟

⎝ ⎠⎝ ⎠⎝ ⎠

yR I Q0Q 0c

θ平滑化パラメータ

Page 4: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( )1 21 2

1 1 1= , ,..., ,t

nn

y y yx x x⎛ ⎞

=⎜ ⎟⎝ ⎠

i ii i

y Q

4( ) ( )

3 31 2 1

3 32 1 2

3

0 1

3

2

1 2

1

012 12

012 12

012 1

, ,...,2

,

n

n

n n

t tn

x x x x

x x x

c c

x x

Nx

x x

θ θ θ

⎛ ⎞− −⎜ ⎟⎜ ⎟⎜ ⎟− −⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− −⎜ ⎟⎜ ⎟⎝

=⎠

← −

i

i

i i i i

i

スプ ライン

=θ c,

R=

Page 5: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)

時間依存性変数

打切り 共 変 量 (初診時の値)No. 生存時間 (=0) 年齢 プロトロンビン時間 ビリルビン値

1 400 0 58.8 12.2 14.5. . . . . .

9 2400 1 42.5 11.0 3.2. . . . .

312 788 0 33.2 10.8 6.4

5

Page 6: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

患者#9の入力データ(死亡例)

6

0 184 361 723 1027 1396 2278 2400

死亡

時間区間

生存時間 年齢 プロントロンビン時間

ビリルビン値

応答

1 92.0 42.5 11.0 3.27.04.2

13.512.016.214.8

2 272.5 43.0 12.5000000

3 542.0 43.5 11.24 875.0 44.5 14.15 1211.5 45.4 11.56 1837.0 46.4 11.57 2339.0 48.8 13.0 1

9l9

la< > 91lx< > 9

2lx< > 93lx< > 来

院日

9δ < >

死亡

Page 7: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

プロトロンビン時間ビリルビン値

0

5

10

15

20

1 2 3 4 5 6 7

来院回数

プロトロンビン時間

ビリルビン値

患者#9の時間依存型データ 7

Page 8: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

企業倒産マトリックス(森平ら, 2002)

業種

90年企業数

倒 産 企 業 数

91 92 93 94 95 96 97 98 99 00建設 2379 15 25 26 20 16 22 44 65 35 40製造 4194 12 21 27 19 23 19 19 42 28 29卸し小売 1991 36 34 34 40 38 32 37 75 56 51その他 1499 13 23 14 12 5 7 14 12 16 14全体 13848 76 103 101 91 82 80 114 194 135 134

8

Page 9: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

建設年度 企業数 倒産企業数

91 2379 1592 2364 2593 2339 2694 2313 2095 2293 1696 2277 2297 2255 4498 2211 6599 2146 3500 2111 40

9

Page 10: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

年度 企業数 倒産企業数 時点 為替レート

91 2379 15 0.5 128.01492 2364 25 1.5 138.2093 2339 26 2.5 145.1494 2313 20 3.5 134.2995 2293 16 4.5 126.5196 2277 22 5.5 110.5397 2255 44 6.5 101.3998 2211 65 7.5 93.8399 2146 35 8.5 109.1800 2111 40 9.5 121.76

建設時間依存型共変量

10

Page 11: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

111990 1992 1994 1996 1998 2000

年度

90

100

110

120

130

140

為替レート

Page 12: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

i

i

i

Nrr

=

=′=

第 時点の直前まで生存していた企業数

第 時点の間に倒産した企業数

第 時点の間に打切られた企業数

it

it

it( )1i i i iN N r r+ ′= − −

時点

1

2

3

10

ttt

t

237923642339

2111

iN152526

40

ir

000

2071

ir′

二項型モデル

12

Page 13: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( )

( ) ( )

{ }

| , , 1. .,

1 , 0,1, 2, ,

Pr:

i ii

i i i i i

N ri ri i i i i

i

i

r N B N h i ni e

Nf r h h r N

r

h i i

=

⎛ ⎞= − =⎜ ⎟⎝ ⎠

=

∼ ∼

第 時点で倒産 第 時点の直前まで生存

  離散ハザード

打切りがなければ、 となり、 は、

によって完全に決まる

1i i ir N N += − 1 2, ,r r

1 2, ,N N

独立性のもとでの全尤度は使えない13

Page 14: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

全対数尤度: ( ) ( ) ( )ll nn lnL , ≡ +α ας ς

部分対数尤度

( ) ( )

( ).

1

lnl 1

| ,

n

~

i in

n ri ii i

i

i i

i i i

nd

i i

N rh hr

r N B N h

=

⎛ ⎞= −⎜ ⎟

⎝ ⎠∏

α

14

Page 15: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

15

{ }

{ }1

0 1 1 2

ln ( ) ln ( ) ln(1 )

, , , ,...,

:n

i i i i ii

n

L r h N r h

c c

xθ θ θ=

= + − −

=

∑α

α

ih⎧⎪= ⎨⎪⎩

ロジスティック回帰モデル

平滑化スプライン

ニューラルネット

対数尤度最大

i i ih r N=c.f.,K-M推定量:

Page 16: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

16

0 1ln

G

1

LMh x

hc c⎛ ⎞ = +⎜ ⎟−⎝ ⎠

部分ロジスティック回帰モデル( )

( )31

10ln

1

GAM

ii

i

nh x x xh

c c θ+

=

⎛ ⎞ = + + −⎜ ⎟−⎝ ⎠∑

平滑化スプライン( )

90 100 110 120 130 140 150

名目為替レート

-5.1

-4.6

-4.1

-3.6

ロジット変換値

Page 17: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( )

( ) ( )

( )

0

1

0

0

3

1

1

0 G

:ln 11 :

12

1 :

1 exp

A

M

1 exp

M

GLn

ii

J

J

j

i

j

j

j

xh

h x x x

h

x

h

c

c c

x

c

βα

θ+

=

=

=

+⎧⎪⎛ ⎞ = ⎨⎜ ⎟− + + −⎝ ⎠ ⎪⎩

⎧ ⎫⎪ ⎪⎪ ⎪⎪ ⎪= ⎨ ⎬

⎡ ⎤⎧ ⎫⎪ ⎪⎪ ⎪⎢ ⎥+ − ⎨ ⎬⎪ ⎪+ −⎢ ⎥⎪ ⎪⎪ ⎪⎩ ⎭⎣ ⎦⎩ ⎭

=

=

∑ ニューラル

ロジスティック回帰

● 平滑化スプライン

      

離散ハザー

ド率

ネッ

為替

17

Page 18: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

平滑化スプライン

⇒局所評点化法は、ペナルティ付き対数尤度

{ } ( ){ }2

1 1

1ln ( )ln(1 )2

pn

i i i i i ji j

jr h N r h f t dtλ= =

′′+ − − +∑ ∑ ∫を最大化

H-T,p.149;H-T-F,5.6節18

Page 19: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

19生存関数の比較

生存率

1990 1992 1994 1996 1998 2000

年度

0.85

0.89

0.93

0.97

建設製造卸し 小売そ の他

Page 20: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

モデル適合度(逸脱度)

業種 GAM(d.f.) GLM(d.f.=7)

全体 1.0016(1.0056) 45.91建設 0.9311(1.3023) 23.09製造 1.5991(1.0211) 15.62卸し・小売 1.6641(1.0080) 16.10その他 1.5596(1.0042) 16.18

20

Page 21: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

非線形効果の有無

業種 時点 為替

全体 * **建設 **製造 **卸し・小売 *その他 * △

**:1%有意、*:5%有意、△ :10%有意21

Page 22: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

残差分析

( ) ( )

( )

ˆsgn 2 ln 2 lnˆ ˆ

0,1

i i i ii i i i i i

i i i i i

r N rDev r N h r N rN h N N h

N

< > ⎛ ⎞ ⎛ ⎞−= − + −⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟−⎝ ⎠ ⎝ ⎠

符号付き逸脱度残差

22

Page 23: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

23

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 200

-3

-2

-1

0

1

2

GAMGLM

年度

符号付き逸脱度残差

逸脱度残差(建設)

Page 24: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

24

符号付逸脱度残残差

Q-Qプロット(平滑化スプライン)

-1.6 -1.1 -0.6 -0.1 0.4 0.9 1.4 1.9

Normal Distribution

-0.5

-0.3

-0.1

0.1

0.3

0.5

Page 25: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

25

Page 26: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

26

( ) ( ){ }1

, 1 ,l i ii l

aS a h≤ ≤

= −∏x x●生存率の推定

( ) ( ) ( )( )

, ,Pr ,

,l

ll

ll

S x Sa a t

aSa a t+ ∆−

+ ∆ =x

x

(1 )la t∆● まで生存した企業の次の 年後の限界倒産確率

共変量として入力

c.f., ハザード(瞬間倒産率):

( ) ( ) ( )( )0

, ,1lim,

l ll t

l

S a S a th a

t S a∆ →

⎧ ⎫⎛ ⎞− +∆⎪ ⎪= ⎜ ⎟⎨ ⎬⎜ ⎟∆⎪ ⎪⎝ ⎠⎩ ⎭

x xx

限界(条件付き)倒産確率の推定

Page 27: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

27限界倒産確率の比較

倒産確率

1990 1992 1994 1996 1998 2000

年度

0.00

0.01

0.02

0.03

0.04

0.05建設製造卸し ・ 小売その他失業率

Page 28: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)

i

時間依存性変数

打切り 共 変 量 (初診時の値)No. 生存時間 (=0) 年齢 プロトロンビン時間 ビリルビン値

1 400 0 58.8 12.2 14.5. . . . . .

9 2400 1 42.5 11.0 3.2. . . . .

312 788 0 33.2 10.8 6.4

28

Page 29: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

患者#9の入力データ(死亡例)

29

0 184 361 723 1027 1396 2278 2400

死亡

時間区間

生存時間 年齢 プロントロンビン時間

ビリルビン値

応答

1 92.0 42.5 11.0 3.27.04.2

13.512.016.214.8

2 272.5 43.0 12.5000000

3 542.0 43.5 11.24 875.0 44.5 14.15 1211.5 45.4 11.56 1837.0 46.4 11.57 2339.0 48.8 13.0 1

9l9

la< > 91lx< > 9

2lx< > 93lx< > 来

院日

9δ < >

死亡

Page 30: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

プロトロンビン時間ビリルビン値

0

5

10

15

20

1 2 3 4 5 6 7

来院回数

プロトロンビン時間

ビリルビン値

患者#9の時間依存型データ 30

Page 31: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

共変量の平滑関数に対する有意性検定

共変量 edf Chi.sq年齢 1.000 43.679**

プロントロンビン時間 3.254 138.66**

ビリルビン値 6.386 44.128**

31

Page 32: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

10 15 20 25 30 35

-20

24

68

1012

V4

s(V

4,6.

39)

平滑化スプラインを当てはめた結果(ビリルビン値) 32

Page 33: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

限界(条件付き)倒産確率の推定

●生存率の推定

( ) ( ){ }1

, 1 ,dl i i

i l

S a h a< >

≤ ≤

= −∏x x

lt(6 )t∆ ケ月後の条件付き生存率

( ) ( )( )

10

,Pr , , , 0

, 2l l

l

S a t t ta a t a tS a

−+ ∆ ++∆ = = =

xx

33

Page 34: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

1 2

3

4

5

6 7年齢 42.5 43.0 43.5 44.5 45.3 46.3 48.7

Bili 3.2 7.0 4.2 13.5 12.0 16.2 14.8

ProTime 11.0 12.5 11.2 14.1 11.5 11.5 13.0

生存

Mayo .987 .939 .980 .767 .903 .851 .763

率 スプライン .987 .912 .972 .517 .823 .794 .627

短期予後予測(患者#9の6ヶ月後の生存率)

共変量

34

Page 35: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( ) ( )[ ]

[ ][ ]

1

1 Pr , , 1, 2; 1, 2,...g

lng

g dgdl

S l l l t g ln =

= + ∆ = =∑

g t∆群 における 後の条件付き生存率の平均値

( )[ ]Pr ,gd l l t l t+∆ ∆:来院回数における 後の条件付き生存率

35

Page 36: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

条件付き生存率

4手法による全312例中の死亡例、打切り例に対する条件付き生存率の比較

0 1 2 3 4 5 6 7 8

来院 回数

0.80

0 .85

0 .90

0 .95

1 .00

M ayo( Dead)Europa( Dead)PL( Dead)Sp line( Dead)M ayo( Censored)Europa( Censored)PL( Censored)Sp line( Censored)

36

Page 37: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

平滑化スプラインの特徴

1. 時間依存型変数の取扱いが容易

2. 観測期間全体を考慮に入れて解析

3. 比例ハザード性の制約を受けない

4. 共変量の非線形性を考慮

5. 死亡例が少ない場合も適用可

6. ML解が一意

7. 計算時間が短い

37

Page 38: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

参考文献

38

[1]Biganzoli,E., Boracchi,P., Marriani,L. and Marubini,E. (1988) : Feed forward neural networks for the analysis of censored survival data: a partial logistic approach, Statist. Medicine, 17,pp.1169-1186.[2]Cox, D.R. (1975): Partial likelihood, Biometrika, 62, pp.269-276. [3]Efron, B.(1988): Logistic regression, survival analysis, and Kaplan-Meier curv, J. Amer. Statist. Assoc., 83, pp.414-425.[4] 森平総一郎ら(2002):倒産確率の期間構造推定と信用リスクのある債権の評価、第17回JAFEE大会[5]Murtaugh,P.A. et al.,(1994):Primary biliary cirrhosis: Prediction of short-term survival based on repeated oatientvisits, Hepatology, 20, pp.126-134.[6]辻谷将明,左近賢人(2005):時間依存型共変量を伴う生存データの解析,応用統計学,34,15-29.

Page 39: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

39

● ●

● ●

0 1c xcy = +回帰モデル

1ln ⎛ ⎞⎜ ⎟−⎝ ⎠発症率

発症率

x

y

( )30

11

n

ii

iy x x xc c θ+

=

−= + +∑平滑化スプライン

付録A.平滑化スプライン(応答が連続値)

Page 40: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

40

( ) ( ) ( )1 1 2 2, , , ,..., ,n nx y x y x yデータ:

11

1

031

12

ˆ

ˆ

n

i

t

ii

n

y x x xc c

λ

θ=

= + + −

⎛ ⎞ ⎛ ⎞+ ⎛ ⎞=⎜ ⎟ ⎜ ⎟ ⎜ ⎟

⎝ ⎠⎝ ⎠⎝ ⎠

yR I Q0Q 0c

θ

平滑化パラメータ

Page 41: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( )1 21 2

1 1 1= , ,..., ,t

nn

y y yx x x⎛ ⎞

=⎜ ⎟⎝ ⎠

i ii i

y Q

41( ) ( )

3 31 2 1

3 32 1 2

3

0 1

3

2

1 2

1

012 12

012 12

012 1

, ,...,2

,

n

n

n n

t tn

x x x x

x x x

c c

x x

Nx

x x

θ θ θ

⎛ ⎞− −⎜ ⎟⎜ ⎟⎜ ⎟− −⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− −⎜ ⎟⎜ ⎟⎝

=⎠

← −

i

i

i i i i

i

スプ ライン

=θ c,

R=

Page 42: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( ) ( ){ } ( )2

2

=1

ni

ii i

hln f x f x dt f x1-h

λ⎡ ⎤⎛ ⎞

′′− +⎢ ⎥⎜ ⎟⎝ ⎠⎣ ⎦

⇒∑ ∫ 最小になる

曲げ弾性エネルギー(小さいほど滑らかな曲線さ)

(

小さいほどモデルの当てはまりは良い

)λ ≥ ⇔0 を大きくする 滑らかな曲線を求める ことに重点をおく

( )f x の曲率

3⇔ 次の自然スプライン

竹澤(上):p.198 42

Page 43: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( ) ( ){ }2

2

=1

n

ii

y f x f x dtλ ′′− +⎡ ⎤⎣ ⎦ ⇒∑ ∫ 最小になる平滑化曲線

( )λ ≥ ⇔0 を大きくする 滑らかな曲線を求める ことに重点をおく

43

3⇔ 次の自然スプライン

( )

( ) ( )

3

33

01

1

:0 :

n

ii

i ii

i

i

y x x x

x x x xx x

x

c

x

c θ+

+

=

= + + −

⎧ − ≥⎪− = ⎨<⎪⎩

Page 44: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

付録B:二値応答の場合(共変量2個)へ拡張

( ) ( )1 1 2 2ln , 1,2,...,1

ii i

i

h s x s x i nh

α⎛ ⎞

= + + =⎜ ⎟−⎝ ⎠

( ) ( )( ) ( )

1 1 1 2 2 2

1 1 2 2 1 2

i i i i

i i i i i

x f x x f x

x x f x f x

α β β

α β β

= + + + +

= + + + +

GLMの重付き最小二乗法

後退当てはめによる局所評点化法

44

Page 45: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

45

局所評点化法

●データ: ( ) ( )1 2

1 :, , , , ..., ,

0 :i i i i i ip i

ix x xδ δ

⎧= = ⎨

個体 が死亡

その他x x

●モデル: ( ){ } ( )1

ln 1 , 1,2,...,p

i i j ijj

h h s x i nα=

− = + =∑ステップ1(初期化)

( )

1

ˆ 0, 1,2,..., ; 1,2,...,

ˆ ln ,1

j ijn

ii

s x i n j p

nδα δ δδ =

≡ = =⎛ ⎞

= =⎜ ⎟−⎝ ⎠∑

ステップ2

( ) ( )1

1ˆˆ ˆ ˆ ,ˆ1 exp

p

i j ij ij i

s x hη αη=

= + =+ −∑

Page 46: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

46

( ) ( )( ) ( )( ) ( ) ( ) ( )1 1 2 2

ˆˆ :ˆ ˆ1

ˆ ˆ1 :

, , , , ..., ,

1 , 2 ,ˆ ˆ

i ii i

i i

i i i

n n

j i

ha zh h

b w h h

c x z x z x z

j = ...p

f h

δη −= +

= −

後退

調整従属変数

重み

を適用し、 について

  を算出する。そして、 を

当て

 はめ法

推定する。

ステップ3(反復)

ステップ4(収束判定)

( ) ( ) ( )1

ˆ ˆˆ, 2 ln 1 ln 1n

i i i ii

D h hδ δ=

⎡ ⎤= − + − −⎣ ⎦∑逸脱度

が収束するまで を繰返す

h

ステップ3

δ

Page 47: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

( ) ( )1 1 2 2i i iz f x f xα= + +後退当てはめ法(ガウス・ザイデル法)

ステップ1(初期化) ( )02

ˆ 0f ≡ステップ2 ( ) ( )

( )

01 2 2

11

ˆ ˆˆ

i i ix z f xfα− −

⎯⎯ ⎯ ⎯ ⎯ ⎯→平滑化スプライン

に対して を

平滑化

ステップ3 ( ) ( )( )

12 1 1

12

ˆ ˆˆ

i i ix z f xfα− −

⎯⎯ ⎯ ⎯ ⎯ ⎯→平滑化スプライン

に対して を

平滑化

ステップ4

47

( ) ( )( )

11 2 2

21

ˆ ˆˆ

i i ix z f xfα− −

⎯⎯ ⎯ ⎯ ⎯ ⎯→平滑化スプライン

に対して を

平滑化

ステップ5 以下( ) ( ) ( ) ( )1 1 2 2

ˆ ˆ,m mi if x f x が収束するまで繰返す

Page 48: GAM(一般化加法モデル による生存時間解析GAM(一般化加法モデル)による生存時間解析大阪電気通信大学情報通信工学部辻谷将明 1 PBC(原発性胆汁性肝硬変)データ(辻谷ら,2005)時間依存性変数

短期予後予測モデル(1)日本肝移植適応研究会モデル●死亡6カ月前のデータと、生存例のat randomなデータを入力して、ロジスティック回帰でsimple analysis(「患者対照研究」:8.1節)● ( )

( )

4.333 1.2739ln 4.4880ln( )/

51 : 6 %1

0DR

T Bili GO

e p

G P

x

T Tλ

λ

= − + +

⇒ = ⇒+ −

任意観測時よりヶ月後の予想死亡率 を超えると移植考慮

( )1979 1990;141∼ 例

48

(2)Mayo updated model(1974~1984;312例;D-ペニシラミンtrial)●任意観測時より、3~24(6)ヶ月の予測生存率● ( ) ( ) ( ) ( )

( ) ( ){ } ( ){ }exp 6.1190

0.051 1.209 ln 2.754 ln 3.304 ln( )

2

0

0

.675

, : %PI t

age T Bil PT Alb ede

S t x S t

maP indexI t−

= × + × + × − × + ×

⇒ = 以下にな

ると移植考慮

(3)Europe new version model(1971~1983;248例;アザチオプリンtrial)●任意観測時より、1,3,6ヶ月の予測生存率● ( ) ( ){ } ( )

( )( ) ( )( ) ( )0 0 0

2.53 ln 1.53 1.39( ) 0.085 34.30.040 55 0.65( )

ˆ, exp exp , :

if presentif bleeding

T Bil asites APpresent

P t t h

I t

P

lbage GI

tI thλ λ

= × − + − × −+ × − +⇒ + = − Λ⎡ ⎤⎣ ⎦i i のグラ

フより推定