discrete keuze theorie - departement werktuigkunde...geaggregeerde en gedisaggregeerde modellen stel...
TRANSCRIPT
Discrete keuze theorieH01I6A Verkeerskunde basis cursus 2011
Francesco Viti & Willem Himpe
Author: Jim Stada
Traffic and Infrastructure
Faculty of Engineering
Katholieke Universiteit Leuven
H01I6A Verkeerskunde Cursus 2011 2
Overzicht college
� Keuze
� Utiliteit
� Logitmodel� Voorbeelden
� Specificatie
� Aggregatie
� Beperkingen
� Nested logitmodel
H01I6A Verkeerskunde Cursus 2011 3
Voorbeelden van keuze in de verkeerskunde
Keuze voor:
� Wel of niet maken van verplaatsing
� Bestemming
� Vervoerwijze
� Route
Gebieds-gegevens
Ritproductie/ritattractie
Vervoersstromen
Trip-ends
Verplaatsings-weerstanden
H-B tabellen
Distributie/vervoerwijzekeuze
Toedeling
Transportnetwerken
H01I6A Verkeerskunde Cursus 2011 4
Discrete keuze theorie
� Algemene theorie over keuze tussen discrete (elkaar uitsluitende) alternatieven
� Afkomstig uit de psychologie en economie
Belangrijke referenties:
� Daniel Mc Fadden
� M. Ben Akiva en S. Lerman (1985)
Discrete choice analysis: Theory and application to Travel Demand (The MIT Press)
� Kenneth Train
H01I6A Verkeerskunde Cursus 2011 5
Werkwijze
� dataset met gegevens over de keuzes die mensen gemaakt hebben in bepaalde situaties
� Opsporen regelmatigheden in die keuzes
� Gieten in mathematische vorm
� Afgeleide formules gebruiken om de keuzes in nieuwe situaties te voorspellen.
H01I6A Verkeerskunde Cursus 2011 6
Kenmerken van alternatieven en keuzemaker + een keuzeregel
� Kenmerken van de alternatieven
� Ook van invloed: kenmerken van de keuzemaker (bijv. inkomen)
� Tenslotte nodig: een keuzeregel
Kenmerken alternatieven
Reistijd Reiskosten Comfort
Auto t1 k1 c1
Bus t2 k2 c2
Lopen t3 k3 c3
H01I6A Verkeerskunde Cursus 2011 7
Utiliteiten : niet direct waarneembaar
Kenmerken alternatieven en personen: wel waarneembaar
Daarom:
Uan = functie (kenmerken alternatief a, kenmerken persoon n)
Utiliteit
Keuzeregel:
De aantrekkelijkheid van een alternatief a voor persoon n kan worden uitgedrukt in één getal, de utiliteit: Uan
Persoon kiest alternatief met hoogste utiliteit
H01I6A Verkeerskunde Cursus 2011 8
Stochastische utiliteit
Personen in (voor de waarnemer) exact dezelfde situatie (zelfde kenmerken a en n)
maken toch verschillende keuzen!
Waarom? Er zijn een (mogelijk groot) aantal kenmerken die de analist niet waarneemt!
Daarom: Definieer Uan als een stochastische variabele:
ε+= anna VU met Van deterministisch = f(kenmerken a,n) en
ε een kansvariabele
De kans dat alternatief a wordt gekozen (door persoon n) wordt nu:
a)k alle(voor )Pr(),Pr( <>>= knan UUna
(We laten in het vervolg n weg als dat niet tot onduidelijkheid leidt)
H01I6A Verkeerskunde Cursus 2011 9
� Optellen (of aftrekken) constante bij alle U maakt geen verschil voor kansen:
Eigenschappen utiliteit U
� Vermenigvuldigen van alle U met positieve constante c maakt geen verschil voor kansen:
Pr( ) Pr( ) Pr( 0)a k a k
a U U U U= > = − >
Pr( ) Pr( ) Pr( )a k a ka U U cU cU= > = >
H01I6A Verkeerskunde Cursus 2011 10
Voorbeeld
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 9
U2
U1
ε1 ε1
A B
D C
ε2
ε2
U1 = 5 + ε1
U2 = 7 + ε2
ε1
Uniform verdeeld tussen –2 en +2
ε2
Uniform verdeeld tussen –1 en +1
En kansverdelingenOnafhankelijk !
Pr(1) = Pr(U1 > U2) = Pr(5 + ε1 > 7 + ε2)
3 7
6 8
Alt 1
Alt 2
Alt 1 wordtgekozenKans = 1/16(alleen bij uniformeen onafhankelijkekansverdelingen!)
H01I6A Verkeerskunde Cursus 2011 11
Kansverdeling stoortermen ε
Probit model Logit model
Kansfunctie? Normale
Verdeling
Gumbel
Verdeling
Varianties? Verschillend Identiek
Onderling
afhankelijk?
Ja Nee
H01I6A Verkeerskunde Cursus 2011 12
Normale verdeling vs Gumbel-verdeling
Gumbel verdeling ook wel Extreme Value of EV-verdeling genoemd
H01I6A Verkeerskunde Cursus 2011 13
Logitmodel
Als we voor de kansverdelingen van de stoortermen aannemen:
� Aanname 1: Gumbel-verdelingen
� Aanname 2: identiek (zelfde variantie :: 1/µ2 )
� Aanname 3: onafhankelijk
Dan kan worden aangetoond:
∑ =
=K
k
V
V
k
a
e
ea
1
'
'
)Pr(µ
µ
∑ =
=K
k
V
V
k
a
e
ea
1
)Pr(
H01I6A Verkeerskunde Cursus 2011 14
Binaire logitmodel
Keuze tussen twee alternatieven:
Deel teller en noemer door
21
1
)1Pr(VV
V
ee
e
+=
)( 211
1)1Pr(
VVe
−−+=1V
e
H01I6A Verkeerskunde Cursus 2011 15
)( 211
1)1Pr(
VVe
−−+=
0
*74,1*31,0*59.1*27,0*21,0*05,047,0
2
1
=
−++++−−=
V
VKGVGMGOPLLV
Keuzeverzameling voor een persoon:
Alternatief 1: maakt wel woon-werk verplaatsing
Alternatief 2: maakt niet woon-werk verplaatsing
Persoonskenmerken:
L = Leeftijd (in jaren 16-90)
OPL = Opleiding (schaal van 1-17)
G = Geslacht (0 = vrouw, 1 = man)
GM = Gehuwde man (0 = nee, 1 = ja)
GV = Gehuwde vrouw (0 = nee, 1 = ja)
VK = Vrouw met jong kind (0 = nee, 1 = ja)
Geschatte functies voor V (uit waarnemingen):
Voorbeeld binaire logitGebruik logitmodel voor berekening productie
Opmerkingen:
� Alleen verschil V1 en V2 is van belang !
� Aggregeren over zone !
� Check de plausibiliteit van de coefficienten !
H01I6A Verkeerskunde Cursus 2011 16
Voorbeeld vervoerwijzekeuze
Pr(a) de kans dat vervoerwijze a wordt gekozenVk de (waarneembare) utiliteit van vervoerwijze kK het aantal alternatieve vervoerwijzen
Als K = 2 binaire logitAls K > 2 multinomiale logit
Multinomiale logit
H01I6A Verkeerskunde Cursus 2011 17
Auto Bus Fiets
TIJD (min) 5 15 20
KOST (Euro) 0,20 0,17 -
Dan: Vauto = +0,47, Vbus = -1,53, Vfiets = -2,50
Modal split
Pr(auto) = e0,47 / (e0,47 + e-1,53 + e -2,50) = 85%
Pr(bus) = = 11%
Pr(fiets) = = 4%
Geschatte functies voor V (uit waarnemingen):
Vauto = 1,00 - 0,15*KOSTauto - 0,10*TIJDauto
Vbus = - 0,15*KOSTbus - 0,10*TIJDbus
Vfiets = -0,50 - 0,10*TIJDfiets
Voorbeeld multinomiale logitGebruik logitmodel voor berekening vervoerwijzekeuze
Opmerkingen:
� V kan negatief zijn !
� V + constante verandert uitkomsten niet !
Stel gegeven:
H01I6A Verkeerskunde Cursus 2011 18
Specificatie logitmodel
� Functionele vorm utiliteitsfuncties� Meestal lineaire functies maar niet verplicht
� Variabelen in de utiliteitsfunctie� Onderscheid 1
� Kenmerken alternatieven (tijd, kost, ….)
� Kenmerken personen (inkomen, leeftijd, …)
� Gecombineerde kenmerken (kost/inkomen, ….)
� Onderscheid 2� Generieke variabelen
� Alternatief-specifieke variabelen
Vauto = 1,00 - 0,15*KOSTauto - 0,10*TIJDauto
Vbus = - 0,15*KOSTbus - 0,10*TIJDbus
Vfiets = -0,50 - 0,10*TIJDfiets
H01I6A Verkeerskunde Cursus 2011 19
Geaggregeerde en gedisaggregeerde modellen
Stel 2 personen A en B:
Correct is eerst Pr(A) en Pr(B) bepalen, daarna middelen.
Foutief is eerst VA en VB
middelen, daarna Pr(C) bepalen.
Voor een zone betekent dit eerst kansen voor homogene groepen bepalen, daarna aggregeren.
H01I6A Verkeerskunde Cursus 2011 20
Schatting logitmodelMaximum Likelihood Methode
Neem aan:
persoon tijd auto tijd bus keuze
1 12 23 auto
2 31 27 auto
3 19 9 bus
aba
ba
VV
V
ee
e
ee
eauto
busauto
auto
2312
12
),1Pr(+
=+
=+
+
.
.
auto auto
bus bus
V a T b
V a T
= +
=
Waarnemingen:
Kans op individuele waarnemingen:
Likelihood =
Gezamenlijke kans op allewaarnemingen:
Bepaal a en b zodat L maximaal is
H01I6A Verkeerskunde Cursus 2011 21
Havenkeuzemodel
H01I6A Verkeerskunde Cursus 2011 22
Resultaten schatting(op basis van gegevens 1992 Statisches Bundesamt)
H01I6A Verkeerskunde Cursus 2011 23
Toepassing modelEffect aanleg IJzeren Rijn
H01I6A Verkeerskunde Cursus 2011 24
Beperkingen logitmodel (1)
Voor de kansverdeling van de stoortermen:
� Aanname 1: Gumbel-verdelingen
� Aanname 2: identiek (zelfde variantie :: 1/µ2 )
� Aanname 3: onafhankelijk
Logit routekeuze
Geeft verkeerd resultaat
Want variantie stoortermen
niet identiek
H01I6A Verkeerskunde Cursus 2011 25
Rode/Blauwe bussen probleem
1e situatie:
Vervoerwijze verdeling auto/blauwe bus 50%/50%
Dan geldt dus Vauto = Vblauwe bus want:
Beperkingen logitmodel (2)
2e situatie:
Introductie rode bussen.
Kleur bussen geen invloed op utiliteit:
Dus Vauto = Vrode bus = Vblauwe bus
Nu keuze uit 3 alternatieven:
Logit geeft verkeerd resultaat want: kansverdeling stoortermen niet onafhankelijk
Pr( ) 50%auto
blauwe busauto
V
VV
eauto
e e= =
+
Pr( ) 33%auto
rode bus blauwe busauto
V
V VV
eauto
e e e= =
+ +
H01I6A Verkeerskunde Cursus 2011 26
Gevolg aanname onafhankelijke stoortermen:Independence of irrelevant alternatives (i.i.a.)
∑ =
=K
k
V
V
k
i
e
ei
1
)Pr(
∑ =
=K
k
V
V
k
j
e
ej
1
)Pr(
Pr( ) / Pr( ) / jiVV
i j e e=
i.a.a. leidt tot:
Proportionele substitutie
(i.a.a. eigenschap)
Nieuwe verdeling als ov B van markt verdwijnt
H01I6A Verkeerskunde Cursus 2011 27
Aanpak i.a.a.
1. Toch logit, maar met heterogenebevolkingsgroepen
Oorspronkelijke verdeling over vervoerwijzen (%)
auto ov-bedrijf A ov-bedrijf B Totaal
Groep 1 95 2,5 2,5 100 %
Groep 2 25 37,5 37,5 100 %
Groep 1 + 2 60 20 20 100 %
Met logitmodel berekende verdeling na verdwijning van bedrijf B (%)
auto ov-bedrijf A ov-bedrijf B Totaal
Groep 1 97,44 2,56 0 100 %
Groep 2 40,00 60,00 0 100 %
Groep 1 + 2 68,72 31,28 0 100 %
H01I6A Verkeerskunde Cursus 2011 28
Betere aanpak i.a.a.
2. Nested logit
Alle verplaatsingen
Bus(of OV bedrijf B)
Openbaar VervoerAuto
Trein(of OV bedrijf A)
H01I6A Verkeerskunde Cursus 2011 29
λλλλk is maat voor correlatie: 0 = perfecte corr
1 = onafhankelijk
Nested logit - Berekeningsmethode (1)
alle verplaatsingen
prive vervoer openbaar vervoer
ov-bedrijf Aauto ov-bedrijf B
∑ ∑∈
−−=
inestenalle nestj
ni
i
ijeF ))(exp(),....,(/
21
λλεεεε
// 1
/
( )
Pr( , )( )
j ka k k
k
j i i
i
VV
j nest
k V
alle nesten i j nest
e e
a neste
λλ λ
λ λ
−
∈
∈
=
∑
∑ ∑
Neem aan:
(Generalised Extreme Value verdeling)
Dan kan worden afgeleid:
Zet gecorrelleerde alternatieven bijelkaar in een “nest”
H01I6A Verkeerskunde Cursus 2011 30
Nested logit - Berekeningsmethode (2)
alle verplaatsingen
/auto priveV λ /ov A ovV λ /ov B ovV λ
OV OVLSλ ∗prive priveLSλ ∗
/ /ln( )A OV B OVV V
OVLS e eλ λ= +
/ln( )auto priveV
priveLS e
λ=
Complexe formule op vorige slide is equivalent aan sequentie van ‘gewone’ logits !
LS = ‘logsom’
H01I6A Verkeerskunde Cursus 2011 31
alle verplaatsingen
/ov A ovV λ /ov B ovV λ
OV OVLSλ ∗autoV
Vereenvoudiging alsnest slechts éénalternatief bevat
Nested logit – nest met 1 alternatief
H01I6A Verkeerskunde Cursus 2011 32
Nested logit – voorbeeld berekening→ −∞→ −∞→ −∞→ −∞→ −∞→ −∞
λOV = 1geen correlatie A en Bnormale logit
λOV = 0,5enige correlatie A en B
λOV → 0perfecte correlatie A en B
ov-A en ov-Baanwezig
enkel ov-Aaanwezig
ov-A en ov-Baanwezig
enkel ov-Aaanwezig
ov-A en ov-Baanwezig
enkel ov-Aaanwezig
Pr(A/ov) 0,50 1,00 0,50 1,00 0,50 1,00
Pr(B/ov) 0,50 0,00 0,50 0,00 0,50 0,00
Pr(auto) 0,60 0,75 0,60 0,68 0,60 0,60
Pr(OV) 0,40 0,25 0,40 0,32 0,40 0,40
Pr(A) 0,20 0,25 0,20 0,32 0,20 0,40
Pr(B) 0,20 0,00 0,20 0,00 0,20 0,00
H01I6A Verkeerskunde Cursus 2011 33
Samenvatting
• Keuze is een centraal thema in de verkeerskunde
• Het logitmodel is een zeer geschikt instrument voor het analyseren van keuzes
• Gebaseerd op toekenning van utiliteiten aan de diverse keuze-alternatieven
• Utiliteiten zijn een functie van de kenmerken van alternatieven(en van kenmerken van personen)
• Omdat we niet alle kenmerken weten, voegen we een stochastischecomponent toe aan de utiliteit. Dit heet een stoorterm.
• De keuzeverdeling wordt gegeven in termen van kansen, die later over een gebied of bevolkingsgroep worden geaggregeerd
• Het logitmodel kent beperkingen. Correlaties in stoortermen kunnen worden verwerkt door toepassing van een nested logitmodel.