Logit mieszany - Mixed logit

Logit mieszany to w pełni ogólny model statystyczny do badania wyborów dyskretnych . Przezwycięża trzy ważne ograniczenia standardowego modelu logitowego , umożliwiając losowe zmiany smaku wśród osób wybierających, nieograniczone wzorce substytucji w wyborach i korelację nieobserwowanych czynników w czasie. Logit mieszany może wybrać dowolny rozkład współczynników losowych, w przeciwieństwie do probit, który jest ograniczony do rozkładu normalnego. Nazywa się to „logit mieszany”, ponieważ prawdopodobieństwo wyboru jest mieszaniną logitów z rozkładem mieszania. Wykazano, że mieszany model logitowy może przybliżyć z dowolnym stopniem dokładności każdy prawdziwy losowy model użytkowy z dyskretnego wyboru, przy odpowiedniej specyfikacji zmiennych i rozkładzie współczynników. ${\ displaystyle f}$ ${\ displaystyle f}$

Losowa zmiana smaku

Współczynniki „smaku” standardowego modelu logitowego są stałe, co oznacza, że są takie same dla wszystkich. Logit mieszany ma różne dla każdej osoby (tj. Dla każdego decydenta). ${\ displaystyle \ beta}$ ${\ displaystyle \ beta}$ ${\ displaystyle \ beta}$

W standardowym modelu logit użyteczność osoby alternatywnej to: ${\ displaystyle n}$ ${\ displaystyle i}$

{\ Displaystyle U_ {ni} = \ beta x_ {ni} + \ varepsilon _ {ni}}

z

{\ displaystyle \ varepsilon _ {ni}}

~ iid ekstremalna wartość

W przypadku modelu z mieszanym logitem specyfikacja ta jest uogólniona przez dopuszczenie losowości. Użyteczność osoby do alternatywy w modelu mieszanego logitu to: ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle n}$ ${\ displaystyle i}$

{\ Displaystyle U_ {ni} = \ beta _ {n} x_ {ni} + \ varepsilon _ {ni}}

z

{\ displaystyle \ varepsilon _ {ni}}

~ iid ekstremalna wartość

{\ Displaystyle \ quad \ beta _ {n} \ sim f (\ beta | \ theta)}

gdzie θ to parametry rozkładu w populacji, takie jak średnia i wariancja . ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle \ beta _ {n}}$

W zależności od tego prawdopodobieństwo, że osoba wybierze alternatywę, jest standardową formułą logit: ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle n}$ ${\ displaystyle i}$

{\ Displaystyle L_ {ni} (\ beta _ {n}) = {\ Frac {e ^ {\ beta _ {n} X_ {ni}}} {\ sum _ {j} e ^ {\ beta _ {n } X_ {nj}}}}}

Ponieważ jednak jest losowe i nieznane, prawdopodobieństwo wyboru (bezwarunkowego) jest całką tego wzoru logitowego po gęstości . ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle \ beta _ {n}}$

{\ Displaystyle P_ {ni} = \ int L_ {ni} (\ beta) f (\ beta | \ theta) d \ beta}

Model ten jest również nazywany modelem logitowym współczynników losowych, ponieważ jest zmienną losową. Pozwala to na losowanie nachyleń użyteczności (tj. Użyteczności krańcowej), co jest rozszerzeniem modelu efektów losowych, w którym tylko punkt przecięcia był stochastyczny. ${\ displaystyle \ beta _ {n}}$

Dowolną funkcję gęstości prawdopodobieństwa można określić dla rozkładu współczynników w populacji, tj . Dla . Najczęściej używana dystrybucja jest normalna, głównie ze względu na swoją prostotę. W przypadku współczynników, które mają ten sam znak dla wszystkich ludzi, takich jak współczynnik ceny, który jest koniecznie ujemny lub współczynnik pożądanego atrybutu, stosuje się rozkłady z obsługą tylko jednej strony zera, jak lognormal. Gdy współczynniki nie mogą być logicznie nieograniczone duże lub małe, często stosuje się rozkłady ograniczone, takie jak rozkłady trójkątne lub. ${\ Displaystyle f (\ beta | \ theta)}$ ${\ displaystyle S_ {b}}$

Nieograniczone wzorce zastępowania

Model mieszanego logitu może reprezentować ogólny wzorzec substytucji, ponieważ nie wykazuje restrykcyjnej niezależności logitu od nieistotnych właściwości alternatywnych (IIA). Procentowa zmiana osoby „s bezwarunkowy prawdopodobieństwa wyboru alternatywy podano procentową zmianę w m p atrybut alternatywa (na elastyczność w odniesieniu do ) jest ${\ displaystyle n}$ ${\ displaystyle i}$ ${\ displaystyle j}$ ${\ displaystyle P_ {ni}}$ ${\ displaystyle x_ {nj} ^ {m.}}$

{\ displaystyle Elasticity_ {P_ {ni}, x_ {nj} ^ {m}} = - {\ Frac {x_ {nj} ^ {m}} {P_ {ni}}} \ int \ beta ^ {m} L_ {ni} (\ beta) L_ {nj} (\ beta) f (\ beta) d \ beta = -x_ {nj} ^ {m} \ int \ beta ^ {m} L_ {nj} (\ beta) { \ frac {L_ {ni} (\ beta)} {P_ {ni}}} f (\ beta) d \ beta}

gdzie jest m- ty element . Z tego wzoru można wywnioskować, że dziesięcioprocentowa redukcja nie musi oznaczać (jak w przypadku logitu) dziesięcioprocentowej redukcji wzajemnej alternatywy . Powodem jest to, że względne wartości procentowe zależą od korelacji między prawdopodobieństwem warunkowym, że dana osoba wybierze alternatywę, a prawdopodobieństwem warunkowym, które osoba wybierze zamiast różnych losowań . ${\ displaystyle \ beta ^ {m.}}$ ${\ displaystyle \ beta}$ ${\ displaystyle P_ {ni}}$ ${\ displaystyle P_ {nj}}$ ${\ displaystyle n}$ ${\ displaystyle i, L_ {ni},}$ ${\ displaystyle n}$ ${\ displaystyle j, L_ {nj},}$ ${\ displaystyle \ beta}$

Korelacja nieobserwowanych czynników w czasie

Standardowy logit nie uwzględnia żadnych nieobserwowanych czynników, które utrzymują się w czasie dla danego decydenta. Może to stanowić problem, jeśli używasz danych panelu, które reprezentują powtarzane wybory w czasie. Stosując standardowy model logitowy do danych panelowych, zakładasz, że nieobserwowane czynniki wpływające na wybór danej osoby są nowe za każdym razem, gdy osoba dokonuje wyboru. To bardzo mało prawdopodobne założenie. Aby uwzględnić zarówno przypadkową zmienność smaku, jak i korelację w nieobserwowanych czynnikach w czasie, użyteczność dla respondenta n dla alternatywy i w czasie t jest określona w następujący sposób:

{\ Displaystyle U_ {nit} = \ beta _ {n} X_ {nit} + \ varepsilon _ {nit}}

gdzie indeks dolny t jest wymiarem czasu. Nadal przyjmujemy założenie logit, które jest wartością ekstremalną. Oznacza to, że jest niezależny w czasie, od ludzi i od alternatyw. jest w zasadzie tylko białym szumem. Jednak korelacja w czasie i względem alternatyw wynika ze wspólnego efektu „s”, które wchodzą do użyteczności w każdym okresie czasu i każdej alternatywie. ${\ displaystyle \ varepsilon}$ ${\ displaystyle \ varepsilon}$ ${\ displaystyle \ varepsilon}$ ${\ displaystyle \ beta}$

Aby wyraźnie zbadać korelację, załóżmy, że rozkład β ma rozkład normalny ze średnią i wariancją . Wtedy równanie użyteczności staje się: ${\ displaystyle {\ bar {\ beta}}}$ ${\ displaystyle \ sigma ^ {2}}$

{\ Displaystyle U_ {nit} = ({\ bar {\ beta}} + \ sigma \ eta _ {n}) X_ {nit} + \ varepsilon _ {nit}}

a η jest wynikiem ze standardowej gęstości normalnej. Po zmianie układu równanie staje się:

{\ Displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + (\ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit})}

{\ Displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + e_ {nit}}

gdzie gromadzone są niezauważone czynniki . Spośród nieobserwowanych czynników jest niezależny w czasie i nie jest niezależny w czasie ani od alternatyw. ${\ Displaystyle e_ {nit} = \ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit}}$ ${\ displaystyle \ varepsilon _ {nit}}$ ${\ displaystyle \ sigma \ eta _ {n} X_ {nit}}$

Następnie kowariancja między alternatywami i jest, ${\ displaystyle i}$ ${\ displaystyle j}$

{\ Displaystyle Cov (e_ {nit}, e_ {njt}) = \ sigma ^ {2} (X_ {nit} X_ {njt})}

i kowariancja między czasem a jest ${\ displaystyle t}$ ${\ displaystyle q}$

{\ Displaystyle Cov (e_ {nit}, e_ {niq}) = \ sigma ^ {2} (X_ {nit} X_ {niq})}

Poprzez odpowiednie określenie X można uzyskać dowolny wzorzec kowariancji w czasie i alternatywy.

W zależności od tego , prawdopodobieństwo sekwencji wyborów dokonanych przez osobę jest po prostu iloczynem prawdopodobieństwa logitowego każdego indywidualnego wyboru dokonanego przez tę osobę: ${\ displaystyle \ beta _ {n}}$

{\ Displaystyle L_ {n} (\ beta _ {n}) = \ prod _ {t} {\ Frac {e ^ {\ beta _ {n} X_ {nit}}} {\ sum _ {j} e ^ {\ beta _ {n} X_ {njt}}}}}

ponieważ jest niezależny w czasie. Wtedy (bezwarunkowe) prawdopodobieństwo sekwencji wyborów jest po prostu całką tego iloczynu logitów po gęstości . ${\ displaystyle \ varepsilon _ {nit}}$ ${\ displaystyle \ beta}$

{\ Displaystyle P_ {ni} = \ int L_ {n} (\ beta) f (\ beta | \ theta) d \ beta}

Symulacja

Niestety nie ma zamkniętej postaci dla całki wchodzącej w prawdopodobieństwo wyboru, więc badacz musi zasymulować P _n . Na szczęście dla badacza symulacja P _n może być bardzo prosta. Należy wykonać cztery podstawowe kroki

1. Weź losowanie z funkcji gęstości prawdopodobieństwa, którą określiłeś dla współczynników „smaku”. To znaczy, weź remis z i oznacz go , aby reprezentował pierwsze losowanie. ${\ Displaystyle f (\ beta | \ theta)}$ ${\ displaystyle \ beta ^ {r}}$ ${\ displaystyle r = 1}$