Friday, 4 August 2017

Zero Gonfiato Binario Options


AVVISO: Stai visualizzando una versione non aggiornata di questa pagina. Il nuovo contenuto può essere trovato sul nostro nuovo stats. idre. ucla. edu dominio. Si può anche cancellare la cache del browser e aggiornare la pagina, che dovrebbe reindirizzare direttamente al contenuto aggiornato. Benvenuti l'Istituto per gli esempi di ricerca digitale e l'istruzione R analisi dei dati: Zero-gonfiato negativo binomiale Regressione Zero-gonfiato la regressione binomiale negativa è per le variabili di conteggio modellazione con zeri eccessivi e di solito è per le variabili di outcome conteggio sovradispersa. Inoltre, teoria suggerisce che gli zeri in eccesso vengono generati da un processo separato dai valori di conteggio e che gli zeri in eccesso possono essere modellati in modo indipendente. Questa pagina usa i seguenti pacchetti. Assicurarsi che è possibile caricare prima di provare a eseguire gli esempi in questa pagina. Se non si dispone di un pacchetto installato, eseguire: install. packages (packagename). o se si vede la versione non è aggiornata, eseguire: update. packages (). Informazioni Versione: Codice per questa pagina è stato testato in R versione 3.1.1 (2014/07/10) On: 2014/08/11 Con: avvio 1,3-11 knitr 1.6 PSCL 1.04.4 VCD 1.3-1 gam 1.09.1 ​​coda 0,16-1 mvtnorm 1,0-0 GGally 0.4.7 plyr 1.8.1 MASSA 7,3-33 Hmisc 3,14-4 Formula 1.1-2 sopravvivenza 2,37-7 psych 1.4.5 reshape2 1.4 msm 1.4 PHIA 0,1-5 RColorBrewer 1.0-5 effetti 3.0- 0 colorspace 1,2-4 reticolo 0,20-29 Pequod 0,0-3 auto 2,0-20 ggplot2 1.0.0 si prega di notare: Lo scopo di questa pagina è quello di mostrare come utilizzare i vari comandi di analisi dei dati. Non copre tutti gli aspetti del processo di ricerca, che sono attesi ai ricercatori di fare. In particolare, non copre la pulizia dei dati e il controllo, la verifica di ipotesi, diagnostica modello o potenziali analisi di follow-up. Esempi di zero gonfiato regressione binomiale negativa Esempio 1. amministratori scolastici studiare il comportamento presenza di juniores scuola superiore a due scuole. Predittori di numero di giorni di assenza sono genere dello studente e punteggi dei test standardizzati nelle arti matematica e lingua. Esempio 2. Lo Stato biologi vogliono modellare quanti pesci vengono catturati dai pescatori in un parco statale. I visitatori sono invitati quanto rimasero, quante persone erano nel gruppo, c'erano bambini nel gruppo e come sono stati catturati molti pesci. Alcuni visitatori non lo fanno i pesci, ma non ci sono dati su se una persona pescato o no. Alcuni visitatori che hanno fatto il pesce non prendere qualsiasi pesce quindi non ci sono zeri in eccesso nei dati a causa delle persone che non hanno i pesci. Descrizione dei dati Consente di perseguire Esempio 2 dall'alto. Abbiamo i dati su 250 gruppi che sono andato a un parco. Ogni gruppo è stato interrogato su come molti pesci hanno catturato (COUNT), quanti bambini erano nel gruppo (bambino), quante persone erano nel gruppo (persone), e se non hanno portato un camper al parco (camper) . Oltre alla previsione del numero di pesci catturati, c'è un interesse nel predire l'esistenza di zeri in eccesso, cioè la probabilità che un gruppo catturato nullo pesce. Useremo il bambino variabili. persone. e camper nel nostro modello. Vediamo i dati. Metodi di analisi si potrebbe prendere in considerazione prima si mostra come è possibile analizzare questo con uno zero-gonfiato analisi binomiale negativa, permette di prendere in considerazione alcuni altri metodi che si possono utilizzare. OLS Regressione - si potrebbe tentare di analizzare questi dati utilizzando regressione OLS. Tuttavia, contano i dati sono altamente non-normale e non sono ben stimati dalla regressione OLS. Zero-gonfiato regressione di Poisson - zero gonfiato Poisson regressione fa meglio quando i dati non sono sovradispersa, cioè quando la varianza non è molto più grande della media. I modelli Count ordinaria - Poisson o modelli binomiali negativi potrebbe essere più appropriato, se non ci sono zeri in eccesso. Zero-gonfiato regressione binomiale negativa Un modello zero gonfiato assume che esito zero è dovuta a due diversi processi. Ad esempio, nell'esempio di pesca qui presentata, i due processi sono che un soggetto è andato a pescare vs non andato a pescare. Se non è andato la pesca, l'unico risultato possibile è pari a zero. Se andato a pescare, è quindi un processo di conteggio. Le due parti del modello zero gonfiato sono un modello binario, di solito un modello logit al modello che dei due processi il risultato di zero è associato e un modello conteggio, in questo caso, un modello binomiale negativo, per modellare il conteggio processo. Il conteggio atteso è espressa come una combinazione dei due processi. Prendendo l'esempio di pesca di nuovo: Per capire lo zero-gonfiato la regressione binomiale negativa, permette di iniziare con il modello binomiale negativo. Ci sono molteplici parametrizzazioni del modello binomiale negativa, ci concentriamo su NB2. La funzione di densità di probabilità binomiale negativa è: dove (p) è la probabilità di (R) successi. Da ciò si può derivare la funzione di verosimiglianza, che è dato da: qui troviamo la probabilità che il valore atteso, (mu) sulla base dei dati e (alfa) che consente la dispersione. In genere, questo sarebbe stato espresso come probabilità di registro, indicato con lo script L, (mathcal): che può essere espressa in termini di nostro modello sostituendo (MUI) con (exp (xi beta)). Per quanto riguarda il modello binomiale negativo zero gonfiato, l'espressione della funzione di verosimiglianza dipende dal fatto che il valore osservato è uno zero o maggiore di zero. Dal modello logistico (yi 1) rispetto a (y 0): Infine, si noti che R non stima (alfa) ma (theta), l'inverso di (alfa). Ora lascia costruire il nostro modello. Abbiamo intenzione di utilizzare il bambino variabili e camper per modellare il conteggio nella parte del modello binomiale negativa e le persone variabili nella parte logit del modello. Usiamo il PSCL per eseguire una regressione binomiale negativo zero gonfiato. Iniziamo stimando il modello con le variabili di interesse. L'uscita è molto simile l'uscita di due regressioni OLS in R. Di seguito la chiamata del modello, troverete un blocco di uscita contenente coefficienti di regressione binomiali negative per ciascuna delle variabili con errori standard, z-score, e valori di p per i coefficienti. Un secondo blocco consegue che corrisponde al modello di gonfiaggio. Questo include coefficienti logit per predire zeri in eccesso con i loro errori standard, punteggi z, e valori p. Tutti i predittori sia nel conteggio e di inflazione porzioni del modello sono statisticamente significative. Questo modello si adatta ai dati significativamente migliori rispetto al modello nullo, cioè il modello di solo intercetta. Per mostrare che questo è il caso, possiamo confrontare con il modello attuale di un modello nullo senza predittori utilizzando test chi-quadro sulla differenza di verosimiglianze di registro. Dall'output sopra, possiamo vedere che il nostro modello generale è statisticamente significativa. Si noti che l'output del modello di cui sopra non indica in alcun modo se il nostro modello di zero-gonfiato è un miglioramento su una regressione binomiale negativa standard. Possiamo determinare eseguendo il modello binomiale negativo norma corrispondente e quindi eseguire un test Vuong dei due modelli. Usiamo il pacchetto di massa per eseguire la regressione binomiale negativa standard. Il bambino predittori e camper nella parte del modello di regressione binomiale negativa numero di pesci catturati predire (contano) sono entrambi predittori significativi. La persona predittore nella parte del modello logit predire zeri eccessivi è statisticamente significativa. Per questi dati, la variazione attesa nel registro (count) per un aumento di un unità bambino è -1,515255 tenendo le altre variabili costanti. Un camper (camper 1) presenta un log atteso (conteggio) di 0,879,051 mila superiore a quella di un non-camper (camper 0) tiene altre variabili costanti. Le probabilità di log di essere uno zero eccessivo diminuirebbero del 1,67 per ogni persona in più nel gruppo. In altre parole, più la gente nel gruppo meno è probabile che lo zero sarebbero dovuti alla pesca non è andato. Mettere chiaramente, più grande è il gruppo la persona era in, più è probabile che la persona che è andato pesca. Il test Vuong suggerisce che il modello binomiale negativo zero gonfiato è un miglioramento significativo su un modello binomiale negativo standard. Possiamo ottenere intervalli di confidenza per i parametri ei parametri a potenza utilizzando il bootstrap. Per il modello binomiale negativo, questi sarebbero rapporti di rischio incidente, per il modello di gonfiaggio di zero, odds ratio. Usiamo il pacchetto di avvio. In primo luogo, si ottengono i coefficienti del nostro modello originale da utilizzare come valori iniziali per il modello per accelerare il tempo necessario per la stima. Poi si scrive una breve funzione che prende i dati e indici come input e restituisce i parametri ci interessa. Infine, passiamo che alla funzione di avvio e fare 1200 repliche, utilizzando neve per distribuirsi su quattro core. Si raccomanda di regolare il numero di core per qualunque sia la vostra macchina ha. Inoltre, per i risultati finali, si può desiderare di aumentare il numero di repliche per contribuire a garantire risultati stabili. I risultati sono alternati stime dei parametri e gli errori standard. Cioè, la prima riga ha la prima stima dei parametri dal nostro modello. Il secondo ha l'errore standard per il primo parametro. La terza colonna contiene gli errori standard bootstrap, che sono considerevolmente più grandi di quelli stimati da zeroinfl. Ora siamo in grado di ottenere gli intervalli di confidenza per tutti i parametri. Iniziamo sulla scala originale con percentile e pregiudizi regolato CI. Confrontiamo anche questi risultati con i normali intervalli di confidenza sulla base degli errori standard. Gli intervalli di confidenza bootstrap sono notevolmente più ampia rispetto al ravvicinamento base normale. Il CIS bootstrap sono più coerenti con le EC residenti Stata quando si utilizza errori standard robusti. Ora si può stimare il rapporto rischio incidente (IRR) per il rapporto modello binomiale negativo e probabilità (OR) per il modello logistico (inflazione zero). Questo viene fatto usando codice quasi identico come prima, ma passando una funzione di trasformazione alla h argomento boot. ci. in questo caso, exp a exponentiate. Per capire meglio il nostro modello, siamo in grado di calcolare il numero atteso di pesci catturati per le diverse combinazioni delle nostre predittori. Infatti, dal momento che stiamo lavorando con predittori categoriali in sostanza, siamo in grado di calcolare i valori attesi per tutte le combinazioni che utilizzano la funzione expand. grid per creare tutte le combinazioni e quindi la funzione di farlo prevedere. Infine creiamo un grafico. Le cose da considerare Qui ci sono alcuni problemi che si può prendere in considerazione nel corso della vostra analisi di ricerca. Domanda sul parametro over-dispersione è, in generale, un ingannevole. Un parametro grande eccesso di dispersione potrebbe essere dovuto ad una mancanza modello specificato o potrebbe essere dovuto ad un processo reale con l'eccesso di dispersione. Aggiunta di un problema di eccessiva dispersione non migliora necessariamente una mancanza modello specificato. Il gonfiato modello binomiale negativo pari a zero ha due parti, un modello di conteggio binomiale negativa e il modello logit per prevedere gli zeri in eccesso, così si potrebbe desiderare di rivedere queste pagine Data Analysis esempio, negativo binomiale regressione e Logit Regressione. Poiché lo zero binomiale negativa gonfiata ha sia un modello conteggio e un modello logit, ciascuno dei due modelli dovrebbero avere buoni predittori. I due modelli non hanno necessariamente bisogno di utilizzare gli stessi predittori. Problemi di perfetta previsione, separazione o parziale separazione possono verificarsi nella parte logistica del modello zero gonfiato. Count dati utilizzano spesso variabile di esposizione per indicare il numero di volte in cui l'evento sarebbe potuto accadere. È possibile incorporare l'esposizione (chiamato anche un offset) nel modello utilizzando la funzione di offset (). Non è consigliabile che lo zero-gonfiati modelli binomiali negative essere applicati a piccoli campioni. Ciò che costituisce un piccolo campione non sembra essere chiaramente definiti in letteratura. Pseudo-R-squared valori differiscono da OLS R squareds, si prega di consultare FAQ: Quali sono pseudo-R squareds per una discussione su questo tema. R online Riferimenti del Manuale di lunghi, J. S. 1997. modelli di regressione per variabili dipendenti categoriali e limitato. Thousand Oaks, CA: Sage Publications. Everitt, BS e Hothorn, T. Un manuale di analisi statistiche Utilizzo R Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dall'Università di California. The GENMOD procedura Zero Modelli gonfiati Count dati che hanno un'incidenza di zeri maggiore del previsto per la distribuzione di probabilità sottostante di conteggi può essere modellato con una distribuzione zero gonfiato. In GENMOD, la distribuzione sottostante può essere sia di Poisson o binomiale negativa. Vedere Lambert (1992), Long (1997) e Cameron e Trivedi (1998) per ulteriori informazioni sui modelli zero gonfiati. La popolazione è considerata consistere di due tipi di individui. Il primo tipo dà Poisson o conteggi negativi binomiali distribuiti, che potrebbero contenere zeri. Il secondo tipo dà sempre un conteggio zero. Sia trattato distribuzione sottostante media e la probabilità di un essere individuale del secondo tipo. Il parametro è chiamato qui la probabilità zero inflazione. ed è la probabilità di zero conteggi in eccesso rispetto alla frequenza prevista dalla distribuzione sottostante. È possibile richiedere che la probabilità di inflazione pari a zero viene visualizzato in un set di dati in uscita con la parola chiave PZERO. La distribuzione di probabilità di una variabile casuale Poisson zero gonfiato Y è data da e la distribuzione di probabilità di una variabile casuale binomiale negativo zero gonfiato Y è data da dove k è il parametro di dispersione binomiale negativa. dove h è una delle funzioni di collegamento binari: logit, probit o complementare log-log. La funzione di collegamento h è il link logit di default, oppure l'opzione funzione di collegamento specifica nella dichiarazione ZEROMODEL. La funzione di collegamento g è la funzione di collegamento log di default, o la funzione di collegamento specifica nel modello di dichiarazione, sia per il Poisson e binomiale negativa. Le covariate per l'osservazione i sono determinati dal modello specificato nella dichiarazione ZEROMODEL, e le covariate sono determinati dal modello specificato nel modello di dichiarazione. I parametri di regressione e sono stimati con la massima verosimiglianza. La media e la varianza di Y per il Poisson zero gonfiato sono dati da e per la binomiale negativa zero gonfiato da puo richiedere che la media di Y visualizzato per ciascuna osservazione in un data uscita impostati con il PRED keyword. zeroinfl: Zero - inflated conte argomenti di regressione dei dati passati al zeroinfl. control nella configurazione di default. Zero-gonfiati modelli di conteggio sono modelli a due componenti della miscela che combinano una massa punto a zero con una corretta distribuzione conteggio. Così, ci sono due fonti di zeri: zeri possono provenire sia dal punto di massa e dal numero di componenti. Di solito il modello di conteggio è un Poisson o la regressione binomiale negativa (con collegamento log). La distribuzione geometrica è un caso speciale della binomiale negativa con parametro dimensionale uguale a 1. Per modellare lo stato inosservato (conteggio vs zero), un modello binario viene utilizzato che cattura la probabilità di inflazione zero. nel caso più semplice solo con un'intercetta ma potenzialmente contenenti regressori. Per questo modello zero inflazione, un modello binomiale con diversi collegamenti possono essere utilizzati, in genere logit o probit. La formula può essere utilizzato per specificare entrambi i componenti del modello: Se è fornita una formula di tipo y x1 x2, allora gli stessi regressori sono impiegati in entrambi i componenti. Ciò equivale a y x1 x2 x1 x2. Naturalmente, un diverso insieme di regressori potrebbe essere specificato per il conteggio e componente zero inflazione, ad esempio y x1 x2 z2 z1 z3 dando il conteggio modello di dati y x1 x2 subordinata () zero-gonfiaggio modello y z1 z2 z3. Un semplice modello gonfiaggio dove tutti a zero conteggi hanno la stessa probabilità di appartenenza alla componente zero può venire indicato dalle Offset formula Y può essere specificata in entrambe le componenti del modello di pertinenza contare e zero inflazione modello: Offset y x1 (x2) Z2 Z1 compensati (Z3). dove x2 è utilizzato come un offset (cioè con coefficiente fissato a 1) nel componente conteggio e z3 analogamente nel componente zero gonfiaggio. Dalla norma sopra indicato y x1 offset (x2) viene espanso per y offset (x2) compensato x1 (x2) x1. Invece di utilizzare l'offset () involucro all'interno della formula. l'argomento offset può essere impiegato anche che imposta una compensazione soltanto per il modello conteggio. Così, la formula y x1 e x2 compensazione è equivalente alla formula y x1 offset (x2) x1. Tutti i parametri sono stimati con la massima verosimiglianza usando Optim. con possibilità di controllo previste in zeroinfl. control. valori iniziali possono essere forniti, stimato dalla EM (Expectation Maximization) algoritmo, oppure glm. fit (impostazione predefinita). Gli errori standard sono derivati ​​numericamente utilizzando la matrice Hessiana restituito da Optim. Vedere zeroinfl. control per i dettagli. L'oggetto modello equipaggiato restituito è di classe zeroinfl ed è simile agli oggetti GLM montati. Per elementi come coefficienti o termini un elenco viene restituito con elementi per lo zero e il numero dei componenti, rispettivamente. Per i dettagli vedi sotto. Un insieme di funzioni estrattori comuni per oggetti del modello a muro è disponibile per gli oggetti di classe zeroinfl. compresi i metodi per le funzioni di stampa generica. sommario. coef. vcov. loglik. residui. prevedere. montato. termini. model. matrix. Vedere predict. zeroinfl per maggiori dettagli su tutti i metodi. Un oggetto della classe zeroinfl. cioè un elenco con i componenti inclusi

No comments:

Post a Comment