Sto eseguendo una regressione sui dati del censimento in cui la mia variabile dipendente è l'aspettativa di vita e ho otto variabili indipendenti. I dati sono aggregati come città, quindi ho molte migliaia di osservazioni.Come impostare un minimo dei quadrati ponderati in r per i dati eteroschedastici?
Il mio modello è piuttosto eterodosso. Voglio gestire un minimo di quadrati in cui ogni osservazione è ponderata dalla popolazione della città. In questo caso, vorremmo dire che voglio pesare le osservazioni per inverso della radice quadrata della popolazione. Non è chiaro per me, tuttavia, quale sarebbe la migliore sintassi. Attualmente, ho:
Model=lm(…,weights=(1/population))
È corretto? O dovrebbe essere:
Model=lm(…,weights=(1/sqrt(population)))
(ho trovato questa domanda qui:. Weighted Least Squares - R ma non chiarisce come R interpreta l'argomento di pesi)
Se si desidera pesare in base all'inverso della radice quadrata della popolazione, quale sarebbe l'argomento dell'opzione 1 rispetto all'opzione 2? – joran
Penso che sia la radice della domanda - R interpreta ulteriormente l'argomento dei pesi? –