Ho un database universitario e vorrei estrarre un campione casuale di dati di circa 1000 record.Esempio casuale SQL con gruppi
voglio garantire il campione è rappresentativo della popolazione in modo da includere le stesse proporzioni di corsi ad esempio
ho potuto fare questo usando il seguente:
select top 500 id from degree where coursecode = 1 order by newid()
union
select top 300 id from degree where coursecode = 2 order by newid()
union
select top 200 id from degree where coursecode = 3 order by newid()
ma abbiamo centinaia di codici di corsi, quindi questo richiederebbe molto tempo e mi piacerebbe poter riutilizzare questo codice per diverse dimensioni del campione e non voglio particolarmente passare attraverso la query e il codice rigido delle dimensioni del campione .
Qualsiasi aiuto sarebbe molto apprezzato
Come fare per assicurarmi di ottenere le proporzioni corrette nel campione? –
Come si calcola la dimensione del campione? Si basa sulla percentuale di popolazione? –
Il campione verrebbe utilizzato per un questionario, quindi la dimensione del campione dipende da quanto budget abbiamo ... non molto scientifico lo so! –