Statistica inferenziale è il processo di stima di una variabile in una popolazione sulla base di dati noti da un campione più piccolo di quella popolazione . Affinché stime accurate da effettuare , la media e la distribuzione del campione devono essere il più vicino possibile alla popolazione da cui è presa. Ci sono diversi passaggi si possono adottare a tal fine . Istruzioni
1
Utilizzare un campione di grandi dimensioni come il tempo e fondi consentono . Se si utilizza un campione più piccolo, è più probabile che il campione si raggrupperanno intorno a una media che non rappresenta la vostra popolazione . Al contrario, maggiore è il vostro campione , maggiore è la probabilità che esso corrisponda statisticamente la popolazione .
2
Utilizzare il campionamento casuale . Idealmente, ogni punto di dati nella popolazione dovrebbe avere la stessa probabilità di finire nel vostro campione . Se questo non è il caso , le stime saranno distorte . Per esempio, se si vuole stimare il valore medio netto di persone nel vostro paese , e si raccolgono solo i dati di esempio dalla città più ricca , il campione sarà molto probabilmente sopravvalutare la media della popolazione .
3
Rimuovere valori anomali. Un valore anomalo è un punto di dati che si trova lontano dal cluster principale. Anche se essi rappresentano i punti dati legittimi dal campione , si consiglia di rimuoverli , in alcuni casi , ad esempio quando la dimensione del campione è piuttosto piccolo , o quando per qualche motivo è necessario utilizzare la media invece di un'altra misura di tendenza centrale , come la mediana . Ad esempio, se il valore di un'indagine rete incluso 10 persone - 9 di classe media , e Bill Gates - la vostra stima del salario medio può essere gonfiato , così si potrebbe contrastare questo rimuovendo il valore anomalo
.