Frekvens er i statistik en relativ hyppighed. Hvis fx en bestemt observation optræder i 8 ud af 20 tilfælde, siges dens frekvens at være 8/20 = 0,4.

I en statistisk analyse kan man fx undersøge, om en plante gror bedre med en bestemt type gødning. Her observerer man, at planterne gror bedre i 8 ud af \(n\) = 20 forsøg. I det tilfælde vil tallet 8 være en observation fra en binomialfordeling. Sandsynligheden \(p\) for, at en plante vil have gavn af gødningen, kan da estimeres ved \(\hat{\theta}=0,4\). Variansen for denne estimator kan så beregnes som

\(\frac{\hat{\theta}(1-\hat{\theta})}{(n)-1)}\),

hvor \(n=20\) i dette tilfælde. Denne varians kan derefter danne udgangspunkt for et konfidensinterval. Selv om antal forsøg \(n=20\) er lavt, vil man vælge at beregne et 95 % konfidendensinterval ud fra en approksimerende normalfordeling som

\(\left[ \hat{\theta}-1.96 \frac{\hat{\theta}(1-\hat{\theta})}{(n-1)},\hat{\theta}+1.96 \frac{\hat{\theta}(1-\hat{\theta})}{(n-1)} \right]\)

I det første eksempel var der tale om et forsøg, men ordet frekvens kan også anvendes i forbindelse med en stikprøve. Hvis der i en stikprøve på 1.000 personer fx er \(n\) = 400, der interesserer sig for håndbold, vil man sige at frekvensen er 400/1000 = 0,4. Teoretisk set, skal der i denne situation tages hensyn til, at stikprøven er indsamlet fra en endelig population, fx 5 millioner danskere i en relevant aldersgruppe. Det betyder, at frekvensen i dette tilfælde er hypergeometrisk fordelt, så variansen på frekvensen bliver et mere kompliceret udtryk. Da populationen, stikprøven og antallet \(n\) er stort, kan der dog approksimeres med en binomialfordeling, så et konfidensinterval får samme form som overfor.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig