Metoda ponovnega vzorčenja

Iz testwiki
Pojdi na navigacijo Pojdi na iskanje

Metoda ponovnega vzorčenja (Predloga:Jezik-en) je statistična metoda, pri kateri statistični izračuni temeljijo na podlagi različnih vzorcev, ki so naključno izbrani iz danih dodatkov s ponovnim vzorčenjem. Tako dobimo različne ocene statističnih parametrov in iz njih lahko ocenimo parameter in interval zaupanja v oceno. Metodo se uporablja zlasti kadar ni znana teoretična porazdelitev podatkov.

Prvi jo je leta 1979 opisal Bradley Efron v članku Bootstrap Methods: Another Look at the Jackknife.

Postopek

Pri bootstrapu po navadi empirična porazdelitvena funkcija F^ na vzorcu x1,,xn nadomesti teoretično porazdelitveno funkcijo F dane naključne spremenljivke.

V najprerpostejšem primeru se ustvari B bootstrap-vzorcev xb=(x1*,,xn*),b=1,,B, tako da se vsakič (pri generiranju vsakega bootstrap vzorca) iz danega vzorca n-krat izbere vrednosti s ponavlajnjem (ista podatkovna točka je lahko izbrana večkrat). To ustreza ponovljenem vlečenju naključnih števil iz empirične porazporeditvene funkcije F^.

Za vsak bootstrap-vzorec se izračuna vrednost Tb(x1*,,xn*)=T(xb) za statistični parameter T, katerega oceno se išče. Porazporeditev parametra T(X1,,Xn) se na koncu aproksimira skozi empirično porazdelitev B ocen za Tb(x1*,,xn*).

V zapletenejših modelih se namesto zgolj ponavljajočega vlečenja iz že obstoječih podatkov, lahko na podlagi ocen parametrov neznane porazdelitve tudi generira "lažne" podatke tako da tej ustrezajo porazdelitvi kateri ustrezajo ocene parametrov. Zlasti kadar statističnih preizkusov ni mogoče izvesti, ker na primer natančna porazdelitev parametra ni znana ali pa je vzorec premajhen za izpolnjevanje konvergenčnih kriterijev, se tako lahko oceni kvantile in p-vrednosti.

Zunanje povezave

Literatura

  • Predloga:Cite journal
  • B. Efron, R.J. Tibshirani: An introduction to the bootstrap, New York: Chapman & Hall, 1993.
  • J. Shao, D. Tu: The Jackknife and Bootstrap, Springer, 1995.

Predloga:Normativna kontrola