Statistika: Kui Palju Peaks Siis Kontrollima?

Link: http://blog.jpalardy.com/posts/statistics-how-many-would-you-check/

9. aprill 2015

vene Tõlge, tänu Vlad.
ukraina Tõlge, tänu Sandi.

Kujutage ette sellist olukorda:

Sa lihtsalt teha partii update miljoneid kasutajaid, sinu andmebaasis. Ei olnud viga sõnumeid ja olete kindlad, et kõik läks hästi. Kuid see ei ole valus vaadata…

Kuidas paljud kasutajad sa pead, et kontrollida, et olla kindel, et kõik töötas kõige vähem 95% kasutajatest?

Siin on mõned mõtted:

  • kui sa ei kontrolli, siis ei tea: enesekindlus on 0%. Lõppude lõpuks, võib-olla oma partii update ei tööta üldse, aga ei olnud viga sõnumid.
  • kui teil vaadata KÕIK, sa tead, et vastus: usaldus on 100%. Kuid see võib olla palju tööd…
  • kui märgid mõned kasutajad, võib-olla 10 ja update töötas … te võite hakata end hästi tunda. Kui kindel saab siis olla?

Ma ei usu, et vastus on ilmne. Ma pidin võtma aega, et mõelda.

ümbersõidu: keskmine reiting

Mulle meenus lugemise Kuidas Ei Sorteeri Keskmine Reiting, ja ma arvasin, et võiks rakendada sama loogikat, et see probleem.

Kui teil on ainult üks kommentaar, ja see on positiivne, on see, et 100%? Intuitiivselt, me teame, et see ei ole: see on lihtsalt ühe inimese arvamus. Kuna rohkem ja rohkem inimesi andma positiivseid kommentaare, saame enesetunne paraneb umbes täpsus skoor.

Tsiteerida artikkel on:

Antud reitingute mul on, on 95% võimalus, et “päris” fraktsioon positiivsed hinnangud on vähemalt, mida?

Me saame kasutada alumine piir Wilson usaldusvahemikuga.

praktikas, R

binom.wilson function, alates binom pakett, saab kasutada nagu see:

> binom.wilson(18, 20)
    method  x  n mean     lower     upper
  1 wilson 18 20  0.9 0.6989664 0.9721335

Teisisõnu, kui me valimisse 18 positiivset ja 2 negatiivset (18/20), “päris” fraktsioon ilmselt langeb vahel 0.699 ja 0.972 (keskmine: 0.9).

Meie näites, me ei võiks kasutada seda 100% edu:

> binom.wilson(10, 10)
    method  x  n mean     lower upper
  1 wilson 10 10    1 0.7224672     1

Ülemine piir ei ole huvitav, me ei ole huvitatud parim stsenaarium. Aga kui sa check 10 ja nad on kõik edukad, võite kindel olla, et ta töötas (alumine piir) 72.2% – kasutajad.

Kui hoiame kontrolli ja hoiame leida edu, me võime tunda rohkem ja rohkem kindel “true” edu:

alumine piir edu üle kontrollimiste arv

See võtab 73 kontrolli, et jõuda alumine piir on 95% “true” edu (punane joon).

Analüüs

Siin on analüüsi, kuna RMarkdown dokument ja tulemuseks väljund html-dokument.

Leave a Reply

Your email address will not be published. Required fields are marked *