Kas ir statistiskā nozīme? P vērtība definēta un kā to aprēķināt

P vērtības ir viens no statistikas analīzē visplašāk izmantotajiem jēdzieniem. Pētnieki, analītiķi un statistikas speciālisti tos izmanto, lai gūtu ieskatu no datiem un pieņemtu pamatotus lēmumus.

Kopā ar statistisko nozīmīgumu tie ir arī viens no statistikas analīzē visbiežāk izmantotajiem un pārprastajiem jēdzieniem.

Šajā rakstā tiks paskaidrots:

  • kā P vērtību izmanto statistiskās nozīmības secināšanai
  • kā tiek aprēķinātas P vērtības
  • un kā izvairīties no dažiem izplatītiem nepareiziem uzskatiem

Atkārtojums: hipotēzes pārbaude

Hipotēžu pārbaude ir standarta pieeja, lai gūtu ieskatu no datiem. To lieto praktiski visās kvantitatīvajās disciplīnās, un tam ir bagāta vēsture vairāk nekā simts gadu senā pagātnē.

Parastā pieeja hipotēžu pārbaudei ir jautājuma definēšana pēc interesējošajiem mainīgajiem lielumiem. Pēc tam varat izveidot divas pretējas hipotēzes, lai uz to atbildētu.

  • Nulles hipotēze apgalvo nepastāv statistiski nozīmīga sakarība starp mainīgajiem
  • Alternatīvā hipotēze apgalvo, ka ir statistiski nozīmīga sakarība starp mainīgajiem

Piemēram, sakiet, ka jūs pārbaudāt, vai kofeīns ietekmē programmēšanas produktivitāti. Ir divi mainīgie, kas jūs interesē - kofeīna deva un programmatūras izstrādātāju grupas produktivitāte.

Nulles hipotēze būtu:

  • "Kofeīna uzņemšana būtiski neietekmē programmēšanas produktivitāti".

Alternatīvā hipotēze būtu:

  • "Kofeīna uzņemšana patiešām būtiski ietekmē produktivitāti".

Vārdam “ievērojams” šeit ir ļoti specifiska nozīme. Tas attiecas uz attiecībām starp mainīgajiem lielumiem, kas pastāv kaut kas vairāk nekā tikai nejaušība .

Tā vietā saistība pastāv (vismaz daļēji) mainīgo lielumu “reālu” atšķirību vai ietekmes dēļ.

Nākamais solis ir apkopot dažus datus, lai pārbaudītu hipotēzes. To varētu apkopot no eksperimenta vai aptaujas vai no datu kopas, kurai varat piekļūt.

Pēdējais solis ir aprēķināt testa statistiku no datiem. Šis ir viens skaitlis, kas atspoguļo dažas jūsu datu īpašības. Piemēri ietver t-testu, Chi-kvadrāta testu un Kruskal-Wallis testu - starp daudziem citiem.

Tieši to, kuru aprēķināt, būs atkarīgs no jūsu uzdotā jautājuma, jūsu datu struktūras un datu izplatīšanas.

Šeit ir ērta krāpšanās lapa jūsu atsaucei.

Kofeīna piemērā piemērots tests varētu būt divu paraugu t-tests.

Jūs iegūsiet vienu testa statistiku no saviem datiem. Atliek tikai interpretēt šo rezultātu, lai noteiktu, vai tas atbalsta vai noraida nulles hipotēzi.

Šeit parādās P vērtības.

Cik maz ticams ir šī statistika?

Atgādinām, ka esat aprēķinājis testa statistiku, kas atspoguļo dažas jūsu datu īpašības. Jūs vēlaties saprast, vai tas atbalsta vai noraida nulles hipotēzi.

Pieņemtā pieeja ir tāda, ka nulles hipotēze ir patiesa. Tas ir, pieņemsim, ka starp mainīgajiem, kas jūs interesē, nav būtiskas sakarības.

Pēc tam apskatiet savāktos datus. Cik liela varētu būt jūsu testa statistika, ja nulles hipotēze patiešām ir patiesa?

Atsauksimies uz kofeīna uzņemšanas piemēru no iepriekš.

  • Pieņemsim, ka produktivitātes līmeņi starp izstrādātājiem tika sadalīti aptuveni vienmērīgi neatkarīgi no tā, vai viņi dzēra kofeīnu vai nē (grafiks A). Šis rezultāts, visticamāk, rastos nejauši, ja nulles hipotēze būtu patiesa.
  • Tomēr pieņemsim, ka gandrīz visu augstāko produktivitāti novēroja izstrādātāji, kuri dzēra kofeīnu (B grafiks). Tas ir "ekstrēmāks" rezultāts, un maz ticams, ka tas notiks tikai nejauši, ja nulles hipotēze būtu patiesa.

Bet cik „ekstrēmam” jābūt rezultātam, pirms tiek uzskatīts, ka pārāk maz ticams, ka tas atbalsta nulles hipotēzi?

Tas ir tas, ko P vērtība ļauj novērtēt. Tas sniedz skaitlisku atbildi uz jautājumu: "ja nulles hipotēze ir patiesa, kāda ir šī galējā vai ekstrēmākā rezultāta varbūtība?"

P vērtības ir varbūtības, tāpēc tās vienmēr ir no 0 līdz 1.

  • Augstu P vērtība, liecina novērotās rezultāti varētu rasties nejauši zem nulles hipotēzi.
  • Zems P vērtība, liecina, ka rezultāti ir mazāka iespēja rasties nejauši zem nulles hipotēzi.

Parasti statistiskās nozīmības noteikšanai tiek izvēlēts slieksnis. Šo slieksni bieži apzīmē ar α.

Ja P vērtība ir zemāka par slieksni , jūsu rezultāti ir “ statistiski nozīmīgi ”. Tas nozīmē, ka jūs varat noraidīt nulles hipotēzi (un pieņemt alternatīvo hipotēzi).

Visiem lietojumiem nav piemērota visiem piemērota sliekšņa. Parasti tiks izmantots patvaļīgs slieksnis, kas ir piemērots kontekstam.

Piemēram, tādās jomās kā ekoloģija un evolūcija ir grūti kontrolēt eksperimenta apstākļus, jo daudzi faktori var ietekmēt rezultātu. Var būt arī grūti savākt ļoti lielus izlases lielumus. Šajos laukos bieži tiks izmantots 0,05 slieksnis.

Citos apstākļos, piemēram, fizikā un inženierzinātnēs, piemērotāks būs slieksnis 0,01 vai pat zemāks.

Či kvadrātā piemērs

Šajā piemērā ir divi (izdomāti) mainīgie: reģions un dalība politiskajā partijā. Lai pārbaudītu, vai pastāv saistība starp reģionu un dalību politiskajā partijā, tā izmanto Či kvadrāta testu.

Katras partijas dalībnieku skaitu var mainīt.

  • Null hipotēze: " Starp reģionu un politisko partiju nav būtiskas attiecības "
  • Alternatīva hipotēze: "pastāv nozīmīgas attiecības starp reģionu un dalību politiskajā partijā"

Lai izmēģinātu dažādus scenārijus, nospiediet pogu Atkārtot.

Bieži sastopami nepareizi uzskati un kā no tiem izvairīties

Pastāv vairākas kļūdas, ko P pieredzes un hipotēžu pārbaudes jomā bieži pieļauj pat pieredzējuši praktiķi. Šīs sadaļas mērķis būs tos noskaidrot.

Nulles hipotēze nav interesanta - ja dati ir labi un analīze tiek veikta pareizi, tad tas ir patiess pamatots secinājums.

Jautājumam, uz kuru ir vērts atbildēt, vajadzētu būt interesantai atbildei - lai kāds būtu rezultāts.

Value P vērtība ir varbūtība, ka nulles hipotēze ir patiesa - P vērtība apzīmē "rezultātu varbūtību, ņemot vērā to, ka nulles hipotēze ir patiesa". Tas nav tas pats, kas "varbūtība, ka nulles hipotēze būs patiesa, ņemot vērā rezultātus".

P (dati | hipotēze) ≠ P (hipotēze | dati)

Tas nozīmē, ka zema P vērtība jums saka: "ja nulles hipotēze ir patiesa, šie rezultāti ir maz ticams". Tas nav pateikt, "ja šie rezultāti ir patiesi, tad nulles hipotēze ir maz ticama".

Vairākiem salīdzinājumiem varat izmantot vienu un to pašu nozīmīguma slieksni - atcerieties P vērtības definīciju. Tā ir varbūtība novērot noteiktu testa statistiku tikai nejauši.

Ja izmantojat slieksni α = 0,05 (vai 1 pret 20) un veicat, teiksim, 20 statistikas testus ... jūs varētu sagaidīt tikai nejauši, lai atrastu zemu P vērtību.

Ja veicat vairākus salīdzinājumus, jums jāizmanto zemāks slieksnis. Ir korekcijas metodes, kas ļaus aprēķināt, cik zemākam jābūt slieksnim.

❌ Nozīmības slieksnis vispār nozīmē jebko - tas ir pilnīgi patvaļīgi. 0,05 ir tikai konvencija. Atšķirība starp p = 0,049 un p = 0,051 ir gandrīz tāda pati kā starp p = 0,039 un p = 0,041.

Tas ir viens no lielākajiem hipotēžu pārbaudes trūkumiem šādā veidā. Tas piespiež vilkt līniju smiltīs, kaut arī nevienu līniju nevar viegli novilkt.

Tāpēc vienmēr apsveriet nozīmīguma sliekšņus, kādi tie ir - pilnīgi patvaļīgi.

Statistiskā nozīme nozīmē, ka nejaušībai nav nozīmes - tālu no tās. Bieži vien konkrētam iznākumam ir daudz iemeslu. Daži būs nejauši, citi mazāk.

Viena nejauša cēloņa atrašana nenozīmē, ka tas izskaidro visas atšķirības starp jūsu mainīgajiem. Svarīgi nemaldināt statistisko nozīmīgumu ar "efekta lielumu".

Values P vērtības ir vienīgais veids, kā noteikt statistisko nozīmīgumu - ir arī citas pieejas, kas dažreiz ir labākas.

Papildus klasiskajai hipotēžu pārbaudei apsveriet arī citas pieejas - piemēram, Baiesa faktoru vai viltus pozitīvā riska izmantošanu.