Ujian hipotesis ialah prosedur yang diperlukan dalam statistik. Ujian hipotesis menilai dua pernyataan yang saling eksklusif untuk menentukan pernyataan yang paling baik disokong oleh data sampel. Apabila sesuatu dapatan dikatakan signifikan secara statistik, ia disebabkan oleh ujian hipotesis.
Kaedah pengesahan
Kaedah untuk menguji hipotesis statistik ialah kaedah analisis statistik. Biasanya, dua set statistik dibandingkan, atau set data sampel dibandingkan dengan set data sintetik daripada model ideal. Data mesti ditafsirkan sedemikian rupa untuk menambah makna baru. Anda boleh mentafsirnya dengan menganggap struktur tertentu hasil akhir dan menggunakan kaedah statistik untuk mengesahkan atau menolak andaian. Andaian dipanggil hipotesis, dan ujian statistik yang digunakan untuk tujuan ini dipanggil hipotesis statistik.
H0 dan H1 hipotesis
Terdapat dua yang utamakonsep ujian statistik hipotesis - apa yang dipanggil "hipotesis utama atau nol" dan "hipotesis alternatif". Mereka juga dipanggil hipotesis Neyman-Pearson. Andaian ujian statistik dipanggil hipotesis nol, hipotesis utama, atau pendeknya H0. Ia sering dirujuk sebagai andaian lalai atau andaian bahawa tiada apa yang berubah. Pelanggaran andaian ujian sering dirujuk sebagai hipotesis pertama, hipotesis alternatif, atau H1. H1 ialah singkatan untuk beberapa hipotesis lain, kerana apa yang kita tahu mengenainya ialah data H0 boleh dibuang.
Sebelum menolak atau tidak menolak hipotesis nol, keputusan ujian mesti ditafsirkan. Perbandingan dianggap signifikan secara statistik jika hubungan antara set data tidak mungkin menjadi pelaksanaan hipotesis nol mengikut kebarangkalian ambang - tahap keertian. Terdapat juga kriteria kesesuaian untuk ujian hipotesis statistik. Ini adalah nama kriteria ujian hipotesis, yang dikaitkan dengan undang-undang yang sepatutnya bagi taburan yang tidak diketahui. Ini ialah ukuran berangka bagi percanggahan antara taburan empirikal dan teori.
Prosedur dan kriteria untuk menguji hipotesis statistik
Kaedah pemilihan hipotesis yang paling biasa adalah berdasarkan sama ada kriteria maklumat Akaike atau pekali Bayesian. Ujian hipotesis statistik ialah teknik utama dalam kedua-dua inferens dan inferens Bayesian, walaupun kedua-dua jenis mempunyai perbezaan yang ketara. Ujian Hipotesis Statistikmentakrifkan prosedur yang mengawal kebarangkalian tersilap membuat keputusan mengenai lalai yang salah atau hipotesis nol. Prosedur ini berdasarkan kepada kemungkinan ia berfungsi. Kebarangkalian membuat keputusan yang salah ini adalah kemustahilan bahawa hipotesis nol adalah benar dan tiada hipotesis alternatif tertentu wujud. Ujian tidak dapat menunjukkan sama ada ia benar atau salah.
Kaedah alternatif teori keputusan
Kaedah alternatif teori keputusan wujud, di mana hipotesis nol dan pertama dianggap pada asas yang lebih sama. Pendekatan membuat keputusan lain, seperti teori Bayesian, cuba mengimbangi akibat keputusan buruk merentasi semua kemungkinan dan bukannya memfokuskan pada satu hipotesis nol. Sebilangan pendekatan lain untuk memutuskan hipotesis mana yang betul adalah berdasarkan data, yang mana antaranya mempunyai sifat yang dikehendaki. Tetapi ujian hipotesis ialah pendekatan dominan kepada analisis data dalam banyak bidang sains.
Menguji hipotesis statistik
Apabila satu set keputusan berbeza daripada set lain, seseorang mesti bergantung pada ujian hipotesis statistik atau ujian hipotesis statistik. Tafsiran mereka memerlukan pemahaman yang betul tentang nilai-p dan nilai kritikal. Ia juga penting untuk memahami bahawa, tanpa mengira tahap kepentingan, ujian mungkin masih mengandungi ralat. Oleh itu, kesimpulannya mungkin tidak betul.
Proses ujian terdiri daripadaberbilang langkah:
- Hipotesis awal sedang dibuat untuk penyelidikan.
- Hipotesis nol dan alternatif yang berkaitan ditunjukkan.
- Menerangkan andaian statistik tentang sampel dalam ujian.
- Menentukan ujian yang sesuai.
- Pilih tahap keertian dan ambang kebarangkalian di bawahnya yang mana hipotesis nol akan ditolak.
- Taburan statistik ujian hipotesis nol menunjukkan nilai yang mungkin di mana hipotesis nol ditolak.
- Pengiraan sedang dijalankan.
- Keputusan dibuat untuk menolak atau menerima hipotesis nol yang memihak kepada alternatif.
Terdapat alternatif yang menggunakan nilai-p.
Ujian kepentingan
Data tulen tidak berguna tanpa tafsiran. Dalam statistik, apabila bertanya soalan tentang data dan mentafsir keputusan, kaedah statistik digunakan untuk memastikan ketepatan atau kemungkinan jawapan. Apabila menguji hipotesis statistik, kelas kaedah ini dipanggil ujian statistik, atau ujian keertian. Istilah "hipotesis" mengingatkan kaedah saintifik, di mana hipotesis dan teori disiasat. Dalam statistik, ujian hipotesis menghasilkan kuantiti yang diberikan andaian yang diberikan. Ia membolehkan anda mentafsir sama ada andaian itu benar atau pelanggaran telah dibuat.
Tafsiran statistik ujian
Ujian hipotesisdigunakan untuk menentukan keputusan penyelidikan yang akan membawa kepada penolakan hipotesis nol untuk tahap kepentingan yang telah ditetapkan. Keputusan ujian hipotesis statistik mesti ditafsirkan supaya kerja dapat diteruskan. Terdapat dua bentuk umum kriteria ujian hipotesis statistik. Ini adalah nilai p dan nilai kritikal. Bergantung pada kriteria yang dipilih, hasil yang diperoleh mesti ditafsirkan secara berbeza.
Apakah itu nilai-p
Output digambarkan sebagai signifikan secara statistik apabila mentafsir nilai-p. Sebenarnya, penunjuk ini bermaksud kebarangkalian ralat jika hipotesis nol ditolak. Dalam erti kata lain, ia boleh digunakan untuk menamakan nilai yang boleh digunakan untuk mentafsir atau mengukur keputusan ujian, dan untuk menentukan kebarangkalian ralat dalam menolak hipotesis nol. Sebagai contoh, anda boleh melakukan ujian normaliti pada sampel data dan mendapati terdapat sedikit peluang untuk outlier. Walau bagaimanapun, hipotesis nol tidak perlu ditolak. Ujian hipotesis statistik boleh mengembalikan nilai p. Ini dilakukan dengan membandingkan nilai p dengan nilai ambang yang telah ditetapkan yang dipanggil aras keertian.
Tahap Kepentingan
Tahap keertian selalunya ditulis dengan huruf kecil Yunani "alpha". Nilai umum yang digunakan untuk alfa ialah 5%, atau 0.05. Nilai alfa yang lebih kecil mencadangkan tafsiran hipotesis nol yang lebih dipercayai. Nilai-p dibandingkan dengannilai alfa yang telah dipilih sebelumnya. Hasilnya adalah signifikan secara statistik jika nilai p kurang daripada alfa. Aras keertian boleh diterbalikkan dengan menolaknya daripada satu. Ini dilakukan untuk menentukan tahap keyakinan hipotesis yang diberi data sampel yang diperhatikan. Apabila menggunakan kaedah menguji hipotesis statistik ini, nilai P adalah kebarangkalian. Ini bermakna dalam proses mentafsir keputusan ujian statistik, seseorang tidak tahu apa yang benar atau salah.
Teori ujian hipotesis statistik
Penolakan hipotesis nol bermakna terdapat bukti statistik yang mencukupi yang kelihatannya berkemungkinan. Jika tidak, ini bermakna tidak ada statistik yang mencukupi untuk menolaknya. Seseorang boleh memikirkan ujian statistik dari segi dikotomi menolak dan menerima hipotesis nol. Bahaya ujian statistik hipotesis nol ialah, jika diterima, ia mungkin kelihatan benar. Sebaliknya, adalah lebih tepat untuk mengatakan bahawa hipotesis nol tidak ditolak kerana tidak ada bukti statistik yang mencukupi untuk menolaknya.
Momen ini sering mengelirukan tambahan pemula. Dalam kes sedemikian, adalah penting untuk mengingatkan diri anda bahawa hasilnya adalah kebarangkalian dan walaupun menerima hipotesis nol masih mempunyai peluang kecil untuk ralat.
Hipotesis nol benar atau salah
Tafsiran nilai p tidak bermakna sifar ituhipotesis adalah benar atau salah. Ini bermakna pilihan telah dibuat untuk menolak atau tidak menolak hipotesis nol pada tahap kepentingan statistik tertentu berdasarkan data empirikal dan ujian statistik yang dipilih. Oleh itu, nilai-p boleh dianggap sebagai kebarangkalian data yang diberikan di bawah andaian yang telah ditetapkan yang tertanam dalam ujian statistik. Nilai-p ialah ukuran tentang kemungkinan sampel data akan diperhatikan jika hipotesis nol adalah benar.
Tafsiran nilai kritikal
Sesetengah ujian tidak mengembalikan p. Sebaliknya, mereka mungkin mengembalikan senarai nilai kritikal. Hasil kajian sedemikian ditafsirkan dengan cara yang sama. Daripada membandingkan satu nilai p dengan tahap keertian yang telah ditetapkan, statistik ujian dibandingkan dengan nilai kritikal. Jika ternyata kurang, ini bermakna tidak mungkin untuk menolak hipotesis nol. Jika lebih daripada atau sama, hipotesis nol harus ditolak. Maksud algoritma ujian hipotesis statistik dan tafsiran keputusannya adalah serupa dengan nilai p. Tahap kepentingan yang dipilih ialah keputusan kebarangkalian untuk menolak atau tidak menolak andaian ujian asas berdasarkan data.
Ralat dalam ujian statistik
Tafsiran ujian hipotesis statistik adalah kebarangkalian. Tugas menguji hipotesis statistik bukanlah untuk mencari pernyataan yang benar atau salah. Bukti ujian mungkin salah. Contohnya, jika alfa ialah 5%, ini bermakna sebahagian besar 1 daripada 20hipotesis nol akan ditolak secara tidak sengaja. Atau ia tidak akan berlaku kerana bunyi statistik dalam sampel data. Memandangkan perkara ini, nilai p kecil untuk menolak hipotesis nol mungkin bermakna ia palsu atau ralat telah dibuat. Jika ralat jenis ini dibuat, hasilnya dipanggil positif palsu. Dan ralat sedemikian adalah ralat jenis pertama apabila menguji hipotesis statistik. Sebaliknya, jika nilai-p cukup besar untuk bermakna penolakan hipotesis nol, ia mungkin bermakna ia adalah benar. Atau tidak betul, dan beberapa peristiwa yang tidak mungkin berlaku disebabkan ralat itu dibuat. Ralat jenis ini dipanggil negatif palsu.
Kebarangkalian ralat
Apabila menguji hipotesis statistik, masih ada peluang untuk membuat mana-mana jenis ralat ini. Data palsu atau kesimpulan palsu berkemungkinan besar. Sebaik-baiknya, tahap keertian harus dipilih yang meminimumkan kemungkinan salah satu ralat ini. Sebagai contoh, ujian statistik hipotesis nol mungkin mempunyai tahap kepentingan yang sangat rendah. Walaupun tahap keertian seperti 0.05 dan 0.01 adalah perkara biasa dalam banyak bidang sains, tahap keertian yang paling biasa digunakan ialah 310^-7, atau 0.0000003. Ia sering dirujuk sebagai "5-sigma". Ini bermakna kesimpulannya adalah rawak dengan kebarangkalian 1 dalam 3.5 juta ulangan bebas eksperimen. Contoh-contoh ujian hipotesis statistik sering membawa ralat sedemikian. Ini juga sebab mengapa penting untuk mempunyai keputusan bebas.pengesahan.
Contoh penggunaan pengesahan statistik
Terdapat beberapa contoh biasa ujian hipotesis dalam amalan. Salah satu yang paling popular dikenali sebagai "Tea Tasting". Dr Muriel Bristol, rakan sekerja pengasas biometrik Robert Fisher, mendakwa dapat memberitahu dengan pasti sama ada ia ditambah terlebih dahulu kepada secawan teh atau susu. Fisher menawarkan untuk memberinya lapan cawan (empat daripada setiap varieti) secara rawak. Statistik ujian adalah mudah: mengira bilangan kejayaan dalam memilih cawan. Kawasan kritikal adalah satu-satunya kejayaan daripada 4, mungkin berdasarkan kriteria kebarangkalian biasa (< 5%; 1 dalam 70 ≈ 1.4%). Fisher berhujah bahawa hipotesis alternatif tidak diperlukan. Wanita itu mengenal pasti setiap cawan dengan betul, yang dianggap sebagai hasil yang signifikan secara statistik. Pengalaman ini membawa kepada buku Fisher Statistical Methods for Researchers.
Contoh Defendan
Prosedur perbicaraan statistik adalah setanding dengan mahkamah jenayah di mana defendan dianggap tidak bersalah sehingga dibuktikan bersalah. Pendakwa raya cuba membuktikan kesalahan defendan. Hanya apabila terdapat bukti yang mencukupi untuk pertuduhan barulah defendan didapati bersalah. Pada permulaan prosedur, terdapat dua hipotesis: "Defendan tidak bersalah" dan "Defendan bersalah." Hipotesis tidak bersalah hanya boleh ditolak apabila kesilapan sangat tidak mungkin kerana seseorang tidak mahu mensabitkan defendan yang tidak bersalah. Ralat sedemikian dipanggil ralat Jenis I, dan kejadiannyajarang dikawal. Akibat daripada tingkah laku tidak simetri ini, ralat Jenis II, iaitu pembebasan pelaku, adalah lebih biasa.
Statistik berguna apabila menganalisis sejumlah besar data. Ini terpakai sama untuk ujian hipotesis, yang boleh membenarkan kesimpulan walaupun tiada teori saintifik wujud. Dalam contoh merasa teh, "jelas" bahawa tiada perbezaan antara menuang susu ke dalam teh atau menuang teh ke dalam susu.
Aplikasi praktikal sebenar ujian hipotesis termasuk:
- menguji sama ada lelaki mempunyai lebih banyak mimpi ngeri daripada wanita;
- atribusi dokumen;
- Menilai pengaruh bulan purnama pada tingkah laku;
- menentukan julat di mana kelawar boleh mengesan serangga menggunakan gema;
- memilih cara terbaik untuk berhenti merokok;
- Menyemak sama ada pelekat bampar menggambarkan tingkah laku pemilik kereta.
Ujian hipotesis statistik memainkan peranan penting dalam statistik secara umum dan dalam inferens statistik. Ujian nilai digunakan sebagai pengganti perbandingan tradisional nilai ramalan dan hasil eksperimen pada teras kaedah saintifik. Apabila teori hanya mampu meramalkan tanda perhubungan, ujian hipotesis terarah boleh dikonfigurasikan sedemikian rupa sehingga hanya hasil yang signifikan secara statistik menyokong teori tersebut. Bentuk teori penilaian ini adalah yang paling tegarkritikan terhadap penggunaan ujian hipotesis.