آزمون فرضیه چیست؟ انواع و مثال کد پایتون
کنجکاوی همیشه بخشی از طبیعت انسان بوده است. از آغاز، این یکی از ابزارهای مهم برای تولد تمدن ها بوده است. با این حال، کنجکاوی ما افزایش می یابد - محدودیت های ما را آزمایش و گسترش می دهد. بشریت دشت های زمین، آب و هوا را کاوش کرده است. ما زیستگاه های زیر آب ساخته ایم که بتوانیم هفته ها در آن زندگی کنیم. تمدن ما سیارات مختلفی را کاوش کرده است. ما زمین را به میزان نامحدودی کاوش کرده ایم.
این چیزها به این دلیل امکان پذیر بود که انسان ها سوال می پرسیدند و جستجو می کردند تا به پاسخ آن ها دست پیدا کنند. با این حال، برای اینکه ما این پاسخ ها را دریافت کنیم، باید از یک روش اثبات شده استفاده کنیم و برای تایید نتایج خود دنبال کنیم. از نظر تاریخی، فیلسوفان فرض میکردند که زمین صاف است و وقتی به لبه میرسید سقوط میکنید. در حالی که فیلسوفانی مانند ارسطو استدلال می کردند که زمین بر اساس شکل گیری ستارگان کروی است، در آن زمان نتوانستند آن را ثابت کنند.
دلیل آن این است که آنها منابع کافی برای کشف فضا یا اثبات ریاضی شکل زمین را نداشتند. این یک ریاضیدان یونانی به نام اراتوستنس بود که محیط زمین را با دقت باورنکردنی محاسبه کرد. او با استفاده از روش های علمی نشان داد که زمین صاف نیست. از آن زمان تاکنون روش های دیگری برای اثبات کروی بودن زمین به کار گرفته شده است.
هنگامی که سؤالات یا گزاره هایی وجود دارد که هنوز بر اساس روشی علمی باید آزمایش و تأیید شود، به آنها فرضیه می گویند. اساساً دو نوع فرضیه داریم: صفر و متناوب.
فرضیه صفر، باور یا استدلال پیش فرض فرد در مورد یک موضوع است. در مورد شکل زمین، فرضیه صفر این بود که زمین صاف است.
یک فرضیه جایگزین ، باور یا استدلالی است که فرد ممکن است سعی در ایجاد آن داشته باشد. ارسطو و اراتوستن معتقد بودند که زمین کروی است.
نمونه های دیگر از یک فرضیه جایگزین تصادفی عبارتند از:
آب و هوا ممکن است بر خلق و خوی افراد تأثیر بگذارد.
در مقایسه با روزهای دیگر هفته، افراد بیشتری در روزهای دوشنبه کت و شلوار می پوشند.
اگر پدر و مادر هر دو در آکادمیک باشند، احتمال اینکه بچه ها درخشان باشند، بیشتر است.
آزمون فرضیه چیست؟
آزمون فرضیه عملی است برای آزمایش درستی یک فرضیه یا استنتاج. هنگامی که یک فرضیه جایگزین معرفی می شود، آن را در برابر فرضیه صفر آزمایش می کنیم تا بدانیم کدام یک صحیح است. بیایید از یک آزمایش گیاهی توسط یک دانش آموز ۱۲ ساله استفاده کنیم تا ببینیم این چگونه کار می کند.
فرضیه این است که وقتی یک نوع کود خاص به گیاه داده شود بلندتر می شود. دانش آموز دو نمونه از یک گیاه را می گیرد، یکی را کود می دهد و دیگری را بدون بارور می گذارد. او هر چند روز یک بار ارتفاع گیاهان را اندازه گیری می کند و نتایج را در جدولی ثبت می کند.
بعد از یک یا دو هفته، او قد نهایی هر دو گیاه را با هم مقایسه می کند تا ببیند کدام یک بلندتر شده است. اگر گیاهی که کود داده می شود بلندتر شود، این فرضیه به عنوان واقعیت ثابت می شود. در غیر این صورت، این فرضیه تایید نمی شود. این آزمایش ساده نشان می دهد که چگونه می توان یک فرضیه تشکیل داد، آن را آزمایش کرد و نتایج را تجزیه و تحلیل کرد.
در آزمون فرضیه، دو نوع خطا وجود دارد: نوع اول و نوع دوم.
هنگامی که فرضیه صفر را در موردی که درست است رد می کنیم، یک خطای نوع I مرتکب شده ایم. خطاهای نوع دوم زمانی اتفاق میافتد که فرضیه صفر را در صورت نادرست بودن رد نکنیم.
در آزمایش گیاهی ما در بالا، اگر دانشآموز متوجه شود که ارتفاع هر دو گیاه در پایان دوره آزمایشی یکسان است و در عین حال معتقد است که کود به رشد گیاه کمک میکند، مرتکب خطای نوع I شده است.
با این حال، اگر گیاه کوددهی شده بلندتر بیرون بیاید و دانش آموز ثبت کند که هر دو گیاه یکسان هستند یا اینکه گیاه بدون کود بلندتر شده است، مرتکب خطای نوع دوم شده است زیرا در رد فرضیه صفر شکست خورده است.
مراحل تست فرضیه چیست؟
مراحل زیر توضیح می دهد که چگونه می توانیم یک فرضیه را آزمایش کنیم:
مرحله ۱ - فرضیه های پوچ و جایگزین را تعریف کنید
قبل از انجام هر آزمونی، ابتدا باید تعریف کنیم که چه چیزی را آزمایش می کنیم و فرض پیش فرض در مورد موضوع چیست. در این مقاله، ما تحلیل خواهیم کرد که آیا میانگین وزن کودکان ۱۰ ساله بیش از ۳۲ کیلوگرم است یا خیر.
فرضیه صفر ما این است که کودکان ۱۰ ساله به طور متوسط ۳۲ کیلوگرم وزن دارند. فرضیه جایگزین ما این است که میانگین وزن بیش از ۳۲ کیلوگرم است. Ho
نشان دهنده یک فرضیه صفر است، در حالی که H1
نشان دهنده یک فرضیه جایگزین است.
هو = ۳۲
H1 = 32
مرحله ۲ - یک سطح اهمیت را انتخاب کنید
سطح معنی داری آستانه ای برای تعیین معتبر بودن آزمون است. این به آزمون فرضیه ما اعتبار می دهد تا اطمینان حاصل شود که ما فقط به شانس وابسته نیستیم، بلکه شواهد کافی برای حمایت از ادعاهای خود داریم. ما معمولاً سطح اهمیت خود را قبل از انجام آزمایشات خود تعیین می کنیم. معیار تعیین مقدار اهمیت ما به عنوان p-value شناخته می شود.
مقدار p کمتر به این معنی است که شواهد قوی تری در برابر فرضیه صفر وجود دارد و پس درجه اهمیت بیشتری دارد. مقدار p 0.05 به طور گسترده ای پذیرفته شده است که در بیشتر زمینه های علم قابل توجه است. مقادیر P نشان دهنده احتمال نتیجه نتیجه نیستند، آنها فقط به عنوان معیاری برای تعیین اینکه آیا نتیجه آزمایش ما ناشی از شانس است یا خیر، عمل می کنند. برای آزمایش ما، مقدار p ما ۰.۰۵ خواهد بود.
مرحله ۳ - جمع آوری داده ها و محاسبه آمار آزمون
می توانید داده های خود را از فروشگاه های داده آنلاین به دست آورید یا مستقیماً تحقیقات خود را انجام دهید. داده ها را می توان خراش داد یا به صورت آنلاین تحقیق کرد. روش ممکن است به تحقیقی که میخواهید انجام دهید بستگی دارد.
ما می توانیم آزمون خود را با استفاده از هر یک از آزمون های فرضیه مناسب محاسبه کنیم. این می تواند تست T، Z-test، Chi-squared و غیره باشد. چندین آزمون فرضیه وجود دارد که هر کدام با اهداف و سؤالات تحقیق متفاوت است. در این مقاله، ما از آزمون T برای اجرای فرضیه خود استفاده خواهیم کرد، اما من تست Z و همچنین مجذور کای را توضیح خواهم داد.
زمانی که انحراف معیار جمعیت را نمی دانیم از آزمون T برای مقایسه دو مجموعه داده استفاده می شود. این یک آزمون پارامتریک است، به این معنی که در مورد توزیع داده ها مفروضاتی ایجاد می کند. این مفروضات شامل توزیع نرمال داده ها و مساوی بودن واریانس های دو گروه است. به معنای ساده تر و کاربردی تر، تصور کنید که نمرات امتحانی در کلاس برای دختران و پسران داریم، اما نمی دانیم که این نمرات چقدر متفاوت یا مشابه هستند. ما می توانیم از آزمون t استفاده کنیم تا ببینیم آیا تفاوت واقعی وجود دارد یا خیر.
زمانی که انحراف معیار جمعیت مشخص باشد از آزمون Z برای مقایسه بین دو مجموعه داده استفاده می شود. همچنین یک آزمون پارامتریک است، اما فرضیات کمتری در مورد توزیع داده ها ایجاد می کند. آزمون z فرض می کند که داده ها به طور معمول توزیع شده است، اما فرض نمی کند که واریانس دو گروه برابر است. در مثال آزمون کلاس ما، با آزمون t، میتوان بیان کرد که اگر از قبل میدانیم که نمرات در هر دو گروه چقدر گسترده است، اکنون میتوانیم از آزمون z استفاده کنیم تا ببینیم آیا تفاوتی در میانگین نمرات وجود دارد یا خیر.
آزمون مجذور کای برای مقایسه دو یا چند متغیر مقوله ای استفاده می شود. آزمون کای دو یک آزمون ناپارامتریک است، به این معنی که هیچ فرضی در مورد توزیع داده ها ایجاد نمی کند. می توان از آن برای آزمون فرضیه های مختلف استفاده کرد، از جمله اینکه آیا دو یا چند گروه دارای نسبت مساوی هستند یا خیر.
مرحله ۴ - بر اساس آمار آزمون و سطح معناداری بر فرضیه صفر تصمیم بگیرید
پس از انجام آزمون و محاسبه آمار آزمون، میتوانیم مقدار آن را با سطح معنیداری از پیش تعیینشده مقایسه کنیم. اگر آمار آزمون از سطح معنی داری فراتر رود، می توانیم تصمیم بگیریم که فرضیه صفر را رد کنیم، که نشان می دهد شواهد کافی برای حمایت از فرضیه جایگزین ما وجود دارد.
برعکس، اگر آمار آزمون از سطح معنیداری فراتر نرود، فرضیه صفر را رد نمیکنیم، به این معنی که شواهد آماری کافی برای نتیجهگیری به نفع فرضیه جایگزین نداریم.
مرحله پنجم - نتایج را تفسیر کنید
بسته به تصمیمی که در مرحله قبل گرفته شده است، می توانیم نتیجه را در چارچوب مطالعه خود و مفاهیم عملی تفسیر کنیم. برای مطالعه موردی خود، می توانیم تفسیر کنیم که آیا شواهد قابل توجهی برای حمایت از ادعای خود مبنی بر اینکه میانگین وزن کودکان ۱۰ ساله بیش از ۳۲ کیلوگرم است یا خیر، داریم یا خیر.
برای آزمایش خود، دادههای ساختگی تصادفی را برای وزن کودکان تولید میکنیم. برای ارزیابی اینکه آیا فرضیه ما درست است یا خیر، از آزمون t استفاده می کنیم.
import numpy as np import scipy.stats as stats # Create a dummy dataset of 10 year old children's weight data = np.random.randint(20, 40, 10) # Define the null hypothesis H0 = "The average weight of 10 year old children is 32kg." # Define the alternative hypothesis H1 = "The average weight of 10 year old children is more than 32kg." # Calculate the test statistic t_stat, p_value = stats.ttest_1samp(data, 32) # Print the results print("Test statistic:", t_stat) print("p-value:", p_value) # Conclusion if p_value < 0.05: print("Reject the null hypothesis.") else: print("Fail to reject the null hypothesis.")
برای درک بهتر، بیایید ببینیم هر بلوک کد چه کاری انجام می دهد.
import numpy as np import scipy.stats as stats
اولین بلوک عبارت import است که numpy
و scipy.stats
را وارد می کنیم. Numpy یک کتابخانه پایتون است که برای محاسبات علمی استفاده می شود. دارای یک کتابخانه بزرگ از توابع برای کار با آرایه ها. Scipy یک کتابخانه برای توابع ریاضی است. دارای یک ماژول آمار برای انجام توابع آماری است، و این همان چیزی است که ما برای آزمون t خود از آن استفاده خواهیم کرد.
# Create a dummy dataset of 10 year old children's weight data = np.random.randint(20, 40, 100)
از آنجایی که ما با یک مجموعه داده واقعی کار نمی کنیم، وزن بچه ها به صورت تصادفی ایجاد شد. ماژول تصادفی در کتابخانه Numpy تابعی را برای تولید اعداد تصادفی ارائه می دهد که randint
است.
تابع randint
سه آرگومان می گیرد. اولین (۲۰) کران پایینی اعداد تصادفی است که باید تولید شوند. دومین (۴۰) کران بالایی است و سومین (۱۰۰) تعداد اعداد صحیح تصادفی را مشخص می کند. یعنی ما در حال تولید مقادیر وزنی تصادفی برای ۱۰۰ کودک هستیم. در شرایط واقعی، این نمونه های وزنی با گرفتن وزن تعداد مورد نیاز کودک مورد نیاز برای آزمایش به دست می آمد.
# Define the null hypothesis H0 = "The average weight of 10 year old children is 32kg." # Define the alternative hypothesis H1 = "The average weight of 10 year old children is more than 32kg."
با استفاده از کد بالا، فرضیه های صفر و جایگزین خود را اعلام کردیم که میانگین وزن یک کودک ۱۰ ساله در هر دو مورد را بیان می کند.
# Calculate the test statistic t_stat, p_value = stats.ttest_1samp(data, 32)
t_stat
و p_value
متغیرهایی هستند که نتایج توابع خود را در آنها ذخیره می کنیم. stats.ttest_1samp
تابعی است که تست ما را محاسبه می کند. این شامل دو متغیر است، اولی متغیر data
ای است که آرایه وزن ها را برای کودکان ذخیره می کند، و دومی (۳۲) مقداری است که ما میانگین آرایه وزن ها یا مجموعه داده های خود را در مواردی که هستیم آزمایش می کنیم. با استفاده از مجموعه داده های دنیای واقعی
# Print the results print("Test statistic:", t_stat) print("p-value:", p_value)
کد بالا هر دو مقدار t_stats
و p_value
را چاپ می کند.
# Conclusion if p_value < 0.05: print("Reject the null hypothesis.") else: print("Fail to reject the null hypothesis.")
در نهایت، ما p_value
خود را در برابر مقدار اهمیت خود که ۰.۰۵ است، ارزیابی کردیم. اگر p_value
ما کمتر از ۰.۰۵ باشد، فرضیه صفر را رد می کنیم. در غیر این صورت، ما نمی توانیم فرضیه صفر را رد کنیم. در زیر خروجی این برنامه آمده است. فرضیه صفر ما رد شد.
Test statistic: -5.114430435590074 p-value: 1.541000376540265e-06 Reject the null hypothesis.
نتیجه
در این مقاله به اهمیت آزمون فرضیه پرداختیم. ما نشان دادیم که علم چگونه دانش و تمدن بشری را از طریق فرمولبندی و آزمایش فرضیهها ارتقا داده است.
ما خطاهای نوع I و نوع II را در آزمون فرضیه و چگونگی تأکید آنها بر اهمیت تحلیل و تحلیل دقیق در تحقیقات علمی مورد بحث قرار دادیم. این ایده را تقویت می کند که نتیجه گیری باید بر اساس تجزیه و تحلیل آماری کامل به جای فرضیات یا سوگیری ها انجام شود.
ما همچنین یک مجموعه داده نمونه با استفاده از کتابخانه های پایتون مربوطه تولید کردیم و از توابع مورد نیاز برای محاسبه و آزمایش فرضیه جایگزین خود استفاده کردیم.
با تشکر از شما برای خواندن! لطفاً من را در لینکدین دنبال کنید، جایی که من نیز محتوای مرتبط با داده های بیشتری را پست می کنم.
ارسال نظر