Ad Code

Statistical Tests Assumptions: Research-এ সবচেয়ে বেশি ignored কিন্তু সবচেয়ে গুরুত্বপূর্ণ বিষয়

Statistical Tests Assumptions: Research-এ সবচেয়ে বেশি ignored কিন্তু সবচেয়ে গুরুত্বপূর্ণ বিষয়
আপনি Statistical test run করছেন, p-value সুন্দর আসছে… কিন্তু result পুরো ভুল! 
কারণ? আপনি assumptions check করেননি।
Statistical test মানে শুধু SPSS-এ ক্লিক করা না । প্রতিটি টেস্টের কিছু শর্ত (assumptions) থাকে—এই শর্তগুলো পূরণ না হলে আপনার result misleading বা ভুল হতে পারে। সহজভাবে বলতে গেলে- Wrong assumption = Wrong conclusion. আমরা বেশিরভাগই Exam, thesis, research—সব জায়গায় একই ভুল করি: Assumption চেক করেই test run করি।

আগের পোস্টে দেখেছি কখন কোন ধরণের Statistical Tests রান করতে হয়। আজকে জানবো Statistical Tests রান করার পূর্বে কি কি Assumptions চেক করতে হয়।
১. One Sample T-Test [উদাহরণ: ঢাবির শিক্ষার্থীদের গড় ওজন কি জাতীয় গড় (৬৫ কেজি) সমান?]
Assumptions:
Continuous variable হতে হবে।
এখানে: ওজন (Weight) Continuous variable।
Data approximately normal distribution হতে হবে।
Histogram বা Shapiro-Wilk test দিয়ে চেক করা যায়।
ছোট sample হলে এটি বেশি গুরুত্বপূর্ণ।
Outlier থাকা যাবে না।
Extreme weight থাকলে বাদ দিতে হবে।
২. Independent Samples T-Test [উদাহরণ: ছাত্র vs ছাত্রীদের গড় ওজন]
Assumptions:
Dependent variable continuous হতে হবে।
Independent groups হতে হবে।
একজন student শুধু একটাই গ্রুপে থাকবে (একই স্টুডেন্ট কখনো ছাত্র আবার কখনো ছাত্রী হিসেবে ২ বার উত্তর দিবে না)।
Normality (প্রতিটি গ্রুপে): ছেলে ও মেয়েদের data আলাদা আলাদা normal হতে হবে।
Homogeneity of variance:
দুই গ্রুপের variance প্রায় সমান হতে হবে।
SPSS-এ Levene’s Test দিয়ে এটি চেক করা হয়।
Outlier না থাকা ভালো।
৩. One-Way ANOVA [উদাহরণ: উচ্চবিত্ত, মধ্যবিত্ত, নিম্নবিত্ত → ওজনের পার্থক্য]
Assumptions:
Dependent variable continuous হতে হবে।
Independent groups (৩+ group): প্রতিটি student একটিমাত্র গ্রুপে থাকবে।
Normality (প্রতিটি গ্রুপে)।
Homogeneity of variance: সব গ্রুপের variance প্রায় সমান হতে হবে।
Outlier না থাকা ভালো।
৪. Paired Samples T-Test [উদাহরণ: করোনার আগে ও পরে একই শিক্ষার্থীদের ওজন]
Assumptions:
Dependent variable continuous হতে হবে।
Paired data (same ব্যক্তি): আগে ও পরে একই student হতে হবে।
Difference scores normal হতে হবে: (After – Before) → এই difference normal কিনা দেখতে হবে।
Outlier না থাকা ভালো।
৫. Pearson Correlation [উদাহরণ: ওজন ও উচ্চতার সম্পর্ক]
Assumptions:
দুটো variable continuous হতে হবে (Weight & Height)।
Linear relationship থাকতে হবে: Scatterplot-এ সরলরেখার মতো trend দেখা যাবে।
Normality (both variables)।
Outlier না থাকা খুব গুরুত্বপূর্ণ: ১টা extreme value পুরো correlation বদলে দিতে পারে।
৬. Chi-Square Test of Independence [উদাহরণ: Gender vs Residential Status]
Assumptions:
দুইটাই categorical variable হতে হবে।
Independence of observations: একজন student একটাই category-তে থাকবে।
Expected frequency ≥ 5 (important!): প্রতিটি cell-এ কমপক্ষে ৫টি observation থাকা উচিত।
৭. Linear Regression [উদাহরণ: SSC, HSC → Honors CGPA predict করা]
Assumptions:
Linear relationship থাকতে হবে।
Dependent variable continuous (CGPA)।
Normality of residuals।
Homoscedasticity: Error variance constant হতে হবে।
No multicollinearity: SSC & HSC খুব বেশি correlated না হওয়া ভালো।
Outlier না থাকা ভালো।
৮. Logistic Regression [উদাহরণ: চাকরি পাবে (Yes/No)]
Assumptions:
Dependent variable categorical (binary)।
Independent variables continuous বা categorical হতে পারে।
No multicollinearity।
Large sample size দরকার।
Outlier না থাকা ভালো।

💡 পরামর্শ: আমরা বাস্তবে যেসব ডেটা পাই সেগুলো এতো ক্লিন থাকে না যে সব ডেটা সঠিকভাবে এসকল Assumption ঠিক থাকে। তাই যদি শর্তগুলো (Assumptions) পূরণ না হয়, তবে ভয় পাওয়ার কিছু নেই, সেক্ষেত্রে আমরা অল্টারনেটিভ Non-parametric টেস্ট ব্যবহার করবো।

🚀 এই পোস্ট পড়ে বা বইয়ের পাতায় পরিসংখ্যান সহজ মনে হলেও রিয়েল ডেটাসেট নিয়ে কাজ করতে গেলে ঘাম ছুটে যায়! আমার কাছে থাকা বিশাল ডেটাসেটে assumptions গুলো কীভাবে প্রাকটিক্যালি চেক করতে হয়, সেটা আমরা হাতে কলমে দেখবো। এই প্রাকটিক্যাল সেশনে থাকতে চাইলে আমার প্রোফাইল থেকে বিস্তারিত জেনে নিতে পারেন।

🧠 Critical Thinking Challenge:
ধরুন, আপনি বয়স ও উচ্চতার মধ্যে সম্পর্ক বের করতে চাচ্ছেন। আপনার সব ডেটা ঠিক আছে, কিন্তু বেশ কিছু ব্যক্তির ডেটা মিসিং এবং কিছু ভুলবশত এন্ট্রি করা হয়েছে এবং কিছু মানুষের বয়সের সাথে ওজন অসামঞ্জস্য দেখাচ্ছে। এখন কি করবেন? (কমেন্টে জানান)👇

#Research #Statistics #DataAnalysis #SPSS #ThesisHelp #StatisticalResearcher #Assumption #research #statisticsclass #DataAnalysis #thesishelp #SPSS #StatisticalAnalysis #StatisticallySignificant #quantitativeresearch #surveyresearch #DataScience #datacollection #statisticsassignmenthelp 

Post a Comment

0 Comments

Close Menu