সাইন্টিফিক গবেষণায় স্টাটিসটিক্যাল এনালাইসিসঃ পর্ব ১
বিজ্ঞানভিত্তিক গবেষণায় শুধু তথ্য সংগ্রহ করলেই হয় না, বরং সেই তথ্য বিশ্লেষণ করে বুঝতে হয় সেটি বাস্তবিকভাবে গুরুত্বপূর্ণ কি না। এই বিশ্লেষণে যেসব পরিসংখ্যানিক (statistical) ধারণা প্রাথমিক ভাবে গুরুত্বপূর্ণ যেমন, Statistical Significance , Null Hypothesis ও p-value , Confidence Level & CI , T-Test, r value, বিষয়ে কনসেপ্ট ধারনা দেওয়ার চেষ্টা করেছি।
⸻
১. স্টাটিসটিক্যাল সিগনিফিকেন্স (Statistical Significance)
সংজ্ঞা:
Statistical Significance বোঝায় গবেষণার ফলাফলটি এতটাই স্পষ্ট যে তা কাকতালীয় হতে পারে না। অর্থাৎ, যেটা আপনি পেয়েছেন তা নিছক দুর্ঘটনা নয়, বরং তার পেছনে একটি বাস্তব কারণ থাকতে পারে।
উদাহরণ:
ধরুন, একটি নতুন সার (fertilizer) দিয়ে পরীক্ষামূলকভাবে ধান চাষ করা হলো। দেখা গেল, যেসব জমিতে এই সার দেওয়া হয়েছে, সেখানে ধান ২০% বেশি উৎপন্ন হয়েছে।
এখন প্রশ্ন—এটা কি সারটার কারণে, না কি অন্য কোনো কারণে (যেমন, আবহাওয়া ভালো ছিল)?
এই সন্দেহ দূর করতেই statistical significance যাচাই করা হয়।
⸻
২. Null Hypothesis ও p-value
Null Hypothesis (H₀):
এটি একটি ভিত্তি অনুমান, যেখানে ধরা হয় কোনো পার্থক্য বা প্রভাব নেই। গবেষণার কাজ হচ্ছে এটি ভুল প্রমাণ করা।
উদাহরণ:
উপরে সার ব্যবহারের উদাহরণে Null Hypothesis হবে:
“নতুন সার ব্যবহার করলে ধান উৎপাদনে কোনো পরিবর্তন হয় না।”
p-value কী?
p-value হলো সম্ভাবনার একটি মান। এটি বলে দেয়, যদি Null Hypothesis সত্য হয়, তাহলে যেটা আমরা পর্যবেক্ষণ করলাম সেটা কতটা সম্ভাব্য?
• p < 0.05 → সাধারণত significant ধরা হয়
• p ≥ 0.05 → significant নয়, মানে ফলাফল কাকতালীয় হতে পারে।
উদাহরণ:
আপনি যদি দেখেন, p = 0.03, তাহলে Null Hypothesis বাতিল হবে এবং বলা যাবে—“নতুন সার ধান উৎপাদনে সত্যিই পার্থক্য আনছে।”
⸻
৩. কনফিডেন্স লেভেল ও কনফিডেন্স ইন্টারভ্যাল (Confidence Level & CI)
Confidence Level:
এটি বলে দেয়, একটি নির্দিষ্ট ফলাফল কতটা নিশ্চিতভাবে সত্যি ধরা যেতে পারে। সবচেয়ে প্রচলিত হলো 95% Confidence Level।
Confidence Interval (CI):
এটি সেই মানের সীমা যা বলছে, এই রেঞ্জের মধ্যেই প্রকৃত মানটি রয়েছে।
উদাহরণ:
ধরুন, গবেষণায় বলা হলো: “নতুন সার ব্যবহার করলে ধান উৎপাদন ৪ থেকে ৬ কেজি/শতাংশ বাড়ে (95% CI = [4, 6])”
→ এর মানে, আমরা 95% নিশ্চিত যে ধান উৎপাদনের প্রকৃত বৃদ্ধি ৪ থেকে ৬ কেজির মধ্যেই।
⸻
৪. টি-টেস্ট (T-Test)
সংজ্ঞা:
T-test ব্যবহার হয় যখন আপনি দেখতে চান দুইটি দলের মধ্যে গড় মানে পার্থক্য রয়েছে কিনা।
প্রধান প্রকারভেদ:
1. Independent T-test: দুটি আলাদা দলের তুলনা
2. Paired T-test: একই দলের আগে-পরে তুলনা
3. One-sample T-test: একটি মানের সঙ্গে তুলনা
উদাহরণ:
ধরুন, আপনি ১০০ জন রোগীকে ওষুধ খাওয়ালেন এবং ১০০ জনকে খাওয়ালেন না। আপনি দেখতে চান, দুই দলের রক্তচাপের গড় মানে পার্থক্য আছে কি না।
→ Independent T-test করে দেখা যাবে এই পার্থক্য significant কিনা।
⸻
৫. r-value (Correlation Coefficient)
সংজ্ঞা:
r-value বোঝায় দুটি ভেরিয়েবলের মধ্যে সম্পর্কের মাত্রা ও দিক।
• r = +1 → সম্পূর্ণ পজিটিভ সম্পর্ক
• r = -1 → সম্পূর্ণ নেগেটিভ সম্পর্ক
• r = 0 → কোনো সম্পর্ক নেই
উদাহরণ:
ধরুন, আপনি পর্যবেক্ষণ করলেন—তাপমাত্রা যত বাড়ছে, আইসক্রিম বিক্রিও তত বাড়ছে। আপনি হিসেব করে দেখলেন r = +0.85 → মানে strong positive relationship।
⸻
গবেষণাকে শক্ত ভিত্তি দিতে হলে শুধু পর্যবেক্ষণ নয়, তার পেছনের পরিসংখ্যানিক যুক্তিগুলোও স্পষ্টভাবে বিশ্লেষণ করতে হয়। Statistical Significance, p-value, Confidence Level, T-test এবং r-value—এই সবগুলো উপাদান একসাথে গবেষণার বিশ্বাসযোগ্যতা নির্ধারণ করে।
0 Comments