পপুলেশন এবং স্যাম্পলের বেসিক গাইডলাইন

পপুলেশন-এবং-স্যাম্পল

পরিসংখ্যানে-পপুলেশন,পরিসংখ্যানে দুইটি গুরুত্বপূর্ণ শব্দ হচ্ছে population and sample ।পপুলেশন এবং স্যাম্পল কি ?এদের মধ্যে পার্থক্য বা কি তা জানার জন্য আজকের এই লেখাটি ।তাত্ত্বিক কথা মধ্য দিয়ে না গিয়ে যদি আমরা বাস্তব অভিজ্ঞতা মধ্য দিয়ে বোঝার চেষ্টা করি ,তাহলে তা আমরা সহজে বাস্তব বা কর্ম জীবনে কাজে লাগাতে পারব ।

তাহলে একটি বাস্তব উদাহরণ দিয়ে বিষয় দুইটি বোঝার চেষ্টা করি ,আমরা কমবেশি সবাই ভাত রান্না করতে পারি ।একটি নির্দিষ্ট সময় অতিবাহিত হওয়ার পর আমরা পাতিল থেকে চার পাচটা চাউল টিপে দেখি চাউল সিন্ধ হয়েছে কিনা ,যদি হয়ে থাকে তাহলে আমরা বুঝে যাই ভাত হয়ে গেছে এবার খেতে হবে হাহাহা।

এই চার বা পাচটি চাল হল স্যাম্পল আর পাতিলের যত চাল ছিল সেগুলো হল পপুলেশন ।

চারবা পাচটি চাল = স্যাম্পল

স্যাম্পল হচ্ছে টোটাল পপুলেশনের একটি অংশ ।অপর দিকে পপুলেশন হচ্ছে টোটাল ডাটা সেট ।

পাতিলের সব চাল = পপুলেশন ।

Sampleবাছাই করার জন্য নানা রকম কৌশল ব্যবহার করা হয় তার মধ্যে অন্যতম হলে   probability sampling ।এটি এমন একটি কৌশল যার পপুলেশনের সবারই স্যাম্পলের অন্তভূক্ত হওয়ার সমান সম্ভবনা থাকে । 

পরিসংখ্যানে স্যাম্পল নিয়ে কাজ করতে গেলে যে বিষয় টির কথা বার বার আসে তা হলRandom sample । এবার আসা যাক,Random sample  কি ?

আবার ও উদাহরণ দিয়ে শুরু করা যাক ,ধরুন আপনাকে বলা হল ১২০ ছাত্র -ছাত্রী বিশিষ্ট একটি ক্লাস রুম থেকে আপনাকে ১৫ জন ছাত্র -ছাত্রী বাছাই করতে হবে ।

তখন আপনি কিভাবে বাছাই করবেন?

১২০জন=পপুলেশন 

১৫ জন =স্যাম্পল 

বাছাই করার আগে Random sample  কি তা জানা যাক ,আগেই বলেছি বই পুস্তক এর সংগার বাইরে গিয়ে আমরা বাস্তবতা দিয়ে সব বুঝব ।

আপনাকে ১২০ জন ছাত্র-ছাত্রীর মধ্যে ১৫ জন কে সিলেক্ট করতে হবে ,আপনি ১২০ জন কে নিতে পারবেন না ।আপনাকে স্যাম্পল এমনভাবে সিলেক্ট করতে হবে যাতে করে ১২০ জনেরই সিলেক্ট হওয়ার সম্ভবনা সমান থাকে ।কারো সম্ভবনা শূণ্য হবে না । লটারির মত।

পপুলেশনের সবার যখন  স্যাম্পল হিসাবে সিলেক্ট হবার সম্ভবনা সমান থাকে তখন তাকে Random sample  বলে ।

পদ্ধতিঃ ধরুন আপনি সবার Random sample এর সংগার কথা বিবেচনায় এনে ১৫ জন কে বাছাই করার জন্য ১৫০ জনের রোল কাগজের মধ্যে রেখে একটি পাত্রে রেখে দিলেন ।তারপর এক এক করে পনেরটি কাগজ উঠালেন তাতে আপনি ১৫ টি Random sample  পেয়ে গেলেন ।

এই পদ্ধতি ছোট ডাটাসেটের জন্য ভাল কিন্ত ডাটা সেট যদি বড় হয় তাহলে আপনি কি করবেন ।অবশ্যই এর জন্য সহজ একটি পদ্ধতি আছে আর তা হল এক্সেল এর Random ফাংশন ।এই ফাংশনের মাধ্যমে আপনি লক্ষ কোটি ডাটা কয়েক মিনিটের মধ্যে Random ভাবে সিলেক্ট করতে সক্ষম হবেন ।

Stratified sampling :

কয়েক টি স্তর বা ধাপের মাধ্যমে যখন পপুলেশন থেকে স্যাম্পল বাছাই করা হয় তখন তাকে Stratified sampling বলে ।

 

Population: all employees in smartB 

Strata Group : Group 1, Group 2 ,Group 3, Group 4

Sample all strata : 4 people from each Group.

Sample total 16 people .

 

ধাপ ১ ।  স্মার্টবি তে  ১০০ জন চাকরী করে ।তাহলে এই একশত জন হলো পপুলেশন ।

ধাপ ২। এই ১০০ জন চারটি বিভাগে কাজ করে ।অতএব প্রতি বিভাগে ২৫ জন করে কাজ করে 

ধাপ ৩। প্রতি বিভাগ হতে Randomly 4  করে বাছাই করতে ।

ধাপ ৪। তাহলে মোট বাছাইকৃত চাকুরীজীবি সংখ্যা হবে ১৬ জন ।

এই বাছাইকৃত ১৬ জন হল Stratified sample.

 

Cluster sampling:

 

Stratified sample এর মত আর ও একটি sampling পদ্ধতি হচ্ছে Cluster sampling:

Cluster শব্দের অর্থ হচ্ছে গুচ্ছ । এ পদ্ধতিতেও কয়েকটি ধাপের মাধ্যমে গুচ্ছ ভাবে স্যাম্পল বাছাই করা হয় । 

Population: all employees in smartB 

Strata Group : Group 1, Group 2 ,Group 3, Group 4

Sample all strata : selected 2 group 

Sample total 50  people .

ধাপ ১ ।  স্মার্টবি তে  ১০০ জন চাকরী করে ।তাহলে এই একশত জন হলো পপুলেশন ।

ধাপ ২। এই ১০০ জন চারটি বিভাগে কাজ করে ।অতএব প্রতি বিভাগে ২৫ জন করে কাজ করে 

ধাপ ৩।এবার চারটি Group থেকে যে কোন দুইটি Group বাছাই করতে হবে ।

ধাপ ৪। এবার বাচাইকৃত Group দুইটির সবাই কে Sample হিসাবে নিতে হবে ।তাহলে ৫০ জন হল এখানে Cluster sample ।

 

Systematic Random sampling:

একটি নির্দিষ্ট সিস্টেম বা প্রক্রিয়ার মধ্য দিয়ে স্যাম্পল বাছাই করা হয় তখন তাকে Systematic Random sampling বলে ।

প্রক্রিয়াটি কয়েকটি ধাপের মাধ্যমে সম্পূর্ণ হয় ।ধাপগুলো নিম্ন রূপঃ

ধাপ ১। ( মোট পপুলেশন / যে সংখ্যার স্যাম্পল হবে)

উদাহরণ ১৫০/১০ =১৫ এখান থেকে বুঝতে পারলাম স্যাম্পলের চেয়ে পপুলেশন ১৫ গুণ বড় ।

ধাপ ২।এবার ১ থেকে ১৫ মধ্যে যে কোন একটি সংখ্যা নিতে হবে ।

ধাপ ৩। এবার যে সংখ্যা নিব তার সাথে ১৫ যোগ করতে হবে ,তারপর যে সংখ্যা পাব তার সাথে আবার ১৫ যোগ করতে হবে এভাবে দুইটি না পাওয়া পর্যন্ত চলব ।

 ধরা যাক সংখ্যাটি ৮ 

তাহলে ৮+১৫=২৩

২৩+১৫=৩৮

এভাবে দশটি পর্যন্ত চলবে । আর আপনি যত সংখ্যার স্যাম্পল নিবেন ততবার ।

 

Multi-stage Sampling:

যখন একাধিক স্যাম্পল পদ্ধতি সমন্বয়  করে স্যাম্পল বাছাই করা হয় তখন তাকে Multi-stage Sampling বলে ।

Non probability sampling:

যে পদ্ধতিতে পপুলেশনের সবার স্যাম্পলে অন্তভূক্ত সবার সম্ভবনা সমান থাকে না ,তাদের Non probability sampling বলে ।

তাদের মধ্যে অন্যতম হলো ‘

1.Convenience Sampling 

2.Purposive sampling 

3. Volunteer sampling 

4.Snowball Sampling 

5.Quota Sampling.

 

Convenience Sampling: যে ভাবে ডেটা কালেক্ট করা সহজ সে ভাবে নিজের ইচ্ছা মত যদি স্যাম্পলিং করা হয় তবে তাকে Convenience sampling বলে ।

যেমন আমাকে যদি কেই বলে একশত জন বিশ্ববিদ্যালয় এর ছাত্রের ব্লাড গ্রুফ দরকার ।তখন আমি সোজা একটি বিশ্ববিদ্যালয় এ যাব এবং রেড ক্রিসেন্ট থেকে তথ্য নিব ।এর একটি অসুবিধা হল পপুলেশনের সবাই সমান সুযোগ পায় না ।

Purposive sampling:

গবেষনার কোন নির্দিষ্ট উদ্দেশ্য বাস্তবায়নের জন্য একটি ক্রাইটেরিয়া সেট করে দিয়ে ডাটা সংগ্রহ করা হয় ,তখন তাকে .Purposive sampling  বলে ।

 

 Volunteer sampling :

পপুলেশনের অন্তভূক্ত লোকজন সোচ্ছায় যখন তথ্য দেয় ,তখন যারা যারা তথ্য দেয় তাদের নিয়ে যে স্যাম্পল গঠিত হয় ,তাদের Volunteer sampling বলে ।

Snowball Sampling:

যখন সেনসেটিভ কোন বিষয় নিয়ে স্যাম্পলিং করা হয় তখন তাকে Snowball Sampling বলে ।যেমন এইচ আইভি রোগির তথ্য নিয়ে স্যাম্পলিং করা ।

Quota Sampling:

অনুপাতের ভিত্তিতে যখন স্যাম্পলিং করা হয় তখন তাকে Quota Sampling. বলে ।

যেমন ঃছেলে৬০ঃমেয়ে৪০

তারমানে স্যাম্পলের মধ্যে ৩ জন ছেলে থাকলে দুই জন মেয়ে থাকবে ।

স্যাম্পল নিয়ে কোন প্রশ্ন কমেন্ট বক্স এ কমেন্ট করুন।

 

Author

Write A Comment