کدام توزیع را انتخاب کنیم، دوجمله ای، دوجمله ای منفی یا فوق هندسی؟

یکی از موضوعات مهم در مواجه با مسائل با پاسخ دوتایی تعیین توزیع داده هاست. به عبارتی دیگر، در اینگونه موارد باید بتوانیم به راحتی تشخیص دهیم که چه تفاوتی بین داده های دوجمله ای، دوجمله ای منفی و فوق هندسی وجود دارد.

اگر آزمایش دارای دو وضعیت پیروزی و شکست باشد با یک آزمایش برنولی سروکار داریم (اگر آزمایش شامل انتخاب یک نمونه تصادفی با جایگذاری از جامعه ای با دو حالت باشد، با توجه به اینکه هر انتخاب مستقل از انتخاب های دیگر است، باز هم با یک آزمایش برنولی مواجه هستیم). برای حالتی که n آزمایش مستقل انجام شده و مایل به محاسبه احتمال تعداد پیروزی و یا شکست در این n آزمایش باشیم از مدل توزیع دوجمله ای استفاده می گردد. ولی اگر هدف محاسبه احتمالی باشد که در آن r-امین پیروزی مورد نظر است، بسته به اینکه در n-امین آزمایش رخ دهد و یا اینکه پیش از m-امین شکست اتفاق افتد باید از مدل توزیع دوجمله ای منفی استفاده کرد. زیرا در این حالت علاوه بر تعداد پیروزی ها، موقعیت r-امین پیروزی نیز مهم می باشد، ولی در توزیع دوجمله ای مایل به محاسبه احتمال تعداد پیروزی ها در n آزمایش هستیم.

اگر آزمایش شامل نمونه تصادفیی باشد که بدون جایگذاری از جامعه ای با دو حالت انتخاب شده باشد، در اینحالت مدل توزیع فوق هندسی برای داده ها مناسب می باشد. پرواضح است که وقتی حجم نمونه افزایش می یابد رویه نمونه گیری بدون جایگذاری کمرنگ شده و تفاوتی با حالت نمونه گیری با جایگذاری ندارد و در این حالت می توان هر انتخاب را مانند یک آزمایش برنولی مستقل مورد توجه قرار داد و توزیع داده ها را به وسیله توزیع دوجمله ای تقریب زد.

 

استفاده از این مطلب بدون ذکر منبع، مجاز نمی باشد.

/ 0 نظر / 23 بازدید