توزیع دیریکله—چندجملهای
توزیع دیریکله-چندجملهای یک توزیع گسسته چندجملهای است. این توزیع نام های دیگری نیز دارد؛ از جمله Dirichlet compound multinomial distribution (DCM) یا multivariate Pólya distribution(که پس از جورج پولیا نامگذاری شده است.) در این توزیع بردار p از یک توزیع دیریکله با پارامترهای نمونه برداری شده است. مجموعه مقادیر گسسته از توزیع دستهای با بردار احتمالات p بدست می آیند.
تابع جرم احتمال
فرض کنیم N نمونه برداری تصادفی مستقل از یک توزیع دسته ای با K دسته انجام می دهیم. فرض کنیم مقادیر تصادفی را با به ازای مقادیر نشان دهیم. فرض بخواهیم تعداد دفعاتی که کلاس (به ازای )دیده شده است را با نشان دهیم. می دانیم . به این مسئله می توان به دو شیوه ی معادل نگاه کرد:
- مجموعه ای از N متغیر با توزیع دسته ای.
- بردار توزیع شده با توجه به توزیع چندجملهای.
اکنون می توان روی این پارامتر این توزیع ها، یعنی p، توزیعی دیکله تجسم کرد و با انتگرال گیری نسبت به آن، توزیع پسین را بدست آورد. اگرچه دو دید فوق معادل هستند، اما با در نظر گرفتن هر کدام می توان توزیع پسین متفاوتی بدست آورد.
توزیع مشترک
به ازای متغیر دسته ای توزیع احتمال مشترک حاشیه ای عبارت است از:
که منجر به فرمول زیر می شود:
که در آن تابع گاما است.
توزیع های مرتبط
توزیع معادل یک بعدی این توزیع توزیع بتا-دو جمله ای نام دارد.
جستارهای وابسته
منابع
- Elkan, C. (2006) Clustering documents with an exponential-family approximation of the Dirichlet compound multinomial distribution. ICML, 289-296
- Kvam, P. and Day, D. (2001) The multivariate Polya distribution in combat modeling. Naval Research Logistics, 48, 1-17
- Madsen, RE., Kauchak, D. and Elkan, C. (2005) Modeling Word Burstiness Using the Dirichlet Distribution. ICML, 545-552
- Minka, T. (2003) Estimating a Dirichlet distribution. Technical report Microsoft Research. Includes Matlab code for fitting distributions to data.
- Wagner, U. and Taudes, A. (1986) A Multivariate Polya Model of Brand Choice and Purchase Incidence. Marketing Science, 5(3), 219-244.