درخت تصمیم

درخت تصمیم‌گیری (Decision Tree) یک ابزار برای پشتیبانی از تصمیم است که از درخت‌ها برای مدل کردن استفاده می‌کند. درخت تصمیم به‌طور معمول در تحقیق‌ها و عملیات مختلف استفاده می‌شود. به‌طور خاص در آنالیز تصمیم، برای مشخص کردن استراتژی که با بیشترین احتمال به هدف برسد بکار می‌رود. استفاده دیگر درختان تصمیم، توصیف محاسبات احتمال شرطی است.

کلیات

Traditionally, decision trees have been created manually.

در آنالیز تصمیم، یک درخت تصمیم به عنوان ابزاری برای به تصویر کشیدن و آنالیز تصمیم، در جایی که مقادیر مورد انتظار از رقابت‌ها متناوباً محاسبه می‌شود، استفاده می‌گردد. یک درخت تصمیم دارای سه نوع گره‌است:

۱-گره تصمیم: به‌طور معمول با مربع نشان داده می‌شود.

۲-گره تصادفی: با دایره مشخص می‌شود.

۳-گره پایانی: با مثلث مشخص می‌شود.

نمودار درخت تصمیم‌گیری

یک درخت تصمیم می‌تواند خیلی فشرده در قالب یک دیاگرام، توجه را بر روی مسئله و رابطه بین رویدادها جلب کند.

مربع نشان دهنده تصمیم‌گیری، بیضی نشان دهنده فعالیت، و لوزی نشان دهنده نتیجه‌است.

مکان‌های مورد استفاده

درخت تصمیم، دیاگرام تصمیم و ابزارها و روش‌های دیگر مربوط به آنالیز تصمیم به دانشجویان دوره لیسانس در مدارس تجاری و اقتصادی و سلامت عمومی و تحقیق در عملیات و علوم مدیریت، آموخته می‌شود.

یکی دیگر از موارد استفاده از درخت تصمیم، در علم داده‌کاوی برای classification است.

الگوریتم ساخت درخت تصمیم‌گیری

مجموع داده‌ها را با $D$ نمایش می‌دهیم، یعنی $D=(x_{1},y_{1}),\cdots ,(x_{i},y_{i}),\cdots ,(x_{n},y_{n})$ ، به قسمی که $x_{i}\in R^{d}$ و $y_{i}\in R$ . درخت تصمیم‌گیری سعی می‌کند به صورت بازگشتی داده‌ها را به قسمی از هم جدا کند که در هر گِرِه متغیرهای مستقلِ $y$ به هم نزدیک شده همسان شوند.[1] هر گِره زیر مجموعه ای از داده هاست که به صورت بازگشتی ساخته شده‌است. به‌طور دقیقتر در گره $m$ اگر داده ما $Q$ باشد سعی میکنیم یک بُعد از متغیرهایی وابسته را به همراه یک آستانه انتخاب کنیم و داده‌ها را برحسب این بُعد و آستانه به دو نیم تقسیم کنیم، به قسمی که بطور متوسط در هر دو نیم متغیرهای مستقل یا $y$ خیلی به هم نزدیک و همسان شده باشند. این بعد و آستانه را $\theta =(j,t_{m})$ می‌نامیم. دامنه $j$ برابر است با $[1,\cdots ,d]$ و $t_{m}$ یک عدد صحیح است. $Q$ برحسب $\theta =(j,t_{m})$ به دو بخش $Q_{left}(\theta )$ و $Q_{right}(\theta )$ به شکل پایین تقسیم می‌شود[1]:

${\begin{aligned}Q_{left}(\theta )=&\{(x_{i},y_{i})\in Q\,|\,x_{i,j}\leq t_{m}\}\\Q_{right}(\theta )=&\{(x_{i},y_{i})\in Q\,|\,x_{i,j}>t_{m}\}\\\end{aligned}}$

حال سؤال اینجاست که کدام بُعد از متغیرهای وابسته و چه آستانه‌ای را باید انتخاب کرد. به زبان ریاضی باید آن $\theta$ یی را انتخاب کرد که ناخالصی داده را کم کند. ناخالصی برحسب نوع مسئله تعریفی متفاوت خواهد داشت، مثلا اگر مسئله یک دسته‌بندی دوگانه است، ناخالصی می‌تواند آنتراپی داده باشد، کمترین ناخالصی زمانی است که هم $Q_{right}(\theta )$ و هم $Q_{left}(\theta )$ از یک دسته داشته باشند، یعنی در هر کدام از این دو گِرِه دو نوع دسته وجود نداشته باشد. برای رگرسیون این ناخالصی می‌تواند واریانس متغیر وابسته باشد. از آنجا که مقدار داده در $Q_{left}(\theta )$ و $Q_{right}(\theta )$ با هم متفاوت است میانگینی وزن‌دار از هر دو ناخالصی را به شکل پایین محاسبه می‌کنیم.[2] در این معادله $N_{m}=|Q|$ ، $n_{left}=|Q_{left}(\theta )|$ و $n_{right}=|Q_{right}(\theta )|$ :

$G(Q,\theta )={\frac {n_{left}}{N_{m}}}H(Q_{left}(\theta ))+{\frac {n_{right}}{N_{m}}}H(Q_{right}(\theta ))$

هدف در اینجا پیدا کردن آن $\theta$ یی است که ناخالصی را کمینه کند، یعنی $\theta ^{*}=\operatorname {argmin} _{\theta }G(Q,\theta )$ . حال همین کار را به صورت بازگشتی برای $Q_{left}(\theta )$ و $Q_{right}(\theta )$ انجام می‌دهیم. بعضی از گره‌ها را باید به برگ تبدیل کنیم، معیاری که برای تبدیل یک گره به برگ از آن استفاده می‌کنیم می‌تواند مقداری حداقلی برای $N_{m}$ (تعداد داده در یک گره) و یا عمق درخت باشد به قسمی که اگر با دو نیم کردن گِره یکی از معیارها عوض شود، گِره را به دو نیم نکرده آن را تبدیل به یک برگ میکنیم. معمولاً این دو پارامتر باعث تنظیم مدل (Regularization) می‌شوند[2]. در ابتدای کار گره شامل تمام داده‌ها می‌شود یعنی $Q=D$ .

مسئله دسته‌بندی

اگر مسئله ما دسته‌بندی باشد و $y_{i}\in [1,\cdots ,K]$ باشد تابع ناخالصی برای گره $Q$ می‌تواند یکی از موارد پایین باشد، در این معادله‌ها $p_{mk}=1/N_{m}\sum _{(x_{i},y_{i})\in Q}I(y_{i}=k)$ [3]:

ناخالصی گینی: $H(Q)=\sum _{k}p_{mk}(1-p_{mk})$

ناخالصی آنتروپی: $H(Q)=-\sum _{k}p_{mk}\log(p_{mk})$

ناخالصی خطا: $H(Q)=1-\max(p_{mk})$

مسئله رگرسیون

در مسئله رگرسیون ناخالصی می‌تواند یکی از موارد پایین باشد:

میانگین خطای مربعات:

${\begin{aligned}{\begin{aligned}{\bar {y}}_{m}={\frac {1}{N_{m}}}\sum _{i\in N_{m}}y_{i}\\H(Q)={\frac {1}{N_{m}}}\sum _{i\in N_{m}}(y_{i}-{\bar {y}}_{m})^{2}\end{aligned}}\end{aligned}}$

میانگین خطای قدر مطلق:

${\begin{aligned}{\begin{aligned}{\bar {y}}_{m}={\frac {1}{N_{m}}}\sum _{i\in N_{m}}y_{i}\\H(Q)={\frac {1}{N_{m}}}\sum _{i\in N_{m}}|y_{i}-{\bar {y}}_{m}|\end{aligned}}\end{aligned}}$

مزایا

در میان ابزارهای پشتیبانی تصمیم، درخت تصمیم و دیاگرام تصمیم دارای مزایای زیر هستند:

۱- فهم ساده: هر انسان با اندکی مطالعه و آموزش می‌تواند، طریقه کار با درخت تصمیم را بیاموزد.

۲- کار کردن با داده‌های بزرگ و پیچیده: درخت تصمیم در عین سادگی می‌تواند با داده‌های پیچیده به راحتی کار کند و از روی آن‌ها تصمیم بسازد.

۳-استفاده مجدد آسان: در صورتی که درخت تصمیم برای یک مسئله ساخته شد، نمونه‌های مختلف از آن مسئله را می‌توان با آن درخت تصمیم محاسبه کرد.

۴- قابلیت ترکیب با روش‌های دیگر: نتیجه درخت تصمیم را می‌توان با تکنیک‌های تصمیم‌سازی دیگر ترکیب کرده و نتایج بهتری بدست آورد.

معایب

۱- مشکل استفاده از درخت‌های تصمیم آن است که به صورت نمایی با بزرگ شدن مسئله بزرگ می‌شوند. ۲- اکثر درخت‌های تصمیم تنها از یک ویژگی برای شاخه زدن در گره‌ها استفاده می‌کنند در صورتی که ممکن است ویژگی‌ها دارای توزیع توأم باشند. ۳- ساخت درخت تصمیم در برنامه‌های داده کاوی حافظه زیادی را مصرف می‌کند زیرا برای هر گره باید معیار کارایی برای ویژگی‌های مختلف را ذخیره کند تا بتواند بهترین ویژگی را انتخاب کند.

منابع

Sequential decision making with partially ordered preferences Daniel Kikuti, Fabio Gagliardi Cozman , Ricardo Shirota Filho

مثال ۱

درخت تصمیم در بهینه‌سازی مشارکت اوراق بهادار مورد استفاده قرار گیرد. مثال زیر اوراق بهادار ۷ طرح مختلف را نشان می‌دهد. شرکت ۱۰۰۰۰۰۰۰۰ برای کل سرمایه‌گذاری‌ها دارد. خطوط پر رنگ نشان دهنده بهترین انتخاب است که موارد ۱، ۳، ۵، ۶ و۷ را در بر می‌گیرد و هزینه‌ای برابر ۹۷۵۰۰۰۰ دارد و سودی برابر ۱۶۱۷۵۰۰۰ برای شرکت فراهم می‌کند. مابقی حالات یا سود کمتری دارد یا هزینه بیشتری می‌طلبد.[4]

مثال ۲

در بازی بیست سؤالی، بازیکن باید یک درخت تصمیم در ذهن خود بسازد که به خوبی موارد را از هم جدا کند تا با کمترین سؤال به جواب برسد. در صورتی بازیکن به جواب می‌رسد که درخت ساخته شده بتواند به خوبی موارد را از هم جدا کند.

جستارهای وابسته

تقویت گرادیان
جدول تصمیم
پیچیدگی درخت تصمیم
آنالیز تصمیم
درخت
گراف تصمیم
شبکه تصمیم
زنجیره مارکف
دیاگرام تصمیم
آدابوست

منابع

Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer Series in Statistics (2 ed.). New York: Springer-Verlag. ISBN 9780387848570.
Rokach، Lior؛ Maimon، Oded (۲۰۱۴). Data Mining With Decision Trees: Theory and Applications (ویراست ۲nd). River Edge, NJ, USA: World Scientific Publishing Co., Inc. شابک ۹۷۸۹۸۱۴۵۹۰۰۷۵.
Krzywinski, Martin; Altman, Naomi (2017-07-28). "Points of Significance: Classification and regression trees". Nature Methods. Retrieved 2018-12-13.
Y. Yuan and M.J. Shaw, Induction of fuzzy decision trees بایگانی‌شده در ۱۰ فوریه ۲۰۰۹ توسط Wayback Machine. Fuzzy Sets and Systems ۶۹ (۱۹۹۵), pp. 125–139

پیوند به بیرون

در ویکی‌انبار پرونده‌هایی دربارهٔ درخت تصمیم موجود است.

Decision Tree Web Application
5 Myths About Decision Tree Analysis in Litigation
Decision Tree Analysis mindtools.com
Decision Analysis open course at George Mason University
Extensive Decision Tree tutorials and examples
Cha, Sung-Hyuk (2009). "A Genetic Algorithm for Constructing Compact Binary Decision Trees". Journal of Pattern Recognition Research. 4 (1): ۱–۱۳. Unknown parameter |coauthors= ignored (|author= suggested) (help); External link in |journal= (help)
Decision Trees in PMML

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[:0-1] Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer Series in Statistics (2 ed.). New York: Springer-Verlag. ISBN 9780387848570.

[:1-2] Rokach، Lior؛ Maimon، Oded (۲۰۱۴). Data Mining With Decision Trees: Theory and Applications (ویراست ۲nd). River Edge, NJ, USA: World Scientific Publishing Co., Inc. شابک ۹۷۸۹۸۱۴۵۹۰۰۷۵.

[3] Krzywinski, Martin; Altman, Naomi (2017-07-28). "Points of Significance: Classification and regression trees". Nature Methods. Retrieved 2018-12-13.

[4] Y. Yuan and M.J. Shaw, Induction of fuzzy decision trees بایگانی‌شده در ۱۰ فوریه ۲۰۰۹ توسط Wayback Machine. Fuzzy Sets and Systems ۶۹ (۱۹۹۵), pp. 125–139