طبقهبندی آماری
در یادگیری ماشینی و آمار، ردهبندی[1] (به انگلیسی: Classification) یا طبقهبندی مسئلهٔ شناسایی تعلق یک مشاهده جدید به کدام یک از مجموعه دستهها (زیر-جمعیتها)، بر اساس یک مجموعه از دادههای مورد استفاده به منظور آموزش شامل مشاهدات است که عضویت در دسته هایشان معلوم است.[2] در اصطلاح یادگیری ماشین، طبقهبندی نوعی یادگیری با نظارت است، که مجموعهای دادهها برای آموزش موجودند. برای نمونه طبقهبندی ایمیلها به اسپم و غیراسپم یک طبقهبندی با دو دسته است. اگر الگوریتمی بخواهد ایمیلهای دریافتشده را طبقه بندی کند هر ایمیل به کلاس اسپم یا غیراسپم تعلق خواهد داشت. این نمونهای از یک طبقهبندی دودویی است.[3] در مقابل طبقهبندی دودویی، طبقهبندی چندکلاسه قرار دارد (برای نمونه تشخیص یک عدد بین ٠ تا ٩ از روی تصویر نه کلاس دارد). طبقهبندیهای چندکلاسه معمولا دشوارتر از طبقهبندی دودویی هستند.[3][4]
الگوریتمهای طبقهبندی
جستارهای وابسته
منابع
- «ردهبندی دادهها» [رایانه و فنّاوری اطلاعات] همارزِ «data classification»؛ منبع: گروه واژهگزینی. جواد میرشکاری، ویراستار. دفتر دوم. فرهنگ واژههای مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۶۴-۷۵۳۱-۳۷-۰ (ذیل سرواژهٔ ردهبندی دادهها)
- T. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” Bayesian Forecast. Dyn. Model., vol. 1, pp. 1–694, 2009.
- Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.".
- Piryonesi S. Madeh; El-Diraby Tamer E. (2020-06-01). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/JPEODX.0000175.
- مشارکتکنندگان ویکیپدیا. «Statistical classification». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۲۵ مارس ۲۰۱۶.