پاک‌سازی داده

پاک‌سازی داده‌ها یا تمیز کردن داده‌ها فرایند پیدا کردن، اصلاح کردن (یا حتی حذف کردن) داده‌های بی ارزش و اشتباه از مجموعه داده (دیتاست) یا پایگاه داده (دیتابیس) است. فرایند تمیز کردن داده‌ها ممکن است که از طریق ابزارهای داده‌کاوی یا پردازش دسته‌ای از طریق اسکریپت‌ها انجام شود. بعد از پاکسازی، مجموعه داده باید با سایر مجموعه داده‌های مشابه در سیستم سازگار باشد. ناسازگاری داده‌ها شناسایی و حذف (اصلاح) شده ممکن است بر اثر اشتباه انسانی هنگام ورود اطلاعات، انحراف در هنگام انتقال و ذخیره سازی اطلاعات یا به دلیل واژه نامه‌های داده مختلف باشد.

منابع

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.