پایگاه داده تحلیلی
پایگاه داده تحلیلی (به انگلیسی: Data warehouse) یک بانک اطلاعاتی بزرگ میباشد که از طریق آن کلیه دادههای حال و گذشته یک سازمان جهت انجام عملیات گزارشگیری و آنالیز در دسترس مدیران قرار میگیرد. پایگاه داده تحلیلی که برخی آن را انبار داده میخوانند، نقش مهمی در تصمیمگیری مدیران کمپانی برای تعیین یک استراتژی موفق دارد. پایگاه داده نقش محوری در سامانه های هوش تجاری در سازمان ها ایفا می کنند.
بعضی از دادهها به منظور پردازش به یک فضای عملیاتی کوچکتر operational data store برای پردازش بیشتر وارد میشوند.
مراحل عملیاتی پایگاه داده تحلیل
در حال حاضر دو رویکرد کلی در روند پردازش داده ها در پایگاه های داده تحلیلی وجود دارد[1]:
- ETL مخفف Extract-Transformation-Load که رویکرد سه لایه دارد که به ترتیب Integration ,Staging و Presentation نام دارد. در این رویکرد، داده ها قبل از فراخوانی به پایگاه داده تحلیلی، ساختار مناسب پیدا می کنند و سپس ذخیره می شوند.
- ELT مخفف Extract-Load-Transformation که بدون توجه به روال سه لایه ETL، داده ها را مستقیما به پایگاه داده های تحلیلی فراخوانی می کند و تغییر ساختار داده ها با توجه به نیاز انجام و در جداول جدید ذخیره می شود.
فراخوانی داده ها از منابع
دادههای خام از منابع اطلاعاتی مختلفی جمعآوری شده و در لایه staging وارد میشوند. منبع داده خام میتواند یک سیستم ERP، پایگاه داده یک برنامه کاربردی یا یک فایل Excel باشد. در اصل، یک پایگاه داده تحلیلی باید امکان دسترسی و پردازش انواع منابع داده اعم از ساخت یافته (مانند پایگاه های داده)، نیمه ساخت یافته (مانند فایل های Excel) یا غیر ساخت یافته (مانند فایل های متنی یا صفحات اینترنتی) را داشته باشد.
ایجاد یکنواختی بین دادههای وارد شده به پایگاه دادهٔ تحلیلی در دومین لایه یعنی integration انجام میشود. به عنوان مثال حذف رکوردهای تکراری یا نرمالسازی دادهها.
در لایه Presentation دادهها در دسترس کاربران قرار میگیرد. نرمافزارهای تهیه گزارش مانند Cognos ,Business Object ,SAP با دسترسی به این لایه میتوانند اطلاعات مورد نیاز مدیران و تحلیلگران را استخراج و در قالب گزارش یا Dashboard عرضه نمایند.
در لایه Presentation میتواند چندین دادهگاه وجود داشته باشد.
منابع
- "Data warehouse". Wikipedia. 2020-05-31.