طراحی انبارداده

مفاهیم انباره داده

مفهوم اساسی و بنیادی انباره داده، تشخیص و تفاوت قائل شدن بین داده و اطلاعات می‌باشد. داده متشکل از حقایق قابل‌مشاهده و قابل ذخیره‌سازی است، که معمولاً در سامانه‌های عملیاتی و تراکنشی وجود دارند. برای مثال یک سیستم دانشگاهی شامل داده‌های ثبت‌نام دانشجویان، داده‌های منابع انسانی، داده‌های حقوق و دستمزد کارکنان، داده‌های زمان‌بندی کلاس‌ها می‌باشد. در یک محیط انباره داده، داده فقط به این دلیل وارد می‌شود که حاوی ارزشی است که برای کاربر نهایی، داده در انباره داده سازماندهی‌شده و به‌صورت اطلاعات ارائه می‌گردد. اطلاعات یک مجموعه یکپارچه‌شده از حقایق کسب‌وکار هستند که به‌عنوان زیربنای سیستم تصمیم سازی مطرح می‌گردند.

تعریف‌های انباره داده

انباره داده بخشی از یک معماری داده می‌باشد، که به‌عنوان مخزنی واحد و یکپارچه از داده‌ها برای پردازش اطلاعات می‌باشد. انباره داده دارای ویژگی‌ها و خصوصیاتی است که در زیر به شرح آن‌ها خواهیم پرداخت:

  1. موضوع گرا Subject-Oriented : اطلاعاتی که در موضوعات و محدوده‌های خاص موردنظر ارائه می‌گردند و صرفاً فایل‌های کامپیوتری نمی‌باشند. داده‌ها بامهارت دستکاری‌شده تا اطلاعات درباره یک موضوع خاص را فراهم نمایند. برای مثال درصد تحقق اهداف جذب سپرده در یک بانک که در اختیار کاربر نهایی است، به‌سادگی ساخته نشده است بلکه بر اساس یک نیاز بخصوص ساختاردهی و سازماندهی‌شده است.
  2. یکپارچگی Integrated : ایجاد یک منبع ساده از اطلاعات برای یک موضوع خاص از منابع داده‌ای چندگانه بسیار جالب‌توجه می‌باشد. انباره داده یک مخزن حاوی اطلاعاتی که در یک گام قابل‌دستیابی هستند را تهیه می‌کند و حاوی اطلاعات در حوزه‌ها و موضوعات بسیار مختلف می‌باشد.
  3. پایایی Non-Volatile : اطلاعات انباره داده پایدار و باثبات بوده و با هر بار اجرای سیستم عملیاتی تغییر نمی‌کنند. بدون توجه به اینکه انباره داده چه زمانی مورداستفاده واقع می‌شود، اطلاعات درون آن پایدار می‌باشند. (در انباره داده غالباً عمل insert انجام می‌شود و عملیات‌های update و delete بسیار نادر رخ می‌دهند)
  4. زمان گرا Time-Variant : انباره داده شامل تاریخچه‌ای از موضوعات و همچنین اطلاعات حال حاضر آن‌ها می‌باشد. اطلاعات تاریخچه‌ای یکی از اجزای بسیار مهم انباره داده می‌باشند. یعنی اطلاعات بصورت برش زمانی snapshot ذخیره میشوند.
  5. در دسترس بودن Accessible : هدف اصلی یک انباره داده تأمین و قابلیت دستیابی خواندن اطلاعات به کاربر نهایی می‌باشد.
  6. فرآیند گرا Process-Oriented : بسیار مهم و ضروری است که دید ما نسبت به انباره داده این باشد که فرآیندی برای ارائه اطلاعات را طی می‌کند. فرآیند نگهداری و پشتیبانی از یک انباره داده به‌صورت مداوم و تکرارشونده انجام می‌پذیرد.
مفاهیم انباره داده
مفاهیم انباره داده

تعاریف و کلیدواژه‌های دیگر مرتبط با انباره داده:

  • انباره داده Data Warehouse : یک ساختار داده که برای سیستم‌های توزیع‌شده بسیار بهینه می‌باشد. انباره داده به‌صورت مجموعه‌ای واحد، از مجموعه داده‌های تاریخچه‌ای، سامانه‌های عملیاتی مختلف و متنوع، است که آن‌ها را ذخیره‌سازی و یکپارچه می‌کند، سپس آن‌ها را در یک یا چند دیتا مارت قرار می‌دهد.
  • دیتا مارت Data Mart : یک ساختار داده‌ای را گویند که برای دسترسی خوب بهینه‌شده است. دیتا مارت جهت ساده کردن کار کاربر نهایی برای تحلیل اطلاعات طراحی‌شده است.
  • مخزن داده میانی Staging Area : هر مخزن داده‌ای که به‌منظور دریافت داده‌های محیط انباره داده طراحی‌شده باشد را مخزن داده میانی گویند.
  • مخزن داده عملیاتی Operational Data Store : یک مجموعه از داده‌هایی که نیازهای عملیاتیِِ واحدهایِ مختلف را نشان می‌دهد. این‌یک جزء از معماری انباره داده نیست اما راه‌حلی برای نیازهای عملیاتی است.
  • OLAP(On-Line Analytics Processing) : روشی که می‌گوید کدام‌یک از تجزیه‌وتحلیل‌های چندبٌعدی رخ می‌دهند.
  • تجزیه‌وتحلیل چندبعدی Multidimensional Analysis : قابلیت دستکاری‌کردن اطلاعات، به‌وسیله انواع مقوله‌های مربوط به آن (یا بُعدها) برای تحلیل‌های ساده و فهمیدن داده‌های اساسی را گویند. همچنین بعضی‌اوقات اشاره بهdrill-down و drill-across دارد.
  • اَبَر مکعب Hypercube : مفهوم بصری ارائه داده‌های چندبُعدی را گویند.
  • مدل ستاره‌ای Star Schema : مفهوم داده‌های تجمیع شده بر اساس بٌعدهای شناسایی‌شده را گویند. در این مدل داده‌های چند بٌعدی در یک سیستم مدیریت پایگاه داده‌های رابطه‌ای Relational Data Base Management System مانند اوراکل ذخیره می‌شوند.
  • مدل دانه برفی Snowflake Schema : یک نوع گسترش از مدل ستاره می‌باشد و به این صورت است که به بٌعدهایی که در محیط قرار دارند بٌعدهایی اضافه می‌گردند.
  • پایگاه داده چند بٌعدی Multidimensional Database : به این مدل MDDB یا MDDBS گویند. یک کلاس خصوصی و غیر رابطه‌ای از ابزارهای مدیریت پایگاه داده‌ها است که داده‌ها را با شیوه‌های چند بٌعدی ذخیره‌سازی و مدیریت می‌کند.
  • ابزارهای OLAP : به مجموعه محصولات نرم‌افزاری گویند که سعی دارند تحلیل‌های چند بٌعدی را آسان و راحت انجام دهند. این ابزارها می‌توانند اکتساب داده، دستیابی به داده، دستکاری‌ درداده یا هر ترکیبی از آن‌ها را انجام دهند.

مقایسه انباره داده و داده‌های عملیاتی

تفاوت انباره داده با پایگاه داده عملیاتی چیست؟

استفاده و نگهداری و پشتیبانی از یک انباره داده در مقایسه با یک پایگاه داده عملیاتی تفاوت‌های خاصی دارد. انباره داده یک دسترسی ساده به داده‌های عملیاتی و خواندن و نوشتن آن‌ها نیست. بلکه تفاوت‌های بنیادی زیر را با پایگاه داده عملیاتی دارد:

داده‌های انباره داده

داده‌های سیستم عملیاتی

موضوع گرا هستند

کاربرد گرا هستند

خلاصه‌شده و درغیراینصورت تصفیه‌شده‌اند

همراه با جزییات هستند

نشان‌دهنده ارزش در طول زمان هستند. برش زمانی

دقیق، در آن لحظه که دستیابی می‌شوند

در خدمت جامعه مدیریتی در خدمت جامعه کارشناسان
به‌روزرسانی نمی‌شوند می‌توانند به‌روزرسانی شوند
اجرای تاریخچه‌ای اجرای تکراری
نیازمند به پردازش‌هایی که قبل از توسعه به‌طور کامل درک نمی‌شوند نیازمند به پردازش‌هایی که قبل از توسعه اولیه قابل‌درک می‌باشند
چرخه حیات کاملاً متفاوت سازگار با چرخه حیات توسعه نرم‌افزار
کار آیی کم(جزو نیازمندی‌ها نیست) حساس به کار آیی(نیازمند پاسخ فوری وقتی‌که یک تراکنش وارد می‌شود)
مجموعه داده‌هایی که در یک‌زمان قابل‌دستیابی است. شامل: رکوردهای زیادی از عناصر داده‌ای فراوان فقط یک واحد داده در یک واحد زمان قابل‌دستیابی است. شامل: چندین رکورد از تعداد محدودی عناصر داده‌ای
تجزیه‌وتحلیل محور تراکنش محور
کنترل می‌شود هیچ موضوعی به‌روزرسانی نگردد کنترل کردن به‌روزرسانی‌ها، که موضوعی چالش‌برانگیز است
قابلیت دستیابی کم قابلیت دستیابی بالا
توسط زیرمجموعه‌ها مدیریت می‌شود به‌وسیله کلیت آن مدیریت می‌شود
افزونگی واقعیت حیات آن است بدون افزونگی
ساختار منعطف ساختار ثابت، محتویات متغییر
مقدار بسیار زیادی از داده‌ها در پردازش بکار می‌روند مقدار کمی داده را در پردازش استفاده می‌کند

1 نظر

  • مسعود حق وردی

    سلام، روز بخیر
    من به دنبال کتابی در مورد BI هستم که مفاهیم اصلی BI را به طور کامل توضیح بدهد.
    توضیحات شما بسیار خوب بود اما هر کدام جداگانه توضیح داده شده اند که خوب و بیان روانی دارد. ممنون
    اما من نیاز به توضیحاتی کمی بیشنری و جامع تری دارم
    اگر برای شما مقدور است کتاب، PDFی معرفی کنید تا من بتوانم به پاسخ سوالات خود برسم.

    باتشکر
    حق ورئی

  • نوشتن نظر

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *