مفاهیم انباره داده
مفهوم اساسی و بنیادی انباره داده، تشخیص و تفاوت قائل شدن بین داده و اطلاعات میباشد. داده متشکل از حقایق قابلمشاهده و قابل ذخیرهسازی است، که معمولاً در سامانههای عملیاتی و تراکنشی وجود دارند. برای مثال یک سیستم دانشگاهی شامل دادههای ثبتنام دانشجویان، دادههای منابع انسانی، دادههای حقوق و دستمزد کارکنان، دادههای زمانبندی کلاسها میباشد. در یک محیط انباره داده، داده فقط به این دلیل وارد میشود که حاوی ارزشی است که برای کاربر نهایی، داده در انباره داده سازماندهیشده و بهصورت اطلاعات ارائه میگردد. اطلاعات یک مجموعه یکپارچهشده از حقایق کسبوکار هستند که بهعنوان زیربنای سیستم تصمیم سازی مطرح میگردند.
تعریفهای انباره داده
انباره داده بخشی از یک معماری داده میباشد، که بهعنوان مخزنی واحد و یکپارچه از دادهها برای پردازش اطلاعات میباشد. انباره داده دارای ویژگیها و خصوصیاتی است که در زیر به شرح آنها خواهیم پرداخت:
- موضوع گرا Subject-Oriented : اطلاعاتی که در موضوعات و محدودههای خاص موردنظر ارائه میگردند و صرفاً فایلهای کامپیوتری نمیباشند. دادهها بامهارت دستکاریشده تا اطلاعات درباره یک موضوع خاص را فراهم نمایند. برای مثال درصد تحقق اهداف جذب سپرده در یک بانک که در اختیار کاربر نهایی است، بهسادگی ساخته نشده است بلکه بر اساس یک نیاز بخصوص ساختاردهی و سازماندهیشده است.
- یکپارچگی Integrated : ایجاد یک منبع ساده از اطلاعات برای یک موضوع خاص از منابع دادهای چندگانه بسیار جالبتوجه میباشد. انباره داده یک مخزن حاوی اطلاعاتی که در یک گام قابلدستیابی هستند را تهیه میکند و حاوی اطلاعات در حوزهها و موضوعات بسیار مختلف میباشد.
- پایایی Non-Volatile : اطلاعات انباره داده پایدار و باثبات بوده و با هر بار اجرای سیستم عملیاتی تغییر نمیکنند. بدون توجه به اینکه انباره داده چه زمانی مورداستفاده واقع میشود، اطلاعات درون آن پایدار میباشند. (در انباره داده غالباً عمل insert انجام میشود و عملیاتهای update و delete بسیار نادر رخ میدهند)
- زمان گرا Time-Variant : انباره داده شامل تاریخچهای از موضوعات و همچنین اطلاعات حال حاضر آنها میباشد. اطلاعات تاریخچهای یکی از اجزای بسیار مهم انباره داده میباشند. یعنی اطلاعات بصورت برش زمانی snapshot ذخیره میشوند.
- در دسترس بودن Accessible : هدف اصلی یک انباره داده تأمین و قابلیت دستیابی خواندن اطلاعات به کاربر نهایی میباشد.
- فرآیند گرا Process-Oriented : بسیار مهم و ضروری است که دید ما نسبت به انباره داده این باشد که فرآیندی برای ارائه اطلاعات را طی میکند. فرآیند نگهداری و پشتیبانی از یک انباره داده بهصورت مداوم و تکرارشونده انجام میپذیرد.
تعاریف و کلیدواژههای دیگر مرتبط با انباره داده:
- انباره داده Data Warehouse : یک ساختار داده که برای سیستمهای توزیعشده بسیار بهینه میباشد. انباره داده بهصورت مجموعهای واحد، از مجموعه دادههای تاریخچهای، سامانههای عملیاتی مختلف و متنوع، است که آنها را ذخیرهسازی و یکپارچه میکند، سپس آنها را در یک یا چند دیتا مارت قرار میدهد.
- دیتا مارت Data Mart : یک ساختار دادهای را گویند که برای دسترسی خوب بهینهشده است. دیتا مارت جهت ساده کردن کار کاربر نهایی برای تحلیل اطلاعات طراحیشده است.
- مخزن داده میانی Staging Area : هر مخزن دادهای که بهمنظور دریافت دادههای محیط انباره داده طراحیشده باشد را مخزن داده میانی گویند.
- مخزن داده عملیاتی Operational Data Store : یک مجموعه از دادههایی که نیازهای عملیاتیِِ واحدهایِ مختلف را نشان میدهد. اینیک جزء از معماری انباره داده نیست اما راهحلی برای نیازهای عملیاتی است.
- OLAP(On-Line Analytics Processing) : روشی که میگوید کدامیک از تجزیهوتحلیلهای چندبٌعدی رخ میدهند.
- تجزیهوتحلیل چندبعدی Multidimensional Analysis : قابلیت دستکاریکردن اطلاعات، بهوسیله انواع مقولههای مربوط به آن (یا بُعدها) برای تحلیلهای ساده و فهمیدن دادههای اساسی را گویند. همچنین بعضیاوقات اشاره بهdrill-down و drill-across دارد.
- اَبَر مکعب Hypercube : مفهوم بصری ارائه دادههای چندبُعدی را گویند.
- مدل ستارهای Star Schema : مفهوم دادههای تجمیع شده بر اساس بٌعدهای شناساییشده را گویند. در این مدل دادههای چند بٌعدی در یک سیستم مدیریت پایگاه دادههای رابطهای Relational Data Base Management System مانند اوراکل ذخیره میشوند.
- مدل دانه برفی Snowflake Schema : یک نوع گسترش از مدل ستاره میباشد و به این صورت است که به بٌعدهایی که در محیط قرار دارند بٌعدهایی اضافه میگردند.
- پایگاه داده چند بٌعدی Multidimensional Database : به این مدل MDDB یا MDDBS گویند. یک کلاس خصوصی و غیر رابطهای از ابزارهای مدیریت پایگاه دادهها است که دادهها را با شیوههای چند بٌعدی ذخیرهسازی و مدیریت میکند.
- ابزارهای OLAP : به مجموعه محصولات نرمافزاری گویند که سعی دارند تحلیلهای چند بٌعدی را آسان و راحت انجام دهند. این ابزارها میتوانند اکتساب داده، دستیابی به داده، دستکاری درداده یا هر ترکیبی از آنها را انجام دهند.
مقایسه انباره داده و دادههای عملیاتی
تفاوت انباره داده با پایگاه داده عملیاتی چیست؟
استفاده و نگهداری و پشتیبانی از یک انباره داده در مقایسه با یک پایگاه داده عملیاتی تفاوتهای خاصی دارد. انباره داده یک دسترسی ساده به دادههای عملیاتی و خواندن و نوشتن آنها نیست. بلکه تفاوتهای بنیادی زیر را با پایگاه داده عملیاتی دارد:
دادههای انباره داده |
دادههای سیستم عملیاتی |
موضوع گرا هستند |
کاربرد گرا هستند |
خلاصهشده و درغیراینصورت تصفیهشدهاند |
همراه با جزییات هستند |
نشاندهنده ارزش در طول زمان هستند. برش زمانی |
دقیق، در آن لحظه که دستیابی میشوند |
در خدمت جامعه مدیریتی | در خدمت جامعه کارشناسان |
بهروزرسانی نمیشوند | میتوانند بهروزرسانی شوند |
اجرای تاریخچهای | اجرای تکراری |
نیازمند به پردازشهایی که قبل از توسعه بهطور کامل درک نمیشوند | نیازمند به پردازشهایی که قبل از توسعه اولیه قابلدرک میباشند |
چرخه حیات کاملاً متفاوت | سازگار با چرخه حیات توسعه نرمافزار |
کار آیی کم(جزو نیازمندیها نیست) | حساس به کار آیی(نیازمند پاسخ فوری وقتیکه یک تراکنش وارد میشود) |
مجموعه دادههایی که در یکزمان قابلدستیابی است. شامل: رکوردهای زیادی از عناصر دادهای فراوان | فقط یک واحد داده در یک واحد زمان قابلدستیابی است. شامل: چندین رکورد از تعداد محدودی عناصر دادهای |
تجزیهوتحلیل محور | تراکنش محور |
کنترل میشود هیچ موضوعی بهروزرسانی نگردد | کنترل کردن بهروزرسانیها، که موضوعی چالشبرانگیز است |
قابلیت دستیابی کم | قابلیت دستیابی بالا |
توسط زیرمجموعهها مدیریت میشود | بهوسیله کلیت آن مدیریت میشود |
افزونگی واقعیت حیات آن است | بدون افزونگی |
ساختار منعطف | ساختار ثابت، محتویات متغییر |
مقدار بسیار زیادی از دادهها در پردازش بکار میروند | مقدار کمی داده را در پردازش استفاده میکند |
1 نظر
سلام، روز بخیر
من به دنبال کتابی در مورد BI هستم که مفاهیم اصلی BI را به طور کامل توضیح بدهد.
توضیحات شما بسیار خوب بود اما هر کدام جداگانه توضیح داده شده اند که خوب و بیان روانی دارد. ممنون
اما من نیاز به توضیحاتی کمی بیشنری و جامع تری دارم
اگر برای شما مقدور است کتاب، PDFی معرفی کنید تا من بتوانم به پاسخ سوالات خود برسم.
باتشکر
حق ورئی
نوشتن نظر
نوشتههای تازه
آخرین دیدگاهها
بایگانیها
دستهها