علم داده

علم داده

علم داده دانشی مبتنی برداده است که با استفاده از دیگر علوم به‌عنوان علمی میان‌رشته‌ای عمل می‌کند. علم داده با استفاده از فرآیندها، سامانه‌ها و روش‌های علمی، از داده‌ها در اشکال مختلف اعم از ساختاریافته یا غیر ساختاریافته استخراج دانش و بینش انجام می‌دهد. علم داده شبیه به کشف دانش در پایگاه داده‌ها است

ETL چیست

ETL چیست

ETL چیست: پروسه استخراج داده‌ها از سامانه‌های منبع و آوردن آن‌ها به انبارداده ETL خوانده می‌شود. همان‌گونه که می‌دانیم ETL مخفف کلمات Extraction , Transformation , Load می‌باشند. دقت داشته باشید که ETL اشاره به یک فرآیند گسترده دارد، نه‌فقط این سه‌گامی که گفته شد. اگرچه مخفف ETL بسیار ساده و کوتاه است و Transformation آن معنای جابجایی داده‌ها را دارد بااین‌وجود کل فرآیند به‌عنوان ETL شناخته می‌شود.

مفاهیم انباره داده

طراحی انبارداده

مفهوم اساسی و بنیادی انباره داده، تشخیص و تفاوت قائل شدن بین داده و اطلاعات می‌باشد. داده متشکل از حقایق قابل‌مشاهده و قابل ذخیره‌سازی است، که معمولاً در سامانه‌های عملیاتی و تراکنشی وجود دارند. اطلاعات یک مجموعه یکپارچه‌شده از حقایق کسب‌وکار هستند که به‌عنوان زیربنای سیستم تصمیم سازی مطرح می‌گردند و در انباره داده ذخیره‌سازی و پشتیبانی می‌شوند.