پردازش تحلیلی برخط (OLAP)
سیستم پردازش تحلیلی برخط (OLAP) یک فناوری برای پاسخ سریع به جستوجوهای چندبعدی در یک پایگاه داده بزرگ از دادهها و اطلاعات است. سیستم OLAP بخشی از قلمرو گسترده هوش تجاری است که مباحث پایگاه داده ارتباطی، سیستم گزارشات و دادهکاوی را در برمیگیرد.
سیستمهای اطلاعاتی تحلیلی در مقابل سیستمهای عملیاتی، سیستمهای هستند که امکان تحلیل دادههای انبوه حاصل از سیستمهای عملیاتی را برای تمامی سطوح کاربران فراهم میکنند. سیستمهای عملیاتی در سازمانهای بزرگی مانند بانکها به صورت روزانه پردازشهای اطلاعاتی فراوانی را به انجام رسانده و به تولید اطلاعات گوناگون میپردازند. بانکهای اطلاعاتی این سازمانها با دادههای فراوان حاصل از تراکنشهای مالی، اداری حسابداری و… روبرو میشوند.
اطلاعات پایه سیستمها همانند اطلاعات کاربران و سطوح دسترسی آنهامعمولا با تغییرات روزانه مواجه نیستند اما اطلاعات عملیاتی نظیر عملیات تجاری،خرید و فروش محصولات و …میتوانندحتی بطور لحظهای تغییرکنند. تحلیل و پردازش درست و دقیق اطلاعات عملیاتی میتواند در تولید نتایج آماری در جهت تصمیم گیریهای کلان مدیریتی موثر بوده و به مدیران کمک کند تا تصمیمات بهینهای برای موفقیت سازمان خود بگیرند. برای آنالیز و پردازش این اطلاعات و تسهیل و سرعت بخشیدن به عملیات گزارشگیری و پرس و جوهای متنوع به جای تحلیل مستقیم دادهها از درون سیستمهای عملیاتی، از سیستمها و پایگاه دادههای تحلیلی استفاده میشود که خارج از حوزه سیستمهای عملیاتی قرار داشته و سرعت بسیار بالایی دارند.
پردازش تحلیلی برخط (OLAP) چیست؟
پردازش تحلیلی برخط یا سیستم OLAP نام خود را از عبارت (Online Analytical Process) با معنی تحت اللفظی سیستمهای پردازش تحلیلی برخط گرفته اند. می توان به جای OLAP از واژه پردازش سریع اطلاعات چند بعدی و یا به عبارت بهتر از فنآوری تحلیل دادهها استفاده کرد. این سیستمها بر اساس تکامل سیستمهای OLTP به معنی سیستم پردازش تراکنش آنلاین (On Line Transaction Processing) ایجاد شده اند.سیستمهای OLAP برای ارائه پاسخهای سریع به سوالات و جستجوهای تحلیلی روی دادههای “چند بعدی” طراحی شدهاند.
بطور معمول اگر بخواهیم مشابه همین پرس و جوهای تحلیلی را روی سیستمهای اطلاعاتی عادی OLTP اجرا کنیم ممکن است نتایج در زمانی طولانی و غیرکاربردی بازگردانده شود در حالیکه استفاده از پردازش تحلیلی برخط تضمین میکند که اطلاعات و گزارشات تحلیلی با زمان پاسخ مناسبی به کاربر تحویل داده شود. کاربردهای معمول OLAP عبارتند از : گزارشات تجاری فروش، بازاریابی، گزارشات مالی و مواردی از این قبیل. این سیستمها دادههای خود را به نحوی خاص نگهداری میکنند که از نظر سرعت در برخورد با دادههای چند بعدی بهتر از سیستمهای OLTP عمل میکنند و از این رو به آنها بانکهای اطلاعاتی سلسلهمراتبی (Hierarchical) هم گفته میشود.
تشریح پردازش تحلیلی برخط (OLAP)
پایگاه دادههای تحلیلی نسخههای متنوعی از دادههای تراکنشی را به صورت اختصاصی برای پرس و جوها و گزارشگیری ،سازمان دهی میکنند.به این ترتیب کاربرانی مانند مدیران سازمان که خارج از سیستمهای عمیاتی قرار دارند میتوانند گزارشها و پرس و جوهای مورد نظر خود را تهیه کنند. پایگاه دادههای تحلیلی OLAP از منابع دادهای متفاوت یک سازمان و یا حتی چندین سازمان و ارگان وابسته به هم تهیه میشود. این پایگاه داده بستر مناسبی را فراهم میآورد که دادههای بایگانی شده در سیستمهای عملیاتی و مستقل از هم سازمان، به صورت مجتمع، خلاصه شده، و یکپارچه و سازمان یافته درآمده و برای استخراج مناسب اطلاعات در دسترس مدیران باشند.
OLAP و پایگاه دادههای مربوطه با استفاده از یک ساختار سلسلهمراتبی و یک data model چندبعدی قدرتمند جهت سازماندهی اطلاعات به ساده سازی محاسبات پرداخته وگزارشاتی بسیار سریعتر نسبت به روشهای قبلی ارائه میدهند. بانکهای اطلاعاتی به کار رفته در OLAP که Data-warehouse یا انبار دادهها نامیده میشوند متشکل از مکعبهای اطلاعاتی چند بعدی بوده که امکان آنالیز سریع اطلاعات پایگاه دادههای مختلف را فراهم میآورند. بعنوان مثال یک پایگاه داده چند بعدی میتواند فروش کل سالیانه را با ماه فروش، تعداد مشتری و قیمت متقاطع سازد. حاصل این تقاطع این است که گزارشات بسیار متنوعی مثل مجموع فروش در ماه خاص یا بهترین قیمت و مشتری سال و … از سیستم به راحتی قابل استخراج است.
مکعبهای OLAP
مکعبهای OLAP با استفاده از data model جامع خودQueryهای کارآمد و پر سرعتی را ارئه داده و جایگزین بهتری برای خلاصه سازی جداول هستند. محاسبات پیچیده میتوانند براحتی درون این مکعبها قرارگرفته و باعث بهبود کیفیت تحلیل برنامههای کاربردی شوند. مثلا یک مکعب OLAP میتواند شامل محاسبات مقایسهای فروش سال جاری هر منطقه و خط تولید با همان زمان در سالهای قبل باشد.در واقع ساختار این مکعبها برای بهینه چنین گزارشات و تحلیل هایی بهینه شده است.
عمده عملیات روی پایگاه داده می تواند شامل update،insert،delete و … باشد اما Data-warehouse که یک مکعب چند بعدی با صدها برابر گنجایش یک پایگاه داده است که به عنوان اصلی ترین وظیفه اش به کاربر data ارائه میدهد و میتواند اطلاعات را در قالبهای متنوع برای نیازهای مختلف نگهداری کند.
پرس و جوهای کاربران در روزهای مختلف غیر قابل پیش بیش بینی هستند. به عنوان مثال شاید لازم شود فروش یک هفته را با همان هفته در چند سال پیش مقایسه کرد. با سیستمهای relational بهینه کردن چنین درخواست هایی بسیار مشکل است.برای برآوردن این نیاز Database وDBAها بصورت متناوب viewها و خلاصه جدول هایی را تولید میکنند.خروجی یک سیستم OLAP به صورت کلی یک ماتریس میباشد و ابعاد مختلف داده، ستونها و سطرهای ماتریس راتشکیل میهند. تکنیکهای بسیاری جهت جمع آوری، پالایش و آنالیز دادهها نظیر OLAP، Data Mart، Warehousing و Data Mining با هدف استخراج اطلاعات از رکوردهای عملیاتی سازمان و نظم دهی آن به منظور انجام تحلیلهای مختلف وجود دارد.
تعاریف عمده فناوری OLAP
انباره داده یا Data Warehouse : انبار دادهها در اواخر دهه ۸۰ و اوایل دهه ۹۰، در پاسخ به نیاز روزافزون سازمانهای بزرگ برای کسب اطلاعات تحلیلی و مدیریتی از دادههای درون سیستمهای عملیاتی (OLTP)ابداع شده و به عنوان نوع خاصی از پایگاههای داده مورد توجه قرار گرفت. انبار دادهها یک پایگاه اطلاعاتی بزرگ است که به جمع آوری، یکپارچه سازی و ذخیره اطلاعات متنوع یک سازمان را با هدف تولید گزارشات چندجانبه و دقیق بر عهده دارد. این قابلیتها در کنار امکانات پشتیبانی از فعالیتهای تحلیل و گزارش دهی آسان و انفصال از فشارهای عملیاتی به رشد روز افزون این سیستمها منجر شد.
سیستمهای عملیاتی به دلایل عدم طراحی اختصاصی آنها جهت گزارشگیری گسترده و یکپارچه، با تولید گزارشات کند و گران قیمت از کارائی و امکانات لازم برای ارائه اطلاعات پویا و راهگشای مدیریتی برخوردار نیستند.بنابراین از فناوری OLAP و راهکار ایجاد انبار دادهها با استفاده از همگن کردن و یکپارچه سازی دادهها جهت تبدیل دادههای نامتجانس به اطلاعات قابل استفاده در زمینههای مختلف استفاده میشود.
ویژگیهای اساسی انبار دادهها
انبار دادهها موضوع گرا (Subject-oriented) است ،یعنی دادهها از بانکهای اطلاعاتی مختلف بصورت انتخابی به انبار داده منتقل شده و بر اساس موضوعات خاص دسته بندی میشوند. بنابراین کاوش دادهها در پرس و جوهای خاص با سرعت و دقت بیشتری انجام میگردد.همچنین انبار دادهها مبتنی بر زمان است و تغییرات دادهها بر اساس بازههای زمانی متفاوت نگهداری شده و در گزارشات تحلیلی مورد استفاده قرار میگیرد.به همین ترتیب انبار دادهها غیرقابل تغییر و غیر فرار میباشد و دادهها در آن بازنویسی و حذف نمی شود.بلکه تغییرات در بازههای زمانی مختلف نگهداری میشوند تا پاسخگوی ارجاعات مختلف باشد.
مرکز دادهها یا Data Mart: انبار دادهها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتری به نام Data Mart نگهداری میکند Data Martها نمونههای کوچکی از انباردادهها بوده و همانند آنها حاوی کپی هایی ثابت از داده هایی هستند که در موارد خاص استفاده میشوند. Data Martها میتواند وابسته یا مستقل از هم باشند. هر Data Mart، دادهها و ابعاد (Dimension ) خاص خود را دارد که میتواند با بقیه به اشتراک بگذارد.
دادهکاوی یا Data Mining: ابزارهای دادهکاوی بدنبال طرحها و گروه بندی هایی در دادهها میگردد که ممکن است از دید ما پنهان مانده باشد. در دادهکاوی این ابزار است که استفاده کننده را هدایت میکند. ابزار فرض میکند که شما خود نیز دقیقا نمی دانید که چه میخواهید. اولین گام دادهکاوی هدفدار، انتخاب مجموعه دادهها برای تحلیل است. دادهها میتواند از انبار دادهها و یا بانکهای اطلاعاتی عملیاتی استخراج شود.
نحوه عملکرد پردازش تحلیلی برخط
پردازش تحلیلی برخط OLAP به صورت مرتب از دادههای منابع اطلاعاتی مختلف کپیهای خلاصه شده برداشته و آنها را در مکعبهای دادهای (Cube) مرتب میکند. پرس و جوهای کاربران میتواند روی این مکعب اجرا شود. روشهای مختلف طراحی انبار دادهها امکان پردازشهای بهینه را بر روی مقادیر زیادی ازدادهها فراهم میآورند. پرس و جوهای پیچیده روی سیستمهای OLAP به زمانی حدود تنها ۰٫۱ درصد از زمان اجرای جستجوهای مشابه روی سیستمهای OLTP احتیاج دارند. انواع ویژهای از الگوهای پایگاه دادهها به نام ستارهای یا دانه برفی برای طراحی انبار داده چند بعدی وجود دارد. در این حالت، پایگاه دادهها از یک جدول مرکزی و جداول چند بعدی تشکیل شده است روابط بین آنها کاملا مشخص است.
نحوه عملکرد این سیستمها به این صورت است که معیارهای اساسی تحلیل به عنوان ابعاد مختلف یک مکعب در نظر گرفته شده و این مکعب در انبار دادهها ساخته میشود. این ابعاد میتوانند در سطوح مختلف و به صورت سلسلهمراتبی نیز وجود داشته باشند.مثلا میزان فروش کل میتواند از سه بعد زمان، نوع محصول و مشتری ساخته شود.زمان میتواند در سلسلهمراتبی متشکل از سال، ماه، هفته، روز و…. قرار گیرد. یک بار که جداول حقیقی به OLAP معرفی شده و مکعبهای متعدد با ابعاد یا (Dimension)های متنوع ساخته شدند،ابزارهای گزارشگیری مبتنی بر OLAP محیطی ساده را جهت استفاده کاربران از این اجزا فراهم میکند. به این ترتیب هر کاربری قادر است به بررسی نتایج از دیدگاه خاص خود و بر مبنای سلسلهمراتب و سطوح مختلف اطلاعاتی بپردازد.
انواع مختلف پردازش تحلیلی برخط
در حال حاضر انواع مختلف پردازش تحلیلی برخط OLAP وجود دارد که سه دسته اصلی آن عبارتند از:
سیستمهای OLAP چند بعدی یا MOLAP: این سیستمها بدلیل ساختار خاص نگهداری اطلاعات از سرعت بالاتری نسبت به سایر مدلها برخوردارند و بجای ذخیره کردن اطلاعات در رکوردهای کلید دار، بانکهای اطلاعاتی خاصی را برای خود طراحی کرده اند بطوریکه دادهها را به شکل آرایههای مرتب شده بر اساس ابعاد داده ذخیره میکنند. این سیستمها جداول دادههای حقیقی وجداول چند بعدی را با ایندکسهای فشرده نگهداری کرده و جستجوهای تحلیلی پیچیده را در حداقل زمان اجرا میکنند. سرعت این ابزار بالا ولی سایز بانک اطلاعاتی آن نسبتا کوچک است.
سیستمهای OLAP رابطهای یا ROLAP : این ابزارها با ایجاد یک بستر روی بانکهای رابطهای اطلاعات را ذخیره و بازیابی میکنند. بطوریکه اساس بهینه سازی برخی بانکهای اطلاعاتی رابطهای بر همین اساس استوار است. سیستمهای ROLAP عملیات OLAP را در قالب استفاده از مدل سنتی Relational ساماندهی میکنند و لذا از سیستمهای MOLAP کندتر عمل میکنند و به فضای بیشتری نیز نیاز دارند.
سیستمهای OLAP از نوع HOLAP : منظور از hybrid ترکیبی از ROLAP و MOLAP است که دارای بانک اطلاعاتی بزرگ و راندمان بالاتر نسبت به ROLAP میباشد. سیستمهای HOLAP به شکل بینابینی پیاده سازی شده اند. یعنی دادههای Fact را در جداول فشرده و دادههای Dimension را در فضای رابطهای نگهداری میکنند لذا مزایای هردو مدل را دارند.
منبع: جمشید ملائی به فرماندهی مهندس سحر بهرامیجم
مدیریت فناوری اطلاعات | ۳۰ آبان ۹۱
روش های مقیاس پذیر برای محاسبه ساحتار های چند بعدی و یا OLAP پردازش تحلیلی آنلاین داده ها که در راستای هوش تجاری است.