OLAP چیست؟

سیستم پردازش تحلیلی برخط (OLAP) یک فناوری برای پاسخ سریع به جست‌وجوهای چندبعدی در یک پایگاه داده بزرگ از داده‌ها و اطلاعات است. سیستم OLAP بخشی از قلمرو گسترده هوش تجاری است که مباحث پایگاه داده ارتباطی، سیستم گزارشات و داده کاوی را در برمی‌گیرد.

سیستم‌های اطلاعاتی تحلیلی در مقابل سیستم‌های عملیاتی، سیستم‌های هستند که امکان تحلیل داده‌های انبوه حاصل از سیستم‌های عملیاتی را برای تمامی سطوح کاربران فراهم می‌کنند. سیستم‌های عملیاتی در سازمان‌های بزرگی مانند بانکها به صورت روزانه پردازشهای اطلاعاتی فراوانی را به انجام رسانده و به تولید اطلاعات گوناگون می‌پردازند. بانکهای اطلاعاتی این سازمان‌ها با داده‌های فراوان حاصل از تراکنش‌های مالی، اداری حسابداری و… روبرو می‌شوند.

اطلاعات پایه سیستم‌ها همانند اطلاعات کاربران و سطوح دسترسی آنهامعمولا با تغییرات روزانه مواجه نیستند اما اطلاعات عملیاتی نظیر عملیات تجاری،خرید و فروش محصولات و …میتوانندحتی بطور لحظه‌ای تغییرکنند. تحلیل و پردازش درست و دقیق اطلاعات عملیاتی می‌تواند در تولید نتایج آماری در جهت تصمیم گیریهای کلان مدیریتی موثر بوده و به مدیران کمک کند تا تصمیمات بهینه‌ای برای موفقیت سازمان خود بگیرند. برای آنالیز و پردازش این اطلاعات و تسهیل و سرعت بخشیدن به عملیات گزارش‌گیری و پرس و جوهای متنوع به جای تحلیل مستقیم داده‌ها از درون سیستم‌های عملیاتی، از سیستم‌ها و پایگاه داده‌‌های تحلیلی استفاده می‌شود که خارج از حوزه سیستم‌های عملیاتی قرار داشته و سرعت بسیار بالایی دارند.

پردازش تحلیلی برخط (OLAP) چیست؟

پردازش تحلیلی برخط یا سیستم OLAP نام خود را از عبارت (Online Analytical Process) با معنی تحت اللفظی سیستم‌های پردازش تحلیلی برخط گرفته اند. می‌ توان به جای OLAP از واژه پردازش سریع اطلاعات چند بعدی و یا به عبارت بهتر از فنآوری تحلیل داده‌ها استفاده کرد. این سیستم‌ها بر اساس تکامل سیستم‌های OLTP به معنی سیستم  پردازش تراکنش آنلاین (On Line Transaction Processing) ایجاد شده اند.سیستم‌های OLAP برای ارائه پاسخ‌های سریع به سوالات و جستجوهای تحلیلی روی داده‌های “چند بعدی” طراحی شده‌اند.

بطور معمول اگر بخواهیم مشابه همین پرس و جوهای تحلیلی را روی سیستم‌های اطلاعاتی عادی OLTP اجرا کنیم ممکن است نتایج در زمانی طولانی و غیرکاربردی بازگردانده شود در حالیکه استفاده از پردازش تحلیلی برخط تضمین می‌کند که اطلاعات و گزارشات تحلیلی با زمان پاسخ مناسبی به کاربر تحویل داده شود. کاربردهای معمول OLAP عبارتند از : گزارشات تجاری فروش، بازاریابی، گزارشات مالی و مواردی از این قبیل. این سیستم‌ها داده‌های خود را به نحوی خاص نگهداری می‌کنند که از نظر سرعت در برخورد با داده‌های چند بعدی بهتر از سیستم‌های OLTP عمل می‌کنند و از این رو به آنها بانک‌های اطلاعاتی سلسله‌مراتبی (Hierarchical) هم گفته می‌شود.

تشریح پردازش تحلیلی برخط (OLAP)

پایگاه داده‌‌های تحلیلی نسخه‌های متنوعی از داده‌های تراکنشی را به صورت اختصاصی برای پرس و جوها و گزارش‌گیری ،سازمان دهی می‌کنند.به این ترتیب کاربرانی مانند مدیران سازمان که خارج از سیستم‌های عمیاتی قرار دارند می‌توانند گزارش‌ها و پرس و جوهای مورد نظر خود را تهیه کنند. پایگاه داده‌‌های تحلیلی OLAP از منابع داده‌ای متفاوت یک سازمان‌ و یا حتی چندین سازمان و ارگان‌ وابسته به هم تهیه می‌شود. این پایگاه داده بستر مناسبی را فراهم می‌آورد که داده‌های بایگانی شده در سیستم‌های عملیاتی و مستقل از هم سازمان، به صورت مجتمع، خلاصه شده، و یکپارچه و سازمان یافته درآمده و برای استخراج مناسب اطلاعات در دسترس مدیران باشند.

OLAP و پایگاه داده‌های مربوطه با استفاده از یک ساختار سلسله‌مراتبی و یک data model چندبعدی قدرتمند جهت سازماندهی اطلاعات به ساده سازی محاسبات پرداخته وگزارشاتی بسیار سریع‌تر نسبت به روش‌های قبلی ارائه می‌دهند. بانکهای اطلاعاتی به کار رفته در OLAP که Data-warehouse یا انبار داده‌ها نامیده می‌شوند متشکل از مکعبهای اطلاعاتی چند بعدی بوده که امکان آنالیز سریع اطلاعات پایگاه داده‌های مختلف را فراهم می‌آورند. بعنوان مثال یک پایگاه داده چند بعدی می‌تواند فروش کل سالیانه را با ماه فروش، تعداد مشتری و قیمت متقاطع سازد. حاصل این تقاطع این است که گزارشات بسیار متنوعی مثل مجموع فروش در ماه خاص یا بهترین قیمت و مشتری سال و … از سیستم به راحتی قابل استخراج است.

مکعب‌های OLAP

مکعبهای OLAP با استفاده از data model جامع خودQuery‌های کارآمد و پر سرعتی را ارئه داده و جایگزین بهتری برای خلاصه سازی جداول هستند. محاسبات پیچیده میتوانند براحتی درون این مکعبها قرارگرفته و باعث بهبود کیفیت تحلیل برنامه‌های کاربردی شوند. مثلا یک مکعب OLAP می‌تواند شامل محاسبات مقایسه‌ای فروش سال جاری هر منطقه و خط تولید با همان زمان در سالهای قبل باشد.در واقع ساختار این مکعب‌ها برای بهینه چنین گزارشات و تحلیل هایی بهینه شده است.

عمده عملیات روی پایگاه داده می‌ تواند شامل update،insert،delete و … باشد اما Data-warehouse که یک مکعب چند بعدی با صدها برابر گنجایش یک پایگاه داده است که به عنوان اصلی ترین وظیفه اش به کاربر data ارائه می‌دهد و می‌تواند اطلاعات را در قالبهای متنوع برای نیازهای مختلف نگهداری کند.

پرس و جوهای کاربران در روزهای مختلف غیر قابل پیش بیش بینی هستند. به عنوان مثال شاید لازم شود فروش یک هفته را با همان هفته در چند سال پیش مقایسه کرد. با سیستم‌های relational بهینه کردن چنین درخواست هایی بسیار مشکل است.برای برآوردن این نیاز Database وDBAها بصورت متناوب viewها و خلاصه جدول هایی را تولید می‌کنند.خروجی یک سیستم OLAP به صورت کلی یک ماتریس می‌باشد و ابعاد مختلف داده‌، ستونها و سطرهای ماتریس راتشکیل می‌هند. تکنیکهای بسیاری جهت جمع آوری، پالایش و آنالیز داده‌ها نظیر OLAP، Data Mart، Warehousing و Data Mining با هدف استخراج اطلاعات از رکوردهای عملیاتی سازمان و نظم دهی آن به منظور انجام تحلیل‌های مختلف وجود دارد.

تعاریف عمده فناوری OLAP

انباره داده یا Data Warehouse : انبار داده‌ها در اواخر دهه ۸۰ و اوایل دهه ۹۰، در پاسخ به نیاز روزافزون سازمان‌های بزرگ برای کسب اطلاعات تحلیلی و مدیریتی از داده‌های درون سیستم‌های عملیاتی (OLTP)ابداع شده و به عنوان نوع خاصی از پایگاه‌های داده مورد توجه قرار گرفت. انبار داده‌ها یک پایگاه اطلاعاتی بزرگ است که به جمع آوری، یکپارچه سازی و ذخیره‌ اطلاعات متنوع یک سازمان را با هدف تولید گزارشات چندجانبه و دقیق بر عهده دارد. این قابلیت‌ها در کنار امکانات پشتیبانی از فعالیت‌های تحلیل و گزارش دهی آسان و انفصال از فشارهای عملیاتی به رشد روز افزون این سیستم‌ها منجر شد.

سیستم‌های عملیاتی به دلایل عدم طراحی اختصاصی آنها جهت گزارش‌گیری گسترده و یکپارچه، با تولید گزارشات کند و گران قیمت از کارائی و امکانات لازم برای ارائه اطلاعات پویا و راهگشای مدیریتی برخوردار نیستند.بنابراین از فناوری OLAP و راهکار ایجاد انبار داده‌ها با استفاده از همگن کردن و یکپارچه سازی داده‌ها جهت تبدیل داده‌های نامتجانس به اطلاعات قابل استفاده در زمینه‌های مختلف استفاده می‌شود.

ویژگی‌های اساسی انبار داده‌ها

انبار داده‌ها موضوع گرا (Subject-oriented) است ،یعنی داده‌ها از بانکهای اطلاعاتی مختلف بصورت انتخابی به انبار داده منتقل شده و بر اساس موضوعات خاص دسته بندی می‌شوند. بنابراین کاوش داده‌ها در پرس و جوهای خاص با سرعت و دقت بیشتری انجام می‌گردد.همچنین انبار داده‌ها مبتنی بر زمان است و تغییرات داده‌ها بر اساس بازه‌های زمانی متفاوت نگهداری شده و در گزارشات تحلیلی مورد استفاده قرار میگیرد.به همین ترتیب انبار داده‌ها غیرقابل تغییر و غیر فرار می‌باشد و داده‌ها در آن بازنویسی و حذف نمی شود.بلکه تغییرات در بازه‌های زمانی مختلف نگهداری می‌شوند تا پاسخگوی ارجاعات مختلف باشد.

مرکز داده‌ها یا Data Mart: انبار داده‌ها حجم عظیمی از اطلاعات را در واحد‌های منطقی کوچکتری به نام Data Mart نگهداری می‌کند Data Mart‌ها نمونه‌های کوچکی از انبارداده‌ها بوده و همانند آنها حاوی کپی هایی ثابت از داده هایی هستند که در موارد خاص استفاده می‌شوند. Data Martها می‌تواند وابسته یا مستقل از هم باشند. هر Data Mart، داده‌ها و ابعاد (Dimension ) خاص خود را دارد که می‌تواند با بقیه به اشتراک بگذارد.

داده کاوی یا Data Mining: ابزارهای داده کاوی بدنبال طرحها و گروه بندی هایی در داده‌ها می‌گردد که ممکن است از دید ما پنهان مانده باشد. در داده کاوی این ابزار است که استفاده کننده را هدایت می‌کند. ابزار فرض می‌کند که شما خود نیز دقیقا نمی دانید که چه می‌خواهید. اولین گام داده کاوی هدفدار، انتخاب مجموعه داده‌ها برای تحلیل است. داده‌ها می‌تواند از انبار داده‌ها و یا بانک‌های اطلاعاتی عملیاتی استخراج شود.

نحوه عملکرد پردازش تحلیلی برخط

پردازش تحلیلی برخط OLAP به صورت مرتب از داده‌های منابع اطلاعاتی مختلف کپی‌های خلاصه شده برداشته و آنها را در مکعبهای داده‌ای (Cube) مرتب می‌کند. پرس و جوهای کاربران می‌تواند روی این مکعب اجرا شود. روش‌های مختلف طراحی انبار داده‌ها امکان پردازشهای بهینه را بر روی مقادیر زیادی ازداده‌ها فراهم می‌آورند. پرس و جوهای پیچیده روی سیستم‌های OLAP به زمانی حدود تنها ۰٫۱ درصد از زمان اجرای جستجوهای مشابه روی سیستم‌های OLTP احتیاج دارند. انواع ویژه‌ای از الگوهای پایگاه داده‌ها به نام ستاره‌ای یا دانه برفی برای طراحی انبار داده چند بعدی وجود دارد. در این حالت، پایگاه داده‌ها از یک جدول مرکزی و جداول چند بعدی تشکیل شده است روابط بین آنها کاملا مشخص است.

نحوه عملکرد این سیستم‌ها به این صورت است که معیارهای اساسی تحلیل به عنوان ابعاد مختلف یک مکعب در نظر گرفته شده و این مکعب در انبار داده‌ها ساخته می‌شود. این ابعاد می‌توانند در سطوح مختلف و به صورت سلسله‌مراتبی نیز وجود داشته باشند.مثلا میزان فروش کل می‌تواند از سه بعد زمان، نوع محصول و مشتری ساخته شود.زمان می‌تواند در سلسله‌مراتبی متشکل از سال، ماه، هفته، روز و…. قرار گیرد. یک بار که جداول حقیقی به OLAP معرفی شده و مکعب‌های متعدد با ابعاد یا (Dimension)های متنوع ساخته شدند،ابزارهای گزارش‌گیری مبتنی بر OLAP محیطی ساده را جهت استفاده کاربران از این اجزا فراهم می‌کند. به این ترتیب هر کاربری قادر است به بررسی نتایج از دیدگاه خاص خود و بر مبنای سلسله‌مراتب و سطوح مختلف اطلاعاتی بپردازد.

انواع مختلف پردازش تحلیلی برخط

در حال حاضر انواع مختلف پردازش تحلیلی برخط OLAP وجود دارد که سه دسته اصلی آن عبارتند از:

سیستم‌های OLAP چند بعدی یا MOLAP: این سیستم‌ها بدلیل ساختار خاص نگهداری اطلاعات از سرعت بالاتری نسبت به سایر مدلها برخوردارند و بجای ذخیره کردن اطلاعات در رکورد‌های کلید دار، بانکهای اطلاعاتی خاصی را برای خود طراحی کرده اند بطوریکه داده‌ها را به شکل آرایه‌های مرتب شده بر اساس ابعاد داده ذخیره می‌کنند. این سیستم‌ها جداول داده‌های حقیقی وجداول چند بعدی را با ایندکسهای فشرده نگهداری کرده و جستجوهای تحلیلی پیچیده را در حداقل زمان اجرا می‌کنند. سرعت این ابزار بالا ولی سایز بانک اطلاعاتی آن نسبتا کوچک است.

سیستم‌های OLAP رابطه‌ای یا ROLAP : این ابزارها با ایجاد یک بستر روی بانکهای رابطه‌ای اطلاعات را ذخیره و بازیابی می‌کنند. بطوریکه اساس بهینه سازی برخی بانکهای اطلاعاتی رابطهای بر همین اساس استوار است. سیستم‌های ROLAP عملیات OLAP را در قالب استفاده از مدل سنتی Relational ساماندهی می‌کنند و لذا از سیستم‌های MOLAP کندتر عمل می‌کنند و به فضای بیشتری نیز نیاز دارند.

سیستم‌های OLAP از نوع HOLAP : منظور از hybrid ترکیبی از ROLAP و MOLAP است که دارای بانک اطلاعاتی بزرگ و راندمان بالاتر نسبت به ROLAP می‌باشد. سیستم‌های HOLAP به شکل بینابینی پیاده سازی شده اند. یعنی داده‌های Fact را در جداول فشرده و داده‌های Dimension را در فضای رابطه‌ای نگهداری می‌کنند لذا مزایای هردو مدل را دارند.

منبع: جمشید ملائی به فرماندهی مهندس سحر بهرامی‌جم

5 1 رای
امتیازدهی به مقاله