مدیریت هشدار ها در Solarwinds
مدیریت هشدار ها در Solarwinds، در این مقاله قصد داریم مبحث هشدار ها ( Alerts ) در نرم افزار مانیتورینگ Solarwinds مورد بررسی قرار دهیم. در ابتدا با مفهوم هشدار (Alerts) و کاربرد آن آشنا خواهیم شد.
مدیریت هشدار ها در Solarwinds
فهرست مطالب
هشدار (Alert) چیست
هشدار بخشی پاسخگو از یک سیستم نظارت و مانیتورینگ می باشد که اقداماتی را بر اساس تغییرات در مقادیر متریک انجام می دهد. تعاریف هشدارها از دو جزء تشکیل می گردد: یک شرط یا آستانه مبتنی بر معیارها، و یک اقدام و Action برای زمانی که مقادیر خارج از شرایط قابل قبول (آستانه) قرار می گیرند.
در حالی که سیستم های نظارت برای تفسیر ، نظارت و بررسی فعال بسیار مفید هستند، یکی از مزایای اصلی یک سیستم نظارت کارآمد این است که مدیران شبکه لزومی به پایش دائمی شبکه از پشت سیستم نخواهند داشت. سیستم هشدارها این امکان را میدهند که در شرایط خاص یا گذر از آستانه های تعریف شده، اعلان هایی به مدیر شبکه انجام پذیرد. در حالی که اطلاع رسانی به اشخاص مسئول رایج ترین اقدام برای هشدار است، برخی از Action های برنامه ای نیز می توانند بر اساس نقض آستانه فعال شوند. به عنوان مثال، هشداری که نشان میدهد برای پردازش بار فعلی به CPU بیشتری نیاز دارید، میتواند با اسکریپتی که لایهای از برنامه شما را بهطور خودکار مقیاس بندی میکند پاسخ داده شود.
با این حال، هدف اصلی هشدار همچنان جلب توجه انسان به وضعیت فعلی سیستم می باشد. هشدار می بایست حاوی اطلاعاتی در مورد اینکه چه خطایی و در کدام قسمت رخ داده باشد. فردی که به هشدار پاسخ می دهد می تواند از سیستم نظارت و ابزارهای مرتبط مانند فایل های گزارش برای بررسی علت مشکل و اجرای یک استراتژی استفاده نماید. زیرساخت هایی با پیچیدگی حتی متوسط نیاز به تمایز در شدت هشدار دارد تا تیم ها یا افراد مسئول بتوانند با استفاده از روش های متناسب با مقیاس مشکل مطلع گردند.
تنظیمات هشدار در Solarwinds
جهت دسترسی به تنظیمات مربوط به هشدار ها در نوار ابزار نرم افزار مانیتورینگ Solarwinds بر روی گزینه Alert کلیک می نماییم. در این قسمت هشدار های ایجاد شده در نرم افزار قابل مشاهده می باشد. در نرم افزار به صورت پیش فرض تعدادی هشدار از قبل تعریف شده است. این امکان نیز وجود دارد که بر اساس نیاز بتوان هشدار هایی را تعریف نمود. نمایی از محیط منوی Alerts به صورت زیر قابل مشاهده می باشد:
در این قسمت امکان فیلتر نمودن هشدار های ایجاد شده بر اساس اهمیت (Severity) نیز وجود دارد که با انتخاب Severity مورد نظر هشدار های تولید شده توسط نرم افزار فیلتر خواهند گردید. جهت مدیریت و همچنین تعریف و ایجاد تغییرات در هشدار ها می بایست بر روی Manage Alerts کلیک نماییم. در این قسمت هشدار های پیش فرض قابل مشاهده می باشد. هشدار هایی که در حالت OFF قرار دارند غیر فعال و هشدار هایی که ON هستند در وضعیت فعال قرار دارند.
افزودن هشدار
این امکان وجود دارد تا بتوان یک هشدار با توجه به نیاز در سیستم تعریف نمود. جهت اضافه نمودن هشدار جدید می بایست بر روی ADD NEW ALERT کلیک نمود. در این سناریو قصد داریم یک هشدار ایجاد نماییم تا با Down شدن یک Node شبکه یک هشدار در نرم افزار ایجاد گردد. به همین منظور در پنجره باز شده ابتدا یک نام برای هشدار در نظر می گیریم. در قسمت Description یک توضیح در مورد هشدار مورد نظر می توان وارد نمود. همچنین در قسمت پایین تر می توان فعال یا غیر فعال بودن هشدار مورد نظر را مشخص نماییم. در قسمت Evaluation Frequency of Alert بازه های زمانی هشدار را می توان مشخص نمود که در حالت پیش فرض بر روی 1 دقیقه قرار دارد. در قسمت Severity می توان اهمیت این هشدار را مشخص نمود. بالاترین سطح اهمیت Critical می باشد. گزینه Responsible Team بر روی تیم پاسخگوی این هشدار تمرکز دارد که در این قسمت می توان مسئول پاسخگوی این هشدار را مشخص نمود. در قسمت Limitation نیز می توان هشدار ها را برای برخی کاربران غیر قابل مشاهده نمود. پس از مقدار دهی موارد ذکر شده بر روی Next کلیک می نماییم.
در پنجره بعدی می توانیم شرط های مورد نظر را بر هشدار ایجاد شده اعمال نماییم. در قسمت I want to alert on می بایست موجودیتی که این شرط بر آن اعمال می گردد مشخص شود. که لیستی را در اختیار قرار خواهد داد که موارد بسیاری در آن وجود دارد و تقریبا همه موارد موجود در شبکه را شامل می شود. در این سناریو گزینه Node را انتخاب می نماییم.
در قسمت The scope of alert می توان مشخص نمود که این شرط بر روی کدام دستگاه ها در شبکه اعمال گردد. چنانچه All objects in my environment را انتخاب نماییم این شرط بر روی تمامی دستگاه ها اعمال خواهد گردید. در حالت دوم می توان برای دستگاه های انتخابی این شرط را اعمال نمود. برای مثال می توان تجهیزات سیسکو را صورت زیر هدف این شرط قرار داد.
در قسمت The actual trigger condition شرط مشخص می گردد که در چه شرایطی هشدار ایجاد گردد. که می توان به صورت زیر مشخص کنیم که Node مورد نظر در شرایط Down قرار گرفت به هشدار برای سیستم در نظر گرفته شود.
البته باید در نظر گرفت که امکان ایجاد حالت چند شرطی نیز وجود دارد. در نهایت در این پنجره نیز بر روی Next کلیک می نماییم. در پنجره بعدی تنظیمات Reset Condition قرار دارد. در این قسمت در حالت پیش فرض گزینه Reset this alert when trigger condition is no longer true انتخاب شده است. این بدین معناست که اگر شرط در نظر گرفته شده دیگر وجود نداشت Reset انجام گیرد. حالت های دیگر نیز وجود دارد که بسته به نیاز می توان از آن ها استفاده نمود. در نهایت بر روی Next کلیک می نماییم.
پنجره بعدی مربوط به Time of Day می باشد که می توان مشخص نمود که در چه بازه زمانی این هشدار ایجاد گردد. در حالت پیش فرض در تمامی ساعات روز این هشدار ها ایجاد می گردد در شرایطی که زمانبندی خاصی در نظر داریم گزینه Specify time of day schedule for this alert را انتخاب می نماییم.
در پنجره Trigger Action باید نوع واکنش در شرایط وقوع شرط را انتخاب نماییم . حالت پیش فرض ایجاد پیام در نرم افزار می باشد. البته این امکان وجود دارد که واکنش های دیگری را در هنگام وقوع شرط را انتخاب کنیم. برای مثال ارسال یک ایمیل را می توان نام برد. هرچند Action های قابل استفاده گسترده می باشند. برای ایجاد یک Action جدید کافیست Add Action را انتخاب نموده و نوع واکنش مورد نظر را انتخاب نماییم.
در نهایت بر روی Submit کلیک نموده تا هشدار مورد نظر ایجاد و مورد استفاده قرار گیرد .
نظرات کاربران