Monitorování serverů je velmi důležité. Pro nepřetržitý provoz je třeba včas odhalit hardwarové i softwarové problémy, ke kterým dochází na kažném systému.
Firma Sun Microsystem dává každému kdo má server s procesorem SPARC možnost zdarma monitorovat svůj systém pomocí programu Sun™ Remote Services Net Connect. Jedná se o online webový nástroj, který běží u Sunu. Program se skládá z několika démodů, kteří mají za úkol monitorovat různé části OS. Jedná se zejména o stav procesorů, pevných disků, ventilátorů a sítě. Takto nasbírané údaje jsou pak zašifrovány a odeslány do centrály, kde jsou zpracovány a uloženy. Po přihlášení do systému můžete tyto údaje prohlížet, případně exportovat. Ale začněme od začátku. První co musíte udělat, je založit si účet https://srsnetconnect.sun.com. Jakmile máte účet, založíte si firmu/pobočku. Nyní je čas na stažení vlastního programu Net Connect. V případě, že ho stáhnete ze svého účtu, bude instalační soubor obsaovat i certifikát, který je nutný k šifrování údajů a správné funkci. Pokud použijete jiný instalační soubor, budete muset certifikát doimportovat. Instalační soubor ve verzi 3.2.2 - pro Solaris verze 8,9,10 má cca 22.97 MB. Pro Solaris 6 a 7 je verze 3.1.1 cca 17 MB. Je možné stáhnou také doplněk - Storage Automated Diagnostic Environment, který jak název napovídá slouží pro monitorování storage.
Instalace:
rozbalíme instalační soubor:
tar -xf NetConnect.003.002.002.tar
založíme skupinu a uživatele pro běh démonů.
groupadd netcon useradd -g netcon -d /netcon -m -s /bin/bash netcon
a nakonec pustíme rozbalený instalátor
./InstallNetConnect.003.002.002.sh
při instalaci budete vyzváni k zadání uživatle a skupiny.
Po instalaci a přihlášení na https://srsnetconnect.sun.com by jste pod nabídkou Monitoring a po kliknutí na založenou firmu měli vidět váš systém.
Zašktnutím a kliknutím na Acknowledge se zbavíte uvítacího erroru.
Po chvíli čekaní se zobrazí datum a čas, ke kterému jsou informace aktualizovány...
Je čas otestovat správnou funkci programu. Budeme simulovat vadný ventiláror a to tak, že do systémového logu zapíšeme pomocí programu logger následující:
logger -p user.error Fan Removed - test
Chvíli počkejte než dojdou na server informace a pak obnovte stránku v browseru. Pokud je vše v pořádku, zobrazí se chyba v části Chassis.
Po rozkliknutí chyby se Vám zobrazí hlášení z logu, které říká, kde je chyba. Pomocí Acknowledge pak potvrdíte, že o chybě víte (systém jí má považovat za vyřešenou).
To je v této konfiguraci vše.
Pokud chcete rozšířit Net Connect o další informace, musíte do cronu přidat další program. Ten bude dle nastavení cronu odesílat informarmace o balíkách atd... Protože se tyto informace nemění tak často, je dobré nastavit odesílání 1x týdně.
Editace cron tabulky pro uživatele netcon:
crontab -e netcon
Vložení nového záznamu do cronu: (je dobré si naplánovat čas tak, aby se cron spustil co nejdříve, jinak se těch údajú nedočkáte :)
12 17 * * 4 /opt/SUNWsrsep/bin/eras_pvr_runner eras_pvr 003.000.008 IM-NC_ENG-era as_pvr /tmp/eras_pvr 3348000 application/x-gtar
Po odeslání informací klikněte vlevo v menu na Sun Asset Survay a pak na Sun Asset Survey Report. Jak můžete vidět na obrázku, informací je o něco více. Už víme, že na stroji je Solaris 10 a že je to Ultra 5 s 333 MHz CPU.
Po kliknutí na hostname - v mém případě demo-253 se zobrazí další detailnější informace a také několik odkazů, pomocí kterých se dostanete k opravdu detailním informacím o stroji.
Mimo informací o rozložení HDD, velikosti cache CPU, nastavení sítě a naintalovaných balíků je nejzajímavější položka System Patches.
Zde najdete přehled nainstalovaných patchů a pokud je nějaký patch starší než verze, která je dostupná, Net Connect vám nabídne jeho stažení s webu http://sunsolve.sun.com. Na tomto webu je podrobný popis, ve kterém se dovíte vše o problému, který patch opravuje nebo o dalších závislostech. Sun upozorňuje, že ke stažení některých patchů budete potřebovat SunSpectrum™ contract.
Jako správný program pro monitorování, disponuje i Sun Net Connect přehlednými statistikami. Z nasbíraných údajů si pak můžete nechat udělat grafy. Celá nabídka je přístupná pod odkazem Sun Trend Reporting.
Na obrázku dole je graf za týden. Je vidět, že stroj se pěkně fláká :)
Pokud máte zájem o zasílání chybových stavů serveru na mail, není problém. Tuto funkci můžete nastavit pod menu System Grouping. Program umožňuje mnoho dalších věcí jako například uživatelské alarmy, update sám sebe, můžete samozřejme nastavit i interval odesílání údajů na server... Všechny informace, které se o vašem stroji posbírají mohou být exportovány do formátu csv. Pokud máte potřebu používat tyto a ještě další funkce, doporučuji přečíst si manuál.
Tento článek není vyčerpávajícím zdrojem informací o Sun Netconnectu, ale jen základním návodem a seznámením s tímto programem. Ještě poznámka na konec: všechny akce, které jsem prováděl (i download patchů) jsem prováděl pouze na základě registrace, která je zdarma...