You are on page 1of 69

Fundamentos de gerenciamento de redes corporativas e proposta de implementao utilizando SNMP

Rafael Rodrigues de Oliveira

Contedo
Motivao. Aspectos tericos. Estudo de caso. Concluso. Bibliografia.

Motivao
Sociedade dependente dos sistemas informatizados. Indisponibilidade dos computadores trazem transtornos e prejuzos. Prevenir e detectar as falhas rapidamente. Monitoramento manual invivel. Automatizao do gerenciamento de redes.

Desafios atuais do gerenciamento de redes


Crescimento da internet (rede global). Redes locais maiores e mais complexas. Gerenciamento remoto dos ativos. Prestadoras de servio precisam atingir obrigaes contratuais. Detectar falhas de hardware e software. Necessidade de notificao de infeco a rede.

Vantagens da automatizao do monitoramento


Administrador pode se dedicar a outras tarefas. Aumento da disponibilidade dos servios. Auxlio no cumprimento dos SLAs. Notificao automtica dos problemas. Verificao da carga de uso dos equipamentos. Reduo de gastos.

SNMP (Simple Network Management Protocol)


Padro na internet. Definido na RFC1157. Camada de aplicao (OSI/ISO). Atualmente na verso 3. Contido em vrios ativos (roteadores, impressoras, etc).

Componentes do SNMP
Gerente SNMP. Dispositivo gerenciado (servidor, switch, etc). Agente SNMP. Management Information Base (MIB).

Fonte: http://www.cisco.com

Funcionamento do SNMP
Protocolo UDP no transporte (sem confirmao). Overhead mnimo. Troca de informaes atravs de mensagens SNMP. Mensagens possuem: verso, comunidade e uma das PDUs (Protocols Data Units). Comunidade SNMP (senha).

MIB (Management Information Base)


Organizao hierrquica. Separao por pontos. Identificao atravs do OID (Object Identifier). Exemplo de item: .1.3.6.1.2.1.25.3.3.1.2.2.

Fonte: http://www.cisco.com.br

Limitaes do SNMP
Administrador necessita conectar ao ativo manualmente. No possui histrico dos dados. O nico alerta SNMP o trap. Alguns valores no so claros.

Ferramentas de monitoramento
Potencializam o uso do SNMP. Armazenam informaes de histrico. Geram grficos e mapas da rede. Enviam alertas para diversas mdias. Vrias opes livres (Zabbix, Nagios, etc) ou proprietrias.

http://oss.oetiker.ch/mrtg Desenvolvido por Tobias Oetiker. Programado em Perl. Faz uso do SNMP para coleta dos dados. Permite gerar grficos de processador, memria, etc. Gera os grficos e o arquivo HTML para visualiz-los. Instalao simples. Configurao atravs de arquivos texto. No envia alertas.

Fonte: http://linux.softpedia.com

http://www.cacti.net Desenvolvido inicialmente por Ian Berry. Programado em PHP. Banco de dados MySQL. Aceita scripts em Bash, Perl, XML, etc. Coleta dos dados atravs do SNMP. Interface web para exibio dos grficos. No envia alertas.

Fonte: http://www.cacti.net

http://www.nagios.org Desenvolvido sob liderana de Ethan Galstad. Possui interface web. Permite monitorar os servios. Envia alertas atravs de e-mail, pager, etc. Configurao atravs de arquivos texto. Possui plugins para monitorar diferentes plataformas. No gera grficos. Existem vrios add-ons.

Fonte: http://www.nagios.org

http://www.zabbix.com Mantido pela Zabbix SIA. Programado em C e PHP. Compatvel com vrios banco de dados (MySQL, Postgree, Oracle). Configurao dos itens atravs da interface web. Suporta auto-descoberta de ativos. Suporte a grficos. Agentes para vrios sistemas operacionais.

Envia alertas atravs de e-mail, SMS, Jabber, etc. Permite a criao de mapas da rede. Utiliza templates na associao dos itens. Suporta diferentes nveis de privilgio para os usurios. Suporte a alertas sonoros no frontend web. Compatvel com o SNMP. Suporta traps SNMP.

Dashboard do Zabbix

Estudo de caso

A empresa
Finamax S/A C.F.I. Ramo financeiro. Fundada em 1995. Matriz em Jundia, SP. Agncias em vrias cidades do interior de So Paulo.

Servidor de monitoramento
Sistema operacional: Ubuntu Server 10.04 AMD_64. Processador: AMD Athlon 64 X2 2.3 GHz. Memria RAM: 4 GBytes. Disco rgido: 80 GBytes. Ferramenta de monitoramento: Zabbix 1.8.3. Banco de dados: MySQL 5.1.

Ativos de rede
Ativo Switches Servidores Linux1 Servidores Windows Servidores OpenBSD2 Rdios Terminais de Saque2 Roteadores Links de internet2 Storage No-Break Total
1. 2. Est incluso o servidor de monitoramento. Ativos no monitorados atravs do SNMP.

Quantidade 17 2 33 15 2 2 2 4 1 1 79

Exemplos de configurao

Exemplos de instalaes do Zabbix (Zabbix SIA, 2010)

Por que foi utilizado o SNMP?


Problemas com o agente da ferramenta. Compatibilidade do SNMP com mltiplos ativos. Baixo consumo de recursos. MIB contm muitos itens.

Monitoramento dos Servidores

Processador
OID do item .1.3.6.1.2.1.25.3.3.1.2.[ndice]. Windows: ndice comea por 2. Linux: inicia por 768. Valor retornado: inteiro de 0 a 99. Verificado a cada 60 segundos.

Item de processador configurado no Zabbix

Processador
Linux: itens de CPU adicionados ao template padro. Windows: Um template cada CPU (core).
Template Template_CPU0 Template_CPU1 Template_CPU2 Template_CPU3 Template_CPU4 Template_CPU5 Template_CPU6 Template_CPU7 Item criado no Zabbix CPU0 Load CPU1 Load CPU2 Load CPU3 Load CPU4 Load CPU5 Load CPU6 Load CPU7 Load OID .1.3.6.1.2.1.25.3.3.1.2.2 .1.3.6.1.2.1.25.3.3.1.2.3 .1.3.6.1.2.1.25.3.3.1.2.4 .1.3.6.1.2.1.25.3.3.1.2.5 .1.3.6.1.2.1.25.3.3.1.2.6 .1.3.6.1.2.1.25.3.3.1.2.7 .1.3.6.1.2.1.25.3.3.1.2.8 .1.3.6.1.2.1.25.3.3.1.2.9

Grfico de utilizao de CPU

Disco
OID do item .1.3.6.1.2.1.25.2.3.1.5.[ndice]: tamanho total do volume. OID do item .1.3.6.1.2.1.25.2.3.1.6.[ndice]: espao ocupado. ndice varivel, no h padro. Desenvolvido um shell script que recebe nome do volume e S.O. Valor retornado: quantidade de blocos (clusters). Intervalo para o tamanho total: 86400 segundos (1 dia). Intervalo para os demais (espao livre e usado): 120 segundos.

Item de partio para um servidor Linux

Disco
No incio, itens de disco foram associados ao template padro do S.O. Posteriormente, foi criado um template para cada volume.

Grfico de utilizao de disco

Memria
OID SNMP semelhante ao disco. Dois shell scripts que verificam a memria total e a utilizada. Recebe os parmetros virtual ou fisica. Valor retornado em unidades de alocao. Linux: 1024. Windows: 65535. Intervalo de verificao para memria total: 86400 segundos. Intervalo para a quantidade utilizada: 120 segundos.

Item de verificao da utilizao de memria em um servidor Windows

Grfico de uso de memria

Servios
Aplicaes fornecidas aos usurios. Uma soluo seria verificar se a porta est aberta. Verificar se o processo est em execuo. A tabela de processos em execuo est em .1.3.6.1.2.1.25.4.2.1.7 .[ndice]. ndice do processo varivel. Utilizao de um shell script que recebe o nome do processo. Retorna 1 para OK, 0 para falha. Intervalo de verificao: 45 segundos.

Item de verificao de servio em um servidor Linux

Alguns servios monitorados


Servio Servidor DHCP (Windows) Servidor DNS (Windows) SQL Server SQL Server Agent IIS Admin Service Oracle (Windows) Oracle (Linux) Executvel Tcpsvcs.exe Dns.exe Sqlservr.exe SQLAGENT.EXE Inetinfo.exe Oracle.exe Oracle

Uptime
Tempo desde a ltima inicializao do sistema. OID na MIB .1.3.6.1.2.1.1.3 . Intervalo de verificao: 300 segundos. Windows: Multiplicador de .001. Linux: multiplicador de .01. Tipo configurado: uptime.

Trfego de rede
OID .1.3.6.1.2.1.2.2.1.10.[ndice] (in). OID .1.3.6.1.2.1.2.2.1.16.[ndice] (out). Servidores com mais de uma interface. Vrias sub-redes. Shell script recebe I ou O; qual sub-rede pertence a interface; verso do SNMP; comunidade. Valor retornado: nmero de octetos. Intervalo de verificao: 60 segundos.

Item de trfego de interface

Grfico de trfego de rede

Status da interface
OID .1.3.6.1.2.1.2.2.1.8.[ndice]. Interface no conectada ao Zabbix. Shell script recebe: a sub-rede; verso do SNMP; comunidade. Retorna um nmero que indica o status.

Item de verificao status da interface

Eventos do Windows
Event to Trap Translator (evntwin). Eventos configurados geram um trap SNMP. Configurados eventos relacionados ao servio em execuo no servidor.

Tela de configurao do evntwin

Servidores Dell
Open Manage acrescenta a MIB do S.O. vrios novos itens. Temperatura, rotao dos fans, status do chassis, fontes de alimentao, etc. Intervalo de verificao 45 segundos.

Alguns itens acrescentados a MIB


Nome do item Disk controller 1 status Power Supply status BMC Fan 1 RPM PROC_1 Temp Fan Status OID na MIB SNMP do S.O. .1.3.6.1.4.1.674.10893.1.20.130.1.1.37.1 .1.3.6.1.4.1.674.10892.1.200.10.1.9.1 .1.3.6.1.4.1.674.10892.1.700.12.1.6.1.1 .1.3.6.1.4.1.674.10892.1.700.20.1.6.1.1 .1.3.6.1.4.1.674.10892.1.200.10.1.21.1

Grfico de temperatura de CPU

Switches
Monitorao do uptime (mesmo OID dos servidores). Foram configurados para enviar traps. Invivel monitorar o trfego de todas as portas.

No-Break
Equipamento da APC. Possui na MIB itens componentes.
Baterias. Mdulos de inteligncia. Tenso. Tempo em bateria. Entre outros.

para

monitorar

diversos

Alguns itens contidos na MIB


Descrio do item Battery status Battery temperature Time on battery Power module 1 status Inteligence module (MIM) status OID do item na MIB .1.3.6.1.4.1.318.1.1.1.2.1.1.0 .1.3.6.1.4.1.318.1.1.1.2.2.2.0 .1.3.6.1.4.1.318.1.1.1.2.1.2.0 .1.3.6.1.4.1.318.1.1.1.13.2.2.1.2.1 .1.3.6.1.4.1.318.1.1.1.13.1.2.1.3.1

Grfico de temperatura da bateria do No-Break

Valores coletados dos itens

Rdios
Interligam os dois prdios. Monitorado o trfego das interfaces. Status da interface wireless. Uptime.

Grfico de trfego de rede

Roteadores
Trfego nas interfaces. Status das interfaces. Uptime.

Storage
MIB SNMP limitada. Item de OID 1.3.6.1.3.94.1.6.1.6.5.0.0.6.0.1.6.0.11.8.14.0.0.13.2.15: status geral do equipamento. Retorna: 3 OK; 4 problema menos grave; 5 para anomalia crtica. Uptime. Envia traps SNMP.

Triggers
Utilizados para indicar um problema em algum item. Permite o uso de expresses com comparaes ( <, >, =, etc). Tambm so associados aos templates.

Alguns triggers configurados


Item Free disk space on {PARTIO} Storage Status PROC Temp Battery Temperature CPU Load Trigger Volume {PARTIO} low free disk space Storage Status: Warning PROC Temp Max Failure High Battery Temperature CPU Load is too high on {HOSTNAME} {HOSTNAME} has just been restarted Condio normal Espao livre >= 2.4 GB Status do storage = 3 Temperatura <= 90 C Temperatura <= 40 C Uso de CPU <= 85% Expresso Espao livre < 2.4 GB

Status do storage = 4 Temperatura > 90 C Temperatura > 40 C Uso de CPU > 85%

Host uptime

Tempo >= 1h

Tempo < 1h

Alertas
Definidos a partir dos triggers. Traps SNMP so enviados por e-mail. Demais so visualizados atravs da TV LCD.

Vdeos

Concluso
Administrador fica livre para outras tarefas. Deteco rpida de uma anomalia. Prever a ocorrncia de um problema. Possuir histrico de informaes acerca dos ativos. Tirar proveito do potencial do SNMP. timas solues livres para monitoramento de redes.

Bibliografia
Cisco. Simple Network Management Protocol (SNMP). URL: http://www.cisco.com/en/US/docs/internetworking/technology/handbook/SNMP.html. Dell. Dell OpenManage Server Administrator Version 1.0 to 6.2 SNMP reference guide. URL: http://support.dell.com/support/edocs/software/svradmin/6.3/en/SNMP/1.0-6.2/HTML/index.htm. HALL, Eric A. Trapping Windows Events with SNMP. URL: http://www.eric-ahall.com/articles/20050715.html. KUROSE, James F; ROSS, Keith W. Redes de computadores e a internet: Uma abordagem topdown. 3 ed. So Paulo: Pearson, 2006. NETO, Arlindo Follador; UCHA Joaquim Quintero. Ferramentas livres para monitorao de servidores. URL: http://www.ginux.ufla.br/files/artigo-ArlindoNeto,JoaquimUchoa.pdf. Zabbix SIA. Zabbix 1.8 Manual. URL: http://www.zabbix.com/documentation/1.8/complete.

Perguntas?
Rafael Rodrigues de Oliveira rafa.tecoy@gmail.com http://tecoytech.blogspot.com

You might also like