===== Nível Básico ===== === 1. Verificação de Informações da CPU com `lscpu` === * **lscpu** - Exibe informações sobre a CPU. - Exemplo de uso: lscpu - Descrição: Mostra informações detalhadas sobre a CPU, como modelo, número de núcleos, threads e arquitetura, ajudando a identificar o tipo de processador instalado. === 2. Listagem de Dispositivos de Armazenamento com `lsblk` === * **lsblk** - Lista todos os dispositivos de blocos (discos e partições). - Exemplo de uso: lsblk - Descrição: Exibe a hierarquia de dispositivos de armazenamento conectados, incluindo discos e partições, mostrando detalhes como nome do dispositivo, tamanho e ponto de montagem. === 3. Verificação de Temperatura com `sensors` === * **sensors** - Exibe a temperatura dos componentes. - Exemplo de uso: sensors - Descrição: Mostra a temperatura de vários componentes do hardware, como CPU e GPU, permitindo monitorar o desempenho térmico do sistema. === 4. Verificação do Uso de Memória com `free` === * **free -h** - Exibe o uso de memória de forma legível. - Exemplo de uso: free -h - Descrição: Mostra o uso de memória RAM e swap, exibindo o total, usado e disponível de forma legível (em MB/GB), útil para monitorar o consumo de memória. ===== Nível Intermediário ===== === 1. Verificação de Informações de Discos com `smartctl` === * **smartctl** - Monitora a integridade de discos com S.M.A.R.T. - Exemplo de uso: sudo smartctl -H /dev/sda - Descrição: Verifica o status de saúde do disco ''/dev/sda'' usando S.M.A.R.T. e indica se o disco está saudável ou se há problemas iminentes. * **smartctl -a** - Exibe informações detalhadas do S.M.A.R.T. - Exemplo de uso: sudo smartctl -a /dev/sda - Descrição: Exibe todas as informações S.M.A.R.T. disponíveis para o disco ''/dev/sda'', incluindo contagens de erros, temperatura, e histórico de falhas. === 2. Testes de Desempenho de Disco com `hdparm` === * **hdparm -t** - Mede a taxa de leitura sequencial do disco. - Exemplo de uso: sudo hdparm -t /dev/sda - Descrição: Realiza um teste de leitura sequencial no disco ''/dev/sda'', exibindo a taxa de transferência em MB/s, útil para avaliar o desempenho de discos. === 3. Testes de Memória com `memtester` === * **memtester** - Testa a integridade da memória RAM. - Exemplo de uso: sudo memtester 512M 5 - Descrição: Testa 512 MB de RAM por 5 iterações, verificando a integridade da memória física e identificando possíveis falhas, especialmente útil para diagnosticar problemas de estabilidade. === 4. Verificação de Dispositivos PCI com `lspci` === * **lspci** - Lista todos os dispositivos conectados via PCI. - Exemplo de uso: lspci - Descrição: Exibe uma lista de todos os dispositivos PCI conectados ao sistema, como placas de vídeo, placas de rede e controladores de armazenamento, incluindo informações sobre fabricante e modelo. === 5. Informações sobre Dispositivos USB com `lsusb` === * **lsusb** - Exibe dispositivos USB conectados ao sistema. - Exemplo de uso: lsusb - Descrição: Lista todos os dispositivos USB conectados ao sistema, incluindo detalhes sobre o fabricante, ID do dispositivo e driver em uso, útil para diagnosticar problemas de USB. ===== Nível Avançado ===== === 1. Testes de Estresse da CPU com `stress` === * **stress** - Executa testes de estresse no sistema. - Exemplo de uso: sudo stress --cpu 4 --timeout 60 - Descrição: Executa um teste de estresse na CPU, utilizando 4 núcleos por 60 segundos. Isso ajuda a verificar a estabilidade do sistema sob carga pesada. === 2. Testes de I/O de Disco com `fio` === * **fio** - Realiza testes de leitura/escrita em dispositivos de armazenamento. - Exemplo de uso: sudo fio --name=test --size=1G --rw=readwrite --bs=4k --direct=1 --ioengine=libaio - Descrição: Executa um teste de I/O no disco, realizando operações de leitura e gravação com blocos de 4KB em modo direto, útil para medir a performance de dispositivos de armazenamento sob cargas reais. === 3. Monitoramento de Processos com `htop` === * **htop** - Exibe o uso detalhado de CPU, memória e processos. - Exemplo de uso: htop - Descrição: Fornece uma interface visual interativa para monitorar o uso de CPU, memória, e processos, permitindo identificar gargalos de desempenho e processos que consomem muitos recursos. === 4. Diagnóstico de Rede com `iperf3` === * **iperf3** - Testa a largura de banda da rede. - Exemplo de uso: # No servidor: sudo iperf3 -s # No cliente: sudo iperf3 -c 192.168.1.100 - Descrição: Mede a largura de banda da rede entre dois sistemas, onde o servidor escuta as conexões e o cliente se conecta, útil para identificar problemas de desempenho de rede. === 5. Testes de GPU com `glmark2` === * **glmark2** - Realiza benchmarks de desempenho da GPU. - Exemplo de uso: glmark2 - Descrição: Executa um benchmark gráfico na GPU, fornecendo uma pontuação de desempenho. Isso é útil para testar o desempenho de placas gráficas em sistemas Linux. === 6. Verificação de Parâmetros de Disco com `iostat` === * **iostat** - Monitora o desempenho de I/O de discos e CPU. - Exemplo de uso: iostat -dx 5 - Descrição: Exibe estatísticas detalhadas de I/O por dispositivo de armazenamento a cada 5 segundos, mostrando taxas de leitura/escrita e tempo de uso de CPU para operações de disco. ===== Nível Especializado ===== === 1. Monitoramento Avançado de Hardware com `perf` === * **perf stat** - Coleta estatísticas detalhadas do hardware. - Exemplo de uso: sudo perf stat -e cycles,instructions,cache-references,cache-misses -p 1234 - Descrição: Monitora o desempenho de um processo específico (PID 1234) em termos de ciclos de CPU, instruções, referências de cache e falhas de cache. Ideal para diagnosticar problemas de desempenho de processos e otimizar o uso de hardware. * **perf top** - Exibe o uso em tempo real de CPU e cache. - Exemplo de uso: sudo perf top - Descrição: Fornece uma visualização em tempo real do uso da CPU e eventos de cache, permitindo monitorar a utilização do sistema em tempo real e identificar possíveis gargalos de desempenho. === 2. Diagnóstico de Problemas de Memória com `valgrind` === * **valgrind --tool=memcheck** - Verifica erros de uso de memória. - Exemplo de uso: valgrind --tool=memcheck ./meu_programa - Descrição: Executa o programa ''meu_programa'' sob o controle de ''valgrind'', detectando vazamentos de memória e acessos inválidos à memória, útil para identificar problemas em programas que causam falhas ou consumo excessivo de memória. === 3. Diagnóstico Avançado de I/O com `blktrace` === * **blktrace** - Rastreamento detalhado de operações de I/O em dispositivos de bloco. - Exemplo de uso: sudo blktrace -d /dev/sda -o - | blkparse -i - - Descrição: Rastreia todas as operações de I/O que ocorrem no dispositivo de bloco ''/dev/sda'', fornecendo detalhes de cada operação. Ideal para entender o comportamento de I/O sob carga pesada e identificar possíveis gargalos. === 4. Monitoramento de Falhas de Hardware com `mcelog` === * **mcelog** - Monitora e registra eventos de erro de hardware. - Exemplo de uso: sudo mcelog --daemon - Descrição: Executa o ''mcelog'' em modo daemon, monitorando erros de hardware, como falhas de memória e CPU. O ''Machine Check Exception (MCE)'' é útil para detectar falhas em hardware crítico antes que causem falhas graves. === 5. Verificação de Erros de ECC em Memória com `edac-util` === * **edac-util** - Monitora e verifica erros de memória ECC. - Exemplo de uso: sudo edac-util -v - Descrição: Exibe informações detalhadas sobre a memória ECC e verifica se houve correção de erros. Esse comando é essencial para servidores que utilizam RAM ECC, garantindo que a memória esteja funcionando corretamente e sem falhas não corrigidas. === 6. Monitoramento e Otimização de Recursos com `nmon` === * **nmon** - Fornece uma visão detalhada do uso de CPU, memória, I/O e rede. - Exemplo de uso: nmon - Descrição: Exibe uma interface interativa com gráficos detalhados que monitoram o uso de CPU, memória, rede, discos e processos em tempo real, ajudando a otimizar o uso de recursos do sistema em ambientes críticos. === 7. Monitoramento de RAID com `mdadm` === * **mdadm --detail** - Exibe informações detalhadas sobre arrays RAID. - Exemplo de uso: sudo mdadm --detail /dev/md0 - Descrição: Mostra detalhes sobre o array RAID ''/dev/md0'', incluindo o status de seus dispositivos, o nível de RAID e o estado de sincronização, permitindo o monitoramento de problemas e degradações em sistemas RAID. === 8. Monitoramento de Hardware em Ambientes de Alta Disponibilidade com `pacemaker` e `corosync` === * **crm_mon** - Monitora o status de clusters em alta disponibilidade. - Exemplo de uso: sudo crm_mon - Descrição: Exibe o status de recursos e nós em clusters de alta disponibilidade gerenciados pelo Pacemaker, mostrando falhas de hardware, serviços migrados e o estado geral do cluster. * **pcs status** - Verifica o status dos nós e recursos do cluster. - Exemplo de uso: sudo pcs status - Descrição: Exibe o status atual de todos os recursos, serviços e nós em um ambiente de alta disponibilidade gerenciado pelo ''Pacemaker'' e ''Corosync''.