===== Nível Básico =====
=== 1. Verificação de Informações da CPU com `lscpu` ===
* **lscpu** - Exibe informações sobre a CPU.
- Exemplo de uso: lscpu
- Descrição: Mostra informações detalhadas sobre a CPU, como modelo, número de núcleos, threads e arquitetura, ajudando a identificar o tipo de processador instalado.
=== 2. Listagem de Dispositivos de Armazenamento com `lsblk` ===
* **lsblk** - Lista todos os dispositivos de blocos (discos e partições).
- Exemplo de uso: lsblk
- Descrição: Exibe a hierarquia de dispositivos de armazenamento conectados, incluindo discos e partições, mostrando detalhes como nome do dispositivo, tamanho e ponto de montagem.
=== 3. Verificação de Temperatura com `sensors` ===
* **sensors** - Exibe a temperatura dos componentes.
- Exemplo de uso: sensors
- Descrição: Mostra a temperatura de vários componentes do hardware, como CPU e GPU, permitindo monitorar o desempenho térmico do sistema.
=== 4. Verificação do Uso de Memória com `free` ===
* **free -h** - Exibe o uso de memória de forma legível.
- Exemplo de uso: free -h
- Descrição: Mostra o uso de memória RAM e swap, exibindo o total, usado e disponível de forma legível (em MB/GB), útil para monitorar o consumo de memória.
===== Nível Intermediário =====
=== 1. Verificação de Informações de Discos com `smartctl` ===
* **smartctl** - Monitora a integridade de discos com S.M.A.R.T.
- Exemplo de uso: sudo smartctl -H /dev/sda
- Descrição: Verifica o status de saúde do disco ''/dev/sda'' usando S.M.A.R.T. e indica se o disco está saudável ou se há problemas iminentes.
* **smartctl -a** - Exibe informações detalhadas do S.M.A.R.T.
- Exemplo de uso: sudo smartctl -a /dev/sda
- Descrição: Exibe todas as informações S.M.A.R.T. disponíveis para o disco ''/dev/sda'', incluindo contagens de erros, temperatura, e histórico de falhas.
=== 2. Testes de Desempenho de Disco com `hdparm` ===
* **hdparm -t** - Mede a taxa de leitura sequencial do disco.
- Exemplo de uso: sudo hdparm -t /dev/sda
- Descrição: Realiza um teste de leitura sequencial no disco ''/dev/sda'', exibindo a taxa de transferência em MB/s, útil para avaliar o desempenho de discos.
=== 3. Testes de Memória com `memtester` ===
* **memtester** - Testa a integridade da memória RAM.
- Exemplo de uso: sudo memtester 512M 5
- Descrição: Testa 512 MB de RAM por 5 iterações, verificando a integridade da memória física e identificando possíveis falhas, especialmente útil para diagnosticar problemas de estabilidade.
=== 4. Verificação de Dispositivos PCI com `lspci` ===
* **lspci** - Lista todos os dispositivos conectados via PCI.
- Exemplo de uso: lspci
- Descrição: Exibe uma lista de todos os dispositivos PCI conectados ao sistema, como placas de vídeo, placas de rede e controladores de armazenamento, incluindo informações sobre fabricante e modelo.
=== 5. Informações sobre Dispositivos USB com `lsusb` ===
* **lsusb** - Exibe dispositivos USB conectados ao sistema.
- Exemplo de uso: lsusb
- Descrição: Lista todos os dispositivos USB conectados ao sistema, incluindo detalhes sobre o fabricante, ID do dispositivo e driver em uso, útil para diagnosticar problemas de USB.
===== Nível Avançado =====
=== 1. Testes de Estresse da CPU com `stress` ===
* **stress** - Executa testes de estresse no sistema.
- Exemplo de uso: sudo stress --cpu 4 --timeout 60
- Descrição: Executa um teste de estresse na CPU, utilizando 4 núcleos por 60 segundos. Isso ajuda a verificar a estabilidade do sistema sob carga pesada.
=== 2. Testes de I/O de Disco com `fio` ===
* **fio** - Realiza testes de leitura/escrita em dispositivos de armazenamento.
- Exemplo de uso: sudo fio --name=test --size=1G --rw=readwrite --bs=4k --direct=1 --ioengine=libaio
- Descrição: Executa um teste de I/O no disco, realizando operações de leitura e gravação com blocos de 4KB em modo direto, útil para medir a performance de dispositivos de armazenamento sob cargas reais.
=== 3. Monitoramento de Processos com `htop` ===
* **htop** - Exibe o uso detalhado de CPU, memória e processos.
- Exemplo de uso: htop
- Descrição: Fornece uma interface visual interativa para monitorar o uso de CPU, memória, e processos, permitindo identificar gargalos de desempenho e processos que consomem muitos recursos.
=== 4. Diagnóstico de Rede com `iperf3` ===
* **iperf3** - Testa a largura de banda da rede.
- Exemplo de uso:
# No servidor:
sudo iperf3 -s
# No cliente:
sudo iperf3 -c 192.168.1.100
- Descrição: Mede a largura de banda da rede entre dois sistemas, onde o servidor escuta as conexões e o cliente se conecta, útil para identificar problemas de desempenho de rede.
=== 5. Testes de GPU com `glmark2` ===
* **glmark2** - Realiza benchmarks de desempenho da GPU.
- Exemplo de uso: glmark2
- Descrição: Executa um benchmark gráfico na GPU, fornecendo uma pontuação de desempenho. Isso é útil para testar o desempenho de placas gráficas em sistemas Linux.
=== 6. Verificação de Parâmetros de Disco com `iostat` ===
* **iostat** - Monitora o desempenho de I/O de discos e CPU.
- Exemplo de uso: iostat -dx 5
- Descrição: Exibe estatísticas detalhadas de I/O por dispositivo de armazenamento a cada 5 segundos, mostrando taxas de leitura/escrita e tempo de uso de CPU para operações de disco.
===== Nível Especializado =====
=== 1. Monitoramento Avançado de Hardware com `perf` ===
* **perf stat** - Coleta estatísticas detalhadas do hardware.
- Exemplo de uso: sudo perf stat -e cycles,instructions,cache-references,cache-misses -p 1234
- Descrição: Monitora o desempenho de um processo específico (PID 1234) em termos de ciclos de CPU, instruções, referências de cache e falhas de cache. Ideal para diagnosticar problemas de desempenho de processos e otimizar o uso de hardware.
* **perf top** - Exibe o uso em tempo real de CPU e cache.
- Exemplo de uso: sudo perf top
- Descrição: Fornece uma visualização em tempo real do uso da CPU e eventos de cache, permitindo monitorar a utilização do sistema em tempo real e identificar possíveis gargalos de desempenho.
=== 2. Diagnóstico de Problemas de Memória com `valgrind` ===
* **valgrind --tool=memcheck** - Verifica erros de uso de memória.
- Exemplo de uso: valgrind --tool=memcheck ./meu_programa
- Descrição: Executa o programa ''meu_programa'' sob o controle de ''valgrind'', detectando vazamentos de memória e acessos inválidos à memória, útil para identificar problemas em programas que causam falhas ou consumo excessivo de memória.
=== 3. Diagnóstico Avançado de I/O com `blktrace` ===
* **blktrace** - Rastreamento detalhado de operações de I/O em dispositivos de bloco.
- Exemplo de uso: sudo blktrace -d /dev/sda -o - | blkparse -i -
- Descrição: Rastreia todas as operações de I/O que ocorrem no dispositivo de bloco ''/dev/sda'', fornecendo detalhes de cada operação. Ideal para entender o comportamento de I/O sob carga pesada e identificar possíveis gargalos.
=== 4. Monitoramento de Falhas de Hardware com `mcelog` ===
* **mcelog** - Monitora e registra eventos de erro de hardware.
- Exemplo de uso: sudo mcelog --daemon
- Descrição: Executa o ''mcelog'' em modo daemon, monitorando erros de hardware, como falhas de memória e CPU. O ''Machine Check Exception (MCE)'' é útil para detectar falhas em hardware crítico antes que causem falhas graves.
=== 5. Verificação de Erros de ECC em Memória com `edac-util` ===
* **edac-util** - Monitora e verifica erros de memória ECC.
- Exemplo de uso: sudo edac-util -v
- Descrição: Exibe informações detalhadas sobre a memória ECC e verifica se houve correção de erros. Esse comando é essencial para servidores que utilizam RAM ECC, garantindo que a memória esteja funcionando corretamente e sem falhas não corrigidas.
=== 6. Monitoramento e Otimização de Recursos com `nmon` ===
* **nmon** - Fornece uma visão detalhada do uso de CPU, memória, I/O e rede.
- Exemplo de uso: nmon
- Descrição: Exibe uma interface interativa com gráficos detalhados que monitoram o uso de CPU, memória, rede, discos e processos em tempo real, ajudando a otimizar o uso de recursos do sistema em ambientes críticos.
=== 7. Monitoramento de RAID com `mdadm` ===
* **mdadm --detail** - Exibe informações detalhadas sobre arrays RAID.
- Exemplo de uso: sudo mdadm --detail /dev/md0
- Descrição: Mostra detalhes sobre o array RAID ''/dev/md0'', incluindo o status de seus dispositivos, o nível de RAID e o estado de sincronização, permitindo o monitoramento de problemas e degradações em sistemas RAID.
=== 8. Monitoramento de Hardware em Ambientes de Alta Disponibilidade com `pacemaker` e `corosync` ===
* **crm_mon** - Monitora o status de clusters em alta disponibilidade.
- Exemplo de uso: sudo crm_mon
- Descrição: Exibe o status de recursos e nós em clusters de alta disponibilidade gerenciados pelo Pacemaker, mostrando falhas de hardware, serviços migrados e o estado geral do cluster.
* **pcs status** - Verifica o status dos nós e recursos do cluster.
- Exemplo de uso: sudo pcs status
- Descrição: Exibe o status atual de todos os recursos, serviços e nós em um ambiente de alta disponibilidade gerenciado pelo ''Pacemaker'' e ''Corosync''.