wiki:linux:comandos_grupos:cmd_access_diagnostic
Table of Contents
Nível Básico
1. Verificação de Informações da CPU com `lscpu`
- lscpu - Exibe informações sobre a CPU.
- Exemplo de uso:
lscpu
- Descrição: Mostra informações detalhadas sobre a CPU, como modelo, número de núcleos, threads e arquitetura, ajudando a identificar o tipo de processador instalado.
2. Listagem de Dispositivos de Armazenamento com `lsblk`
- lsblk - Lista todos os dispositivos de blocos (discos e partições).
- Exemplo de uso:
lsblk
- Descrição: Exibe a hierarquia de dispositivos de armazenamento conectados, incluindo discos e partições, mostrando detalhes como nome do dispositivo, tamanho e ponto de montagem.
3. Verificação de Temperatura com `sensors`
- sensors - Exibe a temperatura dos componentes.
- Exemplo de uso:
sensors
- Descrição: Mostra a temperatura de vários componentes do hardware, como CPU e GPU, permitindo monitorar o desempenho térmico do sistema.
4. Verificação do Uso de Memória com `free`
- free -h - Exibe o uso de memória de forma legível.
- Exemplo de uso:
free -h
- Descrição: Mostra o uso de memória RAM e swap, exibindo o total, usado e disponível de forma legível (em MB/GB), útil para monitorar o consumo de memória.
Nível Intermediário
1. Verificação de Informações de Discos com `smartctl`
- smartctl - Monitora a integridade de discos com S.M.A.R.T.
- Exemplo de uso:
sudo smartctl -H /dev/sda
- Descrição: Verifica o status de saúde do disco
/dev/sdausando S.M.A.R.T. e indica se o disco está saudável ou se há problemas iminentes.
- smartctl -a - Exibe informações detalhadas do S.M.A.R.T.
- Exemplo de uso:
sudo smartctl -a /dev/sda
- Descrição: Exibe todas as informações S.M.A.R.T. disponíveis para o disco
/dev/sda, incluindo contagens de erros, temperatura, e histórico de falhas.
2. Testes de Desempenho de Disco com `hdparm`
- hdparm -t - Mede a taxa de leitura sequencial do disco.
- Exemplo de uso:
sudo hdparm -t /dev/sda
- Descrição: Realiza um teste de leitura sequencial no disco
/dev/sda, exibindo a taxa de transferência em MB/s, útil para avaliar o desempenho de discos.
3. Testes de Memória com `memtester`
- memtester - Testa a integridade da memória RAM.
- Exemplo de uso:
sudo memtester 512M 5
- Descrição: Testa 512 MB de RAM por 5 iterações, verificando a integridade da memória física e identificando possíveis falhas, especialmente útil para diagnosticar problemas de estabilidade.
4. Verificação de Dispositivos PCI com `lspci`
- lspci - Lista todos os dispositivos conectados via PCI.
- Exemplo de uso:
lspci - Descrição: Exibe uma lista de todos os dispositivos PCI conectados ao sistema, como placas de vídeo, placas de rede e controladores de armazenamento, incluindo informações sobre fabricante e modelo.
5. Informações sobre Dispositivos USB com `lsusb`
- lsusb - Exibe dispositivos USB conectados ao sistema.
- Exemplo de uso:
lsusb
- Descrição: Lista todos os dispositivos USB conectados ao sistema, incluindo detalhes sobre o fabricante, ID do dispositivo e driver em uso, útil para diagnosticar problemas de USB.
Nível Avançado
1. Testes de Estresse da CPU com `stress`
- stress - Executa testes de estresse no sistema.
- Exemplo de uso:
sudo stress --cpu 4 --timeout 60
- Descrição: Executa um teste de estresse na CPU, utilizando 4 núcleos por 60 segundos. Isso ajuda a verificar a estabilidade do sistema sob carga pesada.
2. Testes de I/O de Disco com `fio`
- fio - Realiza testes de leitura/escrita em dispositivos de armazenamento.
- Exemplo de uso:
sudo fio --name=test --size=1G --rw=readwrite --bs=4k --direct=1 --ioengine=libaio
- Descrição: Executa um teste de I/O no disco, realizando operações de leitura e gravação com blocos de 4KB em modo direto, útil para medir a performance de dispositivos de armazenamento sob cargas reais.
3. Monitoramento de Processos com `htop`
- htop - Exibe o uso detalhado de CPU, memória e processos.
- Exemplo de uso:
htop - Descrição: Fornece uma interface visual interativa para monitorar o uso de CPU, memória, e processos, permitindo identificar gargalos de desempenho e processos que consomem muitos recursos.
4. Diagnóstico de Rede com `iperf3`
- iperf3 - Testa a largura de banda da rede.
- Exemplo de uso:
# No servidor: sudo iperf3 -s # No cliente: sudo iperf3 -c 192.168.1.100
- Descrição: Mede a largura de banda da rede entre dois sistemas, onde o servidor escuta as conexões e o cliente se conecta, útil para identificar problemas de desempenho de rede.
5. Testes de GPU com `glmark2`
- glmark2 - Realiza benchmarks de desempenho da GPU.
- Exemplo de uso:
glmark2
- Descrição: Executa um benchmark gráfico na GPU, fornecendo uma pontuação de desempenho. Isso é útil para testar o desempenho de placas gráficas em sistemas Linux.
6. Verificação de Parâmetros de Disco com `iostat`
- iostat - Monitora o desempenho de I/O de discos e CPU.
- Exemplo de uso:
iostat -dx 5
- Descrição: Exibe estatísticas detalhadas de I/O por dispositivo de armazenamento a cada 5 segundos, mostrando taxas de leitura/escrita e tempo de uso de CPU para operações de disco.
Nível Especializado
1. Monitoramento Avançado de Hardware com `perf`
- perf stat - Coleta estatísticas detalhadas do hardware.
- Exemplo de uso:
sudo perf stat -e cycles,instructions,cache-references,cache-misses -p 1234
- Descrição: Monitora o desempenho de um processo específico (PID 1234) em termos de ciclos de CPU, instruções, referências de cache e falhas de cache. Ideal para diagnosticar problemas de desempenho de processos e otimizar o uso de hardware.
- perf top - Exibe o uso em tempo real de CPU e cache.
- Exemplo de uso:
sudo perf top - Descrição: Fornece uma visualização em tempo real do uso da CPU e eventos de cache, permitindo monitorar a utilização do sistema em tempo real e identificar possíveis gargalos de desempenho.
2. Diagnóstico de Problemas de Memória com `valgrind`
- valgrind –tool=memcheck - Verifica erros de uso de memória.
- Exemplo de uso:
valgrind --tool=memcheck ./meu_programa
- Descrição: Executa o programa
meu_programasob o controle devalgrind, detectando vazamentos de memória e acessos inválidos à memória, útil para identificar problemas em programas que causam falhas ou consumo excessivo de memória.
3. Diagnóstico Avançado de I/O com `blktrace`
- blktrace - Rastreamento detalhado de operações de I/O em dispositivos de bloco.
- Exemplo de uso:
sudo blktrace -d /dev/sda -o - | blkparse -i -
- Descrição: Rastreia todas as operações de I/O que ocorrem no dispositivo de bloco
/dev/sda, fornecendo detalhes de cada operação. Ideal para entender o comportamento de I/O sob carga pesada e identificar possíveis gargalos.
4. Monitoramento de Falhas de Hardware com `mcelog`
- mcelog - Monitora e registra eventos de erro de hardware.
- Exemplo de uso:
sudo mcelog --daemon
- Descrição: Executa o
mcelogem modo daemon, monitorando erros de hardware, como falhas de memória e CPU. OMachine Check Exception (MCE)é útil para detectar falhas em hardware crítico antes que causem falhas graves.
5. Verificação de Erros de ECC em Memória com `edac-util`
- edac-util - Monitora e verifica erros de memória ECC.
- Exemplo de uso:
sudo edac-util -v
- Descrição: Exibe informações detalhadas sobre a memória ECC e verifica se houve correção de erros. Esse comando é essencial para servidores que utilizam RAM ECC, garantindo que a memória esteja funcionando corretamente e sem falhas não corrigidas.
6. Monitoramento e Otimização de Recursos com `nmon`
- nmon - Fornece uma visão detalhada do uso de CPU, memória, I/O e rede.
- Exemplo de uso:
nmon
- Descrição: Exibe uma interface interativa com gráficos detalhados que monitoram o uso de CPU, memória, rede, discos e processos em tempo real, ajudando a otimizar o uso de recursos do sistema em ambientes críticos.
7. Monitoramento de RAID com `mdadm`
- mdadm –detail - Exibe informações detalhadas sobre arrays RAID.
- Exemplo de uso:
sudo mdadm --detail /dev/md0
- Descrição: Mostra detalhes sobre o array RAID
/dev/md0, incluindo o status de seus dispositivos, o nível de RAID e o estado de sincronização, permitindo o monitoramento de problemas e degradações em sistemas RAID.
8. Monitoramento de Hardware em Ambientes de Alta Disponibilidade com `pacemaker` e `corosync`
- crm_mon - Monitora o status de clusters em alta disponibilidade.
- Exemplo de uso:
sudo crm_mon - Descrição: Exibe o status de recursos e nós em clusters de alta disponibilidade gerenciados pelo Pacemaker, mostrando falhas de hardware, serviços migrados e o estado geral do cluster.
- pcs status - Verifica o status dos nós e recursos do cluster.
- Exemplo de uso:
sudo pcs status - Descrição: Exibe o status atual de todos os recursos, serviços e nós em um ambiente de alta disponibilidade gerenciado pelo
PacemakereCorosync.
wiki/linux/comandos_grupos/cmd_access_diagnostic.txt · Last modified: by Wiki Administrator
