Collectl: una herramienta avanzada de supervisión del rendimiento todo en uno para Linux
El deber más importante de un administrador de sistemas Linux es asegurarse de que el sistema que está administrando esté en muy buenas condiciones. Hay muchas herramientas disponibles para administradores de sistemas Linux que pueden ayudar a monitorear y mostrar procesos en un sistema como top y htop, pero ninguna de estas herramientas puede competir con collectl.

collectl es una muy buena utilidad de línea de comandos rica en funciones que se puede utilizar para recopilar datos de rendimiento que describen el estado actual del sistema. A diferencia de la mayoría de las otras herramientas de monitoreo, collectl no se enfoca en un número limitado de métricas del sistema, sino que puede recopilar información sobre muchos tipos diferentes de recursos del sistema, como CPU, disco, memoria, red, sockets, tcp, inodos, infiniband, brillo, memoria, nfs, procesos, cuadrículas, losas y buddyinfo.
Algo muy bueno sobre el uso de collectl es que también puede desempeñar el papel de utilidades que están diseñadas con un solo propósito específico, como top, ps, iotop y muchos otros. ¿Cuáles son algunas de las características que hacen que colleclt sea una herramienta útil?
Después de investigar mucho, he compilado una lista con algunas de las características más importantes de la utilidad de línea de comandos collectl para ustedes.
- It can run interactively, as a daemon or both.
- It can display the output in many formats.
- It has the ability to monitor almost any subsystem.
- It can play the role of many other utilities such as ps, top, iotop, vmstat.
- It has the ability to record and playback the captured data.
- It can export the data in various file formats. (this is very useful when you want to analyse the data with external tools).
- It can run as a service to monitor remote machines or an entire server cluster.
- It can display the data in the terminal, write to a file or a socket.
Cómo instalar collectl en Linux
La utilidad collectl se ejecuta en todas las distribuciones de Linux, lo único que necesita para ejecutarse es perl, así que asegúrese de tener Perl instalado en su máquina antes de instalar collectl en su máquina.
El siguiente comando se puede utilizar para instalar la utilidad collectl en máquinas basadas en Debian como Ubuntu.
$ sudo apt-get install collectl
Si está utilizando una distribución basada en Red Hat, puede obtenerla fácilmente de los repositorios con el comando yum.
# yum install collectl
Algunos ejemplos prácticos de la utilidad colectiva
Una vez finalizada la instalación de la herramienta Collectl, puedes ejecutarla fácilmente desde el terminal, incluso sin ninguna opción. El siguiente comando mostrará información sobre las estadísticas de la CPU, el disco y la red en un formato muy breve y legible por humanos.
# collectl waiting for 1 second sample... # #cpu sys inter ctxsw KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut 13 5 790 1322 0 0 92 7 4 13 0 5 10 2 719 1186 0 0 0 0 3 9 0 4 12 0 753 1188 0 0 52 3 2 5 0 6 13 2 733 1063 0 0 0 0 1 1 0 1 25 2 834 1375 0 0 0 0 1 1 0 1 28 2 870 1424 0 0 36 7 1 1 0 1 19 3 949 2271 0 0 44 3 1 1 0 1 17 2 809 1384 0 0 0 0 1 6 0 6 16 2 732 1348 0 0 0 0 1 1 0 1 22 4 993 1615 0 0 56 3 1 2 0 3
Como pueden ver en la salida anterior que se muestra en la pantalla del terminal, es muy fácil trabajar con los valores de las métricas del sistema presentes en la salida del comando porque aparece en una sola línea.
Cuando la utilidad collectl se ejecuta sin ninguna opción, muestra información sobre los siguientes subsistemas:
- cpu
- disks
- network
Nota: En nuestro caso, un subsistema es todo tipo de recurso del sistema que se puede medir.
También puede mostrar estadísticas de todos los subsistemas excepto losas combinando el comando con la opción –todos como se muestra a continuación.
# collectl --all waiting for 1 second sample... # #cpu sys inter ctxsw Cpu0 Cpu1 Free Buff Cach Inac Slab Map Fragments KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut IP Tcp Udp Icmp Tcp Udp Raw Frag Handle Inodes Reads Writes Meta Comm 16 3 817 1542 430 390 1G 175M 1G 683M 193M 1G nsslkjjebbk 0 0 24 3 1 1 0 1 0 0 0 0 623 0 0 0 8160 240829 0 0 0 0 11 1 745 1324 316 426 1G 175M 1G 683M 193M 1G nsslkjjebbk 0 0 0 0 0 3 0 2 0 0 0 0 622 0 0 0 8160 240828 0 0 0 0 15 2 793 1683 371 424 1G 175M 1G 683M 193M 1G ssslkjjebbk 0 0 0 0 1 1 0 1 0 0 0 0 622 0 0 0 8160 240829 0 0 0 0 16 2 872 1875 427 446 1G 175M 1G 683M 193M 1G ssslkjjebbk 0 0 24 3 1 1 0 1 0 0 0 0 622 0 0 0 8160 240828 0 0 0 0 24 2 842 1383 473 368 1G 175M 1G 683M 193M 1G ssslkjjebbk 0 0 168 6 1 1 0 1 0 0 0 0 622 0 0 0 8160 240828 0 0 0 0 27 3 844 1099 478 365 1G 175M 1G 683M 193M 1G nsslkjjebbk 0 0 0 0 1 6 1 9 0 0 0 0 622 0 0 0 8160 240828 0 0 0 0 26 5 823 1238 396 428 1G 175M 1G 683M 193M 1G ssslkjjebbk 0 0 0 0 2 11 3 9 0 0 0 0 622 0 0 0 8160 240828 0 0 0 0 15 1 753 1276 361 391 1G 175M 1G 683M 193M 1G ssslkjjebbk 0 0 40 3 1 2 0 3 0 0 0 0 623 0 0 0 8160 240829 0 0 0 0
Pero, ¿cómo monitorea el uso de la CPU con la ayuda de la utilidad? La opción "-s" debe utilizarse para controlar qué datos del subsistema se recopilarán o reproducirán.
Por ejemplo, el siguiente comando se puede usar para monitorear el resumen del uso de la CPU.
# collectl -sc waiting for 1 second sample... # #cpu sys inter ctxsw 15 2 749 1155 16 3 772 1445 14 2 793 1247 27 4 887 1292 24 1 796 1258 16 1 743 1113 15 1 743 1179 14 1 706 1078 15 1 764 1268
¿Qué sucede cuando combina el comando con "scdn"? La mejor manera de aprender a usar las herramientas de línea de comandos es practicar tanto como sea posible, así que ejecute el siguiente comando en su terminal y vea qué sucede.
# collectl -scdn waiting for 1 second sample... # #cpu sys inter ctxsw KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut 25 4 943 3333 0 0 0 0 1 1 0 2 27 3 825 2910 0 0 0 0 1 1 0 1 27 5 886 2531 0 0 0 0 0 0 0 1 20 4 872 2406 0 0 0 0 1 1 0 1 26 1 854 2091 0 0 20 2 1 1 0 1 39 4 1004 3398 0 0 0 0 2 8 3 6 41 6 955 2464 0 0 40 3 1 2 0 3 25 7 890 1609 0 0 0 0 1 1 0 1 16 2 814 1165 0 0 796 43 2 2 0 2 14 1 779 1383 0 0 48 6 1 1 0 1 11 2 795 1285 0 0 0 0 2 14 1 14
Puede comprender fácilmente que la opción predeterminada es "cdn", que significa cpu, discos y datos de red. El resultado del comando es el mismo que el resultado de "collectl -scn"
Si desea recopilar datos sobre la memoria, use el siguiente comando.
# collectl -sm waiting for 1 second sample... # #Free Buff Cach Inac Slab Map 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G 1G 177M 1G 684M 193M 1G
La salida anterior es muy útil cuando desea obtener información detallada sobre el uso de memoria, memoria libre y otras cosas importantes para el rendimiento de su sistema.
¿Qué tal algunos datos sobre tcp? Utilice el siguiente comando para hacerlo.
# collectl -st waiting for 1 second sample... # # IP Tcp Udp Icmp 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Una vez que haya adquirido algo de experiencia, puede combinar opciones fácilmente para obtener los resultados que desea. Por ejemplo, puede combinar la "t" para tcp y "c" para cpu. El siguiente comando hace eso.
# collectl -stc waiting for 1 second sample... # #cpu sys inter ctxsw IP Tcp Udp Icmp 23 8 961 3136 0 0 0 0 24 5 916 3662 0 0 0 0 21 8 848 2408 0 0 0 0 30 10 916 2674 0 0 0 0 38 3 826 1752 0 0 0 0 31 3 820 1408 0 0 0 0 15 5 781 1335 0 0 0 0 17 3 802 1314 0 0 0 0 17 3 755 1218 0 0 0 0 14 2 788 1321 0 0 0 0
Es difícil para nosotros, los humanos, recordar todas las opciones disponibles, así que publico la lista resumida de subsistemas compatibles con la herramienta.
- b – buddy info (memory fragmentation)
- c – CPU
- d – Disk
- f – NFS V3 Data
- i – Inode and File System
- j – Interrupts
- l – Lustre
- m – Memory
- n – Networks
- s – Sockets
- t – TCP
- x – Interconnect
- y – Slabs (system object caches)
Un dato muy importante para un administrador de sistema o un usuario de Linux son los datos recopilados sobre el uso del disco. El siguiente comando le ayudará a controlar el uso del disco.
# collectl -sd waiting for 1 second sample... # #KBRead Reads KBWrit Writes 0 0 0 0 0 0 0 0 0 0 92 7 0 0 0 0 0 0 36 3 0 0 0 0 0 0 0 0 0 0 100 7 0 0 0 0
También puede utilizar la opción "-sD" para recopilar datos en discos individuales, pero debe saber que no se informará la información sobre el total de discos.
# collectl -sD waiting for 1 second sample... # DISK STATISTICS (/sec) # Pct #Name KBytes Merged IOs Size KBytes Merged IOs Size RWSize QLen Wait SvcTim Util sda 0 0 0 0 52 11 2 26 26 1 8 8 1 sda 0 0 0 0 0 0 0 0 0 0 0 0 0 sda 0 0 0 0 24 0 2 12 12 0 0 0 0 sda 0 0 0 0 152 0 4 38 38 0 0 0 0 sda 0 0 0 0 192 45 3 64 64 1 20 20 5 sda 0 0 0 0 204 0 2 102 102 0 0 0 0 sda 0 0 0 0 0 0 0 0 0 0 0 0 0 sda 0 0 0 0 116 26 3 39 38 1 16 16 4 sda 0 0 0 0 0 0 0 0 0 0 0 0 0 sda 0 0 0 0 0 0 0 0 0 0 0 0 0 sda 0 0 0 0 32 5 3 11 10 1 16 16 4 sda 0 0 0 0 0 0 0 0 0 0 0 0 0
También puede utilizar otros subsistemas de detalles para recopilar datos detallados. La siguiente es una lista de los subsistemas detallados.
- C – CPU
- D – Disk
- E – Environmental data (fan, power, temp), via ipmitool
- F – NFS Data
- J – Interrupts
- L – Lustre OST detail OR client Filesystem detail
- N – Networks
- T – 65 TCP counters only available in plot format
- X – Interconnect
- Y – Slabs (system object caches)
- Z – Processes
Hay muchas opciones disponibles en la utilidad Collectl, pero no hay suficiente tiempo ni espacio para cubrirlas todas en un solo artículo. Sin embargo, vale la pena mencionar y enseñar cómo usar la utilidad como top y ps.
Es muy fácil hacer que collectl funcione como la utilidad principal, simplemente ejecute el siguiente comando en su terminal y verá el resultado similar que le brinda la herramienta principal cuando se ejecuta en su sistema Linux.
# collectl --top # TOP PROCESSES sorted by time (counters are /sec) 13:11:02 # PID User PR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKB MajF MinF Command ^COuch!tecmint 20 1 40 R 1G 626M 0 0.01 0.14 15 28:48.24 0 0 0 109 /usr/lib/firefox/firefox 3403 tecmint 20 1 40 R 1G 626M 1 0.00 0.20 20 28:48.44 0 0 0 600 /usr/lib/firefox/firefox 5851 tecmint 20 4666 0 R 17M 13M 0 0.02 0.06 8 00:01.28 0 0 0 0 /usr/bin/perl 1682 root 20 1666 2 R 211M 55M 1 0.02 0.01 3 03:10.24 0 0 0 95 /usr/bin/X 3454 tecmint 20 3403 8 S 216M 45M 1 0.01 0.02 3 01:23.32 0 0 0 0 /usr/lib/firefox/plugin-container 4658 tecmint 20 4657 3 S 207M 17M 1 0.00 0.02 2 00:08.23 0 0 0 142 gnome-terminal 2890 tecmint 20 2571 3 S 340M 68M 0 0.00 0.01 1 01:19.95 0 0 0 0 compiz 3521 tecmint 20 1 24 S 710M 148M 1 0.01 0.00 1 01:47.84 0 0 0 0 skype 1 root 20 0 0 S 3M 2M 0 0.00 0.00 0 00:02.57 0 0 0 0 /sbin/init 2 root 20 0 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 kthreadd 3 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.60 0 0 0 0 ksoftirqd/0 5 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kworker/0:0H 7 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kworker/u:0H 8 root RT 2 0 S 0 0 0 0.00 0.00 0 00:04.42 0 0 0 0 migration/0 9 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 rcu_bh 10 root 20 2 0 R 0 0 0 0.00 0.00 0 00:02.22 0 0 0 0 rcu_sched 11 root RT 2 0 S 0 0 0 0.00 0.00 0 00:00.05 0 0 0 0 watchdog/0 12 root RT 2 0 S 0 0 1 0.00 0.00 0 00:00.07 0 0 0 0 watchdog/1 13 root 20 2 0 S 0 0 1 0.00 0.00 0 00:00.73 0 0 0 0 ksoftirqd/1 14 root RT 2 0 S 0 0 1 0.00 0.00 0 00:01.96 0 0 0 0 migration/1 16 root 0 2 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 kworker/1:0H 17 root 0 2 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 cpuset
Y ahora, por último, pero no menos importante, para usar la utilidad collectl como herramienta ps, ejecute el siguiente comando en su terminal. Obtendrá información sobre los procesos en su sistema de la misma manera que lo hace cuando ejecuta el comando "ps" en su terminal.
# collectl -c1 -sZ -i:1 waiting for 1 second sample... ### RECORD 1 >>> tecmint-vgn-z13gn <<< (1397979716.001) (Sun Apr 20 13:11:56 2014) ### # PROCESS SUMMARY (counters are /sec) # PID User PR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKB MajF MinF Command 1 root 20 0 0 S 3M 2M 0 0.00 0.00 0 00:02.57 0 0 0 0 /sbin/init 2 root 20 0 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 kthreadd 3 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.60 0 0 0 0 ksoftirqd/0 5 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kworker/0:0H 7 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kworker/u:0H 8 root RT 2 0 S 0 0 0 0.00 0.00 0 00:04.42 0 0 0 0 migration/0 9 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 rcu_bh 10 root 20 2 0 S 0 0 0 0.00 0.00 0 00:02.24 0 0 0 0 rcu_sched 11 root RT 2 0 S 0 0 0 0.00 0.00 0 00:00.05 0 0 0 0 watchdog/0 12 root RT 2 0 S 0 0 1 0.00 0.00 0 00:00.07 0 0 0 0 watchdog/1 13 root 20 2 0 S 0 0 1 0.00 0.00 0 00:00.73 0 0 0 0 ksoftirqd/1 14 root RT 2 0 S 0 0 1 0.00 0.00 0 00:01.96 0 0 0 0 migration/1 16 root 0 2 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 kworker/1:0H 17 root 0 2 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 cpuset 18 root 0 2 0 S 0 0 1 0.00 0.00 0 00:00.00 0 0 0 0 khelper 19 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kdevtmpfs 20 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 netns 21 root 20 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 bdi-default 22 root 0 2 0 S 0 0 0 0.00 0.00 0 00:00.00 0 0 0 0 kintegrityd
Estoy muy seguro de que a muchos administradores de sistemas Linux les gustará esta herramienta y sentirán su poder cuando la utilicen al máximo. Si desea avanzar sus conocimientos sobre la colección al siguiente nivel, consulte las páginas de su manual y siga practicando.
Simplemente escriba el siguiente comando en su terminal y comience a leer.
# man collectl
Enlaces de referencia
Collectl Página de inicio