retries rails pricing ruby linux segmentation-fault crash-reports resque

ruby - pricing - sidekiq rails 5



Capturar backtraces de fallas de segmentación de Ruby y Resque en Linux (1)

Estamos ejecutando trabajadores de Ruby en una gran cantidad de máquinas usando Resque. De vez en cuando, vemos fallas de segmentación en nuestros procesos de trabajo de Resque. Es difícil depurar estos, porque son bastante raros, y debemos ejecutar decenas de miles de trabajos distribuidos para provocar un colapso.

Idealmente, nos gustaría capturar backtraces y archivos core después de cada bloqueo, y automáticamente subirlos a un servidor central. En otras palabras, estamos buscando algo así como "Bug Buddy" de Gnome, pero completamente automatizado y capaz de detectar fallas cuando el intérprete de Ruby abandona el núcleo. (Productos basados ​​en GUI similares incluyen MacOS X Crash Reporter, Windows Error Reporting, Dr. Konqi de KDE y Breakpad de Mozilla. Pero necesitamos algo que se ejecute en un servidor desatendido sin cabeza).

Hasta ahora, la opción más prometedora parece ser Apport de Ubuntu, que puede interceptar bloqueos en los procesos del servidor y guardarlos en el disco. Apport normalmente carga los bloqueos al Launchpad de Ubuntu, pero también viene con una biblioteca de Python.

¿Alguien tiene alguna recomendación o experiencia de primera mano usando estas bibliotecas? Pregunto aquí en lugar de en Server Fault porque es probable que las soluciones impliquen cambios de programación o de código.