Tourmentine

To content | To menu | To search


Lino est corrompu

La semaine dernière le serveur secondaire de mon "cluster" MariaDB (master-master, réplication asynchrone) c’est vautré comme une grosse merde, avec l’erreur suivante:

210923 22:24:32 [ERROR] mysqld got signal 10 ; This could be because you hit a bug. It is also possible that this binary or one of the libraries it was linked against is corrupt, improperly built, or misconfigured. This error can also be caused by malfunctioning hardware.

Il arrive que la réplication asynchrone se rate parfois, rien d’inquiétant. Par contre là les tables InnoDB étaient corrompues, le serveur s’est arrêté et refusait de se relancer...

La solution simple, bête et méchante a été de supprimer les données, et de reconstruire le serveur et la réplication à partir d’un dump frais du serveur principal.

SAUF QUE ça a recommencé, et plus gênant pas seulement sur le serveur secondaire mais aussi sur le primaire. Avec à chaque fois dump/restore sur le serveur en question pour réparer (#fatigue)

Bien sûr rien n’a changé depuis des lustres sur les jails en question, par contre un truc à été fait il y a environ deux mois, et le message aurait dû me mettre la puce à l’oreille: la mise à jour des serveurs en FreeBSD 13.0... Évidemment en bonne feignasse je n’ai pas recompilé les binaires des jails. Depuis une recompilation en bonne et du forme des deux nœuds, le problème ne s’est pas reproduit, je touche du bois. Après pourquoi ça n’arrive que maintenant, mystère....

Add a comment

Comments can be formatted using a simple wiki syntax.

This post's comments feed