Koozali.org: home of the SME Server

Affa

Offline gieres

  • *
  • 213
  • +0/-0
Affa
« on: October 06, 2017, 10:52:59 PM »
Bonjour,

La nuit du 30 septembre au 1er octobre, Affa a rempli complètement le disque de 900 Go qui contenait
509 Go jusqu'à présent.

Voici ce que donne la commande affa --list-archives (j'ai enlevé les adresses IP, etc)


Affa version 3.2.2.3-8 on sme
+----------------------------------------------------------------------------------------------------------------+
| Job: localhost                       
| Description: Testjob localhost backup                                                                         
| Directory: /var/affa/localhost/                                                                               
| Hostname:localhost                                                                                           
| Email: root,                                               |
+----------------------------------------------------------------------------------------------------------------+

+----------------------------------------------------------------------------------------------------------------+
| Job:sme                                                                         
| Description: sauvegarde distante du serveur SME                                                 |
| Directory:/var/affa/sme                                                                         
Hostname:                                                                                   
| Email:                                               |
+----------------------------------------------------------------------------------------------------------------+
| Run   | Completion date                           |    buTime | ddTime | ddYld | Files |  Size |  Sent | Recvd |
+----------------------------------------------------------------------------------------------------------------+
| M11  | Sun 2016-10-02 00:48                       |    13m54s |      -|     - |  835k |  456G |  130k |   33M |
| M10  | Sun 2016-10-30 00:47                       |    12m50s |      -|     - |  845k |  464G |  102k |   25M |
| M 9  | Sun 2016-11-27 00:50                       |    15m05s |      -|     - |  844k |  469G |  123k |   37M |
| M 8  | Sun 2017-01-01 00:48                       |    13m02s |      -|     - |  848k |  469G |  137k |   32M |
| M 7  | Sun 2017-01-29 00:51                       |    16m29s |      -|     - |  860k |  476G |  159k |   45M |
| M 6  | Sun 2017-02-26 00:48                       |    13m39s |      -|     - |  867k |  480G |  122k |   31M |
| M 5  | Sun 2017-03-26 00:49                       |    14m44s |      -|     - |  878k |  488G |  123k |   33M |
| M 4  | Sun 2017-04-30 00:53                       |    18m28s |      -|     - |  887k |  499G |  148k |   35M |
| M 3  | Sun 2017-05-28 00:53                       |    18m29s |      -|     - |  837k |  491G |  188k |   48M |
| M 2  | Sun 2017-07-02 00:52                       |    17m39s |      -|     - |  848k |  499G |  183k |   43M |
| M 1  | Sun 2017-07-30 00:57                       |    22m11s |      -|     - |  854k |  502G |  119k |   36M |
| M 0  | Sun 2017-08-27 00:56                       |    21m53s |      -|     - |  856k |  503G |  133k |   28M |
+----------------------------------------------------------------------------------------------------------------+
| W 2  | Sun 2017-09-03 00:53                       |    18m56s |      -|     - |  857k |  504G |  180k |   41M |
| W 1  | Sun 2017-09-10 01:01                       |    26m08s |      -|     - |  859k |  506G |  164k |   44M |
| W 0  | Sun 2017-09-17 00:55                       |    20m10s |      -|     - |  860k |  507G |  111k |   30M |
+----------------------------------------------------------------------------------------------------------------+
| D 6  | Sun 2017-09-24 00:57                       |    22m24s |      -|     - |  862k |  508G |  112k |   31M |
| D 5  | Mon 2017-09-25 00:55                       |    20m54s |      -|     - |  862k |  508G |  112k |   28M |
| D 4  | Tue 2017-09-26 03:20                       |     2h45m |      -|     - |  863k |  509G |  301k |  1.2G |
| D 3  | Wed 2017-09-27 01:41                       |     1h06m |      -|     - |  863k |  509G |  224k |  440M |
| D 2  | Thu 2017-09-28 01:08                       |    33m26s |      -|     - |  862k |  509G |  1.6M |  110M |
| D 1  | Fri 2017-09-29 01:08                       |    33m38s |      -|     - |  863k |  509G |  265k |  158M |
| D 0  | Sat 2017-09-30 01:09                       |    34m23s |      -|     - |  863k |  509G |  464k |  186M |
+----------------------------------------------------------------------------------------------------------------+

Pour l’instant, le serveur tourne et est accessible en ssh. Je ne l'arrête donc pas et je suis  à ta disposition, Arnaud, si tu veux que j'investigue.

Le répertoire scheduled.running existe mais je n'ai pas réussi à déterminer sa taille pour l'instant. J'essaye :

du -h --max-depth=1 /var/affa/sme/scheduled.running

mais cela doit prendre du temps pour compter 400 Go.

D'avance merci.



Offline Arnaud

  • *
  • 143
  • +0/-0
    • GuedeL
Re: Affa
« Reply #1 on: October 13, 2017, 12:49:52 PM »
Bonjour JP,

le phénomène nous étant tous 2 assez connu lors d'un roulement d'archives, je ne sais quoi te dire de véritablement constructif...  :???:

le disque de 900 Go qui contenait 509 Go jusqu'à présent.

Tu es certain qu'il n'était rempli qu'à 509Go le 30.09?
Le retour de --list-archives donne la taille de la sauvegarde, mais pas de la place occupée sur le disque par tout le jeux de sauvegardes.

Ce que j'essaierais:
- efface le répertoire "sheduled.running" pour te retrouver dans l'état d'avant le 1.10.
- quelle est la place libre sur le disque via un "affa --disk-usage"?

Ce qui pourrait expliquer le remplissage du disque:
- as-tu eu de grosses modifications (au sens informatique, càd ajout, déplacement, renommage, changement de permissions, de propriétaires etc...) de fichiers depuis la mi-septembre?
Au vu de ton log, depuis le 26.09, les sauvegardes durent plus longtemps que les 20 minutes qu'elles nécessitaient auparavant
- au niveau de la conf du job: quel est l’état du paramètre  "DiskSpaceWarn":  strict, normal ou risky? (strict par défaut) . As-tu reçu des alertes durant la dernière semaine?
Par expérience perso: depuis que je laisse ~1/3 de place libre sur le disque, je n'ai plus eu ce genre de problème et n'ai plus aucune alerte, même en "strict"

Pour la "résolution" du problème, je ne connais que 2 solutions: tu élimines des sauvegardes pour faire de la place ou tu mets un disque plus gros......

@+
Arnaud

PS: excuse mon retour tardif dû au fait que j'étais offline ces derniers temps

Offline Jean-Philippe Pialasse

  • *
  • 2,747
  • +11/-0
  • aka Unnilennium
    • http://smeserver.pialasse.com
Re: Affa
« Reply #2 on: October 13, 2017, 04:14:24 PM »
Le talon d'Achilles des solutions basees sur rsync est le renomage d'un gros dossier contenant des centaines de giga.
A moins d'avoir une solution en arriere comme fair backuppc pour faire des hardlinks de fichiers similaires, une operation sans changement de taille apparent sur le serveur peut ruiner l'espace de backup et bloquer la sauvegarde.

J'investiguerais aussi en ce sens !



Offline Arnaud

  • *
  • 143
  • +0/-0
    • GuedeL
Re: Affa
« Reply #3 on: October 13, 2017, 04:59:38 PM »
re

j'avais oublié: mon serveur étant relativement "à l'aise" au niveau perfs, j'utilise l'option "dedup=yes" dans la conf du job pour gagner en place au niveau de l'archive. Malheureusement, d'après ce que je lis/comprends dans la doc, l'analyse est faite à postériori et non lors de la sauvegarde => je ne sais pas si cela pourrait t'aider.
De plus je ne sais pas non plus si cela "reconnait" un changement de propriétaire par ex.

Offline gieres

  • *
  • 213
  • +0/-0
Re: Affa
« Reply #4 on: October 14, 2017, 01:25:49 PM »
Bonjour,
Merci à vous pour ces informations.
Donc, en commençant par Arnaud, j'ai supprimé scheduled.running et affa --disk-usage donne :
Code: [Select]
Affa version 3.2.2.3-8 on sme-sauv-dist
+------+--------+--------+----------------------------------------------------+
| Use% |   Used |  Avail | Root Dir                                           |
+------+--------+--------+----------------------------------------------------+
|  91% |   792G |    75G | /var/affa                                          |
+------+--------+--------+----------------------------------------------------+
Donc tu avais raison, Arnaud, sur la taille de la sauvegarde. La sécurité du tiers du disque est largement dépassée.

Et si Affa n'a pas envoyé d'alerte, c'est effectivement parce que :
Code: [Select]
DiskSpaceWarn=risky
A priori, il n'y a eu aucune grosse modification des fichiers sur le serveur mais je n'ai peut-être pas tout vu... Comme ce serveur est sauvegardé par 3 serveurs. Je vais donc jeter un coup d’œil sur les 2 autres qui n'ont pas l'air d'avoir de problème, du moins, ils n'ont pas émis d'alerte. Mais je vais regarder les tailles des sauvegardes.

En attendant je tente de relancer la sauvegarde à la main sur celui-ci et on verra bien ce qu'il adviendra.

Par ailleurs, as-tu noté, Arnaud, qu'il manque une sauvegarde hebdo ? Et pourtant, Affa est bien configuré :
Code: [Select]
weeklyKeep=4
Sur le second serveur SME dédié à la sauvegarde du serveur de production, affa --disk-usage donne 95 % d'occupation sur un disque identique d'un To identique. Là aussi, DiskSpaceWarn est à risky.

Reste à voir le dernier serveur. A suivre.

Bonne fin de semaine.
« Last Edit: October 14, 2017, 07:58:14 PM by gieres »

Offline Arnaud

  • *
  • 143
  • +0/-0
    • GuedeL
Re: Affa
« Reply #5 on: October 15, 2017, 08:55:53 PM »
Bonsoir,

il manque une sauvegarde hebdo
non, je ne l'avais pas vu!
Mais je remarque qu'il y a 1 semaine entre la W2 et la M0 ainsi qu'une semaine entre la D6 et la W0.
Chez moi, j'ai aujourd'hui 1s entre W3 et M0 et 3j entre la D6 et la W0.
Je pense donc qu'il s'agit d'une histoire de roulement d'archives et qu'à la prochaine sauvegarde:
D6 => W0
W0 => W1
W1 => W2
W2 => W3

Donc en gros, je pense que c'est la nouvelle W0 (pour la semaine à suivre) qui n'a pas encore été crée.

@+