2.1.1
Gestion des erreurs liées à la mémoire
Plusieurs fonctions déterminent la façon dont le sous-système de mémoire est
configuré et dont les erreurs liées à la mémoire sont gérées. Une bonne compréhension
des fonctions sous-jacentes peut vous aider à identifier et corriger les problèmes liés à
la mémoire. Cette section décrit la façon dont le serveur gère les erreurs de mémoire.
Remarque – Pour plus d'informations sur la configuration de la mémoire,
reportez-vous à la
FB-DIMM », page
Le serveur utilise la technologie ECC avancée qui corrige jusqu'à 4-bits dans les
erreurs de limites dans les groupes de quatre bits, sous réserve qu'ils se trouvent tous
dans la même mémoire DRAM. Avec les modules de mémoire FB-DIMM de 2 et 4 Go,
en cas d'erreur liée à la DRAM, le module de mémoire DIMM continue de fonctionner.
Les fonctions suivantes du serveur gèrent en toute indépendance les erreurs de
mémoire :
POST : basé sur les variable de configuration ILOM, le POST est exécuté à la mise
■
sous tension du serveur.
En cas d'erreur récupérable, le POST la transfère au démon d'autorétablissement
prédictif Solaris chargé de la gestion de l'erreur. Si une erreur de mémoire
irrécupérable est détectée, le POST l'affiche en utilisant le nom de périphérique
du module FB-DIMM défectueux, puis il consigne l'erreur. Le POST désactive
ensuite les modules de mémoire FB-DIMM défectueux. Suivant la configuration
de la mémoire et l'emplacement du module de mémoire FB-DIMM défectueux, le
POST désactive la moitié de la mémoire physique du système ou la moitié de la
mémoire physique et la moitié des unités d'exécution du processeur. Lorsque ce
processus de désactivation survient dans des conditions d'utilisation normale,
vous devez remplacer les modules de mémoire FB-DIMM défectueux en fonction
n du message d'erreur, puis activer les modules de mémoire FB-DIMM désactivés
à l'aide de la commande set périphérique component_state=enabled où
périphérique désigne le module de mémoire FB-DIMM activé (par exemple, set
/SYS/MB/CMP0/BR0/CH0/D0 component_state=enabled).
Technologie d'autorétablissement prédictif Solaris : fonction du SE Solaris
■
qui utilise le démon de gestion des erreurs (fmd) pour contrôler certains
types d'erreur. Lorsqu'une erreur survient, un ID de panne unique (UUID)
lui est assigné avant qu'elle ne soit consignée. La fonction d'autorétablissement
prédictif signale l'erreur et recommande le remplacement des modules de
mémoire FB-DIMM associés à l'erreur.
Si vous suspectez un problème de mémoire au niveau du serveur, reportez-vous à
l'organigramme de diagnostic (voir
d'ILOM. La commande show faulty affiche la liste des erreurs de mémoire et
répertorie les modules de mémoire FB-DIMM associés.
2-8
Manuel d'entretien pour les serveurs Sun SPARC Enterprise T5140 et T5240 • Octobre 2008
section 5.2, « Guide de référence des configurations des modules
5-15.
FIGURE 2-1
). Exécutez la commande show faulty