Memory Sparing (Mémoire de réserve)
Dans ce mode, une rangée par canal est réservée. Dans le cas où des erreurs corrigeables persistantes sont détectées sur une rangée, les
données de cette rangée sont copiées sur la rangée de réserve et la rangée défaillante est désactivée.
Avec la mémoire de réserve activée, la mémoire système disponible pour le système d'exploitation est réduite d'une rangée par canal. Par
exemple, pour une configuration à deux processeurs avec seize barrettes DIMM à double rangée de 4 Go, la mémoire système disponible
est la suivante : 3/4 (rangées/canal) × 16 (barrettes DIMM) × 4 Go = 48 Go et non 16 (barrettes DIMM) × 4 Go = 64 Go.
REMARQUE :
La mémoire de réserve n'offre aucune protection contre une erreur non corrigeable sur plusieurs bits.
REMARQUE :
Les modes Advanced ECC/Lockstep (Fonctions ECC avancées/étape de verrouillage) et Optimizer (Optimiser)
prennent en charge la mémoire de réserve.
Optimisation de la mémoire (canal indépendant)
Ce mode prend en charge la correction SDDC uniquement pour les barrettes de mémoire qui utilisent une largeur de périphérique x4 et qui
n'imposent aucune exigence spécifique relative à la population des bancs de mémoire.
ECC avancé
Le mode Advanced ECC (Fonctions EEC avancées) permet d'étendre la SDDC des barrettes DIMM DRAM de largeur x4 aux DRAM de
largeur x4 et x8. Ce mode permet de protéger le système contre les échecs de puce DRAM seule au cours du fonctionnement normal.
Défaillance de mémoire
La désactivation du module de mémoire dans le canal entraîne une défaillance de mémoire.
Une défaillance de mémoire peut se produire pour les raisons suivantes :
•
Le système n'utilise pas la dernière version du BIOS.
•
Les modules de mémoire ne sont pas placés correctement sur les sockets DIMM dans le système.
•
Le système est équipé d'un socket DIMM défectueux.
Erreurs corrigibles et non corrigibles
Les erreurs corrigibles peuvent être détectées et corrigées si le jeu de puces et le module DIMM prennent en charge cette fonctionnalité.
Généralement, les erreurs corrigibles sont des erreurs monobit (SBE). La plupart des serveurs Dell sont capables de détecter et de corriger
de telles erreurs. Par ailleurs, les serveurs Dell avec prise en charge du mode Advanced ECC (ECC avancé) peuvent détecter et corriger les
erreurs multibits.
Les erreurs corrigibles peuvent être classifiées en tant qu'erreurs matérielles et erreurs logicielles. Les erreurs matérielles indiquent
généralement un problème lié au module DIMM. Même si les erreurs matérielles de mémoire corrigibles sont corrigées par le système et
n'entraînent pas de temps d'inactivité du système ni de corruption des données, elles indiquent un problème lié au matériel. Les erreurs
logicielles n'indiquent pas de problème lié au module DIMM. Une erreur logicielle se produit lorsque les données et/ou les bits ECC du
module DIMM sont incorrects, mais elle ne persiste pas une fois que les données et/ou bits ECC du module DIMM ont été corrigés.
Les erreurs non corrigibles sont toujours des erreurs de mémoire multibits. Si les erreurs corrigibles n'ont pas d'incidence sur le
fonctionnement normal du système, les erreurs de mémoire non corrigibles entraînent une panne ou un arrêt du système si ce dernier n'est
pas configuré pour la mise en miroir ou les modes AMP RAID. Les erreurs de mémoire non corrigibles peuvent généralement être isolées au
niveau d'un banc de modules DIMM en échec, plutôt qu'au niveau du module DIMM proprement dit.
Le système cesse de répondre pendant le POST après la mise à niveau ou
l'installation d'une barrette de mémoire
Problème :
Dépannage des problèmes matériels
75