Come ripristinare l’OCR e il voting disk quando vengono persi
11gR2 – Restore OCR/ VOTEDISK based on ASM, when loss of CRS Diskgroup.
etichette: 11GR2, loss of CRS Diskgroup, lost OCR on ASM, RAC, RESTORE OCR, RESTORE OCR ON ASM, RESTORE VOTEDISK
-
Individua il backup OCR automatico più recente
Quando si utilizza una home CRS non condivisa, i backup OCR automatici possono essere posizionati su qualsiasi nodo del cluster, di conseguenza tutti i nodi devono essere controllati per il backup più recente:
$ ls -lrt $CRS_HOME/cdata/rac_cluster1/
-rw——- 1 root root 7331840 Mar 10 18:52 week.ocr
-rw——- 1 root root 7651328 Mar 26 01:33 week_.ocr
-rw——- 1 root root 7651328 Mar 29 01:33 day.ocr
-rw——- 1 root root 7651328 Mar 30 01:33 day_.ocr
-rw——- 1 root root 7651328 Mar 30 01:33 backup02.ocr
-rw——- 1 root root 7651328 Mar 30 05:33 backup01.ocr
-rw——- 1 root root 7651328 Mar 30 09:33 backup00.ocr -
Assicurati che l’infrastruttura di rete sia chiusa su tutti i nodi
Dato che manca il gruppo di dischi OCR, lo stack GI non funzionerà su nessun nodo, tuttavia potrebbero essere ancora in esecuzione vari processi daemon. Per ogni nodo arrestare lo stack GI utilizzando l’opzione force (-f):
# $CRS_HOME/bin/crsctl stop crs -f
-
Avvia lo stack CRS in modalità esclusiva
Sul nodo che ha il backup OCR più recente, accedere come root e avviare CRS in modalità esclusiva, questa modalità consentirà ad ASM di avviarsi e rimanere attivo senza la presenza di un Voting disk e senza il processo del damon CRS (crsd.bin) in esecuzione.
11.2.0.1:
# $CRS_HOME/bin/crsctl start crs -excl
…CRS-2672: Attempting to start ‘ora.asm’ on ‘racnode1’
CRS-2676: Start of ‘ora.asm’ on ‘racnode1’ succeeded
CRS-2672: Attempting to start ‘ora.crsd’ on ‘racnode1’
CRS-2676: Start of ‘ora.crsd’ on ‘racnode1’ succeeded
11.2.0.2:
# $CRS_HOME/bin/crsctl start crs -excl -nocrs
CRS-4123: Oracle High Availability Services has been started.
…
CRS-2672: Attempting to start ‘ora.cluster_interconnect.haip’ on ‘auw2k3’
CRS-2672: Attempting to start ‘ora.ctssd’ on ‘racnode1’
CRS-2676: Start of ‘ora.drivers.acfs’ on ‘racnode1’ succeeded
CRS-2676: Start of ‘ora.ctssd’ on ‘racnode1’ succeeded
CRS-2676: Start of ‘ora.cluster_interconnect.haip’ on ‘racnode1’ succeeded
CRS-2672: Attempting to start ‘ora.asm’ on ‘racnode1’
CRS-2676: Start of ‘ora.asm’ on ‘racnode1’ succeeded -
Assegna un’etichetta al disco CRS per l’utilizzo con ASMLIB
Se si utilizza ASMLIB, il disco da utilizzare per il gruppo di dischi CRS deve prima essere assegnato all’utente root:
# /usr/sbin/oracleasm createdisk ASMD40 /dev/sdh1
Writing disk header: done
Instantiating disk: done -
$ sqlplus / as sysasm
SQL*Plus: Release 11.2.0.1.0 Production on Tue Mar 30 11:47:24 2010
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to:
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 – Production
With the Real Application Clusters and Automatic Storage Management options
SQL> create diskgroup CRS external redundancy disk ‘ORCL:ASMD40’ attribute ‘COMPATIBLE.ASM’ = ‘11.2’;
Diskgroup created.
SQL> exit -
Ripristina l’ultimo backup OCR
Ora che il gruppo di dischi CRS è stato creato e montato, l’OCR può essere ripristinato – deve essere eseguito come utente root:
# cd $CRS_HOME/cdata/rac_cluster1/
# $CRS_HOME/bin/ocrconfig -restore backup00.ocr -
Avvia il daemon CRS sul nodo corrente (solo 11.2.0.1!)
# $CRS_HOME/bin/crsctl start res ora.crsd -init
CRS-2672: Attempting to start ‘ora.crsd’ on ‘racnode1’
CRS-2676: Start of ‘ora.crsd’ on ‘racnode1’ succeeded - Ricerea il Voting file
Il Voting filedeve essere inizializzato nel gruppo di dischi CRS:# $CRS_HOME/bin/crsctl replace votedisk +CRS
Successful addition of voting disk 00caa5b9c0f54f3abf5bd2a2609f09a9.
Successfully replaced voting disk group with +CRS.
CRS-4266: Voting file(s) successfully replaced -
Ricrea l’SPFILE per ASM (opzionale)
Preparare un pfile (ad esempio /tmp/asm_pfile.ora) con i parametri di avvio di ASM – questi possono variare dall’esempio seguente. In caso di dubbio, consultare il registro degli avvisi ASM poiché l’avvio dell’istanza ASM dovrebbe elencare tutti i valori dei parametri non predefiniti. Si noti che l’ultimo avvio di ASM (nel passaggio 2 tramite avvio CRS) non avrà utilizzato un SPFILE, quindi è necessario individuare un avvio prima della perdita del gruppo di dischi CRS.
*.asm_power_limit=1
*.diagnostic_dest=’/u01/app/oragrid’
*.instance_type=’asm’
*.large_pool_size=12M
*.remote_login_passwordfile=’EXCLUSIVE’
Now the SPFILE can be created using this PFILE:
$ sqlplus / as sysasm
SQL*Plus: Release 11.2.0.1.0 Production on Tue Mar 30 11:52:39 2010
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to:
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 – Production
With the Real Application Clusters and Automatic Storage Management options
SQL> create spfile=’+CRS’ from pfile=’/tmp/asm_pfile.ora’;
File created.
SQL> exit - Spegnimento CRS
Poiché CRS è in esecuzione in modalità esclusiva, deve essere spento per consentire nuovamente l’esecuzione di CRS su tutti i nodi. Potrebbe essere richiesto l’uso dell’opzione force (-f):
# $CRS_HOME/bin/crsctl stop crs -f
CRS-2793: Shutdown of Oracle High Availability Services-managed resources on ‘auw2k3’ has completed
CRS-4133: Oracle High Availability Services has been stopped. - Ripete la scansione dei dischi ASM
Se si utilizza ASMLIB, ripetere la scansione di tutti i dischi ASM su ogni nodo come utente root:
# /usr/sbin/oracleasm scandisks
Reloading disk partitions: done
Cleaning any stale ASM disks…
Scanning system for ASM disks…
Instantiating disk “ASMD40” - Avvia CRS
# $CRS_HOME/bin/crsctl start crs
CRS-4123: Oracle High Availability Services has been started. - Verifica CRS
Per verificare che il CRS sia di nuovo completamente funzionante:
# $CRS_HOME/bin/crsctl check cluster -all
**************************************************************
racnode1:
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
**************************************************************
racnode2:
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
**************************************************************
Thank you for sharing this post, it greatly helps me