SQL Server and Windows Server Failover Cluster Patching – Guía Paso a Paso

Impactos: 4

En esta guía describiremos paso a paso como instalar y actualizar una instancia SQL Server que se encuentra configurada sobre Windows Server Failover Cluster, minimizando el tiempo de downtime.

[EVENTO] Data & AI Revolution 18/9/2019

Impactos: 146

Los Datos y la Inteligencia Artificial son más que nuevas palabras de moda: se trata de la revolución de las organizaciones.
Microsoft está posicionado para ser el jugador clave como proveedor de Infraestructura de Datos e IA brindando servicios a través de sus plataforma Azure y SQL Server.  

Te invitamos a participar de un evento que reunirá speakers de Microsoft, MVPs y profesionales de la industria en una jornada de día completo con sesiones y hands on para explotar el potencial de los datos con SQL Server, Azure e inteligencia artificial.  

Lo invitamos el día Miércoles 18 de septiembre de 09:00 a 18:00 hs
Microsoft Buenos Aires: Bouchard 710 – 4° piso, Capital Federal

RSVP a través de este link.

SQL Server Upgrade & Assessment Guía Paso a Paso

Impactos: 64

En esta guía describiremos paso a paso como instalar y ejecuta las herramientas de MAP Toolkit y Data Migration Assistant para realizar un relevamiento y evaluar las instancias de SQL Server en situación de Upgrade.

Always On Availability Groups – Error Node Down. Event ID 1000 : Faulting Application name clussvc.exe

Impactos: 332

Para todo hay una primera vez, y esta fue el turno de un nodo caído en una solución de Always On Availability Groups en un Failover Cluster de 5 nodos distribuidos geográficamente.

La configuración de cada nodo se compone:

  • Virtual Machine – VMWare ESX Hypervisor
  • 2 Socket – 2 Processors
  • Windows Server 2012 R2 RTM
  • SQL Server 2016 SP1 Build 13.0.4001.0        
  • 1 Availability Group sobre 2 nodos
  • 1 Availability Group sobre 5 Nodos

Arquitectura

Luego de un reinicio inesperado sobre el nodo secundario del AG1, las bases de datos quedaron en un estado de Recovery Pending.

El nodo 2 de la solución quedó permanente en estado de Offline dentro del Failover Cluster Manager.

Los eventos que aparecieron en el Event Viewer y Failover Cluster Manager:

Event ID 1000

Event ID 1135

Para resolver esta situación, oficialmente Microsoft tiene un KB que repara esta situación. El mismo debe ser aplicado a nivel de Windows:  

https://support.microsoft.com/en-us/help/2984324/clussvc-exe-or-cluster-node-crashes-when-a-node-sends-a-message-to-ano

Una vez aplicado el KB en todos los nodos y reinicio correspondiente, automáticamente el servicio de Cluster inicia correctamente en todos los nodos y la solución de Always On vuelve a sincronizar a los nodos..

Moraleja de la historia, es importante tener un plan de actualización de Service Packs y KBs ya que se pueden evitar situaciones como ésta en Producción y evitar downtimes.