Strom und Klimatechnik – ein nicht ganz banaler Zusammenhang

15.04.2020

Datenverarbeitung und Notstrom, das gehört irgendwie untrennbar zusammen, egal ob sich die Rechner in Serverräumen, Rechenzentren, Data Centern oder wo auch immer befinden. Eine Ausnahme bildet hier höchstens die sprichwörtliche Besenkammer, diese lassen wir aber in der folgenden Betrachtung einmal außen vor:

Oft sind es wichtige oder gar "missionskritische" Prozesse, die durch die Rechnertechnik ermöglicht, unterstützt oder ganz übernommen werden. Dies setzt eine gewisse Robustheit oder auch zu neudeutsch Resilienz der unterstützenden Technologien gegen Störungen voraus – und dazu zählen vorrangig und insbesondere die Versorgung mit elektrischer Energie und das Abführen der anfallenden Verlustwärme. Der Ausfall von Ersterem führt zum unmittelbaren Stillstand der Verarbeitung und somit zum Ausfall des Prozesses – ganz schlecht. Bleibt Zweiteres aus, gibt es in vielen Systemen zwar eine gewisse Trägheit, das Überhitzen eines Rechners geht je nach Technologie nicht ganz so abrupt vor sich. Das sichere Ende der Datenverarbeitung passiert somit zwar zeitverzögert, aber trotzdem sehr zweifellos.

Diese Sachverhalte sind hinreichend bekannt und werden von Fachleuten durch das Einplanen von Notsystemen gewürdigt. Hierzu gehören insbesondere die USV (unterbrechungsfreie Stromversorgung) und die NEA (Netzersatzanlage). Letztere wird in der Regel mit fossilem Brennstoff befeuert und treibt einen Generator an. Die Versorgung kann bei entsprechender Kraftstoffbevorratung bzw. entsprechendem Nachschub quasi ewig dafür sorgen, dass die Rechner Strom bekommen.

Die Rechner sind jedoch nur die halbe Miete, genauso ist die Klimatisierung gefragt! Konkrete Analysen in bestehenden Anlagen zeigen jedoch, dass ein ganzheitliches Umsetzen einer funktionierenden Notstromversorgung eine Herausforderung zu sein scheint. Dabei lässt sich ganz abstrakt betrachtet der Notstrombedarf auf drei wesentliche Funktionsgruppen beschränken:

  1. Die Rechner selbst
  2. Die Klimatisierung der Rechner
  3. Die Klimatisierung der technischen Infrastruktur

Als wichtigste Funktionsgruppe ist die Notversorgung der Rechner den allermeisten Planern und Betreibern bewusst. Entsprechend werden USVen eingesetzt, die die sensible Rechentechnik so lange mit Strom versorgen, bis die NEA angelaufen und einsatzbereit ist – ein Prozess, der binnen 15 Sekunden abgeschlossen sein sollte.

Die Klimatisierung hingegen ist offenbar nicht mehr ganz so trivial. Immer wieder zeigen Schwachstellenanalysen auf, dass es, je weiter man sich (entweder räumlich oder organisatorisch) vom Rechenzentrum wegbewegt, immer dünner wird mit dem Thema Notstrom. Umluftkühlgeräte (ULKs) in oder neben Rechnerräumen werden meist noch NEA-versorgt, schließlich ist der direkte Zusammenhang zwischen IT-Betrieb und Klimatechnik noch den meisten bewusst. Doch leider brauchen solche Geräte noch weitere Funktionsgruppen, um zu funktionieren. Denn ULKs übertragen die anfallende Wärme nur auf ein anderes zumeist flüssiges Medium, das seinerseits ebenso die Wärme irgendwohin "abliefern" muss, um nicht selbst zu überhitzen.

Dazu dienen je nach Technologie entweder zentrale Kälteerzeuger mit nachgeschalteten Rückkühlwerken irgendwo draußen oder direkte Rückkühler im Außenbereich. Und auf dem Weg dorthin verblasst das Bewusstsein, dass diese Komponenten existenziell wichtig für den IT-Betrieb sind. Oft sieht man, dass solche Elemente entweder gar nicht oder nicht mit hinreichenden Redundanzen notstromversorgt sind. Dann kann das Gesamtsystem die Wärme nicht mehr "loswerden", überhitzt an irgendeiner Stelle und fällt aus. So ist dann kein gesicherter IT-Betrieb mehr möglich – die Prozesse geraten ins Stocken.

Und natürlich muss das flüssige Medium, das die Wärme vom Rechnerraum zum Rückkühler bringen soll, auch umgewälzt werden. Die erforderlichen Pumpen gehören in ihrer Gesamtheit ebenso auf die Liste mit existenziell notwendigen notstromrelevanten Baugruppen.

Noch weiter weg vom Bewusstsein liegt oft der Klimatisierungsbedarf der technischen Infrastruktur, wie beispielsweise zentraler USV-Systeme. Da diese Geräte permanent Wechselstrom in Gleichstrom wandeln und umgekehrt, erzeugen sie ebenso wie IT-Systeme Verlustwärme, die abgeführt werden muss. Unterlässt man dies, überhitzt ein USV-System und schaltet sich in den Bypass-Betrieb. Dies ist eine Betriebsart, die die unmittelbare Versorgung der Rechner noch nicht einschränkt, kleinste Netzunregelmäßigkeiten hingegen kommen in diesem Modus ungefiltert bei der dann ungeschützten Rechentechnik an. Wer nun angibt, dies bewusst so herbeizuführen, um beispielsweise übermäßige Notstromkapazitäten zu vermeiden, übersieht, dass das Rückschalten in den Normalbetrieb so unter bestimmen Voraussetzungen nicht zu bewältigen ist.

Denn nehmen wir an, der Betrieb hat sich nach einem Netzausfall wie folgt stabilisiert: Server und die gesamte IT laufen im NEA-Betrieb, die Klimatisierung der IT-Räume ebenfalls. Nur die USV-Kühlung ist ausgefallen, da sie nicht notstromberechtigt ist. Folglich werden die USV-Räume immer wärmer und die Anlagen schalten irgendwann auf Bypass. Nun kommt der Strom zurück und die Versorgung soll von der NEA wieder auf die reguläre Speisung durch Transformatoren geleitet werden. Im Idealfall erfolgt diese sogenannte "Rückübergabe" unterbrechungsfrei – wenn alles funktioniert.

Moderne NEAs verfügen dazu über die Funktion der "Rückübergabe-Synchronisation". Doch längst nicht jede bestehende Anlage hat diesen Komfort eingebaut. Dann erfolgt das Rückschalten mit einer kurzen Unterbrechung – so wie sie eine USV abfangen würde. Nur leider ist unsere USV durch Hitzeschock gerade im Bypass und somit unpässlich. Was passiert? Die Rechner bleiben beim Rückschalten auf das reguläre Netz stehen, und das, nachdem die NEA lange Zeit funktioniert hat! Das kann nicht befriedigend sein.

Nun könnte man an dieser Stelle abschließen mit dem Hinweis auf ganzheitliche gewerkeübergreifende Konzipierung und Planung. Jedoch darf hier einmal mehr der Hinweis auf die unbedingte Notwendigkeit auf Funktions- und Resilienztests nicht fehlen. Denn die Wirksamkeit einer Schutzmaßnahme weist man nicht durch Beschreibungen, Schaltschemen und Pläne nach, sondern durch konkrete Tests. Bei diesen Tests wird nichts simuliert, sondern real abgeschaltet. Also Strom aus! Und erst dann sieht man, was ausgeht und was anbleibt. Jedes Mal gibt es Überraschungen und Erstaunen bei den Beteiligten.

So banal also der Zusammenhang zwischen Stromversorgung und Klimatisierung zu sein scheint, so komplex ist er bei vielen Beteiligten und vielen Fachrichtungen. Gut beraten ist hier, wer eine qualitätssichernde Instanz zur Seite hat, die die vorab verabschiedeten Verfügbarkeitsanforderungen auf dem Schirm hat und konsequent deren Umsetzung überwacht und einfordert und die Umsetzung nach der Realisierung oder auch als wiederkehrenden Prozess prüfen kann.

: : : Jörg Schulz : : :


Dieser Beitrag ist Bestandteil von: