Abmilderung der Kosten von Ausfallzeiten im Zeitalter der künstlichen Intelligenz

Die Fähigkeit, Hardwareausfälle mit einem gewissen Grad an Genauigkeit vorherzusagen, bietet Dienstleistern mit großen Investitionen in die Informationstechnologie (IT) ein enormes Einsparpotenzial. Für Unternehmenskunden, die kostspielige HPC- (High Performance Computing) und KI-Plattformen (Künstliche Intelligenz) in großem Umfang betreiben, ist die Verfügbarkeit ihres Serviceangebots von entscheidender Bedeutung: Ein ausgefallenes System sperrt Kunden und Ressourcen aus und macht sie mit hohen Kosten unbrauchbar. Ein solcher Ausfall kann zu Umsatzeinbußen führen, die allgemeine Mitarbeiterproduktivität beeinträchtigen und der Marke eines Unternehmens schaden. Je nach Branche haben Studien gezeigt, dass die durchschnittlichen Kosten einer Stunde ungeplanter Ausfallzeit zwischen 100.000 Dollar pro Stunde und weit über 500.000 Dollar pro Stunde liegen können.[1] [2]

Eingabe der prädiktiven Fehleranalyse (PFA)

Durch die Auswertung großer Mengen historischer Daten kann die vorausschauende Fehleranalyse (PFA) wertvolle Erkenntnisse über die Wahrscheinlichkeit eines Ausfalls liefern. Chipsätze, Leiterplatten, Festplatten und Lötverbindungen haben alle eine begrenzte Lebensdauer. Trends in historischen Ausfalldaten können auf einen Zeithorizont für zukünftige Ausfälle hinweisen.

Für Großgeräte- oder Automobilhersteller (und ihre Kunden) kann PFA die Lebenserwartung von Anlagen verbessern und so künftige Ausgaben um bis zu 5 % senken. PFA kann auch genutzt werden, um Wartungsarbeiten zu planen, wenn Bediener und Techniker freier und billiger verfügbar sind, was zu Effizienzsteigerungen und Einsparungen von bis zu 20 % führt.[3]

Zahlreiche Faktoren können die Leistung von PFA beeinflussen. Abhängig von der durchschnittlichen Arbeitslast des betreffenden Systems, dem Umfang der verwendeten historischen Daten und den verwendeten Algorithmen für maschinelles Lernen (ML) oder Deep Learning (DL) kann die Genauigkeit der PFA in Frage gestellt werden.

Lineare und polynomiale Regressionen werden häufig zur Bestimmung der Restnutzungsdauer (RUI) verwendet, während Long Short-Term Memory (LSTM) und Random-Forest-Algorithmen mit unterschiedlichem Erfolg zur Verfeinerung der Ausfallvorhersage eingesetzt werden können. [4] [5] [6] 

PFA bietet zwar greifbare Vorteile, ist aber nicht narrensicher. Um das gleiche Maß an Serviceverfügbarkeit zu gewährleisten und den Wert von Investitionen zu schützen, ist es ratsam, jedes Supportprogramm, das PFA einsetzt, durch einen Fernwartungsvertrag zu ergänzen.

Ferngesteuerte Hände als Versicherungspolice

Der Einsatz von Remote Hands in Verbindung mit PFA bietet sowohl bei geplanten als auch bei ungeplanten Ausfällen Vorteile.  

Ein geplanter Ausfall kann lange im Voraus geplant werden, so dass die Ressourcen dann eingesetzt werden können, wenn sie frei verfügbar und am günstigsten sind. Remote Hands-Anbieter profitieren auch von Größenvorteilen: Da genügend Ressourcen zur Verfügung stehen, können erhebliche Einsparungen gegenüber der Einstellung, Schulung und Verwaltung eigener Techniker erzielt werden. (Ein voll ausgelasteter Techniker kann je nach den erforderlichen Fähigkeiten leicht sechsstellige Beträge oder mehr pro Jahr kosten).

Bei jedem ungeplanten Ausfall ist die Wiederherstellung des Dienstes das wichtigste Anliegen. Bei einem ungeplanten Ausfall ohne Fernwartungsvertrag dauert die Behebung länger. Die Ressourcen, die zur Fehlersuche und Problemlösung vor Ort eingesetzt werden, müssen zunächst überprüft und versichert werden, bevor sie zum Einsatz kommen können. Der Remote-Hands-Anbieter, der über umfangreiche Ressourcen verfügt, hat diese bereits überprüft und zugewiesen, was zu einer schnelleren Reaktionszeit führt.

Strategische Technologie-Investitionen

Je nach Art des Dienstes kann ein anhaltender Ausfall in einer großen Umgebung leicht Millionen von Dollar kosten. Ein Fernwartungsvertrag als solcher oder als Teil eines umfassenderen Disaster-Recovery-Plans, der PFA einschließt, kann als Ausgabenposten behandelt oder möglicherweise sogar als Teil eines größeren Software- oder Service-Abonnements kapitalisiert werden.

Eine geringfügige Erhöhung der Betriebskosten könnte Sie sehr wohl vor Verlusten in Millionenhöhe schützen, die mit einem längeren Serviceausfall verbunden sind.

Welchen Ansatz sollten Sie wählen, um eine Investition in den Remote-Hand-Support zu rechtfertigen? Die Finanzkennzahlen sind von Unternehmen zu Unternehmen unterschiedlich, aber es lassen sich einige Beispiele anführen.

Fallstudie

Sie evaluieren einen Vertrag über 250.000 $ für drei Umgebungen in Rechenzentren in Nordamerika für ein Jahr. Die geschätzten Kosten für Ausfallzeiten belaufen sich auf insgesamt 100.000 USD pro Stunde (einschließlich nicht genutzter oder ungenutzter Ressourcen, Umsatzeinbußen, Auswirkungen auf die Marke usw.). Das letzte Mal, als Sie einen Ausfall wegen defekter Hardware hatten, war Ihre Anwendung sechs Stunden lang nicht verfügbar. Der Nettoschaden für das Unternehmen betrug 600.000 Dollar.

Die Finanzabteilung eines Unternehmens wird IT-Ausgaben nur dann genehmigen, wenn die Investition eine Mindestrendite von 10 % erreicht (manchmal auch als "Minimum Acceptable Rate of Return" oder MAAR bezeichnet).

Ein erwarteter Vorteil eines Fernwartungsvertrags ist die Verkürzung der mittleren Wiederherstellungszeit (MTTR) bei einem ungeplanten Ausfall. Schätzungen gehen davon aus, dass die MTTR erheblich reduziert werden kann. Eine Verringerung der MTTR um 50 % bei dem letzten Ausfall hätte eine Einsparung von 300.000 $ bedeutet, da der Dienst drei Stunden schneller wiederhergestellt werden konnte.

Sollte die Finanzabteilung des Unternehmens den Kauf dieses Fernwartungsvertrags als Versicherungspolice genehmigen, um künftige ungeplante Ausfallzeiten zu reduzieren?

Wir werden eine einfache Formel für den ROI verwenden:

ROI = (Nettogewinn / Investitionskosten) * 100

In diesem Fall wäre der Nettogewinn die Einsparung von 300.000 $ abzüglich der Kosten für den Vertrag über 250.000 $, also 50.000 $.

ROI = (300.000$- 250.000$)/250.000$ * 100

50.000 $ geteilt durch 250.000 $ sind 20 %, also das Doppelte der von der Finanzverwaltung geforderten MARR.

(Bedenken Sie, dass diese Rendite nur für einen einzigen Ausfall gemessen wird. Bei mehreren ungeplanten Ausfällen in einem Jahr wären die Einsparungen wesentlich höher).

Die Finanzabteilung des Unternehmens sollte die Investition in den Fernsteuerungsvertrag genehmigen.

Zusammenfassung

Künstliche Intelligenz hat auf dem Gebiet der vorausschauenden Fehleranalyse große Fortschritte gemacht, und die Wirksamkeit der PFA wird in den kommenden Monaten und Jahren noch zunehmen.

In der Zwischenzeit bleibt die Notwendigkeit eines Investitionsschutzes bestehen. Eine strategische Investition in einen Fernwartungsvertrag kann dazu beitragen, die finanziellen Auswirkungen ungeplanter Ausfälle zu mindern und gleichzeitig die Flexibilität geplanter Ausfallzeitfenster zu nutzen.

Anmerkungen

[1 ] https://medium.com/@brijesh_soni/why-random-forests-outperform-decision-trees-a-powerful-tool-for-complex-data-analysis-47f96d9062e7

[2] Yadav, D. K., Kaushik, A., & Yadav, N. (n.d.). Vorhersage von Maschinenausfällen durch maschinelles Lernen und Deep-Learning-Algorithmen. ScienceDirect. https://www.elsevier.com/locate/smse

[3] https://www.bakerhughes.com/bently-nevada/blog/unplanned-downtime-key-disruptor-industry

[4] https://medium.com/@jatin2707/machine-failure-prediction-a-comprehensive-guide-524726c3b1fd

[5] https://www.atlassian.com/incident-management/kpis/cost-of-downtime

[6] Aus "Predictive Maintenance: Der Ansatz von Deloitte " https://www2.deloitte.com/content/dam/Deloitte/us/Documents/process-and-operations/us-predictive-maintenance.pdf

 

Themen: Ferngesteuerte Hände, maschinelles Lernen (ML), künstliche Intelligenz (AI), Deep Learning (DL), Produktivität, Rechenzentren, Cloud, prädiktive Fehleranalyse (PFA), rekurrente neuronale Netze (RNN), Hochleistungscomputer (HPC), Unternehmensfinanzierung, strategische Investitionen, lineare Regression, Long Short-Term Memory (LSTM), Zufallswälder, Portfoliotheorie.

Weiter
Weiter

NVIDIAs Revolution auf der Computex 2025: Verwandlung von Rechenzentren in KI-Fabriken