Nachhaltigkeit

Das KI-Paradoxon

Der ökologische Preis des Fortschritts

Im Angesicht des exponentiellen Wachstums

Während die Künstliche Intelligenz (KI) das Potenzial hat, globale Herausforderungen von der medizinischen Diagnose bis zur Klimamodellierung zu lösen, ist sie gleichzeitig ein gigantischer Ressourcenfresser. Wir erleben ein neues Paradoxon: Die Entwicklung und Skalierung der KI-Modelle. Die Leistungsfähigkeit wächst exponentiell und der ökologische Preis steigt ins Unermessliche. Schätzungen zufolge kann allein das Training eines einzigen grossen Sprachmodells so viel CO₂ verursachen wie fünf Autos über ihren gesamten Lebenszyklus. Angesichts der Klimakrise ist dieses Wachstum beängstigend. Bei morev•o begreifen wir diese Dynamik nicht als Schicksal, sondern als Herausforderung und Aufgabe. Wir integrieren die Sustainable Development Goals (SDGs) der Vereinten Nationen direkt in unseren Entwicklungszyklus.

Innovation und resiliente Infrastruktur (SDG 9)

Grösser ist nicht immer besser, obwohl ohne Grösse auch nichts geht. Unser Augenmerk liegt vor allem auf der Entwicklung und Implementierung von Small Language Models (SLMs). Diese spezialisierten Modelle erreichen bei klar definierten Aufgaben die Leistung von grossen Sprachmodellen, verbrauchen dabei aber nur einen Bruchteil der Ressourcen. Ein entscheidender Hebel ist hierbei die Modell-Optimierung. Durch mathematische Verfahren wie Pruning (das Entfernen unnötiger Verbindungen im neuronalen Netz) und Quantisierung (die Reduzierung der Präzision der Gewichte) senken wir die Modellkomplexität massiv. Studien zeigen, dass bereits eine minimale Reduktion der Genauigkeit um lediglich ein Prozent den Energiebedarf eines Modells um bis zu 77 % senken kann. In der Praxis bedeutet das, dass eine KI-Anwendung schneller reagiert, weniger Hardware benötigt und dennoch präzise Ergebnisse liefert. Indem wir spezialisierte Architekturen schaffen, die auf Standard-Hardware statt auf grossen, energiehungrigen GPU-Clustern laufen, ermöglichen wir den Zugang zu modernster Technologie, ohne in eine exorbitante Infrastruktur investieren zu müssen.

↑ Zum Inhaltsverzeichnis

Nachhaltige Produktion durch Fine-Tuning (SDG 12)

So viel KI wie nötig, so wenig Energie wie möglich. Das Rad muss nicht jedes Mal neu erfunden werden. Wir setzen auf die Anpassung bestehender, bewährter Modelle (Fine-Tuning), um energieintensive Neüntwicklungen von Grund auf zu vermeiden. Das initiale Pre-Training eines Modells wie GPT-3 verbraucht etwa 1.300 Megawattstunden Strom – das entspricht dem Jahresbedarf von etwa 400 durchschnittlichen Haushalten. Ein zielgerichtetes Fine-Tuning hingegen benötigt oft nur einen winzigen Bruchteil dieser Energie. Durch optimierte Fine-Tuning-Verfahren können die benötigten Gleitkommaoperationen (FLOPs) um bis zu 64 % reduziert werden. Die Modellpräzision bleibt gewahrt, die bereits vorhandene Intelligenz grosser Modelle wird genutzt und für den spezifischen Anwendungsfall massgeschneidert.

↑ Zum Inhaltsverzeichnis

Aktiver Klimaschutz & lokale Souveränität (SDG 13)

In der Softwareentwicklung wird oft vergessen, dass jede Zeile Code einen energetischen Fussabdruck hinterlässt. Wir bei morev•o nehmen die Verantwortung für unsere indirekten Emissionen (Scope 3) ernst. Ein zentraler Punkt ist die Abwägung zwischen Cloud und Lokalität. Wir analysieren für jedes Projekt individüll die ideale Infrastruktur. Cloud-Plattformen können durch Skaleneffekte und den Einsatz erneürbarer Energien bis zu 93 % energieeffizienter sein als klassische Rechenzentren. Doch dort, wo Datenschutz und Datensouveränität an oberster Stelle stehen, bieten lokale On-Premise- und Edge-Lösungen einen grossen Vorteil: Sie reduzieren den CO₂-intensiven Datentransfer über weite Strecken. Eine komplexe, unnotig breit formulierte Anfrage an ein generisches Modell kann bis zu 50-mal mehr CO₂ verursachen als ein optimierter, spezialisierter Prompt an ein effizientes Modell.

↑ Zum Inhaltsverzeichnis

Partnerschaften für die Ziele (SDG 17)

Nachhaltigkeit im KI-Sektor ist keine Einzeldisziplin, sondern eine Gemeinschaftsaufgabe. SDG 17 erinnert uns daran, dass wir die globalen Ziele nur durch Kooperation erreichen können. Wir verstehen uns als Partner unserer Kunden und begreifen ökologische Verantwortung und digitale Wettbewerbsfähigkeit nicht als Gegenspieler. Unternehmen, die auf diese Erkenntnis setzen, senken ihre Betriebskosten durch reduzierten Energieverbrauch und steigern gleichzeitig ihre Attraktivität für Investoren und Kunden, die Wert auf ESG-Kriterien (Environmental, Social, Governance) legen. Optimierte KI-Lösungen können eine bis zu 33 % höhere Produktivität ermöglichen, während der Ressourcenverbrauch gleichzeitig sinkt. Für morev•o ist High-End-KI dann am stärksten, wenn sie mit minimalen Ressourcen maximale Wirkung erzielt.

↑ Zum Inhaltsverzeichnis

Technische überlegungen

Modell-Kompression

Um KI-Modelle auf Standard-Hardware lauffähig zu machen, nutzen wir zwei primäre Verfahren. Post-Training Quantization (PTQ): Während Standardmodelle meist 32-Bit-Fliesskommazahlen (FP32) für ihre Gewichte nutzen, transformieren wir diese in 8-Bit (INT8) oder sogar 4-Bit-Formate. Dies reduziert den Speicherbedarf um das Vierfache und beschleunigt die Inferenz massiv. Beim strukturellen Pruning identifizieren wir tote Neuronen oder Verbindungen, die keinen signifikanten Beitrag zur Vorhersagequalität leisten. Durch das Entfernen dieser Redundanzen verringern wir die Anzahl der notwendigen Berechnungen (FLOPs) pro Anfrage.

Parameter-Efficient Fine-Tuning (PEFT)

Statt alle Milliarden Parameter eines Modells zu aktualisieren, setzen wir Techniken wie LoRA (Low-Rank Adaptation) ein. Dabei werden nur kleine, zusätzliche Matrizen trainiert, während das Hauptmodell eingefroren bleibt. Der Speicherbedarf während des Trainings sinkt drastisch (oft um über 90 %), was das Training auf einer einzelnen GPU statt auf einem Cluster ermöglicht. Das spart Energie und Kosten.

Inferenz-Optimierung am Edge

Um den Datentransfer (Scope 3 Emissionen) zu minimieren, optimieren wir Modelle für das Edge Computing. Wir reduzieren den Speicherhunger bei langen Textgenerierungen, damit die KI auch auf lokalen Servern ohne Latenzverlust antwortet. Durch intelligentes Zusammenfassen von Anfragen erhöhen wir die Auslastung der Hardware-Ressourcen, damit keine Energie im Leerlauf verschwendet wird.

Metriken der Nachhaltigkeit

Der Erfolg von Projekten kann anhand spezifischer KPIs gemessen werden, z.B. durch Messung des Jouleverbrauches einer einzelnen Nutzeranfrage (Energy per Inference – EPI) oder durch Abgleich der Rechenzeit mit dem aktüllen Strommix unter besonderer Berücksichtigung der Nutzung von Rechenzentren zu Zeiten hoher Einspeisung erneürbarer Energien (Carbon Intensity of Compute).

↑ Zum Inhaltsverzeichnis

Eine morev•o Fallsimulation: Effizienz im Kundenservice

Das Projekt

Automatisierte E-Mail-Klassifizierung und Antwortentwurf für einen Energiedienstleister.

Die Ausgangslage

Der Kunde nutzt eine API-Anbindung an ein marktübliches, grosses Sprachmodell (LLM), um monatlich ca. 50.000 Kundenanfragen zu sortieren. Die Probleme sind hohe laufende Kosten pro Anfrage, Datenschutzbedenken bei der Cloud-übertragung und ein massiver energetischer Overhead, da ein Alleskönner-Modell für eine spezialisierte Aufgabe (Klassifizierung) genutzt wird. Der CO₂-äquivalent ist vergleichbar mit dem täglichen Laden von ~10 Elektroautos.

Die morev•o Lösung

I. Modell-Wahl (SDG 9 & 12): Statt des 175-Milliarden-Parameter-Modells wird ein kompaktes Open-Source-Basismodell mit nur 7 Milliarden Parametern gewählt.
II. Fine-Tuning mit PEFT: Mittels LoRA wird das Modell spezifisch auf die Fachterminologie des Energiewesens (z.B. Zählerstände, Tarifwechsel) trainiert – wenige Stunden auf einer einzelnen Workstation statt Tage in einem Serverpark.
III. Quantisierung: Das Modell wird von FP16 auf 4-Bit (GGUF-Format) komprimiert, sodass die KI nun auf einem lokalen Server (On-Premise) läuft.
IV. Prompt-Optimierung: Vage Anweisungen werden durch hochpräzise System-Prompts ersetzt, die die Rechenzeit (Tokens) um 40 % reduzieren.

Die Ergebnisse

Metrik	Vorher (Standard-KI)	Nachher (morev•o)	Verbesserung
Latenz	~4,5 Sekunden	~0,8 Sekunden	− 82 %
Energiebedarf / Anfrage	12,0 Wh	1,4 Wh	− 88 %
Betriebskosten / Monat	~1.200 € (API-Fees)	~150 € (Strom/Wartung)	− 87 %
Datensouveränität	Cloud (extern)	Lokal (intern)	Maximal

Fazit: Produktivität wird gesteigert und der ökologische Fussabdruck ist fast vollständig neutralisiert.

↑ Zum Inhaltsverzeichnis