Da sind wir wieder: Neun Beiträge aus der Woche 20.10-26.10 (KW43-2025). Meine Favoriten aus hunderten Artikeln, zwei Beiträge davon mit allerlei Meinung versalzen, so wie immer Sonntags quer durch die „Wews der Woche“.
GlasfaserDSL? | AWS-Ausfall | Passierschein-A38 | 33k Lehrgeld | Adobe Commerce | Game News Week | WSUS Lücke | Medien Digital | Lokale LLM
Artikel 1
Spaghetti bestellt, Maccaroni bekommen? Willkommen bei 1&1 „Glasfaser-DSL“
Moin, liebe Highspeed-Jäger und alle, die schnelles Internet wollen!
Kennt Ihr das? Ihr bestellt im Restaurant die feinsten Spaghetti, lang, dünn, High-End-Nudel-Genuss. Geliefert bekommt Ihr aber nur die etwas derberen Maccaroni. Guter Versuch, aber eben nicht das, wofür Ihr bezahlt habt.
Genau dieses Gefühl beschreibt perfekt, was viele gerade mit der Werbung von 1&1 durchmachen. Es geht um das Zauberwort „Glasfaser“.
Wenn Glasfaser nicht Glasfaser ist
Werbung verspricht uns das volle Programm: Glasfaser, beste Geschwindigkeit, Zukunftstechnologie! Aber moment mal, was steckt da wirklich im Kleingedruckten bzw. im Kabel?
Genau das hat jetzt das Landgericht Koblenz auf den Tisch bekommen und entschieden: Die Werbung von 1&1 ist irreführend!
Der Knackpunkt:
- Bestellt: Die Kunden buchen Tarife, die mit der magischen Vokabel „Glasfaser“ beworben werden. Sie erwarten die reinrassige Faser bis in die Wohnung (FTTH, das Fiber to the Home), die locker 1.000 Mbit/s und mehr liefert.
- Geliefert: Oft bekommen die Kunden aber nur DSL-Anschlüsse oder sogenannte Vectoring-Anschlüsse.
Vectoring: Ein Turbo, aber kein Quantensprung
Vectoring ist zwar ein ordentlicher Turbo für die alte Kupferleitung, denn dabei liegt die Glasfaser immerhin bis zum grauen Verteilerkasten an der Straße (FTTC, also Fiber to the Curb). Aber vom Verteilerkasten bis zu Eurer FritzBox ist es eben Kupferkabel.
Das macht einen Riesenunterschied! Über Kupfer sind (je nach Entfernung) vielleicht maximal 250 Mbit/s drin. Mit echter Glasfaser (FTTH) sind wir heute schon bei 1.000 Mbit/s und mehr, und das ist erst der Anfang! Der Unterschied ist wie zwischen einem guten alten Diesel und einem Formel-1-Wagen.
Das Urteil: Schluss mit der Mogelpackung
Das Landgericht hat nun klargestellt: Wer Glasfaser verspricht, muss auch Glasfaser bis in die Wohnung liefern. Mit Begriffen wie „Glasfaser-DSL“ einer Wortschöpfung, die wie die Quadratur des Kreises klingt werden Verbraucher getäuscht.
Ramona Pop vom Verbraucherzentrale Bundesverband (VZBV) hat es auf den Punkt gebracht: „Kunden dürfen nicht mit falschen Highspeed-Internet-Verheißungen zum Vertragsabschluss bewogen werden.“
Was heißt das für Euch?
Wenn Ihr einen neuen Vertrag abschließt oder wechselt:
- Immer genau prüfen: Schaut im Verfügbarkeitscheck nicht nur auf die Geschwindigkeit, sondern auch auf die zugrunde liegende Technologie.
- Fragt nach FTTH: Wenn es wirklich Glasfaser sein soll, achtet darauf, dass von Fiber to the Home (FTTH) die Rede ist.
- Lasst Euch nicht blenden: Ein schnelles DSL-Ergebnis ist okay, aber es ist eben kein Glasfaser-Anschluss.
Der Weg zum echten Highspeed-Internet ist steinig, aber lasst Euch nicht mit Maccaroni abspeisen, wenn Ihr Spaghetti bestellt habt!
Artikel 2
AWS-Ausfall legt zahlreiche Dienste lahm
Am Montag, 20. Oktober 2025, erlebte Amazon Web Services einen massiven Ausfall in der Region Nord-Virginia (US-EAST-1), der über 14 Stunden andauerte und zahlreiche Cloud-Dienste weltweit beeinträchtigte.
Der Ausfall begann um 8:48 Uhr europäische Zeit und betraf zunächst die nur das Rechenzentrum US-EAST-1, dort konnten keine neuen EC2-Instanzen mehr gestartet werden, Network Load Balancer produzierten Verbindungsfehler, und zahlreiche AWS-Services wie Lambda, ECS, Amazon Connect und Redshift fielen aus. Auch dutzende externe Dienste die auf Amazon Cloud hosten wie der Messenger Signal oder Snapchat, Social Media Platformen Reddit und Facebook, Games, Finanzdienstleister und auch Amazons eigene Webseite waren stundenlang nicht mehr oder nur noch sehr eingeschänkt erreichbar.
Update vom Freitag:
Die Ursache: Race-Condition im DNS-Management
Amazon hat nun einen detaillierten Bericht veröffentlicht: Eine latente Race-Condition im automatischen DNS-Management-System von DynamoDB löschte durch unglückliches Timing alle IP-Adressen für den regionalen DynamoDB-Endpunkt. Da DynamoDB eine zentrale Komponente für unzählige AWS-Dienste ist, löste dies eine Kaskade von Ausfällen aus, die sich über den ganzen Tag hinzog.
Alle Details zu dem Vorfall habe ich im Blog aufgearbeitet und auch die Stellungnahme von Amazon und das PostMortem von Freitag in einem weiteren Post am Samstag nachgereicht.
Es gibt mittlerweile auch einige Videos zum Thema, unterhaltsam ist beispielsweise die WAN-Show mit den Jungs von LTT:
Artikel 3
Wunderbarer Artikel zur deutschen Bürokratie mit dem perfekten Titel „Passierschein A38“ bei heise.de
Hallo zusammen, liebe Unternehmer und alle, die täglich mit dem deutschen Papierkrieg kämpfen!
Kennt Ihr noch den „Passierschein A38“ aus Asterix? Ein Dokument, dessen einzige Funktion es ist, einen wahnsinnig zu machen, indem man es sich von Schalter zu Schalter besorgen muss. Herzlich willkommen im Jahr 2025, denn eine neue Studie zeigt: Die deutsche Bürokratie hat in den letzten drei Jahren ein absurdes Niveau erreicht!
Die Schock-Zahl: 325.000 neue „Bürokratie-Jobs“
Das renommierte Institut für Arbeitsmarkt- und Berufsforschung (IAB) hat in einer aktuellen Befragung (9.209 Betriebe, Q1 2025) eine Zahl veröffentlicht, die uns alle aufhorchen lässt:
Deutsche Unternehmen mussten in den letzten drei Jahren rund 325.000 zusätzliche Mitarbeiter einstellen, nur um die gestiegene Bürokratie zu bewältigen!
Das sind keine Jobs, die neue Produkte entwickeln oder Innovationen vorantreiben. Das sind Arbeitsplätze, die nur dafür da sind, Formulare auszufüllen, Gesetze zu interpretieren und Compliance zu managen.
Der Aufwand explodiert
Die wahrgenommene Bürokratiebelastung ist massiv gestiegen. Auf einer Skala von 1 (sehr niedrig) bis 10 (sehr hoch) bewerten die Betriebe den Aufwand heute durchschnittlich mit 6,8. Vor nur drei Jahren lag dieser Wert noch einen ganzen Punkt niedriger!
Besonders krass: 2022 gaben nur 4 % den Höchstwert 10 an. Heute sind es schon 14 %! Da brennt der Hut!
Die Übeltäter: DSGVO, IT-Sicherheit & Lieferkette
Was belastet Euch am meisten? Die Unternehmen nennen ganz klar:
- Die DSGVO: Der Datenschutz frisst massiv Ressourcen, und laut Bitkom-Umfrage klagen 97 % der deutschen Firmen über sehr hohen Aufwand bei der Umsetzung.
- EU-IT-Sicherheitsverordnungen: Neue Regeln für die IT-Sicherheit.
- Das Lieferkettengesetz: Auch wenn die Bundesregierung hier im September 2025 etwas entschärft hat – der Mehraufwand ist da.
Das kostet uns alle 146 Milliarden Euro!
Die 325.000 neuen Stellen sind nur die Personalkosten. Die gesamtwirtschaftlichen Folgen sind verheerend: Das ifo Institut hat berechnet, dass die entgangene Wirtschaftsleistung durch Bürokratie Ende 2024 bei unglaublichen 146 Milliarden Euro pro Jahr lag! Der Maschinenbau-Verband VDMA sieht das als Hauptgrund für die anhaltende Wachstumsschwäche in Deutschland.
Lichtblick am Horizont?
Ja, das Thema wird erkannt!
- Das Bürokratieentlastungsgesetz IV ist am 1. Januar 2025 in Kraft getreten (kleine Erleichterungen, z.B. bei Meldepflichten).
- Der neue Digitalminister, Karsten Wildberger, hat eine Modernisierungsagenda angekündigt, die die Kosten um 25 Prozent senken soll.
Diskutiert wird auch die „One in, two out“-Regelung: Für jedes neue belastende Gesetz müssen zwei alte, gleichwertige Belastungen wegfallen. Das wäre ein echter Game Changer!
Die IAB-Studie zeigt: Produktive Unternehmen beißen in den sauren Apfel und stellen ein. Weniger produktive Betriebe kommen dadurch aber in Existenznöte. Es geht also um die Wettbewerbsfähigkeit von uns allen!
Was meint Ihr? Ist die „One in, two out“-Regelung der richtige Weg? Oder welche Gesetze müsste man sofort in die Tonne treten?
Artikel 4
Urteil: Vater muss 33.000 Euro für In-App-Käufe des Sohnes zahlen
Ein Vater aus Baden-Württemberg muss über 33.000 Euro für In-App-Käufe zahlen, die sein minderjähriger Sohn über fast zwei Jahre auf einem Tablet getätigt hat. Das entschied das Landgericht Karlsruhe (Az. 2 O 64/23).
Mehr als 1.200 Käufe in einer Spiele-App bezahlt über das Google-Konto des Vaters mit hinterlegter Kreditkarte. Die Klage auf Rückzahlung scheiterte. Details sowie eine Anleitung wie ihr dass verhindern könnt habe ich diese Woche auch bereits im Blog veröffentlicht.
Das Urteil
Das Gericht sah eine „Anscheinsvollmacht“: Da die Käufe fast zwei Jahre liefen, erweckte der Vater den Eindruck, sein Sohn sei berechtigt. Entscheidend: Der Vater hatte keine Sicherheitsmechanismen wie Kaufbestätigungen oder Familienfreigaben aktiviert – Verletzung der Sorgfaltspflicht.
Was Eltern tun sollten
- Kaufbestätigungen aktivieren
- Familienfreigabe (Apple) oder Family Link (Google) einrichten
- Separate Kinderkonten ohne Zahlungsmittel nutzen
→ Ausführliche Anleitung zur Kindersicherung
Quelle: PC-WELT | Az.: LG Karlsruhe 2 O 64/23
Artikel 5
Online-Shop in Gefahr! Kritische Lücke in Adobe Commerce & Magento wird aktiv angegriffen:
Achtung, liebe Shop-Betreiber, Entwickler und alle, die E-Commerce-Plattformen betreuen!
Nachdem wir gerade über Bürokratie, lahme Internetleitungen und Elternfreigaben gesprochen haben, kommt jetzt der nächste Schocker aus der Cyber-Welt. Wenn Ihr Adobe Commerce (ehemals Magento) nutzt, müsst Ihr jetzt handeln und sofort patchen!
Adobe hat im September Updates für eine kritische Sicherheitslücke veröffentlicht, die inzwischen aktiv im Internet angegriffen wird. Die Zeit drängt!
„SessionReaper“ -> der Albtraum für Online-Shops
Die Schwachstelle (CVE-2025-54236) hat einen extrem hohen Gefahren-Score von 9.1 (Kritisch). Die IT-Sicherheitsforscher von NullSecurityX haben ihr den gruseligen Namen „SessionReaper“ gegeben.
Was macht dieser „SessionReaper“?
Es handelt sich um eine sogenannte Deserialisierungs-Schwachstelle, die extrem gefährlich ist. Angreifer können sie nutzen, um:
- Sessions zu übernehmen: Sie können sich in die Sitzung eines anderen Nutzers (oder sogar Admins!) einklinken.
- Remote Code Execution (RCE): Unter bestimmten Bedingungen (z.B. bei dateibasiertem Session-Speicher) können die Hacker sogar Code über das Netzwerk ausführen! Das bedeutet, sie hätten die vollständige Kontrolle über Euren Shop.
Das Gefährliche daran: Es ist keine Nutzerinteraktion nötig. Die Angreifer können die Schwachstelle über gängige API-Endpunkte (REST, GraphQL, SOAP) ausnutzen.
Über 60 Prozent der Shops sind noch verwundbar!
Die IT-Analysten von Sansec schlagen Alarm, denn sie beobachten seit Mittwoch aktive Angriffe auf diese „SessionReaper“-Lücke.
Und die traurige Statistik: Bisher haben nur 38 Prozent der Adobe Commerce und Magento Shops die nötigen Sicherheitsupdates installiert!
Das heißt: Mehr als 60 Prozent aller Shops sind derzeit ein leichtes Ziel für Cyberkriminelle!
Proof-of-Concept-Exploits sind bereits öffentlich im Umlauf. Das bedeutet, automatisierte Scanner durchkämmen gerade das Internet, um ungepatchte Shops zu finden und anzugreifen.
Euer dringender Aufruf zum Handeln: Jetzt Patchen!
Wenn Ihr einen Adobe Commerce oder Magento Shop betreibt, schaut bitte SOFORT nach, ob die im September veröffentlichten Sicherheitsupdates bei Euch installiert sind.
- Prüfen: Ist der Shop auf dem neuesten Stand?
- Patchen: Holt die im September veröffentlichten Updates umgehend nach.
- Vorsicht: Rechnet damit, dass die Angriffe in den nächsten Tagen massiv zunehmen werden.
Lasst Euren Online-Shop nicht zur leichten Beute werden! Ein kompromittierter Shop bedeutet im besten Fall Datenklau, im schlimmsten Fall eine komplette Geschäftsschädigung.
Habt Ihr Euren Shop schon gepatcht? Oder arbeitet Ihr gerade daran?
Artikel 6
Gaming-Woche im Überblick: Strahlendes Ödland, sarkastische Kolonien, dicke Dinos, Vampire & mehr!
Moin, liebe Zocker-Community!
Was für eine Woche! Zwischen Notfall-Patches und absurder Bürokratie gibt es zum Glück auch auf der Couch gute Nachrichten. Diese Woche steht ganz im Zeichen von großen Namen, heiß erwarteten Releases und einer gehörigen Portion Nostalgie. Packen wir’s an: hier sind die wichtigsten Game News der Woche!
Happy 10th Birthday! Fallout 4 Anniversary Edition kommt! ☢️
Das Ödland ruft zurück! Bethesda feiert das zehnjährige Jubiläum von Fallout 4 mit einer dicken Anniversary Edition.
- Release: Markiert Euch den 10. November 2025 fett im Kalender!
- Was ist drin? Das ultimative Komplettpaket! Die Anniversary Edition enthält nicht nur das Hauptspiel und alle sechs offiziellen Erweiterungen (Far Harbor, Nuka-World etc.), sondern auch über 150 Inhalte aus dem Creation Club. Denkt an neue Waffen, zusätzliche Quests und sogar neue Hunderassen für Dogmeat!
- Plattformen: Verfügbar für Xbox Series X|S, Xbox One, PS5, PS4 und PC.
- Switch-Fans aufgepasst: Es kommt sogar eine Version für die kommende Nintendo Switch 2, allerdings erst 2026.
Die perfekte Gelegenheit, falls Ihr das postapokalyptische Boston noch nicht erkundet habt, oder einfach nochmal mit allen Goodies losziehen wollt!
Ready for Launch: The Outer Worlds 2 steht in den Startlöchern! 🪐
Die Korporationen von Halcyon bekommen bald Konkurrenz: The Outer Worlds 2, die heiß erwartete Sci-Fi-RPG-Fortsetzung von Obsidian Entertainment, steht kurz vor dem Release!
- Der Termin: Der offizielle Launch ist am 29. Oktober 2025, perfekt für alle, die nach einer großen Rollenspiel-Erfahrung suchen.
- Day-One-Überraschung: Für alle Xbox Game Pass-Abonnenten gibt es gute Nachrichten: Das Spiel ist direkt ab Tag 1 im Abo enthalten! (Auch für PC Game Pass).
- Über das Spiel: Nachdem The Outer Worlds mit seinem bissigen Humor und seiner Anti-Corporate-Einstellung viele Fans gewonnen hat, verspricht der zweite Teil ein noch größeres und besseres RPG-Erlebnis im neuen Sternensystem Arcadia.
Die Reviews zur Premium Edition, die einen Early Access ermöglichte, sind bereits aufgetaucht und versprechen einen starken Nachfolger. Nur noch wenige Tage bis zum Start in die neue, galaktische Kolonie!
Finally: Cyberpunk 2077 Apple MacOS Gaming „News“ gibt es auch!
Der seit Dezember 2020 für Windows, Playstation und Xbox Hit „Cyberpunk 2077“ von CD Project Red hat nun endlich auch MacOS erreicht. YAY!
Wenn ihr eurem Geldbeutel aber einen Gefallen tun wollt, kauft bitte nicht im Apple App Store ein, sondern über die üblichen anderen Verdächtigen. Das spart euch mindestens 3 Starbucks Kaffee Spezialitäten 😉
Weitere Gaming-Highlights der Woche (KW 43, Oktober 2025)
Aber das war noch nicht alles! Die Woche hatte einige weitere coole Releases:
- Jurassic World Evolution 3: Für alle Strategie- und Dino-Fans ist der dritte Teil der Park-Simulation von Frontier bereits am Start (seit 21.10.).
- Vampire: The Masquerade – Bloodlines 2: Nach langer Wartezeit konnten die Rollenspiel-Fans mit der Day 1 Edition ebenfalls am 20. Oktober endlich in die düstere Welt von Seattle eintauchen.
- Ninja Gaiden 4: Das rasante Action-Spektakel ist ebenfalls am 21. Oktober für Xbox und PC erschienen; direkt mit einem Day-One-Launch im Game Pass!
Fazit der Woche: Der Oktober hält, was er verspricht, nämlich jede Menge hochkarätige Releases, von denen einige sogar direkt im Abo landen.
Auf gehts, GG WP und allen ein schönes Wochenende.
Artikel 7
Kritische WSUS-Lücke! Sofort patchen denn Angriffe laufen bereits!
Ihr habt es vielleicht schon mitbekommen: Microsoft hat am Freitagmorgen außerplanmäßig Notfall-Patches rausgehauen. Der Grund ist brandheiß und betrifft den Windows Server Update Service (WSUS)!
Es geht um eine kritische Sicherheitslücke mit der Kennung CVE-2025-59287 (CVSS-Score 9.8), die es Angreifern erlaubt, Code über das Netzwerk auszuführen, und zwar ohne Authentifizierung.
Darum ist jetzt Eile geboten!
Die Sache ist leider nicht nur theoretisch:
- Exploit-Versuche gesichtet: Die IT-Sicherheitsforscher von Huntress haben bereits aktive Angriffe im Internet beobachtet. Die Hacker zielen auf WSUS-Dienste, die die Ports 5830/5831 offen im Netz zugänglich gemacht haben. Sie nutzen speziell präparierte Anfragen, um die Lücke auszunutzen und dann Base64-kodierte PowerShell-Skripte auszuführen. Die klauen dann sensible Netzwerk- und Nutzerdaten und senden sie an einen Remote-Server.
- Spielend leicht auszunutzen: Der bekannte IT-Sicherheitsforscher Kevin Beaumont (GossiTheDog) hat die Schwachstelle selbst im Labor getestet. Sein Fazit auf Mastodon: Es war kinderleicht, Remote Code Execution (RCE) auf dem WSUS-Server zu bekommen. Und noch schlimmer: Er konnte die Update-Angebote manipulieren und bösartige Updates an die Clients im Netzwerk verteilen! Stellt euch mal vor, ein Angreifer schiebt Ransomware über euren eigenen Update-Mechanismus aus – Albtraum-Szenario!
Was müsst Ihr jetzt tun?
Keine Zeit verlieren! Wenn Ihr WSUS im Einsatz habt, solltet Ihr die Notfall-Updates von Microsoft sofort installieren.
Das Update steht für Windows Server ab 2012 zur Verfügung:
- Windows Server 2025 (KB5070881)
- Windows Server, version 23H2 (KB5070879)
- Windows Server 2022 (KB5070884)
- Windows Server 2019 (KB5070883)
- Windows Server 2016 (KB5070882)
- Windows Server 2012 R2 (KB5070886)
- Windows Server 2012 (KB5070887)
Die offizielle Beschreibung der Lücke ist: „Die Deserialisierung nicht vertrauenswürdiger Daten im Windows Server Update Service ermöglicht es einem nicht autorisierten Angreifer, Code über ein Netzwerk auszuführen.“
Wichtig zu wissen:
- Betroffen sind alle unterstützten Windows Server Versionen (ab Server 2012).
- Nach der Installation des Stand-alone-Updates ist ein Neustart des Servers erforderlich.
- Ihr solltet anhand der von Huntress gelieferten Indicators of Compromise (IOCs) in Euren Weblogs und WSUS-Protokollen prüfen, ob Eure Systeme möglicherweise schon angegriffen wurden.
Indicators of Compromise
| Item | Description |
| C:\Program Files\Update Services\Logfiles\SoftwareDistribution.log | WSUS log file to review indicators of compromise |
| C:\inetpub\logs\LogFiles\W3SVC*\u_ex*.log | HTTP service log files to review indicators of compromise |
| w3wp.exe | HTTP worker process binary |
| wsusservice.exe | WSUS service process binary |
| whoami;net user /domain | Observed enumeration command |
| net user /domain; ipconfig /all | Observed enumeration command |
Unser dringender Rat: Setzt diese Patches ganz oben auf Eure Prioritätenliste! Bevor ein Angreifer Euren WSUS in eine Verteilstelle für Schadsoftware verwandelt, schließt das Tor!
Bleibt sicher und patched fleißig!
Artikel 8
Medienstaatsvertrag: Große Reform für das digitale Zeitalter geplant
Die Rundfunkkommission der Länder arbeitet an einer umfassenden Neuordnung der deutschen Medienregulierung.
Ein aktuelles Diskussionspapier zeigt: Die Medienordnung soll fit gemacht werden für KI, Plattformen und algorithmische Vermittlung.
Die wichtigsten geplanten Änderungen:
- KI-Regulierung: ChatGPT & Co. sollen zur Quellenangabe verpflichtet werden, Rechteinhaber eine Vergütung für KI-Training erhalten
- Faire Werbemärkte: Gleiche Regeln für Rundfunk und digitale Plattformen, Lockerung überholter Beschränkungen
- Bessere Auffindbarkeit: Qualitätsjournalismus soll in Feeds, Timelines und KI-Antworten privilegiert ausgespielt werden
- Schutz vor Manipulation: Kennzeichnungspflicht für Bots, Fake Accounts und bezahlte Inhalte
- Medienkonzentration: Auch Plattformmacht und Verbreitungsstrukturen sollen künftig erfasst werden
Die Reform versucht den Spagat zwischen Innovationsförderung und dem Schutz journalistischer Standards in einer von Tech-Giganten dominierten digitalen Welt.
→ Nächste Woche erscheint eine ausführliche Analyse mit allen Details zu den Reformplänen
Artikel 9
Lokale LLM als Chatbot einfach und schnell privat auf deinem Rechner
Dieses Video von c’t 3003 „Lokale KI ist jetzt WIRKLICH brauchbar (und auf dieser Hardware läuft sie)“ befasst sich ausführlich mit dem Betrieb von großen Sprachmodellen (LLMs) direkt auf dem eigenen Rechner (lokale KI oder Open Weights Modelle) und liefert Empfehlungen zur benötigten Hardware und Software. Dies ist eine prima Ergänzung zu meinem Artikel zu LM Studio.
Zusammenfassung:
Optimale Hardware für lokale KI
Die wichtigste Komponente für die Geschwindigkeit beim lokalen Betrieb von LLMs (Inferenz) ist die Speicher-Datentransferrate der Grafikkarte.
- Grafikspeicher (VRAM) ist entscheidend: Wenn das Sprachmodell vollständig in den schnellen VRAM der Grafikkarte passt, ist die Geschwindigkeit (Tokens pro Sekunde) am höchsten.
- Empfehlungen für den Grafikkartenspeicher (VRAM):
- Kleine Modelle (< 24 GB): Eine einzelne NVIDIA RTX 3090 (gebraucht, ca. 700 €) oder 4090 reicht aus und wird empfohlen, da sie schnellen Speicher (GDDR6X) bieten und CUDA unterstützen.
- Große Modelle (bis 72 GB): Für sehr große Modelle wird ein System mit mehreren gebrauchten RTX 3090 Grafikkarten empfohlen, da diese noch NVLink (zum Bündeln des Speichers) unterstützen, was bei der 4000er Generation entfallen ist.
- Alternative Hardware:
- AMD Strix Halo (Ryzen AI Max Plus 395): Bietet für ca. 1800 € eine ähnliche Leistung in Bezug auf Tokens/Sekunde wie eine wesentlich teurere Nvidia DGX Park.
- Apple Silicon (Macs): Rechner mit M3 Max und 120 GB Shared Memory können sehr gute Geschwindigkeiten erzielen, da sie über schnellen, gemeinsamen Speicher verfügen.
- Achtung bei Nvidia DGX Park: Trotz des großen und schnellen Speichers liefert die DGX Park in Tests mit dem GPT-OSS 120B Modell geringere Geschwindigkeiten (Token/Sekunde) als selbstgebaute Rigs mit 3090ern.
2. Software und Modelle
- LM Studio: Wird als die aktuell beste Plattform zum einfachen Anzapfen (Prompting) von Sprachmodellen auf Linux, Windows und MacOS empfohlen. Es bietet einfache Einstellmöglichkeiten für Offloading (Auslagerung auf die GPU) und Kontextlänge.
- Quantisierung: Die Modelle liegen in verschiedenen Quantisierungsstufen vor (z.B. 4 Bit), was die Dateigröße reduziert und die Geschwindigkeit erhöht. Im LM Studio sieht man, welche Versionen am besten in den eigenen GPU-Speicher passen.
- Modellempfehlungen:
- Qwen 3 Coder 34B: Ein sehr kleines (2,5 GB großes) Modell, das auf „jeder Kartoffel“ läuft und beim Programmieren (Coding) erstaunlich gute Ergebnisse liefert.
- GPT-OSS 120B (von Omi): Ein sehr großes Modell, das gute Faktengenauigkeit liefert.
- Mistral Small 3.2: Bietet ebenfalls korrekte Fakten, z.B. über das c’t Magazin.
3. Anwendungsfälle und Vorteile lokaler KI
Nachteil: Lokale Modelle können nicht von Haus aus im Netz suchen, was Cloud-LLMs wie ChatGPT oder Gemini standardmäßig tun. Dies führt bei Wissensfragen ohne RAG-Funktion oft zu falschen oder veralteten Antworten.
Coding-Assistenz: Lokale Modelle können mit Software wie Continue oder Cody in Editoren wie Visual Studio Code eingebunden werden, um beim Programmieren zu helfen.
RAG (Retrieval-Augmented Generation): Funktioniert gut für die Analyse lokaler Dokumente (z.B. PDFs). Man kann komplexe Fragen zu einem Dokument stellen, ohne es ins Internet hochladen zu müssen (Datenschutz).
Vision-Modelle: Einige kleine Modelle, wie das nur 12 Milliarden Parameter große Gemma 3 von Google, können Bilder verstehen und verarbeiten.
Da auch diese Woche der Kollege Sun-Tsu aus der IT Sicherheit noch im Urlaub ist muss wieder ein anderer Lückenfüller einspringen: Kamik423 auf Github hat sich in bester deutscher Behördenvorgabe an die Arbeit gemacht.
Und bitte nicht vergessen: „Eintragen einer Galeere? Da sind sie hier falsch! Wenden Sie sich an die Hafen-Kommandantur, unten im Hafen.“