De afgelopen weken gingen er meerdere berichten rond over een specifieke Windows 11-update: KB5063878. De inmiddels beruchte update in kwestie zou ervoor zorgen dat ssd's crashen en pas weer functioneren na een reboot. In een enkel geval zou zelfs de data op de ssd corrupt zijn geraakt, met dataverlies als gevolg.
Het groeide sindsdien uit tot een ware soap. Aanvankelijk werden ssd's met controllers van Phison als probleemfactor genoemd, hoewel later ook drives met andere ssd-controllers getroffen zouden zijn. Tegelijkertijd werden schijnbaar neppe Phison-documenten verspreid, waarover een rechtszaak is aangespannen.
Inmiddels heeft Microsoft laten weten dat het geen problemen heeft kunnen vinden met zijn Windows-update. Ook Phison, een fabrikant van ssd-controllers, zegt dat het de problemen niet wist te reproduceren na 'meer dan 4500 cumulatieve testuren' en '2200 testcycli', waarbij het bedrijf gebruikers wel aanraadde om goede heatsinks en heatpads op hun ssd's te installeren.
Hoewel het geen extreem wijdverspreid probleem lijkt te zijn, bleven er toch hier en daar wat berichten verschijnen op sociale media. Daarom besloten wij zelf de nodige testuren aan deze kwestie te besteden. Op een testbench probeerden we meerdere ssd's uit in de hoop meer duidelijkheid te kunnen scheppen over de uitvalproblematiek.
We zijn inmiddels enkele dagen verder en hebben interessante data verzameld. We kunnen geen volledig uitsluitsel geven over de precieze oorzaak, maar we hebben wel een hypothese daarvoor; die kun je hieronder lezen. We kunnen bovendien wel met zekerheid zeggen dat de problemen niet veroorzaakt zijn door de KB5063878-update en mogelijk ook niet door Windows in het algemeen.
Onze testmethode
We kozen ervoor om voor dit artikel zo dicht mogelijk bij de oorspronkelijke oorzaak te blijven: grote bestandsoverdrachten van meer dan 50GB. Voor onze tests gebruikten we dan ook een groot videobestand (~59GB) dat herhaaldelijk naar de ssd's werd schreven. We deden dat per ssd en dus niet naar meerdere ssd's tegelijkertijd. Hoewel dat laatste sneller zou zijn, kan dat ook bottlenecks in de lees- en schrijfsnelheid veroorzaken, wat we wilden voorkomen. We hebben daarom iedere ssd afzonderlijk getest.
We hebben verschillende Windows-installaties geprobeerd: een verse mét de update geïnstalleerd en een oude Windows 11-installatie van het recentste Desktop Best Buy Guide-systeem. Die installatie is sinds juli niet geüpdatet, dus was de KB5063878-update van 12 augustus daarop niet geïnstalleerd. Ook de gelieerde previewupdate (KB5062660) uit juli stond niet geïnstalleerd op dat systeem. Voor de zekerheid hebben we deze installatie tijdens het testen enkel gebruikt zonder internetverbinding, om onverwachte updates tijdens het herstarten te voorkomen. Later probeerden we ook Linux Mint 22 met één van de probleemdrives, waarover straks meer.
Onlangs publiceerde JayzTwoCents ook een video, waarin hij soortgelijke problematiek uitlichtte tijdens het benchmarken van F1 24, weliswaar op een enkele drive. Een opvallende wending; de youtuber gaf zelf ook aan dat deze oorzaak sterk afwijkt van de problematiek die anderen melden. Voor nu richten we ons op de oorspronkelijk gemelde oorzaak: grote schrijfacties.
De line-up: negen verschillende ssd's
We hebben tests uitgevoerd met negen verschillende ssd's. Veel daarvan stonden op de lijst met mogelijk getroffen drives, of lijken daar sterk op. We testten bijvoorbeeld de Crucial P3 in plaats van de P3 Plus, aangezien we die laatste niet hadden. Beide drives hadden wel dezelfde controller en nand, met de PCIe 3.0-interface van de P3 als enige downgrade ten opzichte van de P3 Plus.
In onze opstelling zitten zes verschillende ssd's met een Phison-controller, twee van Silicon Motion en een van WD. Phison is dus sterk vertegenwoordigd ten opzichte van andere fabrikanten; in eerste instantie werden controllers van dat bedrijf als concrete probleemfactor genoemd, hoewel dat later werd ontkracht. Phison levert bovendien controllers aan veel fabrikanten.
Alle geteste ssd's en hun controllers | ||
---|---|---|
Ssd | Controller | Interface |
XPG SX8200 Pro 512GB | Silicon Motion SM2262G | PCIe 3.0 |
XPG SX8200 Pro 2TB | Silicon Motion SM2262ENG | PCIe 3.0 |
Corsair MP600 Core 2TB | Phison E16 | PCIe 4.0 |
Corsair MP600 Pro 2TB | Phison E18 | PCIe 4.0 |
Crucial P3 2TB | Phison E21T | PCIe 3.0 |
Kioxia Exceria Plus G4 2TB | Phison E31T | PCIe 5.0 |
Patriot Viper VPN100 2TB | Phison E12 | PCIe 3.0 |
Patriot Viper VPR100 RGB 2TB | Phison E12 | PCIe 3.0 |
WD Blue SN5000 4TB | WD Polaris | PCIe 4.0 |
De resultaten
Om maar meteen met de deur in huis te vallen: we hebben de ssd-uitval inderdaad kunnen reproduceren, hoewel we daarbij ook wat kanttekeningen moeten zetten. Twee van de negen ssd's vertoonden crashes na herhaaldelijke bestandsoverdrachten. In beide gevallen konden we dat gedrag meermaals herhalen.
De twee ssd's in kwestie waren de Corsair MP600 Core en de 2TB-variant van de XPG SX8200 Pro 2TB; de 512GB-versie crashte niet. Alle overige zeven ssd's hebben we herhaaldelijk bestookt met het grote videobestand, soms wel meer dan een half uur lang, zonder op crashes te stuiten.
De symptomen waren identiek aan de door anderen beschreven problemen: onze test-pc liep héél even vast, terwijl de schrijfsnelheid naar de gecrashte ssd sterk terugliep. Uiteindelijk gaf Windows de foutmelding dat de drive 'niet bestond'. In de diskmanagementtool binnen Windows stonden de drives vervolgens vermeld als 'niet geïnitialiseerd'. In de meeste gevallen konden we de ssd's weer herstellen na een reboot of door de ssd even uit het systeem te halen en opnieuw te installeren.
Om daar maar meteen aan toe te voegen: we kunnen met zekerheid zeggen dat deze problemen niet zijn veroorzaakt door de recente KB5063878-update voor Windows 11. Beide drives vertoonden namelijk hetzelfde gedrag op een oude Windows-installatie zónder de update in kwestie. Een van de drives crashte zelfs eenmalig in Linux Mint op exact dezelfde manier, hoewel we dat bij een tweede poging niet konden herhalen.
In beide gevallen valt er echter meer te vertellen over de crashes in kwestie, aangezien beide gevallen ook eigenaardigheden vertoonden. We lichten beide drives daarom afzonderlijk uit met wat meer diepgang.
Drive 1 in-depth: de XPG SX8200 Pro 2TB
De XPG SX8200 Pro 2TB van Adata was de eerste drive die we aan het crashen kregen. We deden dat in eerste instantie op een frisse Windows 11 24H2-installatie die op een andere ssd stond, mét de KB5063878-update geïnstalleerd. De XPG SX8200 Pro zelf was vers geformatteerd en aan het begin van de test dus leeg.
Nogmaals: we schreven herhaaldelijk hetzelfde bestand naar de ssd. Het betrof een .mov-bestand van ongeveer 59GB. Omdat sommige gebruikers meldden dat het probleem zich pas zou voordoen wanneer de ssd meer dan 50 procent gevuld is, hebben we bij iedere schrijfactie een nieuw mapje aangemaakt. Zo liep de ssd gaandeweg vol terwijl we onze stresstests uitvoerden. Tegelijkertijd hielden we de Smart-data van de ssd in de gaten met HWInfo64, waarin onder andere de temperatuur te zien is.
Na ongeveer elf minuten deed het probleem zich voor het eerst voor. De ssd reageerde niet langer en de Smart-data werd onleesbaar; de temperatuur van de drive daalde volgens de HWInfo64-tool naar 0 graden Celsius, waar de tool eerder gewoon netjes aangaf dat de drive rond de 76 graden Celsius was − overigens wel met de nodige temperatuurwaarschuwingen, waarover straks meer.
De ssd stond in eerste instantie nog wel in Windows, hoewel we foutmeldingen kregen als we opnieuw probeerden bestanden naar de drive te schrijven. Die gaven aan dat we probeerden te schrijven naar een 'niet-bestaand apparaat'. In diskmanagement stond de drive – na een refresh – aangegeven als 'niet-geïnitialiseerd'. Initialiseren binnen Windows was niet mogelijk, maar na Windows opnieuw op te starten was de ssd weer volledig bruikbaar.
De gecrashte Adata XPG XS8200 Pro 2TB en alle bijbehorende foutmeldingen. Screenshots: Tweakers
We besloten dit meermaals te herhalen, steeds met hetzelfde resultaat. Opvallend genoeg gebeurde dit ook met een andere Windows-installatie zónder de KB5063878-update. De ssd vertoonde op die installatie exact hetzelfde gedrag: de ssd was ongeveer tien minuten lang bezig met schrijven, werd zeer warm en begaf het vervolgens. De update in kwestie leek dus geen enkele impact te hebben op het vertoonde gedrag.
/i/2007713694.png?f=imagemedium)
hetzelfde gedrag. Screenshot: Tweakers
Na dit herhaaldelijk te hebben geprobeerd, stuitten we op een serieuzer probleem, wederom zonder de Windows-update geïnstalleerd. De ssd vertoonde na een tijdje een ander symptoom: een blue screen of death.
Bij een herstart verscheen de ssd niet meer in Windows, en ook na de ssd opnieuw in het systeem te plaatsen werd deze niet gevonden in het OS. Zelfs in de bios werd de drive niet meer herkend, wat ons doet vermoeden dat de ssd in kwestie is gestorven.
We moeten daarbij wel eerlijk toegeven dat het ging om een vrij oude drive, die herhaaldelijk werd gemarteld met enorme schrijfacties, daarbij bloedheet werd en het verder bij 'gewoon gebruik' prima deed. Desalniettemin vonden we dit een opvallend en kwalijk resultaat. De 512GB-versie van dezelfde ssd vertoonde overigens geen problemen, hoewel die in ons geval een andere versie van de Silicon Motion SM2262-controller aan boord had. Deze is wat lager geklokt.
Drive 2 in-depth: de Corsair MP600 Pro 2TB
Ook de tweede drive, de Corsair MP600 Pro 2TB, wisten we meermaals tot crashen te krijgen in Windows. We gebruikten opnieuw dezelfde testmethode, wederom met een Windows-installatie zonder de KB5063878-update, en wisten exact hetzelfde gedrag meermaals te veroorzaken − zelfs wat sneller dan bij de Adata-drive. Alvast vooraf: deze ssd is na herhaaldelijke crashes niet kapotgegaan.
De Corsair-ssd viel uit in een oude Windows-installatie zonder update. Screenshots: Tweakers
Dankzij de Adata-ssd en ook deze Corsair-drive konden we al concluderen dat de Windows-update geen probleemfactor lijkt te zijn. Daarom hebben we er bij deze ssd een ander OS bij gepakt: Linux Mint 22.1. We hoopten op die manier te ontdekken of het probleem bij Windows ligt, of dat er iets anders aan de hand is.
We gebruikten in Linux exact dezelfde testmethode: we schreven het grote videobestand herhaaldelijk naar de MP600 Core. Hoewel het langer duurde dan op Windows, wisten we ook met dit OS de ssd te laten crashen. Dat gebeurde op vrijwel exact dezelfde manier: de ssd stopte met reageren, de schrijfsnelheid daalde tot in het extreme en in het schijfoverzicht stond de ssd aangegeven als 'unmounted', waarbij enkel een reboot de ssd weer aan de praat kreeg.
Opvallend was dat de ssd bij deze eerste Linux-test amper leek te throttelen; ook na tien minuten haalde de drive nog altijd een schrijfsnelheid van ongeveer 1GB/s tot het moment dat deze daadwerkelijk crashte. We hebben in dit geval helaas geen temperatuurinformatie. Bij een tweede poging schroefde de ssd zijn schrijfsnelheid wat verder terug, waarbij de ssd niet leek te crashen. Helaas konden we de Adata-drive niet testen in Linux, aangezien die inmiddels al kapot was.
De schrijfactie in Linux Mint en de uiteindelijke crash. Screenshots: Tweakers
Onze hypothese en extra informatie van Phison
Het moge duidelijk zijn dat we nog geen volledig uitsluitsel kunnen geven over de exacte oorzaak van het probleem. We durven wel te zeggen dat de recente KB5063878-update niet de dader is; die had in onze uitgebreide tests geen enkele impact op de resultaten.
Het is dus ook de vraag of het probleem door Windows wordt veroorzaakt, omdat we de overgebleven 'probleemdrive' ook in Linux tot crashen wisten te krijgen. Dan resteert de vraag waar dit wél vandaan komt. Het blijft enigszins speculeren, maar hebben een hypothese. We hintten er gedurende dit artikel al meermaals op: oververhitting.
Beide drives werden bloedheet tijdens de grote schrijfacties. Zeker de Adata-ssd gaf veel warmtewaarschuwingen voordat hij de geest gaf en ook de Corsair-drive werd duidelijk te warm, hoewel deze slechts een enkele temperatuursensor had en dus slechts beperkte temperatuurgegevens in de Smart-data gaf. Tijdens onze tweede Linux-test besloten we echter de FLIR-camera erbij te pakken. De Corsair MP600 Core-ssd, met heatsink, werd ruim 72 graden Celsius. Daarbij zullen de daadwerkelijke componenten onder het koelblok nóg warmer zijn.
Dat de Adata-ssd met een lager geklokte controller geen problemen vertoonde, zou die verklaring ook kunnen bijstaan, aangezien die controller vermoedelijk minder warm wordt. Los daarvan is het ook 'normaal' gedrag dat ssd's zichzelf uitschakelen als ze sterk oververhitten en throttelen niet voldoende helpt, om zo permanente schade te voorkomen.
We hebben verder contact gehad met Phison over de Corsair-ssd, aangezien die beschikt over een E16-controller van dat bedrijf. De fabrikant erkent dat het 'enkele problemen' is tegengekomen met de Corsair MP600, een andere ssd met dezelfde E16-controller. Het bedrijf schrijft dit echter ook toe aan warmte en bovendien in specifieke gevallen: het probleem zou zich in hun ervaring vooral voordoen op testbenches.
Testbenches hebben immers geen losse ventilators die koele lucht over de ssd heen blazen, waardoor componenten als ssd's warmer kunnen worden dan in een gewone pc. Phison zei dat de ssd in kwestie is ontworpen met 'de verwachting dat er enige airflow is' en dat deze naar behoren presteert in een desktop-pc met normale airflow, of door een ventilator op de ssd te richten. De fabrikant benadrukt daarom ook dat het in zijn eerdere statement al verwees naar adequate koeling.
Ook wij gebruikten een testbench tijdens het uitvoeren van onze tests. Collega Tomas heeft daarom extra tests uitgevoerd met de Corsair MP600 Core. We gebruikten daarvoor dezelfde Windows-installatie waarmee het eerder misging met diezelfde ssd, maar plaatsten een Noctua-ventilator bij de ssd. Waar de MP600 Core voorheen steeds na enkele minuten uitviel, hebben we deze ssd ruim zeventien minuten getest zonder problemen. Wel werd de drive na een tijdje wel fors langzamer, vermoedelijk omdat de slc-cache vol zat. We konden de resultaten van Phison dus herhalen, wat bijdraagt aan onze hypothese dat getroffen drives vooral te warm worden.
Onze extra tests. De MP600 Core viel niet uit na het toevoegen van een ventilator. Foto's: Tweakers
Tot slot
Na onze tests lijkt het erop dat de recente ssd-problematiek niets te maken heeft met de recente updates voor Windows 11. Bovendien lijkt het probleem niet te liggen aan Windows in het algemeen, aangezien we dezelfde crash ook wisten te veroorzaken in Linux.
Hoewel het enigszins speculeren blijft, lijkt oververhitting ons een voor de hand liggende verklaring. Het vertoonde gedrag komt overeen met ssd's die zichzelf uitschakelen als ze te warm worden – en daarbij in uitzonderlijke gevallen corrupt kunnen raken of zelfs defect kunnen gaan. De twee getroffen ssd's die wij in huis hadden werden daadwerkelijk bloedheet. Met extra koeling vertoonde onze overgebleven ssd tijdens een aanvullende test geen crashproblemen meer.
De vraag resteert waarom dit nu pas naar voren komt en wordt verbonden aan de recente Windows-update. Vermoedelijk is het verhaal een eigen leven gaan leiden op basis van de beperkte tests van de oorspronkelijke melder van het probleem: een socialemediagebruiker die meerdere ssd's testte –vermoedelijk op een testbench en zonder tests uit te voeren op een frisse Windows-installatie zónder de update.
Dan is er nog de F1 24-problematiek die JayzTwoCents onlangs uitlichtte in zijn video met een Crucial T500-ssd, die voor zover wij kunnen zien overigens alleen is getest mét de KB5063878-feature-update, en dus niet zonder. De youtuber constateerde zelf al dat het scenario waarin hij problemen opmerkte, afweek van het scenario waarin de meeste andere melders problemen ervoeren, namelijk bij het schrijven van grote hoeveelheden data.
Toch lijken enkele 'probleemfactoren' die volgens onze tests crashes veroorzaken, overeen te komen met de test van JayzTwoCents, die tijdens zijn video bijvoorbeeld verwijst naar een testbench met vermoedelijk beperkte ssd-koeling. Tegelijkertijd hebben we dat zelf nog niet kunnen verifiëren en zien we niet helemaal in hoe een game als F1 24 voor soortgelijke grote schrijfacties of overmatige hitte kan zorgen. Hoewel de symptomen hetzelfde zijn, kunnen we daarom niet compleet uitsluiten dat daar een ander probleem speelt.
Redactie, tests: Daan van Monsjou • Eindredactie: Marger Verschuur • Aanvullende tests: Tomas Hochstenbach