Intel verhelpt Atom C2000-probleem met nieuwe stepping

Intel heeft een nieuwe stepping uitgebracht van zijn Atom C2000-processors. De revisie moet de defecten met de clock-output verhelpen, die ervoor zorgden dat de chips stoppen met functioneren.

Intel meldt de komst van de C0-stepping in een specificatie update voor de Atom C2000. Bij het aangepast ontwerp is de lpc-interface aangepast, wat de problemen met de lpc-clock-output moet verhelpen. Bij de huidige C2000 kan die output stoppen met functioneren, waardoor de gehele chip kan uitvallen.

Het probleem had betrekking op producten van een groot aantal fabrikanten, waaronder Dell, Cisco, HP, Netgear, Seagate, Supermicro en Synology. Sommige daarvan hadden vervangingsprogramma's opgezet. Zo had Cisco een bedrag van 125 miljoen dollar gereserveerd voor kosten met betrekking tot het probleem.

De defecten betroffen de B0-stepping van de Atom C2000-chips met typenummers C2308, C2338, C2350, C2358, C2508, C2518, C2530, C2538, C2550, C2558, C2718, C2730, C2738, C2750 en C2758.

Door Olaf van Miltenburg

Nieuwscoördinator

27-04-2017 • 10:23

42

Reacties (42)

42
41
25
6
0
10
Wijzig sortering
De defecten betroffen de B0-stepping van de Atom C2000-chips met typenummers C2308, C2338, C2350, C2358, C2508, C2518, C2530, C2538, C2550, C2558, C2718, C2730, C2738, C2750 en C2758.
Stepping en CPU type kunnen softwarematig uitgelezen worden. Kan dit ook met het typenummer?
Ja, dit is gewoon mogelijk. Met windows gewoon via task manager en met Linux met cat /proc/cpuinfo.
In geval van FreeBSD kan dit door te kijken naar /var/run/dmesg.boot :

$ grep -B1 Stepping /var/run/dmesg.boot
CPU: Intel(R) Atom(TM) CPU C2750 @ 2.40GHz (2400.06-MHz K8-class CPU)
Origin="GenuineIntel" Id=0x406d8 Family=0x6 Model=0x4d Stepping=8


Stepping=8 is het B0 model. Overigens was er alleen een B0 model voor dat deze C0 uit kwam.

Ik heb 2 machines met deze CPU thuis staan, 1 van de 2 is er al aan stuk gegaan maar prima vervangen door alternate binnen 3 dagen.

[Reactie gewijzigd door nightwing op 22 juli 2024 21:35]

Ja, behalve dan dat deze vaak vastgesoldeerd zit op embeddded apparaten (... Routers..)
Maar dan weet je tenminste of je hem zult moeten gaan inleveren bij de fabrikant.
Probeer maar eens bij Synology, die veel apparaten hebben verkocht met deze CPU, je krijgt het deksel op de neus...

Cisco doet dan weer niet moeilijk, hebben we reeds gebruik van gemaakt.
Na contact met Synology zelf hebben ze aangeboden mijn Nas simpelweg te vervangen. Welliswaar was dat 1 maand nadat het issue bekend werd.
Het is dan ook lang niet altijd nodig om het ding in te leveren. Niet iedere device gebruikt de betreffende functie dus bij deze devices kun je het via een firmware simpelweg uitschakelen. Velen doen dat dan ook. Denk hierbij aan pfSense/Netgate. Wellicht dat dit ook voor Synology geldt (waarbij dan de firmware update in 1 van de nieuwe OS updates van ze zit), dat zul je na moeten vragen.
Ik denk dat de meeste fabrikanten (leveranciers eigenlijk...) dat pas toelaten als het apparaat niet meer werkt.
Als jij kunt aantonen dat je een erkent defect product hebt, moeten ze wel omruilen voor een nieuwe. Of het probleem zich voordoet of niet.
Er is genoeg aangetoond dat het product niet goed is.
edit: nevermind...

[Reactie gewijzigd door mindwarper op 22 juli 2024 21:35]

Dus ze konden het niet oplossen met een firmware update?
ofc niet het is een hardwarematig probleem
Ze kunnen wel toch het hardware defect omzeilen met een firmware update? Als in, het bepaalde defect omzeilen door het te emuleren via werkende methoden?
Bij sommige dingen kan dit inderdaad. Bijvoorbeeld hoe de AMD Ryzen's FMA3 crash opgelost werd met een microcode update. Bepaalde dingen zijn echter nodig en kunnen niet aangepast of omzeild worden. Zo ook de clock output. Daar zal heus een hoop aan kunnen worden aangepast, zoals de clock-snelheid en de werking van de PLL. Maar als geen enkele instelbare parameter het probleem verhelpt, kun je de clock niet even omzeilen. Je hebt die namelijk door de gehele chip nodig.
Ja dat kan in dit geval en wordt dan ook gedaan door diversen. De echte oplossing kan alleen hardwarematig en daar is deze stepping voor. Netgate (bekend van pfSense; ze gebruiken hardware van ADI Engineering) heeft een mail de deur uitgedaan met het volgende aan verklaring:
The Intel specification clarification is available at the following location: Intel Atom C2000 Specification Update. This specification clarification includes the following text on page 36:

“If your system does not use SERIRQ and BIOS puts SERIRQ in Quiet-Mode, then the weak external pull-up resistor is not required. All other cases must implement an external pull-up resistor, 8.2k to 10k, tied to 3.3V.”

Since the LPC bus, including SERIRQ is not used in the SG-2xxx, SG-4xxx and SG-8xxx systems, a software workaround for this specification clarification has been implemented by ADI Engineering in v12 of coreboot for the affected systems. The workaround disables SERIRQ to prevent indeterminate interrupt behavior for these systems.

[Reactie gewijzigd door ppl op 22 juli 2024 21:35]

Het probleem is dat de lpc-clock-output stopt met werken, dan kun je wel firmware gebruiken om het uit te schakelen maar dan werkt de CPU niet meer.

Auto met een motor die kan ontploffen? Motor eruit en het probleem is opgelost... ;) :P

lpc-clock-output is een vrij belangrijk onderdeel.
Tenzij dat alleen voorkomt bij meer dan 6000tpm en minder dan 60 C.

Dan kun je in de software/firmware inbouwen dat je pas boven de 6000tpm kan en mag boven de 60 C

Natuurlijk lost een nieuwe motor dat ook op, net als dat die ene piepende deur zal verdwenen in de Trump Tower wanneer je die opnieuw neerzet. ;)
En daarmee voldoet het apparaat niet meer aan de specs waarmee jij het gekocht hebt. Want om een motorblok onder de 60 graden te houden zonder iets aan de koeling te doen betekent waarschijnlijk een enorme imperking op het vermogen.
Dat zal niemand pikken. Ik zal het niet accepteren als ze van mijn 5820K ineens 2 cores en de HT functie uitschakelen omdat Intel een blunder van jewelste in het ontwerp gemaakt heeft.

[Reactie gewijzigd door arbraxas op 22 juli 2024 21:35]

Minder dan 60 C, minder! :+

Meer mag wel! :9
Niet alle hardware defecten zijn te omzeilen met een firmware fix. Was het maar zo makkelijk. ;-)

In het gunstigste geval werkt er een functie gewoon niet meer, of gaat er iets 'trager'.

Ergste geval is het gewoon replacement.
Nee, want de LPC clock doet het niet, en de firmware wordt vaak via LPC uitgelezen. Dus zelfs als het al kon, dan was het niet op te lossen om dat bij elke boot de firmware gelezen moet worden.
Je mag toch aannemen dat er eerst prototypes van de chip worden gebakken en wordt gecontroleerd op de juiste werking. Of zou hier sprake zijn van een fabricage fout ipv een ontwerpfout.
Dit is een duur grapje voor Intel neem aan dat de computer leveranciers die worden genoemd in het artikel ook de gevolgschade verhalen op intel.
Probleem deed zich toch na een tijd voor? Kan me voorstellen dat je dat met testen niet ontdekt.
Natuurlijk wordt dat gedaan. En niet alleen dat, elke chip wordt individueel getest op de juiste werking. Maar je kan uiteraard nooit 100% coverage garanderen, en al helemaal niet als het een probleem is waarbij het normaal wel werkt, maar na loop van tijd ermee stopt. Overigens worden de prototypes ook kunstmatig verouderd (bepaalde tijd op een hoge temperatuur houden), maar het is simpelweg nooit 100% garantie.
Het probleem ontstaat na enkele jaren volcontinue gebruik, hoe wil je dat testen?
Ben al een tijdje aan het kijken voor een opvolger van mijn Synology DS212+. Hierbij stond de Synology DS415+ (Intel Atom C2538) op het lijstje echter nu dit bericht er is ga ik toch voor de 916+. Met deze wetenschap lijkt het mij een no-go om nog te kiezen voor een product met de Atom C2000 processorreeks

[Reactie gewijzigd door bluecupra op 22 juli 2024 21:35]

Heb een DS415+ en na lang zeuren is deze door synology ogenwisseld. CPU is nog dezelfde maar schijnt een hardware mod te zijn om het langer mee te laten gaan.

Uiteindelijk alleen de kosten voor het terugsturen van oude unit gehad.
Wie heb je gecontacteerd hiervoor? Wij hebben tientallen RS units bij klanten geinstalleerd met deze CPU, Synology wil niet preventief omruilen.

//Bedankt voor de antwoorden hieronder, gaan we nogmaals proberen

[Reactie gewijzigd door nils83 op 22 juli 2024 21:35]

Bij mij hebben ze 3 DS415+ nassen omgeruild voor gemodificeerde nassen.
even mailen naar clocksignal@synology.com
Met mijn nassen was nog niets mis en is preventieve omruiling.
Dit doen ze ook met rackstations.
support@synology.com

Begonnen met dat ik nieuws gelezen heb dat er een probleem was.
Ik hier niet blij mee was en wat men er aan ging doen.

Antwoord dat het pas lang kan duren en standaard bla bla verhaal.
Geantwoord dat ik niets heb aan een standaard verhaal.
Verwijzing naar hun statement.
Antwoord dat ik hier niet blij mee ben aangezien ik betaald heb voor een product met een bewezen hardware flaw.
Vermeld dat andere merken wel iets doen en ik dit van een A merk niet verwacht.
Ik nu met een timebomb unit zit die ik gebruikt ook niet meer kan verkopen, wie koopt er nog zoiets.

Bedankt voor de feedback als antwoord en dat men vertrouwen heeft in hun producten en als ik er op aandring er een rma gemaakt kan worden.
Bedankt maar standaard rma betekend dat ik mijn unit moet insturen, zonder nas zit en ik daar voor bedrijfsmatig gebruik niet blij van ga worden.
Ze hebben toen netjes advanced rma aangeboden. d.w.z ik krijg nieuwe unit, stuur binnen 14 dagen oude op mijn kosten retour.
rond 10-3 is de nieuwe vervangende unit verstuurd.
cpu heeft nog wel dezelfde stepping, maar als ik het mag geloven is er wel een hardware mod die het probleem verhelpt in het mainbord van deze unit.
Mijn unit was 18 maanden oud en heb nu in ieder geval nieuwe unit dus zal nog wel wat langer meegaan.

Neem wel aan dat als je komt met 50 units men dit misschien niet gaat doen.

In USA zal er vroeg of laat wel een class action komen aangezien je als eindklant met een unit zit die bewezen (uitspraak intel) een hardware fout heeft.
Ik had de leverancier er ook op aan kunnen spreken, die heeft hem verkocht en denk als je dit zou laten voorkomen je het ook nog zal winnen. Uiteindelijk heeft synology het opgelost.
Waarom ? Zelfs met de komst van de opvolger: de C3XXX, die nog meer gericht is naar de low-end, blijft dit een uitstekende chip voor kleine infrastructuurtoestellen (routers/firewalls, NAS, monitoring host, ...) met een beetje meer.
Weest gewaarschuwd: De Kerio Technologies NG300 appliance gebruikt deze avoton ook. Dit vermeld men op de website helaas niet. Navraag bij Kerio levert NIETS op ; je wordt van het kastje naar de muur gestuurd en uiteindelijk hoor je niets meer van ze. Goed, ik heb mijn ng300 niet nieuw gekocht, wat niet wegneemt dat dit door de Avoton problemen een inferieur product betreft en men in mijn optiek tenminste de moeite mag nemen inhoudelijk te reageren.
dat is zeker mooi dat intel hier aandacht voor heeft en een nieuwe stepping uitbrengt voor de C2000 Avoton (weet niet zeker...) serie SoCs....

Ook al hadden ze dat niet hoeven doen, aangezien ze ook al de Denverton C3000 SoCs serie hebben aangekondigd paar maanden geleden

[Reactie gewijzigd door mindwarper op 22 juli 2024 21:35]

Je bedoelt een dusdanig ontwerpfout dat het letterlijk de chip buiten werking stelt?
Denk dat ze wel degelijk verplicht zijn om daar iets aan te doen.
Dit heeft niets met het feit dat er een nieuwe chip aangekondigd is, EOL en dat soort kreten.
Dat zou netjes zijn ja, maar als die units de garantieperiode doorkomen plus wat extra en er maar x procent uitval is kunnen ze ook zeggen dat t prima werkt.

Zie synology, die doofpot ook alles.
Je kunt synologie ook moeilijk met intel vergelijken.
Deze blunder van intel heeft ook invloed op klanten als IBM, HP, Asus noem ze maar op.
Dus daar zal al een hoop druk wegkomen.

Verder is in nederland de garantieperiode niet heilig. Je hebt ook nog een te verwachten levensduur. Als je nieuwe auto een week na einde garantie volledig in de soep loopt en het is aantoonbaar een ontwerpfout dan staat de fabrikant er wel voor.
Zelf meegemaakt met mijn auto en een aandrijfketting die niet goed was qua ontwerp.
Begaf het iets van 2 maand na de garantie. Garage deed eerst onzettend moeilijk, ik was natuurlijk eerst een stoplichtracer, daarnaa moest ik niet als een oud vrouwtje rijden etc.
Maar de BOVAG had deze kwaal al als ontwerpfout aangewezen en VW ook. (De 1.2 TSI is een VW blok). Uiteindelijk dus wel gerepareerd op kosten van garage. Uiteraard wel nadat ik ze voor de keus van reparatie of rechtszaak had gezet.

En dat is het probleem, voor relatief kleine bedragen nemen mensen de moeite / risico niet. En daar maakt synologie mooi misbruik van.
Je bedoelt een dusdanig ontwerpfout dat het letterlijk de chip buiten werking stelt?
Denk dat ze wel degelijk verplicht zijn om daar iets aan te doen.
Dit heeft niets met het feit dat er een nieuwe chip aangekondigd is, EOL en dat soort kreten.
nee dat bedoelde ik dus niet... ik bedoelde goede actie om ontwerpfout te herstellen met een nieuwe stepping...
ik was misschien niet duidelijk genoeg in mijn fipo :)

[Reactie gewijzigd door mindwarper op 22 juli 2024 21:35]

Ik neem aan dat deze stepping vrijwel alleen is ontwikkeld om apparaten te kunnen vervangen. Gezien de C3000 soc er al is. Misschien niet de volledige lineup maar dat zal niet lang meer zich laten wachten.
Weet iemand wat supermicro doet met de garantie? Ik zit met een router gebouwd rond een moederbord met c2575 cpu van supermicro. En zit dus in de problemen als ik het eerst moet opsturen.
Als ik me niet vergis zou je direct contact op moeten kunnen nemen met hun support afdeling, deze kunnen je precies vertellen of het direct via Supermicro kan of dat dit via de reseller moet.

Op dit item kan niet meer gereageerd worden.