Anandtech: MediaTek speelt vals in benchmarks met 'verborgen sportmodus'

Processorontwerper MediaTek speelt volgens techsite Anandtech vals in benchmarks met een 'sportmodus' voor benchmarks, die gebruikers zelf niet kunnen benaderen. De cheat zit in apparaten van diverse fabrikanten.

Anandtech kwam de cheat op het spoor door een dubieus resultaat van een Oppo Reno3 Pro, maar de cheat is ook te vinden in de firmware van veel andere fabrikanten, waaronder Sony, Vivo en Xiaomi. In de map /vendor/etc stond een bestand power_whitelist_cfg.xml en daarin stonden benchmarks die toegang hadden tot een 'sportmodus' die diverse elementen aanpaste om hogere benchmarkresultaten mogelijk te maken.

Het ging onder meer om het ophogen van de maximale temperatuur die de soc mag bereiken, het verhogen van de spanning en andere aanpassingen. De cheat was niet alleen gericht op benchmarks voor consumenten, maar ook tools en versies die alleen media en fabrikanten gebruiken. Het verschil is ongeveer 30 procent in de PCMark-score, maar kan oplopen tot 75 procent in sommige tests.

MediaTek bevestigt min of meer de bevindingen in een reactie aan Anandtech. De fabrikant zegt 'geaccepteerde industriestandaarden' te volgen op dit gebied. "We geloven dat het laten zien van de volledige capaciteiten van een chipset in benchmarks in lijn ligt met de praktijken van andere bedrijven en we geloven dat het consumenten een goede afspiegeling geeft van de prestaties van het apparaat."

MediaTek is de eerste processorontwerper die is betrapt op valsspelen in benchmarks, maar er zijn al veel fabrikanten geweest die zich daar ooit ook schuldig aan hebben gemaakt. Tweakers heeft anderhalf jaar geleden al geconcludeerd dat het cheaten op benchmarks zo'n wijdverspreide praktijk is in de smartphonemarkt dat prestatiebenchmarks geen zin meer hebben en in reviews van Tweakers zijn die resultaten dus sinds die tijd niet meer te vinden.

Valsspelen in benchmarks door MediaTek
Fabrikant Oppo Oppo Oppo Oppo Vivo Xiaomi Realme iVoomi Sony
Toestel Reno3 Pro Reno Z F15 F9 Pro S1 Note 8 Pro C3 i2 Lite XA1
Soc P95 P90 P70 P60 P65 G90 G70 A22 P20
AndroBench2 *
PCMark *
Antutu *
Antutu 3DBench *
GeekBench *
Quadrant *
Quadrant Professional *
鲁大师 / Master Lu
鲁大师 / AIMark
AI Benchmark (ZTH)
NeuralScope Benchmark
GFXBench 4 Corporate

* op deze benchmarks is de cheat wel aanwezig, maar niet actief. Bron: Anandtech

Door Arnoud Wokke

Redacteur Tweakers

09-04-2020 • 16:10

98

Submitter: CyberMania

Reacties (98)

98
95
42
4
0
25
Wijzig sortering
Ik snap niet echt heel erg goed waarom dit valsspelen is. Ja, ze passen instellingen aan waardoor de SoC sneller is bij bepaalde workloads (die wel een beetje dubieus gekozen zijn), maar het is niet alsof ze de score direct aanpassen naar onrealistische waardes. Het is nog steeds hun SoC die het werk doet. Of zie ik dit verkeerd?

EDIT: hoe is deze opmerking "Off-topic / Irrelevant"? Het gaat duidelijk over het artikel, en ik was benieuwd waarom men mijn opvatting niet lijkt te delen.

[Reactie gewijzigd door jvnknvlgl op 26 juli 2024 08:21]

Is dit niet een beetje zoals dieselgate? Mensen baseren hun koopgedrag op dit soort cijfers. De cijfers komen dus geenszins overeen met de werkelijkheid, waardoor concurrenten worden benadeeld.

Naar mijn mening is dit wel degelijk valsspelen.
Hoeveel mensen op deze wereld baseren hun smartphone aankoop op benchmark resultaten?

Ze hebben nu een handjevol geeks om de tuin geleid die volledig onzinnige (of ze nu kloppen of niet) benchmarks belangrijk vinden.

Nauwelijks nieuwswaardig.
Hoeveel keer wordt op deze site (in de reacties) gezegd xx is beter want specs & benchmarks

Ik zou zeggen veel, als je dan de benchmarks manipuleert dan heb je IMO gesjoemeld, net zoals er in dieselgate manipulatie was van de uitstoot testen...
En laten we ook eerlijk zijn, wij nerds geven vaak advies aan anderen over wat te kopen,

Ooh haal de xxxxxx maar want die is wat sneller of heeft een langer accuduur of whatever het is.

Dus dit heeft weldegelijk een groter effect dan op de mensen die de benchmarks lezen.
Dieselgate is een verkeerde vergelijking vooral waar je op doelt. De dieselgate manipulaties waren alleen gericht op de Lease waardoor men een betere bijteling had, zal veel van die leaserijders een bol interesseren of die auto 1:20 of 1:17 rijd, zolang die auto maar een lage %bijtelling had.
We kunnen het beter gewoon Tech gerelateerd houden en kijken naar andere grote bedrijven zoals AMD, Intel, Nvidia, ARM etc. Deze hebben dat in het verleden gedaan en zullen elke kans dit nog eens te doen gewoon aangrijpen 8)7 .
Vooral in Tech zijn we toch beetje afhankelijk van benchmarks om de prestaties bij onderlingen producten te vergelijken zijnde deze synthetic, games of compute based is relevant voor de use case.
Bijtelling is iets typisch Nederlands. Dieselgate was wereldwijd en had te maken met allerlei globale normen voor de uitstoot. Dat Nederland daar dan rare fiscale constructies bovenop bouwt, dat is een andere discussie.
Vind de vergelijking met dieselgate wel ideaal.
Dieselgate heeft niets met bijtelling te maken:)

Real life metingen of een stand voor "labo en benches"
Vw deed simpelweg t zelfde.
Niet helemaal waar, ook niet-lease auto's hadden / hebben er last van.

Zodra de auto merkte dat ie in test stand gezet werd, schroeft deze de uitstoot naar beneden.

Gewoon op de weg heb je nergens last van. En kun je gewoon rijden.

Uiteraard moet iedereen dan naar een dealer om de boel te laten updaten, wat ze er alleen niet bij vertellen is dat het je 10 a 15 pk gaat kosten, die raak je gewoon kwijt en je auto rijdt voor geen meter meer.
Dan denk je dat het de consument is die uiteindelijk bepaalt, maar ik geloof zo dat ook de grote inkopers hun inkopen baseren op dit soort resultaten - "Welk topmodel moeten we inkopen?" "Oh doe de snelste maar". Het gaat verder dan alleen de geeks, want het gaat ook om beslissingsmakers die beslissingen maken over inkoop en marketing ("dit is echt de snelste volgens onze experts!").

[Reactie gewijzigd door YopY op 26 juli 2024 08:21]

Precies. Karel op de relevante afdeling vraagt wat offertes op, bekijkt wat specificaties en benchmarks, en hoppa, 2000 nieuwe telefoons voor het personeel. Op papier de beste keuze, maar in de praktijk?
Misschien Karel een schop geven en een competente inkoper inhuren?
Als alle benchmarks vals zijn, en dat nu pas zo'n beetje naar buiten / wijdverspreid raakt, hoe is het dan Karel z'n schuld?
Iemand die zoveel devices in een keer koopt gebaseerd op benchmarks is gewoon niet slim bezig.
En de benchmarks zijn niet vals, maar sowieso onbetrouwbaar en geen goed uitgangspunt voor een dergelijk aanschaf. Daar doe je een evaluatie voor.
Ik denk dat er eerst naar prijs gekeken word, het dan een hele tijd stil blijft, en dat er dan pas naar specs gekeken gaat worden in de meeste bedrijven anders ;-)
Ik denk dat er eerst naar prijs gekeken word, het dan een hele tijd stil blijft, en dat er dan pas naar specs
Sommige specs zijn wel relevant, water/stofdicht, schermgrootte, garantie, wellicht dual sim.
Dan prijs, en dan na heel eind ergens aantal cores, frequentie en dat soort dingetjes. Als daar al iemand nog naar kijkt ;)
Nee hoor. Eerst prijs, en binnen dat raamwerk word gekeken wat van de "wenslijst" mogelijk is, en wat niet. Toestel met de meeste vinkjes wint meestal.
Als bijna niemand naar benchmarks kijkt, waarom cheaten ze ze dan?
Om het handjevol nerds met minimale middelen blij te maken?
En zelfs daar kun je vraagtekens bij zetten.

Het zijn tools voor reclamedoeleinden. Je kunt enigszins gefundeerd zeggen dat je sneller bent dan de concurrent, maar welke normale gebruiker kijkt ernaar?
Vraag voor de lol eens in een willekeurige winkel naar de PCMark score van een toestel... Alsof iemand opeens zegt: "goh, die Xiaomi heeft een betere score dan de Samsung, laat ik die maar nemen". 8)7

Zelfs in de pricewatch kun je er niet naar filteren/sorteren. Waarom eigenlijk niet? :?
Worden reviewscores ook niet mede bepaald door resultaten van deze tools? Als een telefoon hierdoor net een 8 scoort in plaats van een 7,5 kan dat toch een paar 'niet normale gebruikers' misleiden. En zelfs 'normale' gebruikers googelen wel eens op '[telefoon die ik wil kopen] reviews'. Plus, een 'niet normale' gebruiker loopt dan rond met zo'n telefoon en zal deze mogelijk ook aanraden aan 'normale' gebruikers.
Dat is dus onzin. Er is een behoorlijk groot publiek waar mensen kort even een review doorlezen met wat benchmark resultaten. Je wilt tenslotte het snelste toestel voor je geld hebben. Een 'handjevol nerds' is een term die kort door de bocht is en doet grote tech websites met duizenden bezoekers geen eer aan.
Hoe is dat relevant hoeveel mensen er gebruik van maken? elk is er een te veel. Ook vind ik het apart dat jij CPU scores wegzet als onzinnig. Dat kan voor jou zijn, voor een ander niet.
Depends, als iedereen zegt dit is de snelste, en jij wilt de snelste .... In theorie is het de snelste ja, maar in praktijk krijg je dit niet. Vergelijkbaar met reviews van Samsung. EU versie is niet hetzelfde als de US versie. Ik gebruik een telefoon om te bellen, sms, een paar apps, speel er geen games op en af en toe een foto te maken. Maar ik kan me inbeelden dat mensen een all rounder willen en dan kan dit voor mij dus wel van belang zijn
Dat maakt niet uit, Mediatek geeft zelf aan dat het doel is om de benchmarks te spekken:
... Many companies design devices to run on the highest possible performance levels when benchmarking tests are running in order to show the full capabilities of the chipset. This reveals what the upper end of performance capabilities are on any given chipset.
Dit is het statement dat Mediatek geeft.
Waar het in een notendop op neerkomt: elke fabrikant (smartphonemaker en nu dus ook smartphoneSoC-bouwer) heeft er baat bij goed uit de verf te komen tegenover de concurrenten. En dus hoge scores in benchmarks.

Ooit is er begonnen met het zogenaamde cheaten. Ik wil het geen valsspelen noemen, maar vuilspelen. Heel zwart/wit genomen: de SoC is in staat om die prestaties te halen (totdat het toestel zich afsluit vanwege oververhitting). Klopt het? Nee. Want iedereen begrijpt dat de snelheid in die tests niet representatief zijn voor de gebruikersscenario's waarin de toestellen worden gebruikt.

Je kunt dat misschien omzeilen door allerlei trucjes, maar willen we daarheen? Of moet er een situatie zijn waarin we kunnen zeggen: ja, leuk dat valsspelen, maar stop maar. Anders boetes of productiestop.

Dit is inderdaad zoals de dieselgate: je apparatuur herkent een situatie en past zijn eigenschappen hierop aan. Met deze benchmarkgate gebeurt dit meer dan zes jaar (klik). En niet alleen op dit vlak: "Samsung-tv's blijken in het echt meer energie te verbruiken dan bij testen".

Als je kritisch gaat kijken, zijn er meer situaties waarin specificaties niet overeenkomen met de verwachte realiteit (voor mij persoonlijk is geluidsproductie bij ventilatoren er eentje: weergegeven waardes hiervan liggen zo ver uiteen, dat het fysiek praktisch onmogelijk is dat ze een realistische weergave zijn van de werkelijkheid).

Zonder af te dwalen: het grote probleem is dat fabrikanten dus manieren verzinnen om hun eigen testresultaten rooskleuriger te laten zijn dan dat het is. Van computerventilatoren naar verbruikwaardes van televisies naar benchmarks van smartphones tot testverbruiken bij auto's. Alles speelt zich af over producten die behoorlijk wat omzet vertegenwoordigen en afgezien van de dieselgate (die ook wel héél smerig was), is er weinig veranderd. Nu kunnen we verwachten dat onze overheid wakker wordt en dit oppakt (niet op basis van elke situatie, maar algemeen moeten fabrikanten verplicht worden dat testresultaten relevant zijn over het complete gebruiksspectrum en moet er een autoriteit zijn die de verkoop kan stopzetten, totdat het is opgelost).

Of dat verwachten realistisch is, is een tweede. Maar we kunnen ook zelf iets doen. In het geval van Samsung lijken ze daar niet heel erg integer te zijn (dat begon met de benchmarkgate, maar dus ook televisies en een topman is jaren terug voor fraude in de gevangenis beland).
Dus we kunnen zelf beoordelen of je je geld wil steken in een bedrijf wat meermaals dubieuze praktijken laat zien. Vergeet ook niet de OQLED televisies. ;)
of zoals er op tv's een "Winkel modus" zit die alle instellingen op zijn hoogst zet, daardoor lijkt de tv in de winkel super mooie kleuren te hebben, ja maar het "gemiddelde energieverbruik" klopt totaal niet met wat je ziet in de winkel

"oh deze tv zie je hele scherpe kleuren en volgens het kaartje verbruikt de tv veel minder stroom dan die ernaast staat"

2 verschillende waardes die wel aan elkaar gekoppeld worden door de gemiddelde koper.
Ik denk best wel wat, veel mensen zullen op YouTube naar review filmpjes kijken. En de meeste techkanalen nemen dit soort benchmarkresultaten blind over in hun reviewfilmpjes.

Gelukkig zijn er websites zoals Tweakers en HWI die verder kijken, maar of de gemiddelde consument dat ziet vraag ik me af.
Definieer "best wel wat"? :)

Ik leef in een andere bubbel en ik ken mensen die steeds de nieuwste Samsung kopen (meeste slaan wel een generatie over), mensen die geen Samsung willen en dan voornamelijk Huawei gekozen hebben omdat het geen Samsung is en uiteraard iPhone, die mensen interesseren zich al helemaal niet om die cijfertjes.
Af en toe eens een one+ en die zijn dan al vaak heel trots dat ze dat merk kennen.

Maar buiten de bezoekers van sites zoals Tweakers is er niemand die het zich een zak aantrekt. Hoogstens gokken ze erop dat ze wel mensen beïnvloeden in hun omgeving, maar dat is een te slecht te beïnvloeden groep om op te kunnen rekenen.
Nou ik denk dat het er best wat zijn die er wel een paar filmpjes erbij pakken op YouTube. Jij denkt dat het er heel weinig zijn. We hebben beiden geen precieze cijfers dus. Let's agree to disagree 😉
Ergo, benchmarks zijn onzinnige overbodige dingen.

Volgens mij ligt het toch iets anders maar dat terzijde.

Dus naast de sjoemeldiesel hebben we nu ook de sjoemelprocessor.
Als het er allemaal niet toe doet, waarom zouden ze dit dan manipuleren? Natuurlijk draagt dit bij aan het imago van deze chipsets en telefoons die ze gebruiken. Als die bij kunnen blijven met de norm in de markt is er niets aan de hand, als ze de helft zo snel zouden zijn gaat dat echt wel opvallen en heeft dat invloed op het algemene oordeel en daarmee hun positionering in de markt.
Hoeveel mensen op deze wereld baseren hun smartphone aankoop op benchmark resultaten?
Direct zijn dat er niet veel, maar indirect wel. De meeste mensen baseren hun aankoop namelijk op wat ze van hun vrienden horen en een paar reviews. Die reviewers kijken wel naar de benchmarks. In het midden segment waar heel veel aanbod is en de concurrentie fel kan een klein verschil in prestaties zorgen dat zo'n telefoon opvalt door (ogenschijnlijk) door een betere bang/buck verhouding dan de rest.
Als je als reviewer een winnaar moet kiezen (en beargumenteren) uit 30 telefoons die sprekend op elkaar lijken, dan kan een goede bechmarkscore wel eens de doorslaggevende factor zijn. "Alles is hetzelfde, maar deze is 20% sneller voor dezelfde prijs".
Dit is hetzelfde als bij het nieuws dat een bepaald merk kwark maar de helft van de op de verpakking vermelde eiwitten bevat te melden dat alleen een handje bodybuilders zich om de tuin leiden door die volstrekt onzinnige voedingswaarden. Niet nieuwswaardig?

Nieuwswaardigheid gaat er niet om of jij vind dat het aantal eiwitten in een product zou helpen bij het kweken van biceps of dat je die bezigheid überhaupt zinnig vind. Het gaat erom mensen worden beduveld omdat een fabrikant meer omzet wil draaien.

Benchmarks houden mij niet zo bezig, hooguit als ze in een review voorbij komen maar als ik zo’n telefoon had liggen zou ik mij er nu ook aan geërgerd hebben en ik denk ook niet dat ik dit merk ooit nog zou overwegen.
Naar mijn mening is dit wel degelijk valsspelen.
Ik schaar het onder oplichting. Dieselgate ook trouwens.
Dit is zeer zeker valsspelen: de weergegeven waardes zijn niet representatief voor het werkelijke gebruik.
De vergelijk met de dieselgate gaat zeker op, alleen betreft het daar ook gevolgen tot het milieu, wat een kwalijke zaak is. Hier heb je benchmarkresultaten, die misschien vergelijkbaar kunnen zijn (ze zijn nooit een exacte weergave van de reële gebruiksscenario's, hooguit een zo accuraat mogelijke nabootsing), dus niet per se een directe reflectie moeten hebben met scenario's die wél in een reëel gebruiksspectrum vallen.

Je zou zoiets kunnen doen met het vermogen van een auto: als dat is gebaseerd op een hoog octaangehalte brandstof (of een speciale geprepareerde brandstof die de motor herkent en daarmee et andere instellingen draait), met een installatie die de inlaat voorziet van relatief veel pure zuurstof, dan zal de motor behoorlijk wat meer vermogen kunnen leveren. Is dit representatief voor de praktijk? Nee. Maar hij kan het wel. Grappig dat het bij auto's dan weer niet gedaan wordt ...

Eigenlijk willen we wetgeving die verbiedt dat testresultaten in welke vorm dan ook niet representatief zijn voor een reëel gebruiksscenario. Ik weet niet of dat juridisch-technisch mogelijk is, maar misschien kunnen we zelf al iets doen: niet kopen. Stel je koopt een tweedehands auto en die blijkt verborgen gebreken te hebben. Grote kans is dat je daar niet teruggaat. Maar waarom niet bij elektronica? Misschien ben ik er gewoon heel makkelijk in, maar ik voel weinig behoefte om iemands winst te spekken en zodoende juist dat gedrag dat ik niet wil zien, te belonen.

Lost van dat er wetgeving zou moeten komen, kunnen we dit zelf ook oplossen. Ik ben wel vrij kritisch en dit gebeurt al meer dan 6 jaar en hekel ik. Samsung heeft ook al met televisies de boel opgelicht en praktisch iedereen weet hier dat de 3,5mm aansluiting wordt weggelaten bij telefoons (in feite is dat ook oplichting, want je wordt daarmee gedwongen een (relatief duur) bluetoothsetje te kopen terwijl je die ook kan kopen mét 3,5mm aansluiting), terwijl die bespaarde kubieke millimeters echt niet merkbaar is.
Daarom pas ik mijn gedrag aan. Niet alleen bij een Samsung televisie of een telefoon zonder 3,5mm aansluiting, maar ook bij een Amazon, waarbij ook voldoende geluiden zijn dat werknemers worden uitgeknepen.
Ik snap deels de vergelijking met Dieselgate, maar in dat geval was het ook zo om regels te omzeilen (voor zover ik me kan herinneren). Dat is hier niet aan de orde, dus ik vind het wat minder extreem.

Je hebt wel gelijk over koopgedrag, je koopt iets wat minder presteert dan (indirect) geadverteerd en dat is wel valsspelen.

EDIT: Dat je het niet met me eens bent wil niet meteen zeggen dat mijn opmerking "Ongewenst" is. Ik heb een mening, en ik vraag mensen om daar met me over te discussiëren.

[Reactie gewijzigd door jvnknvlgl op 26 juli 2024 08:21]

Het zijn andere wetten, maar volgens mij nog steeds illegaal (IANAL): als volgens een synthetische benchmark een hogere score getoond wordt dan dat er in werkelijkheid gehaald wordt, gaat het om misleiding en/of "false advertising", net als dat een auto volgens het lab 200 km/u kan doen maar in het echt maar net de 150 aanstipt.
als volgens een synthetische benchmark een hogere score getoond wordt dan dat er in werkelijkheid gehaald wordt,
Maar de snelheid wordt ook daadwerkelijk gehaald in de benchmark, daar is dus niks vals aan.
Maar de snelheid wordt ook daadwerkelijk gehaald in de benchmark, daar is dus niks vals aan.
In de benchmark wel, maar in real life niet! (Want meer conservatieve settings).

De verwachting is dat de prestaties in een benchmark een indicatie geven hoe het apparaat onder ‘real life’ omstandigheden presteert.

Door deze modus is dat dus niet zo, en geeft de benchmark daarmee een vertekend beeld van de real life prestaties. ( want die liggen lager dan de benchmark)

Dus cheat.
Het probleem is, dat Op deze manier synthetische benchmarks zo ver boven de werkelijkheid komen te staan (en boven de concurrentie, wat dat is uiteindelijk het doel), dat je kunt spreken van manipulatie.

Ook normaal uitgevoerde synthetische benchmarks hebben een zekere relatie tot real-life prestaties, en tot de competitie, zodat je vergelijkingen kunt maken. Als Je dat niet meer mogelijk maakt, door de boel te manipuleren, dan speel je vals.

Immers, wat test je dan nog?? Wat heeft die benchmark dan nog voor nut? Geen! En dat zie je dus ook gebeuren.

Dus met dit soort akties haal je deze hele testmethode onderuit. (Wellicht is dat ook een doel, om het achterblijven in echte prestaties te verbloemen.) Dus te stoppen met synthetische benchmarks, aangezien de resultaten toch bullshit zijn...
Dit kun je dan eerder vergelijken dat de nieuwste AMD Ryzen 9 9900 op 6 Ghz loopt volgens de benchmark, maar in dagelijks gebruik onder de 5Ghz blijft hangen want stroom te kort, of kan de warmte na een half uur niet meer kwijt.

Is volgens mij pure misleiding.

[Reactie gewijzigd door DiaZ_1986 op 26 juli 2024 08:21]

Dat gebeurd toch ook met die turbo/boost clocks? Eventjes hoog, maar zodra de temperatuur stijgt draait ie zichzelf weer terug die CPU. Met slechte koeling in een PC/laptop gebeurd dat zo goed als permanent ja.
Maar die boost doet het tenminste voor alle programma’s, niet alleen voor de benchmarks.
bedoel je zoiets als die chilled Xeon CPU op die show een paar jaar terug waar ze een 28-core CPU op 5Ghz lieten zien (zonder te vermelden dat iets exotischere koeling gebruikten dan de industrie standaard.

https://nl.hardware.info/...ing-die-er-voor-nodig-was
Ja en nee, het idee is hetzelfde, alleen wordt er in dit bericht direct al aangegeven dat dit nu werkt onder extreme koeling en dat ze het hopen binnenkort uit te brengen. Als ze dat er inderdaad niet bij hadden vermeld (dat er extreme koeling is gebruikt) dan was dit, in mijn ogen, ook misleiding geweest.
Als de chip rapporteert dat het maar 75% load heeft, terwijl ie 100% load werkelijk heeft, dan zou het vergelijkbaar zijn, maar hier komt de input overeen met de resultaten.

Het is eerder dat de auto normala gesproken een maximumsnelheid van 200kmh heeft, maar als je hem op een circuit rijdt, dan gaat ie ineens 220.

[Reactie gewijzigd door Martinspire op 26 juli 2024 08:21]

Het probleem is echter dat de auto's alleen op het circuit rijden wanneer er een benchmark wordt gestart. Jij als gebruiker moet het doen met de openbare weg zonder zelf ooit op het circuit te kunnen rijden.

De benchmarkresultaten worden door alle potentiële kopers gezien op de bekende websites en krijgen een verkeerde indruk van de prestaties. Als gebruiker zul je diezelfde prestaties namelijk niet halen omdat het een verborgen modus is waarop de socket opereert.

Ik vind dit misleiding, ze laten iets zien dat een normale gebruiker nooit kan bereiken zonder dat een gebruiker dit weet. Mooi dat ze zijn betrapt.
de nissan skyline/gtr doet exact dat, normaal begrenst op 200 a 250 (afhankelijk waar je hem koopt) en als de gps ziet dat je een circuit op rijd gaat de begrenzer automatisch eraf.
Heb je daar hard bewijs van? Ik heb met een GT-R meegereden (in 2013) in Duitsland. Ding gekocht in NL, daar ging de meter vér over de 250 heen. Op standaard software, met bio-ethanol, dat wel.
afhankelijk waar je hem koopt zei ik ook. de nederlandse importeur haalt de 250 begrenzer eruit standaard omdat veel europese circuits niet in het systeem staan.

in japan is de begrenzer standaard op 200. maar daar staan wel alle circuits erin.

[Reactie gewijzigd door flippy op 26 juli 2024 08:21]

Het geldt ook alleen in Japan, daar mogen ze maar 180. Iedere auto daar heeft zo’n begrenzer. Alleen bij de GTR gaat die er op basis van de gps vanaf op een circuit. Wat hij buiten Japan doet is mij niet duidelijk

https://www.motorauthorit...when-you-get-to-a-circuit
Het geldt ook alleen in Japan, daar mogen ze maar 180.
Was dat geen "gentlemans agreement" tussen de grote automerken (en dan vooral Nissan en Toyota, na de Skyline/Supra race) welke Nissan "gebroken" heeft met de GT-R? Zo is het bij mij bekend in ieder geval.
Nee, iedere auto in Japan is begrensd op 180. Ze hadden volgens mij wel een gentlemen’s agreement op het vermogen van 280 pk. (Wat stiekem uiteindelijk gewoon 330-350 pk betekende.)
Maar adverteren ze hier zelf mee? Op zich leveren ze gewoon een SoC die beter is in benchmarks, als je reviews leest staat daar dat hij goed is in benchmarks, en als je hem op basis daarvan koopt heb je een telefoon gekocht die goed is in benchmarks. Als hij daarna traag aanvoelt in telefoongebruik kan je niet klagen over false advertising, gezien ze nooit iets zeiden over normaal telefoongebruik. Het is een inherent probleem met benchmarks, je test niet hoe krachtig de SoC is voor gaming of browsing, maar voor bepaalde berekeningen. Een review waarbij de laadtijd van een website in een browser getest wordt zou in dit geval nog steeds een correct beeld schetsen.

Het is als een auto kopen waarvan je gelezen hebt dat hij op een drag strip 120km/u kan en dan teleurgesteld zijn dat je op een gewone snelweg met wat passagiers erin maar 90 kan, terwijl de fabrikant niet eens over de snelheid sprak.

Ja, het is uiteindelijk misleidend, maar er is niks officieel, geen standaard zoals bij de uitstoot van auto's.

[Reactie gewijzigd door bertware op 26 juli 2024 08:21]

Het is precies hetzelfde resultaat dus, alleen een andere aanleiding om het te doen.

Vindt hun statement dat het ondanks de selectieve boost gebruikers een goede indicatie geeft hoe goed de hardware is ook niet bepaald slim gekozen.
Dat is hier niet aan de orde, dus ik vind het wat minder extreem.

Dat is wel aan de orde. De SoC presteert enkel beter in die benchmark, niet in de game die jij vervolgens speelt. (Tenzij die game toevalig ook als benchmark gebruikt wordt op veel sites.)

Net zoals die diesel VW schoner was op de testbank, dan op de weg, zo is deze SoC sneller in de benchmark dan in de game of video-editing tool.
-edit- (verward met een andere tweaker)

[Reactie gewijzigd door sampoo op 26 juli 2024 08:21]

Dieselgate was bedoelt om wetten te omzeilen. Het gaat hier om het optimaliseren van benchmarks zoals heel veel fabrikanten doen er die hebben daardoor benchmarks tot iet nietszeggend gemaakt. Ik ken geen enkele site met enige reputatie die dat soort tests doet en ook de firma's zelf doen er amper iets mee.

Het is irritant maar ik lig er niet wakker van. Dreft roept ook dat het twee keer beter schoonmaakt.
Dat zie je verkeerd. Want de SoC doet inderdaad het werk, maar dat doet de SoC ook alleen in een benchmark. Dit doen ze omdat de telefoon in normaal gebruik veel te heet wordt, veel stroom verbruikt en dus de levensduur gigantisch achteruit gaat. Dus je hebt er nooit iets aan als gebruiker zijnde, want dan worden er wel weer allemaal limieten ingesteld die de telefoon bruikbaar houden.

Vergelijk het een beetje met Intel en AMD die benchmarks gaan uitbrengen die gedaan zijn met vloeibare stikstof koeling en zo dus de 7GHz halen in de opstelling die ze gebruiken, maar jij als gebruiker komt nooit boven de 5GHz uit bij bijvoorbeeld Intel. Ja de chip doet al het werk, maar thuis ga je er nooit iets van merken. Of je moet thuis ook aan de gang met LN2 en dan wachten tot de chip kapot gaat binnen een paar dagen. :P
Wel een idee, zoveel benchmarken tot je telefoon gesmolten is en dan vragen om garantie. Als genoeg mensen dit doen komen ze er wel van terug..
Dit vind ik een reëel en goed idee, de consument is hier namelijk de dupe van aangezien tech reviewers dergelijke benchmarks gebruiken om bijvoorbeeld scores toe te wijzen aan een telefoon. Zo ook tweakers.net.
Je krijgt dus hele scheve verhoudingen. De SoC van het ene bedrijf kan op papier (a la deze benchmarks) sneller zijn, maar een ander toestel met een andere SoC kan in de praktijk sneller zijn omdat deze bijvoorbeeld zijn hitte kwijt kan en dus langer op hogere clocksnelheden kan draaien.
Dit is puur om winst op te drijven. Werkt alleen bij benchmarks, als gewone gebruiker kun je er niet bij.. Kortom, nutteloos voor ons als gebruiker.
Het probleem is dat het geen realistisch beeld geeft van de daadwerkelijke performance van de soc. Ook kan je geen vergelijkingen meer trekken met socs van andere makers om erachter te komen welke echt sneller is
Dit is toch niet anders als met het "diesel schandaal" van alle auto fabrikanten. Daar was het toch ook dezelfde motor die getest werd.

Waar ik mijzelf meer aan erger is dat dit soort berichten altijd gepaard gaan met: we opereren binnen de richtlijnen maar wat ze eigenlijk bedoelen te zeggen is we hebben een grijs gebied gevonden en die proberen we tot zover we kunnen uit te buiten.

En dan waarschijnlijk wel aan je medewerkers een ethics & compliance training geven.
Stel je voor dat je een PC koopt met een processor die in benchmarks 5ghz haalt, men roept dan dat het een goede koop is en dat de processor snel is.

Maar dan in praktijk haal (bijvoorbeeld) maar 4ghz, en je hebt de mogelijkheid niet om de geclaimde 5ghz te halen tenzij je zo'n benchmark opstart.

En dan heb je een concurrent die niet vals speelt en 4ghz is en dagelijks ook haalt, men gaat voor de snellere 5ghz want tja deze benchmark zegt dat die snellere beter is toch?

In feite is dat wat hier nu gebeurt, die chip gaat koste wat het kost de snelste snelheid hanteren zodat hij beter presteert in zo'n benchmark dan in praktijk, terwijl de concurrent die dat misschien niet doet dus op papier slechter lijkt, terwijl in alle non benchmark gebruik ze even goed zijn.

Je krijgt een heel verkapt beeld op die manier.
Een auto is een goed voorbeeld.
Het zou wat zijn als de consument een auto koopt die begrenst is op 250 km/u...

Komen die gasten van Top Gear, The Grand Tour, Fifth Gear langs en ineens kan de auto 300 km/u. Waarom? Omdat de auto de presentatoren herkent en zichzelf lekker overklokt.

Dit laten ze dan zien als een soort waarheid. Echter klopt het niet met wat je als koper krijgt.

Dus ja, het is valsspelen. Je product beter voordoen dan wat de consument werkelijk krijgt,

Off Topic:
En wat betreft dat down modden. Mensen doen niet aan de tekst die in je bijdrage staat en dat dan modden volgens de regels. Ze geven gewoon aan dat ze het niet met je eens zijn. Dat is al jaren zo.
Als ze maar 1 punt meer dan een concurrent kunnen scoren op deze manier staan ze erboven in de lijstjes.
Dat schijnt van belang te zijn. ;)
Omdat deze performance niet is wat je krijgt.
Autofabrikanten passen met dezelfde methode ook emissietest aan zodat ze beter uit de bus komen c.q aan een norm voldoen.

Raar dat ze toch dikke boetes gekregen hebben en het argument we laten zien wat technisch mogelijk is toch niet opgaat.

Maar stel je voor je koopt een auto 0-100 in 6sec. Echter dat is alleen mogelijk als de gps ziet dat je op het zeg vw test terrein bent en de software via chiptuning even het vermogen met 30% verhoogd. Zie daar 0-100 in 6 sec

In de praktijk blijkt het echter 8 seconde te zijn en oeps de euro 6 blijkt eigenlijk euro 5 te zijn.

Maar ach we laten zien wat technisch mogelijk is.
Dit het zelfde als de sjoemel diesel.
Door dit soort trucjes krijg je een onrealistisch beeld van de prestaties van de processor. De processor presteert beter in de benchmarks in een niet-kunstmatig workload. En dit word puur gedaan om de processor te adverteren als beter dan het eigenlijk is, dit is niks anders dan misleidend.

Rond 2003 liepen GPU fabrikanten ook te sjoemelen met hun drivers zodat hun hardware beter presteerde in benchmarks zoals de toen populaire Futuremark en 3Dmark. Na tegenbeweging van de gaming gemeenschap die dit zeer misleidend vond zijn deze optimalisaties uit de drivers verwijdert.
Stel je hebt een collega die de hele dag lettwrlijk niet werkt, en enkel op facebook en YouTube zit, maar als de baas langskomt doet hij zijn werk prima.

Op welk gedrag moet je die collega beoordelen als ik je vraag hoe goed hij z'n werk doet? Ga je daadwerkelijk zeggen "hij is erg goed hoor. nou ja: hij doet enkel wat als de baas er ie, maar daarmee bewijst hij wel dat hij het kan"?

Nee, natuurlijk niet, zo ook met deze soc: de score in die benchmarks weerspiegelen niet wat gebruikers kunnen verwachten in de praktijk, omdat de soc minder hard werkt buiten die benchmarks.
maar het is niet alsof ze de score direct aanpassen naar onrealistische waardes. Het is nog steeds hun SoC die het werk doet. Of zie ik dit verkeerd?
Aangezien het niet voor consument benaderbaar is, is het wel degelijk vals spelen: stel dat je een sportwagen koopt die alleen op een test bank sneller gaat dan 80km, dan voel je toch ook belazerd?

Daarentegen kan je argumenteren dat alle bench marks synthetisch zijn.
Als de SOC deze performance kan halen, dan moeten ze die permanent aan hebben staan. Het is nu zo dat je performance meet met benchmark A (en dan gaat de sportmode aan) en battery life met benchmark B (en dan is de sportmode uit). De getallen uit de benchmarks zeggen dan ook vrij weinig (iig. de performance getallen). Dus imnsho is dit gewoonweg misleiding: het uiteindelijke product haalt of de battery life niet of de performance getallen niet.
Het behoeft eigenlijk geen uitleg, maar bij deze mijn uitleg aan jou, omdat je het niet begrijpt.
Als een telefoon 30% sneller is, is dat ongeveer de hele winst die binnen 1 jaar behaald wordt door R&D in de industrie. Ofwel je bent door zo'n toename bij met de markt, of je bent het niet en loopt een jaar achter.
Wat ze feitelijk doen op deze manier in met hardware die een jaar achterloopt pronken alsof het mee kan komen met de nieuwste hardware op de markt. Dat geeft hen een oneerlijke concurrentiepositie.
Het is dus maar goed dat ze tegen de lamp lopen.
Blijkbaar werken ook de telefoonfabrikanten er vrolijk aan mee om maar goedkoop te kunnen scoren.
Dat is hier aan de hand en dat is valsspelen aangezien de eindgebruiker het feitelijk altijd met 25% minder moet doen dan zij denken te krijgen.
Het is zo simpel als het verschil tussen het aantal mensen dat staat te trappelen om de nieuwste iPhone te kopen en de groep mensen die het wel best vind en een jaar oud model koopt. Aan die eerste groep mensen is simpelweg meer geld te verdienen per telefoon. De winstmarges zijn hoger. En dat is puntje bij paaltje het enige dat telt voor het voortbestaan en de doorontwikkeling van je bedrijf. En zie je het al voor je dat Apple de nieuwste iPhone aankondigt met veel bravoure en vervolgens blijkt dat er gewoon dezelfde chip als vorig jaar in zit, alleen een cheat zorgt ervoor dat hij beter presteert in benchmarks, maar in de praktijk is je telefoon gewoon 1 jaar minder lang relevant door zo'n move.
Het is niet eerlijk dat het ene bedrijf enorm investeert om dit te bereiken en een ander bedrijf door te manipuleren op z'n louweren kan zitten. Uiteindelijk zou het ook voor de consument beter zijn als er niet wordt valsgespeeld, maar de vergelijkingen 1-op-1 kloppen. Dat betekent meer concurrentie en daarmee nog betere producten voor minder geld.

Het gedrag van Mediatek en haar partners is simpelweg niet te verantwoorden en immoreel. Richting de consument in de eerste plaats. Dat zou toch het doel van iedereen hier moeten zijn? Dat de ontwikkelingen binnen de markt ten goede komen van de consument.

[Reactie gewijzigd door nms2003 op 26 juli 2024 08:21]

Dit is vals spelen omdat de gangbare grenzen en begrenzingen uitgeschakeld worden. Dit gebeurd enkel tijdens benchmarken (vandaar de whitelist) en heeft enkel als doel om hogere scores te behalen.
Het is alsof je bij de autodealer vraagt hoeveel brandstof een auto verbruikt. De dealer zegt 'hij rijdt 1 op 30'. Wat blijkt - de auto rijdt 1 op 22 in de praktijk.
Benchmarks zijn (waren?) er om een meetbare en duidelijke vergelijking te maken voor consumenten (leken). Hoe meer de benchmarks opgepompt worden met lucht, hoe meer consumenten voor de gek gehouden worden. Consumenten laten zich sturen of zelfs leiden door benchmarks wat betreft aankopen. De consument wil namelijk geen uren op een of ander forum zitten met allemaal nerds ( ;) ) om te beslissen wat die gaat kopen. Daarom zijn er keurmerken, energielabels en compatibility kreten (bedenk er zelf maar even een paar, ben even inspiratieloos) en jawel - benchmarks.
Door de benchmarks te foempen wordt er bij de consument zand in de ogen gestrooid. Dat noem ik vals spelen.

[Reactie gewijzigd door 5pë©ïàál_Tèkén op 26 juli 2024 08:21]

En dan nog achterlopen op de concurrentie. Ik hecht de afgelopen jaren ook weinig waarde meer aan benchmarks, wat nogal jammer is, want ze waren een prima manier te zien hoe SOCs ten opzichte van elkaar presteerden.
Of de rest doet dit ook maar beter?
Synthetische benchmarks zijn überhaupt compleet nutteloos voor de de gemiddelde gebruiker en zelfs de gemiddelde poweruser. Computers (ook die in je broekzak) zijn tegenwoordig zo opgezet dat verschillende subsystemen elkaar op meerdere manieren kunnen beinvloeden, gedeelde bussen caches en andere resources zorgen er voor dat de performance van een resource drastisch anders kan zijn als er een ogenschijnlijk ongerelateerde resource word aangesproken. En dan heb je ook nog powermanagement dat zelfs binnen een enkele chip nog uit verschillende zones en niveaus kan bestaan.

Ze zijn alleen nuttig voor software developers om te bepalen hoe ze het beste resource gebruik kunnen optimaliseren om juist performance / power / warmte problemen door bovenstaande te voorkomen.

Gelukkig zijn de meeste benchmarks in consumentenreviews dan ook simpelweg herhaalbare scripts binnen échte toepassingen zoals in-game benchmarks, zip bestanden (de)comprimeren en video en/decoden. Dat zouden ze bij smartphones ook moeten doen.
"We geloven dat het laten zien van de volledige capaciteiten van een chipset in benchmarks in lijn ligt met de praktijken van andere bedrijven en we geloven dat het consumenten een goede afspiegeling geeft van de prestaties van het apparaat."
Ofwel: Andere bedrijven doen het ook dus gaan wij hier in mee.
Er valt wat voor te zeggen... Als jij als een van de weinige fabrikanten eerlijke scores plaatst, dan val je weg tussen alle hogere scores.
Jammer als je dan wordt betrapt en de deksel op de neus krijgt.
Maak dan gewoon een website aan waarin je ander fabrikanten aan de schandpaal nagelt ipv. dit zieke systeem in de lucht te houden.
Dat doet je als bedrijf geen goed als je regelmatig onderling over patenten, fabrieken (als ze fabs delen), leveranciers etc moet onderhandelen.
dat spelletje kennen we nog van in de tijd dat amd en nvidia begonnen met geoptimaliseerde drivers voor bepaalde games/benchmarks te maken. nix nieuws dus onder de zon, alleen dat het nu bij een ander type hardware is en gewoon de powersaving van smartphone/OS-makers bypassen is
doet me denken aan VW sjoemelsoftware. krijgen we nu een hele reeks schade claims en rechtzaken?
Mogelijk (als een gebruiker hard kan maken het toestel niet te hebben gekocht met slechtere benchmarkwaardes) maar wel een stuk minder heftig natuurlijk, VW probeerde de wet te omzeilen, MediaTek niet ;)

[Reactie gewijzigd door watercoolertje op 26 juli 2024 08:21]

Nah want VW (en vele andere fabrikanten) hebben regels overtreden. Er is geen wetboek waarin staat dat je een SOC niet wat harder mag laten werken in een benchmark.
Er is wel een wetgeving die stelt dat als de fabrikant/verkoper je spullen verkoopt die niet aan de verwachting voldoet, je mag vragen alsnog dat te krijgen wat je kunt verwachten. Kunnen ze dat niet, dan kun je de koop ongedaan maken.

Ik zet er bewust verkoper bij, omdat deze moet zorgen voor een deugdelijk apparaat. En met de verkoper heb je de overeenkomst, meestal niet met de fabrikant.

Aangezien Mediatek niet zelf de apparaten maakt, maar bedrijven als Oppo en Sony, zullen we eerder naar hen moeten wijzen. Zij implementeren namelijk dit stukje software/firmware.
Ik snap je punt, al is het dit keer niet de fabrikant, maar mediatek zelf die dit levert, als ik het zo lees. Kan hier fout zitten hoor.

Dan wordt belangrijk, roept de verkoper iets in de richting van, de telefoon kan dit want de benchmark is. Zolang ze zelf niet met scores te koop lopen, als reclamemiddel e.d. dan heb je denk ik geen poot om op te staan. Want dan is het een bijv. een youtuber die een 3rd party benchmark doet, dat staat ver genoeg van de fabrikant vandaan.
Hooguit een motie van treurnis. Er zijn geen wetten overtreden o.i.d.. Qua strafrecht is er in ieder geval geen zaak.
Qua civiel recht kan dit anders liggen maar verwacht geen Amerikaanse taferelen. Het consumentenrecht is er om consumenten te beschermen, niet om er aan te verdienen. Als je kan concretiseren/bewijzen dat je echt misleid bent door een benchmark die de fabrikant goedkeurde én dat je hierdoor aantoonbare schade hebt opgelopen (je zou anders een ander toestel kopen), dán kan je naar een jurist/advocaat stappen. Class cases hebben we in de EU zeer zelden dus als je je belazert voelt moet je zelf aan de bak.

Wat me beter lijkt is dat het consumentenrecht wordt aangescherpt op het punt van door de fabrikant aangeleverde data die als doel hebben het product te vergelijken (energieverbruik, benchmarks etc etc). Dan is het hopelijk snel afgelopen met dit gehannes.
Is de vorige keer toen dit aan het licht kwam ook al gebeurd. In het Anandtech artikel vertellen ze data er inderdaad class action lawsuits zijn gewonnen tegen Samsung om vervalste benchmarkresultaten.
Mwa wil toch niks van mediatek hebben dus het zal mij een worst wezen.. het is vaak oude techniek in een nieuw jasje op een oude node en gewoon minder qua features. Ik pas er voor doe mij maar gewoon een snapdragon.

Van mij mag dit overigens keihard aangepakt worden. Dit heeft niets met optimaliseren te maken maar is gewoon de consument misleidden. 99% zal niet in de whitelist staan en dus niet die snelheid halen en dus is dit totaal niet representatief van de gebruikservaring.
Dit is gewoon meer hardware specs beschikbaar stellen om beter voor de dag te komen. optimalisaties zouden voor iedere game gelden die er gebruik van maakt en dat is hier gewoon niet het geval.

[Reactie gewijzigd door computerjunky op 26 juli 2024 08:21]

Bedenk me ineens. Mediatek speelt helemaal niet vals.
Ze leveren de SoC en eventueel de firmware/software om in te zetten.

Het zijn Sony, Oppo en consorten die beide implementeren om dit mogelijk te maken in benchmarks.
Ik vraag me namelijk af waarom Samsung niet genoemd wordt. Die gebruiken ook al enkele jaren Mediatek in een aantal apparaten.

Het is dan weer wel zo dat Mediatek het de afnemers mogelijk maakt om vals te spelen...

Sony, Oppo en consorten gebruiken firmware/software om vals te spelen met mediatek SoC's in benchmarks

Lijkt me een betere titel. En dan uitleggen die deze code aangeleverd heeft.

off topic:Dit Off Topic/Irrelevant?

[Reactie gewijzigd door jqv op 26 juli 2024 08:21]

Benchmarks zijn sowieso geen afspiegeling van dagelijks gebruik. Hoe snel en soepel je user interface is hangt afgezien van de chip ook af van optimalisatie, animaties, refresh rate en touch respons rate en zelfs internetsnelheid. Daarom is het dus ook zo verstandig om reviews te lezen / kijken, en bekend te zijn met de software en schermspecificaties.

Dat gezegd te hebben, benchmarks zijn altijd al een plek geweest om als OEM het meest uit een telefoon te trekken, om de concurrentie zwakker te laten lijken. En als elke chipfabrikant en telefoonmaker dat doet, is het nog steeds kwalijk, maar relatief gezien zullen de resultaten niet veel verschillen.

Het is anderzijds wel logisch dat fabrikanten hier zoveel baat bij hebben. Omdat het uitvoeren van speedtests in de UI veel moeilijker is en veel meer tijd vraagt van reviewers, worden bijna altijd benchmarks gebruikt. Het kan lekker snel, de verschillen zijn visueel goed te zien, en potentiële kopers kunnen de resultaten makkelijk vergelijken met benchmarks van andere toestellen. Dat gaat moeilijker bij speedtests, omdat elke reviewer zijn eigen test heeft.

Het is jammer dat dit gebeurt, maar tegelijk ook begrijpelijk. Het zou daarentegen wel fijn zijn als hier tegenop wordt getreden, door de reviewers, commissies of fabrikanten zelf, al ben ik bang dat er weinig gaat veranderen, aangezien er niets strafbaars, maar wel vuil, wordt gedaan. De tijd zal het leren.
Vandaar dat mijn oude Philips TV zoveel moeite had met Android TV |:(

Op dit item kan niet meer gereageerd worden.