Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 31 reacties

Onderzoekers van chipfabrikant Intel hebben een energiezuinige chip ontwikkeld die mobiele processors moet ontlasten bij het coderen van videocontent. Het ontwerp is gebaseerd op het Terascale-project van de fabrikant.

De chip die het encoderen van videocontent moet versnellen is met een 65nm-cmos-procedé vervaardigd en werkt op een spanning die tussen de 220mV en 1,4V ligt. Volgens Intel levert het nieuwe chipontwerp bij het coderen van video tien tot honderd keer meer prestaties per watt dan een normale cpu. Intel claimt dat zijn prototype bij 320mV en een kloksnelheid van 23MHz slechts 56 μW verbruikt. In de spaarstand schakelt de chip terug naar 4,3MHz en verbruikt dan slechts 14,4μW. Op vol vermogen, waarbij de kloksnelheid op kan lopen naar 2,4GHz en de spanning op 1,4V ligt, bedraagt het energieverbruik 82mW. De chip zou vooral bedoeld zijn om mobiele cpu's te ontlasten.

De testchip is onderdeel van het Terascale-project van Intel. De originele Terascale-chip heeft tachtig IA-cores, maar de technici van Intel hebben dit aantal verhoogd naar 255, waarvan een deel speciaal voor een bepaalde taak is ontworpen. Zo blijkt uit de presentatieslide van de hardwarematige video-encoder dat 25 cores specifiek ontworpen zijn voor versnelling van graphics en video, terwijl 20 cores zijn gereserveerd voor encryptie. Voor spraak- en zoekfunctionaliteit heeft Intel 39 kernen vrijgemaakt.

Intel video-encoder accelerator-chip

Moderatie-faq Wijzig weergave

Reacties (31)

moet ik dat zien als een soort 80's co-processor?
Jup, deze chip kan ingezet worden voor video taken.

Het ligt net iets anders als Maddoc McHare aangeeft. Larrabee is ook een onderdeel voor bepaald bewerkignen (3D effecten met name, het wordt dan ook een videokaart).

Deze chip is zo ook een deel uit de tera-scale processor. Een CPU die net als die van de Cell Processor PS3 uit afzonderlijke delen bestaat die voor hun eigen taak zijn gemaakt. Zie ook de afbeelding. Allemaal cores met hun eigen taken.

Ook AMD is bezig met een dergelijke "Lego-systeem". Allemaal blokjes die men samen kan voegen en afhankelijk van de markt afstemmen. Voor de 1 meer normale processor cores, voor de ander meer video cores.

Voor tera-scale zal oa deze chip intern komen, maar kan men ook cores van Larrabee in de chip verwerken.

Dit is de richting die we op gaan. Dit is wat uiteindelijk AMD Fusion moet zijn. Een modulair systeem waarin de oude x86 cores worden gecombineerd met nieuwe technieken in een flexibele CPU die op een bepaalde taak is afgestemd. Voor het in 1 chip zit duurt nog even. Maar het begin is er. Straks krijgt de Core i5 de northbridge al intern en daarmee ook de igp. De volgende stap is dus dit, tera-scale. Dan zal deze chip, net als x87 floating point, in de CPU komen ipv in een losse chip.

Edit: Het komt niet duidelijk uit mijn post misschien, maar dit is voorlopig wel een losse chip. Hij zit nog niet in je CPU. Dat is wel het uitendelijke doel zoals je kunt lezen. Echter, dit is een losse stand alone testchip dat als opstapje wordt gebruikt. Nu nog een losse, zuinige, chip. In de toekomst maakt het deel uit van een groter geheel: Tera-scale processor.

[Reactie gewijzigd door GENETX op 19 mei 2009 15:17]

In mijn ogen lijkt het me juist veel handiger om een bak met processors te hebben die dynamisch multitasken. Als er veel videokracht gevraagd wordt, bijv. gamen, 3d renders enz. wordt de massa hierop gestort en en een klein deel voert de overige taken uit, os, programma enz. wat nu de cpu doet vooral.
Dat er nu veel cores gebruikt kunnen worden is wel erg mooi maar het beperkt zich nu nog wel op bepaalde delen.
Ik weet echter niet of dat veel uitmaakt.
Die processor hebben we al: De x86. Een General Purpose CPU. een CPU die voor alle taken geschikt is. Het heeft enkel 1 probleem: Hij is niet geoptimaliseerd voor bepaalde taken.

Het liefste heb ik ook hetgeen jij schetst. echter is het niet echt haalbaar op dit moment. Dan zou je uiteindelijk een 64-core of 128-core CPU willen waarbij elke kern een x86 instructieset heeft, een igp, deze chip voor video, wellicht nog een hulpstuk etc etc.

Wat krijg je? Een hele grote, dure, energieverslindende CPU. Wellicht dat we dat krijgen in de toekomst, maar voorlopig is het vaststellen van het aantal cores en van welk type in een lego model de enige haalbare optie om echt winst te boeken zonder aparte insteekkaarten.

De huidige x86 kan alles zogezegd dus ook wel, maar het kan onze eisen niet bijhouden. Daarom hebben we deze ingrepen alsnog nodig. Dat is het grote manco van General Purpose CPU's en daarom grijpt men juist naar gespecialiseerde units.
In mijn ogen lijkt het me juist veel handiger om een bak met processors te hebben die dynamisch multitasken.
Even kort door de bocht: hoe specialistischer een chip hoe zuiniger die kan zijn. Dat een x86 zo lekker veelzijdig is lijkt op het eerste gezicht mooi, maar die verstoken al gauw richting de 100 W (voor een lullige vier coretjes). Dit ding haalt de 100 mW nog niet eens (letterlijk duizend keer zuiniger), terwijl er 255 cores inzitten. Tuurlijk zijn die core-voor-core een stuk minder krachtig, maar op een taak met veel parallellisme zouden ze die x86 processor zonder problemen finaal moeten verslaan op totale snelheid.
Nee een ontwikkeling hieruit voortvloeiend is de Larabee architectuur.

http://www.intel.com/technology/visual/microarch.htm
Nope: "een 80's co-processor" was 1 afzonderlijke chip die gespecialiseerd was in 1 taak (bijv. floating-point berekeningen), naast de CPU.

Dit is 1 chip die meerdere gespecialiseerde taken kan afhandelen (zie post van GENETX hierboven)
Niet. Dit is dan wel geen insteek kaart, de chip kan gewoon op het moederbord komen naast de CPU.

Er zijn hier 2 dingen die spelen:
1. De gehele tera-scale chip waarin oa deze core kan komen in 1 plakje silicium (waar jij het over hebt.
2. Een losse chip als resultaat uit het tera-scale project. Iets waar het artikel over gaat.

Kortom: Nu nog een losse chip specifiek voor deze taken, in de toekomst een chip di in je processor is gebakken. Dus voorlopig wel een "80's co-processor", in de nabije toekomst komt deze wel in 1 chip.

Het is voorlopig een losse chip die als opstapje wordt gebruikt naar tera scale. Hetzelfde als de vroegere co-processor (die nu ook standaard in je CPU zit) en de videokaart die vroeg of laat ook zal sneuvelen voor consumenten als losse insteekkaart.

[Reactie gewijzigd door GENETX op 19 mei 2009 15:14]

SX / DX verhaal.
Zie het als een klein bedrijfje waar iedereen doelgerichte opleidingen heeft gekregen en dus werk naar hun wordt geschoven.
Terascale is West-Europa, de x86 is China.
Alleen loopt de vergelijking met landen niet echt op, :p. Europa is beter in dure, specifieke taken, China is beter in goedkope massaproductie, maar in het geval van video-encoding en dergelijke wil je liever goedkope, energie-efficiente massaproductie dan gespecialiseerde en dure units.

/offtopic
4,3MHz en verbruikt dan slechts 14,4μW. Op vol vermogen, waarbij de kloksnelheid op kan lopen naar 2,4GHz
:| zou dat ook niet mogelijk kunnen zijn met de gewone x64 en x86 cpu's? Surfen kan je al op een 100 MHz processor.

edit: Ik weet dat x64 en x86 verschillend zijn qua instructieset... Apropos deze instructieset moet in de cpu "gebrand" worden dus verschillen doen ze zeker. Maar wou eigenlijk richten naar de mainstream cpu's. Dus lees ipv x64 en x86 ->mainstream

Ik doel op het omlaaghalen van de kloksnelheid. Als het bij deze chips mogelijk is, dan moet het zeker mogelijk zijn op "mainstream" cpu's. Hoeveel mensen laten hun pc met msn opstaan terwijl ze naar de bakker gaan?

[Reactie gewijzigd door leeuwtjeuh1986 op 19 mei 2009 16:19]

:| zou dat ook niet mogelijk kunnen zijn met de gewone x64 en x86 cpu's? Surfen kan je al op een 100 MHz processor.
Niet perse... In de eerste plaats zijn Intel en AMD aan het proberen CPUs zo snel mogelijk te krijgen. Een CPU iets langzamer draaien dan waar ie voor bedoeld is, mag geen enkel probleem zijn. Als je echter heel ver gaat onderklokken (of dynamisch terugklokken), dan zouden er rare dingen kunnen gaan gebeuren; het zit er dik in dat Intel en AMD hun ontwerp (dat bedoeld is om bijvoorbeeld op ongeveer 2,5 tot 3 GHz te lopen) niet gecontroleerd hebben met een klok van 100 MHz. In theorie is het best mogelijk dat dit niet werkt, bijvoorbeeld omdat ladingen te snel weglekken. Als je op 2,5 GHz draait hoeft een lading maar 1 / (2,5 gigahertz) = 400 picoseconde herkenbaar te blijven als een nul of een één. Als je de klok op 100 MHz zet, dan duurt het opeens 10.000 picoseconde voordat eindelijk de volgende klokpuls aankomt, en je moet maar hopen dat je nul of één dan nog steeds herkenbaar is.
Mwoah, 100MHz? Ik zie een eeuwig draaiend rondje in Vista... Dat gaat niet lukken maar processoren klokken al tijden terug naar zo'n 800MHz. Het kan nog wel lager idd.

Overigens bestaan x64 processoren niet, dat zijn x86 processoren met 64-bit aanvullingen. Ze delen dezelfde basis.
Je hebt Vista niet nodig om te surfen, Win95 met een Pentium 100Mhz lukt zeker (jaren zo gewerkt).
Ja, en jij zou het liefst op Windows 95 blijven. De techniek gaat vooruit en daarmee ook onze eisen wat betreft snelheid. Het kan, maar of je het wilt is een tweede. Zie, mijn Ford Fiesta uit 96 rijd ook nog steeds, maar ik mis toch wel de airco. ;)

[Reactie gewijzigd door GENETX op 19 mei 2009 15:49]

Je bent 2 cpus aan het vergelijken die danig verschillen in instructieset. Deze nieuwe cpu verhoud zich tot een x86 als de cpu in je rekenmachine zich verhoud tot een gpu. Zoals een snorfiets zich verhoud tov een bus. Ze is zeer gespecialiseerd, bevat maar enkel instructies voor videoverwerking.

Het verbruik van een chip staat in verhouding tot de kloksnelheid en de chipgrootte.en de dikte vd verbindingen (65nm,.,.) en het materiaal, ...
Daarom kan een chip nog wel lager klokken ;) . Dat is waar leeuwtjeuh1986 op doelt.
Dit zou mooi zijn voor mobiele telefoons. Eindelijk enigzins met vrij weinig energie toch hoge kwalitatieve video's opnemen.
Maar ik neem aan dat dit een soort DSP word?

[Reactie gewijzigd door Pyronick op 19 mei 2009 14:58]

Dit zou mooi zijn voor mobiele telefoons.
Ik begrijp je niet helemaal, waar doel je op? energie efficiency? die technologie voor versnelling van het encoderen van beeldmateriaal? Integratie in mobieltjes is het laaste waar ik (op korte termijn) een oplossing in zie. Denk eerder aan verwerking van complexe matrices, beeldmateriaal van NASA e.d. niet het versturen van fotos en video op mobieltjes.

@SgtH3nry3 hoevaak blijf je je comment nog aanapssen?

[Reactie gewijzigd door Maddog McHare op 19 mei 2009 15:04]

Zo'n zwakke chip voor de NASA? Dit is gewoon bedoeld voor wat HD video. Oa voor in je laptop of in een HTPC. Wellicht dat we hem wel terugzien in blu-ray spelers. Ook voor mobieltjes met mini HDMI aansluiting is deze chip geen gekke gedachte.

Het is een chip die bedoeld om zuinig en efficient video te verwerken voor mobiele apparaten. Maar hoogswaarschijnlijk ook voor apparaten die een aparte chip behoeven voor deze taken omdat de huidige oplossingen doorgaans niet krachtig genoeg zijn.
Nu is het nog een zwakke chip, maar als 'ie doorontwikkeld wordt en de techniek (multi-core processors) verbeterd wordt zal het zeker wel voor gespecialiseerde taken gebruikt kunnen worden. Zoals nu bijvoorbeeld ook CUDA gebruikt wordt, alleen dan in plaats van een soort van 'bij-effect' van hoe videokaarten zich ontwikkeld hebben in floating-point rekenmonsters, veranderd naar iets dat speciaal daarvoor ontwikkeld is.
Dat klopt. Mede met het lego-systeem van hierboven: Uiteindelijk zullen er ook chips komen met een stuk of 200 van deze krengen in 1 die :)

Maar dat is niet aan de orde op dit moment en dezelfde chip, 1 zielig eenzaam chipje, kan evengoed nog altijd voor mobiele telefoons worden ingezet.
Bedoelen ze niet decoding?
encoding, decoding, komt op hetzelfde neer ongeveer. Je zou zoiets toe kunnen passen om iets direct te encoden op een videocamera of mobiele telefoon.
Encoding of decoding komt niet echt op hetzelfde neer. Het kan wel van eenzelfde chiparchitectuur gebruik maken (omdat het zowat dezelfde instructies nodig heeft) maar heeft tot zowat 5 maal zoveel rekenkracht nodig, al is dat nog zeer afhankelijk van het gebruikte formaat. Zeker bij een high end chip is een factor 5 niet zo triviaal.
Zo blijkt uit de presentatieslide van de hardwarematige video-encoder dat 25 cores specifiek ontworpen zijn voor versnelling van graphics en video, terwijl 20 cores zijn gereserveerd voor encryptie. Voor spraak- en zoekfunctionaliteit heeft Intel 39 kernen vrijgemaakt.
Wel grappig op zich, een X aantal jaren geleden had Intel zo'n zelfde verhaaltje, maar dan voor onderdelen en instructies voor processors - deze instructie is specifiek ontworpen voor versnelling van graphics en video (of multimedia, MMX), deze instructie is voor encryptie... etc.
Lijkt mij dat er altijd software moet zijn in de Mediaplayer die dit aanstuurt. Als je kijkt dat DXVA al beperkt ondersteund wordt door vele mediaplayers, duurt het nog jaren voor zoiets uberhaupt zijn weg vind in de gangbare mediaplayers. Op dit moment is er maar 1 mediaplayer die DXVA i.c.m. subtitles ondersteund (MPC-HC).En dit terwijl DXVA al heel wat jaren bestaat.
Lijkt mij dat het voor mobiele apparaten zoals mobiele telefoons is gemaakt en dat DXVA daar weinig mee te maken heeft.
Waarom zou de applicatie software dit moeten aansturen? Lijkt me meer een taak voor het OS: "Hmm, deze hele time slice was er geen enkel proces dat gebruik wou maken van de CPU. Nou, dan zullen we de boel es terugklokken.".
Het idee erachter is natuurlijk vergelijkbaar aan het Larrabee principe. Hoe meer schaalverkleining er op treed, hoe meer functionaliteit er op eenzelfde grootte wafer past.

Stel voor dat er straks processoren zijn met daarin een hoop gespecialiseerde cores. De cores zijn geoptimaliseerd voor wat men zich wenst om met een processor te doen. Ofwel, servers krijgen 10tallen voor SQL Server geoptimaliseerder cores en laptops krijgen zuinige voor Office geoptimaliseerde cores. 'Smartphones' (sorry Forrester ;)) krijgen

En, uiteraard schakelen de cores zich uit als ze niet gebruikt worden ;)

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True