Inleiding
Van 16 tot en met 18 april komen enkele duizenden technici, professionals en journalisten bij elkaar om samen de nieuwste technieken, producten en trends te bespreken. Het Intel Developer Forum is een twee maal per jaar terugkerend evenement waarbij het publiek een kijkje in de keuken van 's werelds grootste chipbakker wordt gegund. Het mooie aan de IDF is dat het niet puur een mediashow is, maar dat het ook technisch uitzonderlijk diepgaand is. Nergens anders krijg je de kans om in een paar dagen tijd te praten met de (hoofd)ontwerpers van zo veel verschillende standaarden en producten.
Tweakers.net zal net als in de drie vorige jaren vertegenwoordigd zijn bij de Spring-editie van IDF, die dit keer wordt gehouden in de Chinese hoofdstad Beijing in plaats van op de vaste stek San Francisco. De reden voor deze verhuizing is niet helemaal duidelijk, maar kan te maken hebben met Intels sterker wordende aanwezigheid in China: recent werd de bouw van een 2,5 miljard dollar kostende fabriek aangekondigd. Sowieso is een groot deel van het publiek dat op de Amerikaanse edities van de beurs afkomt Aziatisch, wat nu steeds meer bedrijven (delen van) hun ontwerpafdelingen naar het oosten verplaatsen alleen maar meer wordt. Het is dus ook wel zo eerlijk om het een keer bij hen 'thuis' te houden. Voor ons maakt het in ieder geval niet veel uit: het is nog steeds een rotstuk vliegen
.

Net als vorig jaar zullen we de beurs gaan verslaan in weblogstijl. Vanwege de overvloed aan informatie en een zwaar tekort aan tijd om alles te verwerken is het helaas niet mogelijk om op veel dingen diep in te gaan, maar in plaats daarvan een breed en gevariëerd beeld leveren lijkt ons een mooi alternatief.
Wat valt er te verwachten?
In de aanloop naar IDF heeft Intel al een aantal vrij onthullende aankondigingen gedaan, waaronder een ongebruikelijk openhartige presentatie over de 45nm-chipfamilies Penryn en Nehalem. Waarschijnlijk zullen er her en der wel nieuwe details op te pikken zijn - we zullen in ieder geval aanwezig zijn bij een benchmark-sessie - maar het lijkt er op dat men op het gebied van processors zijn kruit al verschoten heeft. Sowieso lijkt de beurs dit jaar iets minder groots opgezet dan voorheen: het aantal dagen is teruggebracht van drie naar twee, er wordt minder pers (in ieder geval uit de Benelux) uitgenodigd en een paar bekende namen - waaronder die van topman Paul Otellini - schitteren door afwezigheid. Hoewel IDF niet de eerste grote beurs zou zijn die aan schaalverkleining doet (onder andere vanwege de opkomst van internet) valt het volgens Intel allemaal wel mee: het zijn volgens hen meer de logistieke en praktische problemen die bij de 'verhuizing' kwamen kijken die ervoor hebben gezorgd dat men wat voorzichtiger is.
Er liggen in ieder geval genoeg kansen voor leuk nieuws, waaronder op de eerste plaats op het gebied van platforms. We hopen nieuwe informatie op te vangen over de plannen voor geïntegreerde geheugencontrollers, graphics en stroombesparing voor notebooks. Informatie over de prestaties van toekomstige chips en features staan ook hoog op het verlanglijstje. Andere sessies die we hebben omcirceld op het programma zijn die over de ontwikkeling van een benchmark om de prestaties per watt te meten, plannen voor co-processors op de FSB (en zijn opvolger CSI), de toepassing van DDR3 en hardwarematige XML-versnelling. Ook zullen we aanwezig zijn in een gesprek met Pat Gelsinger, die hopelijk wat inzicht kan verschaffen over toekomstplannen op servergebied en hebben we een interview met twee benchmarkexperts die hopelijk nog iets toe kunnen voegen aan onze servertests. Ervaring leert echter dat het de beste strategie is om alles maar een beetje over je heen te laten komen en dan vanzelf te zien waar het schip strandt.
(Draadloos) onderzoek
De eerste dag staat zoals gebruikelijk in het teken van research en development. De dag begint met een presentatie van de hoogstgeplaatste technicus van Intel, Justin Rattner, die een verhaal vertelt over de manier waarop het bedrijf probeert innovatief te blijven, waarbij constant verzet geleverd moet worden tegen de neiging om het 'makkelijke' en op het oog veilige pad van conservatisme te bewandelen, zoals grote bedrijven neigen te doen. Vorig jaar heeft Intel 473 patenten aangevraagd en 286 gekregen, wat volgens hem een goede indicatie is dat men nog steeds veel verschillende mogelijkheden onderzoekt. Er wordt onder andere gekeken naar geheugen, opslag, (draadloze) communicatie, stroombesparende technieken, nieuwe platforms en terascale computing.

Vervolgens worden er een aantal praatjes gehouden door Chinese onderzoekers, waar men ondere andere bezig is met het zoeken naar nieuwe toepassingen om multicoreprocessors te gebruiken. Een van de dingen die men laat zien is een project op het gebied van video-mining, waarbij men een opgenomen voetbalwedstrijd analyseert door de spelers te identificeren en volgen. Gebruikers kunnen dan makkelijk een selectie maken van belangrijke momenten. Een ander project zit op een lager niveau en houdt zich bezig met 'speculative parallel threading', waarbij delen van de code uit één thread tegelijk worden uitgevoerd op meerdere cores. Ook onderzoekt men hoe de kwaliteit van draadloze verbindingen beter kan worden in ruimtes waar een groot aantal apparaten tegelijk aanwezig is.

De volgende presentatie werd gehouden door Kevin Kahn, hoofd van de communicatie-afdeling, die uitleg gaf over onderzoek naar het gebruik van reconfigureerbare antennes. Laptops ondersteunen steeds meer draadloze standaarden (WiFi a/b/g/n, WiMax, Bluetooth, gsm/umts), maar antennes en radio's zijn relatief duur en veel ruimte in beslag. Daarom zoekt men naar manieren om zoveel mogelijk onderdelen te delen tussen verschillende standaarden. Een probleem daarbij is dat een antenne die heel 'breed' is en alle frequenties oppikt ook een hoop ruis heeft, wat niet bevorderlijk is voor de kwaliteit van de verbinding. Dit probeert men te voorkomen door de antenne dynamisch af te stellen op één frequentie. Door de verschillende communicatie-controllers met elkaar samen te laten werken, bijvoorbeeld door ze om de beurt in plaats van tegelijk uit te laten zenden, kunnen ze allemaal profiteren van betere verbindingen.
PCI Express Accelerators
Ajay Bhatt behandelde Geneseo, Intels visie op applicatie-specifieke 'Accelerators', analoog aan het Torrenza-initiatief van AMD. Er is al veel gedaan op dit gebied door een groot aantal verschillende bedrijven, maar het probleem is dat iedereen het op een andere manier aanpakt. Met toekomstige versies van de PCI Express-standaard probeert Intel dat te veranderen. Naast nog een verdubbeling van de effectieve transmissiefrequentie naar 10GHz - waarmee een x16-slot tot 32GB/s kan leveren - komen er een uitbreidingen om de software- en hardware-overhead te reduceren, bijvoorbeeld door betere ondersteuning voor het verzenden van kleine pakketten en snellere foutafhandeling en synchronisatie. Ook voegt men ondersteuning toe voor virtualisatie en energiebeheer. Voor toepassingen denkt men onder andere aan spraakherkenning, XML, encryptie, compressie en simulaties.
Een klein deel van de 'Accelerators' zal niet genoeg hebben aan Geneseo, omdat ze een directere verbinding met de processor(s) nodig hebben, maar daar komen andere oplossingen voor gebaseerd op CSI. HyperTransport c.q. Torrenza gebruiken is volgens Intel geen goede optie, omdat PCI Express veel breder is verspreid en het overgrote deel van de Accelerators helemaal niet zo'n strakke koppeling met de processor nodig heeft, helemaal niet zodra de Geneseo-uitbreidingen zijn ingevoerd. Dat zal helaas nog wel een tijd duren; hoewel dit jaar al delen af zullen komen, wordt de 1.0-versie van de standaard pas in 2008 verwacht, met eerste producten in 2009.
Intels eigen it-afdeling aan het woord
Hoewel iedereen Intel kent als producent van chips en ander spul, zijn ze uiteindelijk natuurlijk ook een grote gebruiker ervan. Intels it-infrastructuur bestaat uit 90.000 servers verdeeld over 136 datacentrums. Deze worden voor allerlei doeleinden gebruikt: ieder ontwerpteam, iedere fabriek en iedere locatie heeft zijn eigen servers. Maar zoals in bijna alle bedrijven het geval heeft men meer capaciteit dan er gebruikt wordt. Met een gemiddelde belasting van 65% doet Intel het nog redelijk goed, maar de trend is dat de individuele machines steeds minder te doen hebben, ondanks het feit dat er in totaal wel meer werk is. Bovendien is het grootste deel van serverruimtes meer dan tien jaar oud en dus niet optimaal voorbereid op de laatste technieken. Het ambitieuze plan is nu om alles terug te brengen naar acht locaties (drie in Amerika, drie in Europa en twee in Azië) en de gemiddelde belasting met virtualisatie op te voeren naar 85%. Hierdoor is minder fysieke hardware nodig waardoor men kosten kan besparen. Met een paar pilot-projecten op het gebied van virtualisatie heeft het bedrijf al 200 miljoen dollar bespaard, waarmee het een voorbeeld geeft aan anderen die overwegen om dezelfde trucs toe te gaan passen.
Mobiele plannen
Intels notebook-guru Mooly Eden gaf een presentatie over toekomstige mobiele platforms. Hoewel er op het moment nog steeds (iets) meer desktops dan notebooks worden verkocht, zal dat binnen twee tot drie jaar veranderen. Een beperking van notebooks is echter dat ze zuinig moeten zijn en een processor nu eenmaal hoger kan klokken als hij 65W mag gebruiken dan wanneer hij 35W mag gebruiken. Een truc die men heeft bedacht om dit op te lossen is het overklokken van één core als de andere niet gebruikt wordt (lees hier meer over in ons artikel over Penryn). Dit is op zich leuk compromis, maar sommige mensen - neem bijvoorbeeld de klanten van Alienware - willen het liefst nog meer. Om deze groep tevreden te stellen gaat Intel speciale chips uitbrengen voor gamers zonder multiplierlock. Deze kunnen door de fabrikant of gebruiker makkelijk worden overklokt. In dezelfde lijn zal er een quadcorechip voor notebooks komen.
De volgende stap voor het Centrino-platform is 'Santa Rosa', dat begin volgende maand zal worden onthuld. In het kort levert dit een snellere bus (800MHz), geïntegreerd flashgeheugen voor Vista (Turbo Memory), 802.11n WiFi en vPro-techniek voor bedrijven. Turbo Memory werd live gedemonstreerd met een sessie bestaande uit Google Earth en Adobe Elements, die op een systeem zonder flashgeheugen twee minuten duurde, maar met 1GB flash in 68 seconden kon worden afgerond.
Begin volgend jaar krijgt Santa Rosa een update, door de eerder genoemde Penryn-processor in hetzelfde socket te prikken. Vervolgens is de chipset weer aan de beurt: het Monteniva-platform bouwt verder op de 45nm-chip, maar brengt nieuwe features en extra zuinigheid in het platform. Ook geeft men WiMax een nieuwe kans: oorspronkelijk zou dit al worden opgenomen in het Santa Rosa-platform, maar was niet op tijd af.
Exclusief: veel-core x86, desktops met flash
Tijdens een perspreview op de Technology Showcase kwamen we een aantal interessante dingen tegen, enkele waarvan nog niet eerder zijn onthuld. De eerste primeur is dat het team dat de 80-core teraflopchip heeft ontwikkeld op dit moment bezig is met een x86-versie van hun ontwerp. De huidige versie is gebaseerd op een hele simpele instructieset die speciaal voor dit project is bedacht, waar standaard software dus niets mee kan. Alle demo's zijn met de hand in elkaar geknutseld en erg gebruiksvriendelijk is het dus allemaal niet. Het doel van het - slechts vijftien koppen tellende - team is nu om de mensen die zich daadwerkelijk bezighouden met het ontwikkelen van producten ervan te overtuigen dat hun ideeën ook buiten het lab haalbaar zijn. Hoewel de huidige chip al vrij veel indruk heeft gemaakt zou een x86-versie de boodschap wellicht nog beter overbrengen. Wel denkt men niet zoveel cores te kunnen realiseren met x86, omdat ze ingewikkelder en groter zijn. Ook de onderlinge communicatie zullen ze moeten verbeteren, aangezien de huidige versie niet aan cache-synchronisatie doet, terwijl dat wel een vereiste is voor x86.

Een tweede primeur is de bevestiging dat Intel de Turbo Memory-techniek uit Santa Rosa (voorheen bekend als Robson) ook toe gaat passen op desktops. Er zijn hiervoor een aantal uitbreidingen nodig, waaronder de mogelijkheid om meerdere schijven te ondersteunen en manieren om met zaken als RAID om te kunnen gaan, maar in principe ziet Intel deze techniek zeker niet als iets wat alleen voor notebooks voorbehouden is. Tevens zijn er hints geweest dat ook een andere feature uit Santa Rosa (het dynamisch overklokken van een core als de ander even niets te doen heeft) zijn weg zal vinden naar desktops. Gezien de sterk groeiende populariteit van laptops zou het ons niet verbazen als Intel over een paar jaar desktopversies van zijn notebookproducten uitbrengt, in plaats van andersom.
Co-processors op de FSB
Een derde punt want ons opviel op de Showcase was dat twee merken (Xilinx en Altera) flexibele co-processors toonden die rechtstreeks op Intels FSB aangesloten kunnen worden. Hoewel Intel zijn protocol nog steeds geheimhoudt en de 'code' om de FPGA zo to programmeren dat hij met de chipset kan praten dus alleen als 'zwarte doos' wordt aangeboden stelt het fabrikanten wel in staat om zij aan zij met Xeons in een server te werken. AMD staat dit overigens ook toe met Opterons, maar het lijkt erop dat Intel snel heeft gereageerd uit angst om de boot te missen.

Er zijn verschillende opties voor deze techniek: je kunt zowel een 'lege' chip kopen waar je als ontwikkelaar helemaal je eigen ding mee kan doen, of je kiest voor een kant en klare oplossing. Onderstaande foto toont het product van een bedrijf dat vier gigabit ethernetcontrollers rechtstreeks in een Socket 604 heeft geplempt. Hoe de kabels moeten lopen als de kast dicht moet wist de vriendelijk man overigens niet te vertellen, maar gelukkig was het nog geen marktklaar product
.
Phase change volgt Flash en DRAM op?
In de keynote van Justin Rattner werden om te beginnen een aantal leuke statistieken gegeven. In het vierde kwartaal van 2006 zijn er bijna 300.000 quadcores verkocht: 130.000 voor servers en 165.000 voor desktops. Ergens in dit kwartaal zou de miljoenste over de toonbank moeten gaan. Inmiddels is vrijwel alle productie (94%) van Intel 65nm en zijn er sinds eind 2005 al 112 miljoen 65nm-processors geleverd. In de volgende stap (45nm) heeft Intel ook erg veel vertrouwen: er werden notebooks, desktops en servers getoond met werkende Penryn-processors, om de wereld te verzekeren dat het procédé gezond en gereed is. De ambitie om ieder jaar een nieuwe processorfamilie uit te brengen worden nogmaals herhaald. Er is wel een kleine wijziging te melden in de roadmap: de voor 2010 geplande 'Gesher' is verdwenen en vervangen voor 'Sandy Bridge'.
De eerste belangrijke aankondiging is die van Alderstone, een 128Mbit geheugenchip gebaseerd op phase change-techniek, die volgens Intel de potentie heeft om zowel Flash als DRAM te vervangen. De chip kan meer dan een miljoen keer beschreven worden en houdt zijn gegevens meer dan tien jaar vast zonder stroom nodig te hebben. De capaciteit zal nog flink moeten toenemen om de ambities waar te maken, maar het is zonder meer een interessante ontwikkeling.
De presentatie wordt afgesloten met de demonstratie van de 80-core chip - eerder al getoond op één teraflop, die wordt opgedreven naar twee teraflops.
Penryn demonstratie en benchmarks
Pat Gelsinger toont een machine met twee 3,2GHz quadcores op een 1600MHz FSB, met een PCIe 2.0-videokaart van nVidia. Intel verwacht 15 tot 40 procent betere prestaties van de Penryn-familie, gedreven door een combinatie van hogere kloksnelheid, nieuwe features en verbeterde chipsets. Men toont een vergelijking tussen de 45nm quadcore 'Yorkfield' en de huidige 65nm Kenstsfield tijdens het coderen van VC1. De eerste doet er 18 seconden over en de andere 29 seconden, een verbetering van meer dan 40% die kan worden toegeschreven aan een combinatie van hogere kloksnelheid en SSE4-instructies.
De Xeon MP-familie - die vanwege strengere kwaliteitseisen altijd achterloopt op de rest van de productlijn - zal in het derde kwartaal overgaan op de 65nm-versie van Core. Een blade met vier van deze quadcore 'Tigertons' wordt gedemonstreerd door een bedrijf dat nooit eerder op IDF aanwezig was: Sun. De blade heeft 128GB geheugen en gebruikt een nieuwe techniek die 'Dynamic Power Technology' heet om op systeemniveau 15% te besparen. De quadcore Xeon MP zal beschikbaar zijn op snelheden tot en met 2,93GHz en vormt samen met Penryn het belangrijkste wapen tegen de Barcelona van AMD.
Het antwoord op GPGPU en QuadFather
Een belangrijk onderwerp is Larrabee, een product dat al een aantal maanden wordt getipt als zijnde een videokaart, maar eigenlijk gewoon een processor is. Larrabee wordt een chip met een groot aantal x86-cores die meer dan een teraflop aan prestaties biedt. Volgens Intel zijn softwarebouwers hier erg enthousiast over en zal het een einde maken aan de opkomst van GPGPU, simpelweg omdat het veel eenvoudiger te programmeren is.
Intel heeft ook zijn tegenhanger voor de QuadFather aangekondigd: Skulltrail. Met twee sockets voor dual- of quadcore processors en ruimte voor vier videokaarten moet dit het ultieme gameplatform worden, maar net als de versie van AMD zal het waarschijnlijk heet en duur zijn. Het lijkt waarschijnlijk dat dit bij Intel nog wat erger is, want als men gebruikmaakt van de serverchipset zal er ook FB-DIMM-geheugen in moeten. Het is niet duidelijk wanneer de eerste Skulltrail-systemen in de winkel zullen staan.
Gelsinger niet bang voor Barcelona
Tijdens een rondetafelgesprek heeft Intels servertopman Pat Gelsinger tegenover Tweakers.net aangegeven niet bang te zijn voor de quadcore Opteron van AMD, die ook wel bekend staat als Barcelona. AMD roept al geruime tijd dat zijn nieuwe chipgeneratie tot veertig procent sneller zal zijn dan die van Intel, maar lijkt daarbij voor het gemak te hebben aangenomen dat Intel een jaar lang stil zou blijven zitten. De vandaag gedemonstreerde quadcores Xeons, gebaseerd op de 45nm Penryn-core, zouden geen moeite hebben om Barcelona bij te houden. Sowieso hebben ze een verder verbeterde architectuur, maar ook een flink voordeel qua kloksnelheid. Verwacht wordt dat AMD zijn quadcores niet sneller dan 2,3 à 2,5GHz kan klokken, terwijl Intel vandaag een 3,2GHz heeft gedemonsteerd.
Dat Penryn geen geïntegreerde geheugencontroller heeft, mag volgens Gelsinger ook geen beperking zijn. De geoptimaliseerde Seaburg-chipset met zijn dubbele 1600MHz bus zou ook in bandbreedteslurpende applicaties zijn mannetje staan. Op de vraag of Intel SSE4 nodig heeft om Barcelona voor te blijven wordt ook negatief geantwoord. Gelsinger: 'Ik kan geen specifieke benchmarks vrijgeven, maar we hebben verbeteringen tot 45% gemeten in bandbreedtegevoelige applicaties, en het is niet moeilijk om te bedenken welke ik daarmee bedoel'. Waarschijnlijk doelt hij op SPECfp_rate, een van de weinige tests waarin AMD vandaag de dag nog heer en meester is.
Meer Penryn benchmarks
UMPC wordt nóg kleiner
Intel ziet een grote toekomst voor ultra-mobiele pc's, omdat het gelooft dat er een enorme markt is voor mobiel internet en telefoons niet geschikt acht voor deze toepassing. Naast de bevestiging van eerdere geruchten over het McCaslin-platform kondigde men vandaag de eerste generatie techniek aan die van de grond af is ontworpen om in dit soort apparaten terecht te komen, in plaats van slechts een verkleinde versie van de normale notebooklijn. Het Menlow-platform bestaat uit de 45nm Silverthorne-processor en Poulsbo-chipset. Een volledig moederbord met deze chips is niet veel groter dan een speelkaart en is daarmee het meest compacte en zuinige Intel-platform ooit. Anand Chandrasekher demonsteerde een werkende versie van Menlow en belooft deze in de eerste helft van 2008 te zullen gaan leveren. Overigens zijn eerdere geruchten die stelden dat Intels UMPC-platform gebaseerd zou zijn op Linux maar half waar: naast Ubuntu en Red Flag wordt ook Windows Vista ondersteund.
