Allereerst is Beowulf geen OS! Dit is een groot misverstand. Het OS is meestal een Linux-distributie zoals RedHat, FreeBSD of OpenBSD. De originele Beowulf draaide op Slackware. Vooral de BSD OS-en zijn populair in combinatie met een Beowulf cluster vanwege hun stabiliteit. Beowulf is meer een verzameling patches voor de Linux kernel en een paar programma'tjes die ontwikkeld zijn door verschillende partijen (lees academische instellingen).
Ten tweede moet de software speciaal voor een cluster geschreven worden. De code moet geschikt worden gemaakt voor opsplitsing in parallele taken, net zoals bij SMP. Deze paralelle taken communiceren over het algemeen met elkaar m.b.v. message passing systems als
MPI of
PVM. Dit is duseen van de manieren om het op te lossen. Het opsplitsen van de code zal handmatig moeten gebeuren, omdat zelfs de meest intelligente compiler zich niet voldoende bewust is van alle dependencies en tijdsafhankelijkheden. Multi-threaded software zal niet automatisch soepel draaien op een cluster, omdat multi-threaded software ervan uitgaat dat er shared memory is, wat zeker niet het geval is. Het heeft dus geen zin om Apache of MySQL op een cluster te draaien. Geen grote onderneming heeft zich er ooit aan gewaagd om een "cluster" versie van hun SMP software te maken, voor zover dat natuurlijk mogelijk is, omdat geen cluster hetzelfde is. Natuurlijk kun je wel gangbare software individueel laten schrijven/ aanpasssen, maar dan schiet het gebruik van een Beowulf cluster zijn doel voorbij; veel rekenkracht voor weinig geld. De mensen die een cluster (nuttig!!) gebruiken zijn dus over het algemeen academische instellingen, zoals SARA, het grootste Beowulf cluster van Nederland, die wetenschappelijke berekeningen uitvoeren en de code daarvoor helemaal zelf hebben geschreven.
De markt voor Beowulf clusters is dus zeer beperkt, ook al zal een beetje instelling zonder met de ogen te knipperen een cluster bouwen van >16.000 nodes. Daar komt voor AMD nog bij dat ze te maken krijgen met een schaalbaarheidsprobleem. De dure server versies van hun CPUs, de Opteron
MP zal niet zinnig gebruikt kunnen worden in een cluster. Met 4-CPU nodes creeer je een cluster in een cluster. Je krijgt een minieme prestatiewinst tegen onevenredig hogere kosten en daarom oninteressant voor gebruik. Ook met een dual CPU oplossing creeer je in eerste instantie een cluster in een cluster. Toch kun je hier wel veel aan hebben als je bepaalde (I/O) processen toewijst aan 1 CPU, zoals alle network interrupts, terwiijl de andere de eigenlijke taak dedicated kan uitvoeren. Voor optimale kosten-batenverhoudingen zou het ideaal zijn als er een moederbord komt dat ASMP, anti-symmetric multi-processing, ondersteunt i.c.m. de Hammer.