Enkele maanden geleden is de eerste fase van het project Distributed Folding afgerond. In dit nieuwsbericht zal worden teruggeblikt op deze fase en worden vooruit gekeken naar de tweede fase.
In het kort
Op 8 januari 2002 werd het Distributed Folding gestart, en de Dutch Power Cows zijn enkele maanden later op kleine schaal begonnen aan het project. De inspanningen van deze kleine groep werden ruim een jaar later, toen fase één was afgerond, beloond met een dertiende plaats wereldwijd. Een mooie prestatie, maar wel met ruimte voor verbetering. Hopelijk brengt deze dertiende plaats geen ongeluk.
Het project
Het Samuel Lunenfeld Research Institute heeft met behulp van subsidies verstrekt door diverse Canadese overheidsinstanties het Distributed Folding project kunnen ontwikkelen tot een goed lopend onderzoek naar het inzicht in hoe proteïnen (eiwitten) gevouwen worden en hoe deze in elkaar gezet worden in de levende cel. Het begrijpen van het vouwen van proteïnen zorgt er voor dat we behandelmethoden voor ziekten kunnen verbeteren. Aan dit project werken verder mee de Universiteit van Toronto en het Mount Saini Hospital gelegen in Toronto (Canada).
De Distributed Folding client gebruikt, net als bij de meeste andere projecten, de overgebleven processorkracht van je computer, ook wel 'idle time' genoemd, om te zoeken naar een betere behandeling van ziekten. Kenmerkend aan het project is dat voor zowat alle bekende besturingssystemen een client beschikbaar is.
Geschiedenis
De beginperiode van DF werd aangeduid met de term "fase 1". Uitgangspositie bij het project was dat fase één opgesplitst zou worden in drie subfases, waarbij iedere subfase een eigen doelstelling had.
- Subfase A bestond uit kleine proteïnen die als een test voor de cliënt dienden. Een resultaat van de gevouwen eiwitten valt hier te zien. Gestaag groeide het aantal leden dat meedeed aan dit project en zodoende kwam al snel de volgende fase aan de beurt.
- Subfase B was opgebouwd uit diverse reeds bekende proteïnen waardoor een vergelijking tussen bestaande gegevens en die van het project gemaakt kon worden. Door langer in te gaan op deze bekende proteïnen werd getracht een beter resultaat te behalen. Hierbij zijn enkele hoop gevende en enkele wat minder goede resultaten geboekt. In de tussentijd heeft iemand van de organisatie een kort nieuwsbericht op een wetenschappelijke website gepost waarin werd ingegaan op het proteïnevouwen door middel van Distributed Computing.
- Subfase C was de echte uitdaging. Grofweg werd er maandelijks een nieuw proteïne (eiwit) uitgegeven waardoor er nog langer (en dus grondiger) naar gekeken werd. Gevolg van alle verschillende proteïnen is dat de berekentijd verschillend is en zodoende de output aardig kan schommelen.
Tijdens de zomer van 2002 heeft het DF project meegedaan aan een CASP5 voorspellingswedstrijd. Deze test om te zien hoe de resultaten van de client zich verhouden ten opzichte van voorspellingen en andere methoden is redelijk goed bevallen. Gedurende een kleine twee maanden werd wekelijks een nieuw CASP-target uitgegeven. Alle deelnemers hadden zodoende evenveel tijd om tot een zo goed mogelijk resultaat / voorspelling te komen. De resultaten waren beter dan gemiddeld en het was een mooie aangelegenheid om te kijken of de cliënt voldeed aan de verwachtingen. Omdat de makers achter het project vonden dat er nog betere resultaten haalbaar moesten zijn, is er begonnen aan de ontwikkeling van een nieuwe benaderingsmethode. Deze moet dan ook het kloppende hart worden van fase twee.
Heden
Op 17 juni jongstleden is Distributed Folding begonnen met fase twee. De reden voor deze nieuwe fase is dat de mannen achter het project van mening waren dat er nog verbetering mogelijk was in de manier van 'protein folding'. Het grote verschil is dat er een andere cliënt is uitgebracht waarin een slimmer algoritme (andere manier van benadering) is gebruikt. Al tijdens het bètatesten bleek dat de resultaten met dit nieuwe algoritme veelbelovend waren. De enige consequentie is dat de client dusdanig veranderd is qua benadering dat doorgaan met de oude puntentelling niet eerlijk zou zijn. Daarom is er besloten om de statistieken op nul te zetten. Alle oude statistieken zijn bewaard gebleven en zijn terug te vinden op de officiële site. Voordeel van deze reset van statistieken is dat alle teams nu met een schone lei zijn begonnen, en dat DPC nu wereldwijd op plaats negen staat en kan meestrijden met de besten.
Wil je meedoen aan dit project of wil je er meer over weten? Check dan de FAQ of kijk op GoT waar dagelijks wordt gediscussieerd over dit project. Hier kun je dan ook gerust je vragen stellen.