Hoofdcategorieën
Device Settings

SCO maakt gedeelte van gewraakte code openbaar

Door Harm Hilvers, dinsdag 19 augustus 2003 21:40
Bron: C|Net, submitter: T.T., views: 2.515

SCO is in maart 2003 een rechtszaak gestart tegen IBM. Inzet van de strijd tussen de twee bedrijven is de beschuldiging van SCO dat IBM code uit System V naar Linux gekopieerd zou hebben. Sindsdien hebben verschillende organisaties en personen om opheldering gevraagd omdat SCO in het midden liet welk gedeelte van de Linux kernel-code gekopieerd zou zijn. Daar is echter sinds gisteren echter verandering in gekomen. Tijdens SCOForum heeft Darl McBride, SCO's CEO, laten weten dat er door een team van experts al veel dubbele code is ontdekt in vergelijkingen tussen de Linux-code en de System V-code. SCOForum is een jaarlijkse conferentie waar SCO zijn beleid en plannen toelicht. Daarnaast gaf hij nogmaals aan dat zijn bedrijf er niet op uit is Linux kapot te maken, maar juist wil bereiken dat ieder bedrijf op zijn eigen manier software kan verkopen.

SCO logo (geel)In de presentatie die volgde op die van McBride, ging Chris Sontag, manager van SCOsource, verder in op de code-overeenkomsten tussen SCO's System V en de Linux-kernel. Een aantal experts op het gebied van patroonherkenning hebben de afgelopen weken de code van beide systemen vergeleken. De resultaten van die onderzoeken hebben meer dan 800.000 regels code en comments opgeleverd die gekopieerd zouden zijn naar Linux. Deze regels komen voor het grootste deel voor in een aantal enterprise features: NUMA (nonuniform memory access), RCU (read-copy update), SMP (symmetrical multiprocessing), schedulers, JFS (journal file system) en XFS (extended file system). Om de beweringen te ondersteunen liet Sontag een aantal dia's zien met daarop afbeeldingen van overeenkomsten tussen de Linux- en de Unix-code. Wie meer wil zien kan zich bij SCO melden en na ondertekening van een NDA de code inzien.

Linux- vs System V-code 1 kleinLinux- vs System V-code 2 klein
Klik op de afbeeldingen voor een grotere versie.

Op onder andere Ars Technica, Slashdot en Gentoo Forums is verontwaardigd gereageerd op het nieuws. Op Slashdot wordt een vergelijking gemaakt tussen de hoeveelheid regels met code in de verschillende kernelversies. Daaruit blijkt dat versie 2.2 1,8 miljoen regels heeft, versie 2.4 3,4 miljoen en versie 2.5 5,1 miljoen. Het zou er dan dus op neerkomen dat bijna twintig procent van de Linux-kernelcode in versie 2.4 bij SCO vandaan komt. Een onmogelijk feit omdat daarvoor niet genoeg kernelcoders toegang hebben tot System V-code. Ook wordt het bewijs van SCO in twijfel getrokken door een aantal Slashdot-gebruikers. De code die op het rechter plaatje hierboven te zien is, zou een algemeen stukje Unix-code zijn dat zelfs in schoolboeken gebruikt wordt. Op de Gentoo Forums wordt tenslotte duidelijk gemaakt dat ditzelfde stukje code al erg oud is, en al in versie 2.11 van BSD terugkomt. Daar komt dan nog eens bij dat het stukje code niet meer in versie 2.6 van de Linux-kernel zit.

Tijdens het laatste gedeelte van de eerste dag van de conferentie presenteerde Erik Hughes, manager productmanagement bij SCO, een aantal nieuwe producten. In april had SCO zijn web service-plannen gepresenteerd onder de naam SCOx. Met de lancering van de SCOx WebFace Solution Suite heeft het bedrijf hieraan concrete invulling gegeven. Ontwikkelaars en klanten kunnen met deze suite applicaties ontwikkelen en uitvoeren. Ook werd afgelopen maandag UnixWare Office Mail Server 2.0, een pakket met soortgelijke features als Microsoft Exchange, gepresenteerd. Daarnaast werd ook versie 2.1 van SCO Authentication gelanceerd. Met dit pakket kunnen gebruikersprofielen gedeeld worden tussen Unix- en Windowsomgevingen. Tenslotte werden ook een aantal features van de nieuwe versie van OpenServer aangekondigd. Het systeem zal de nieuwste Java-versie bevatten, verbeterde hardware-ondersteuning, een aantal security-updates en betere compatibiliteit met Windows via Samba 3.

Volgende 21:50 RIAA: alleen p2p-grootverbruikers zijn het doelwit
Vorige 20:42 Palm OS aanwezig op 51 procent van verkochte PDA's in Q2
Advertentie

Reacties

«  1  2  3  4  »

Een aantal experts op het gebied van patroonherkenning hebben de afgelopen weken de code van beide systemen vergeleken. De resultaten van die onderzoeken hebben meer dan 800.000 regels code en comments opgeleverd die gekopieerd zouden zijn naar Linux.
Ik neem aan dat dat onafhankelijke experst waren? Anders is het natuurlijk sowieso niet betrouwbaar. Bovendien wordt er ook niet gezegd in hoeverre het is gekopieerd. Een aantal opeenvolgende programmeerregels is één ding, maar een gigantisch stuk van 800.000 (!) regels.....Als onafhankelijke onderzoekers dat hebben geconcludeerd, mag er worden getwijfeld aan hun onafhankelijkheid. Er wordt immers hier:
Een onmogelijk feit omdat daarvoor niet genoeg kernelcoders toegang hebben tot System V-code.
al bewezen dat dat niet kan. :?

precies
en hoe weten we eigenlijk dat die stukken code zeker door SCO codeklopper zijn geschreven? system-V is toch ook niet zomaar van cratch geschreven (correct me if im wrong)

Scratch is het goeie woord :P

Ik denk dat er ooit een hele goeie open-source programmeur was die werk deed voor de kernel en later ingehuurd werd door SCO. En toen had ie vast zoiets van, ja, maar dat gaat ik niet helemaal opnieuw doen.

ctrl+c
ctrl+v

en zo is het gebeurt :*)

Ik denk het niet. Ik denk dat het eerder een situatie is waarbij er door de vele smaken en kleuren van code het wellicht niet meer duidelijk is wat nu wel en niet openbaar is/was. Maar dat maakt allemaal niet meer uit. SCO heeft zelf Linux gedistribueerd onder GPL en heeft dat nu teruggetrokken. Verder is een kaartje met wat code niet echt bewijs. Code is oud, code is niet meer in gebruik, code is al reeds vrijgegeven in een boek.. noem maar op.... en dat comments in de code hetzelfde zijn maar de eigenlijke code krijgen we niet te zien... nou ja...
Dames en heren, ik heb het wiel uitgevonden... LOL

Ga maar in de rechtbank zitten als je zo zeker bent. Al deze FUD is nonsense..


{edit}
http://www.zdnet.com.au/newstech/enterprise/story/0,2000048640,2027750 0,00.htm

http://perens.com/Articles/SCO/SCOSlideShow.html

Hoe zou je ooit miljoenen regels kunnen vergelijken? Moeten ze toch wel erg snel kunnen lezen lijkt me zo... En als ze het met een programma gedaan hebben dan snap ik het wel:

"/*" 800.000x found in Linux source....

Hoe zou je ooit miljoenen regels kunnen vergelijken? Moeten ze toch wel erg snel kunnen lezen lijkt me zo... En als ze het met een programma gedaan hebben dan snap ik het wel:

Unix is juist heel krachtig op dit terrein. Het vergelijken van 2 files kan met diff en je krijgt de output, zoals regel_x is in file2 toegevoegd of regel_x van file1 heeft als extra het woord "zoals", maar dan in de ed commando-style. ed is trouwens een Unix text editor; er is ook een windows variant waar je mee kunt spelen; deze is echter beperkter dan de unix variant: http://www.mkssoftware.com/docs/man1/ed.1.asp
http://www.mkssoftware.com/docs/man1/diff.1.asp

of je gebruikt gewoon PERL

Zelfs sourcesafe van Microsoft kan dat. Is niks bijzonders. Als ik een nieuwe versie van code aangeleverd krijg die ik in een bestaand software project moet integreren doe ik niets anders (alleen sla ik de overeenkomsten juist over en zoek de verschillen). Een verschilletje is ook wel dat ik maar 200.000 regels code te onderhouden heb :P

tja, wat moet je hier nu op zeggen..
nog even en dan wordt je nog aangeklaagt omdat je het alfabet gebruikt.. ik denk dat ze zich niet zo moeten aanstellen... code is niet universeel...

als je bepaalde functies aan wilt spreken dan moet dat nu eenmaal volgens een bepaald patroon.. en als je daar van afwijkt dan werkt het niet.

als ze nu met bewijs komen dat een stuk "geniale" code is gejat.. dat dus nergens anders is gebruikt... JA dan is het niet helemaal eerlijk verkregen.

Waar denk je nu eigenlijk dat ze over aan het bekvechten zijn?
enterprise toepassingen als NUMA .... etc
Dat zijn in veel gevallen "geniale" stukjes code.

800.000 regels woord voor woord gekopieerd is wel wat anders dan het alfabet hergebruiken. Stel dat een gemiddelde programmeur 50 regels per dag produceert (dat is een hoge schatting), ga jij dan maar eens uitrekenen hoeveel mandagen werk hier gejat zijn (even verondersteld dat SCO gelijk heeft).

Ik las ergens dat linux maar 3.5 miljoen regels code bevat, dus een kwart van het totaal oneerlijk verkregen is een zeer serieuze zaak!

50 regels programmeren per dag? Dat vind ik wel bizar weinig, dat zouden dus 6,25 per uur zijn en ongeveer 10 minuten werk voor 1 regeltje?

If (score==0)
return;

dat zou dus al 20 minuten werk zijn volgens jou :Y)

30 regels zinnige code per dag.
met dien verstande dat je soms een dag bezig bent met 3 of 6 regeltjes code, en soms gewoon wat herklopt.

tel al het debuggen en wijzigingen maar eens op bij de tijd die je nodig had om een stukje code te schrijven. echt, die 30 kloppen wel. is natuurlijk wel erg taal afhankelijk, maar c++ is erg compact geschreven.

screenshots?
is dat alles waar mee zwaaien?

EEEEK waarom laat SCO in hemelsnaam een stuk code zien dat al algemeen bekend is.... Daar bewijzen ze nog niets mee. Die code is zogezegd al "public domain". En er is grote kans dat dergelijke code al in de eerste Linux kernels zit (die Linus nog helemaal zelf geschreven heeft terwijl hij zo'n beetje nog nooit van SCO gehoord heeft) en in andere kernels zoals alle *BSD's en waarschijnlijk ook in Windows kernels....

Dit is bijna het zelfde als klagen dat de Linux kernel opgebouwd is uit woorden in de C syntax zoals for, if, strncpy, malloc of free en ze dan aanklagen omdat de Linux kernel coders deze woorden gecopy-pasted hebben en daarmee hun kernel geschreven hebben. AARGH.... want zeg nu zelf ... hoe groot moet een tekst blok zijn voordat je van een kopie kan spreken???

<-typotje veranderd (geeft in heeft)
-eerdere opmerking over "ondergewaardeerd" weggehaald>

Wees nu eens gewoon eerlijk.

Je kan in berperkte mate nog beweren dat 2 mensen voor dezelfde functionaliteit identieke code kunnen schrijven. (moet je al wel toevallig alle variabelen dezelfde naam gegevens hebben dus zo waarschijnlijk is dat niet)

Maar dat zelfs het commentaar identiek is kan je absoluut niet verdedigen. Iedereen maakt zijn commentaar anders. Als dat precies hetzelfde is dan is dat gewoon een bewijs dat het gekopieerd is.


Het enige wat je dan nog niet weet is of het van Linux naar SCO gekopieerd is, of omgekeerd, of allebei van weer wat anders.
Dat interesseert me ook eigenlijk weinig. Het gaat er gewoon om dat dit wel degelijk duidelijke bewijzen zijn dat er code gekopieerd is.

SCO heeft het juist specifiek over Linux kernel 2.4 en later. Zij zeggen te geloven dat er recent veel stukken unix code aan linux zijn toegevoegd om dat operating-systeem beter commercieel bruikbaar te maken. Het soort code dat ze noemen (zie het artikel) zijn inderdaad redelijk moderne modules die er overwegend voor bedoeld zijn om het besturingssysteem beter te kunnen gebruiken voor een server.

Als ze gelijk hebben hebben ze een goede zaak, omdat dankzij technieken als NUMA en SMP je een Linux als vervanging van een grote dure Unix server kan gebruiken. Dus de 'gratis' verkregen kopie concurreert rechtstreeks met het dure origineel. Dat is jatwerk van het zuiverste water en moet als ze gelijk hebben terecht bestraft worden. Niet iedereen kan dit soort programmeerwerk verrichten en de mensen die dat wel kunnen verdienen een fatsoenlijke beloning voor hun goede werk.

En er is al meteen een mooie analyse gemaakt van dit 'bewijs':
http://perens.com/Articles/SCOCopiedCode.html :) Enjoy!

Thanks! Heel informatieve analyse en nog leuk om te lezen ook. Maar waar haalt SCO dan die arrogantie vandaan?

* As part of the kernel evolution toward modular naming, the
* functions malloc and mfree are being renamed to rmalloc and rmfree.
* Compatibility will be maintained by the following assembly code:
* (Also see mfree/rmfree below)
Dat is wat er in het Grieks staat volgens die site. Niet erg moeilijk om die "code" te ontcijferen door het in Grieks in te typen en dan naar het standaard alfabet te veranderen... Ze zijn echt niet zo slim daar bij SCO |:(

It's entertaining that the SCO folks had no clue that the font-change could be so easily un-done.
Het kan nog sneller:
Het Griekse alfabet leer je in België in het 1ste middelbaar (Latijnse). Dus die van SCO dachten dat het niet ontcijferbaar was terwijl een 12jarige het gewoon al kan aflezen in het Engels (realtime fontverandering dus ;))... |:(
Zo'n beveiliging werkt mss wel bij de Amerikanen maar hier niet... }:O

Heel mooi artikel. Duidelijk en goed onderbouwd, in tegenstelling tot de berichten van SCO. Inderdaad, als dit het beste is wat SCO kan geven als bewijs dan zal het een korte rechtzaak worden.

Je denkt toch niet dat SCO meteen het beste bewijs wat ze hebben op tafel gooien? Zoiets moet je opbouwen zodat je langzaam maar zeker iedereen achter je krijgt, inclusief de rechter/jurie.

The function was written by Dennis M. Ritchie or Ken Thompson at AT&T, in 1973.
het is dus een erg nieuw stuk code wat ge "copiert" is, maar hoe lang zijn patenten ook al weer geldig? :P

Het gaat hier niet om patenten, maar om auteursrecht :)

En wat dat betreft heeft SCO nog wel een tijdje om te procederen hoor :
Auteursrecht eindigt pas na 70 jaar, te rekenen vanaf de eerste januari, volgende op het jaar waarin de maker is overleden.
En ws zijn Dennis M. ritchie en Ken Thompson nog niet eens dood ;)

De eerste jpeg met System V code maakt mij zo gruwelijk hard aan het lachen: het voor velen moeilijk of niet te lezen onderste stuk is Engels in grieks font:

* Also part of the kernel ewolution
towards modular naming, the
* functions malloc and mfree are being
renamed to rmalloc and rmfree.
* Compatibility will be maintained by
the following assembler code:
* (also see mfree/rmfree below)
*/

Verzin zelf maar wat je er van vindt :)

er is al lang gereageerd door de open source community op deze code.

en wat blijkt?

de code is terug te traceren tot 1974, Unix V5.

AT&T heeft er al een keer rechtzaak op verloren, het toenmalige SCO heeft publicatie van de code toegestaan, etc. etc.

zie:
http://perens.com/Articles/SCOCopiedCode.html
http://lwn.net/Articles/45019/ (vooral de commentaren!)
http://slashdot.org/articles/03/08/19/1523236.shtml?tid=106&tid=185

Ook werd afgelopen maandag UnixWare Office Mail Server 2.0, een pakket met soortgelijke features als Microsoft Exchange, gepresenteerd. Daarnaast werd ook versie 2.1 van SCO Authentication gelanceerd. Met dit pakket kunnen gebruikersprofielen gedeeld worden tussen Unix- en Windowsomgevingen. Tenslotte werden ook een aantal features van de nieuwe versie van OpenServer aangekondigd.
Als je naar bovenstaande quote kijkt is SCO toch ook met goede dingen bezig geweest, jammer dat ze door hun eigen acties vakkundig hun imago hebben verbouwd, want er zitten toch mooie dingen in het vat bij SCO.

UnixWare Office Mail Server heeft in tegen stelling tot OpenGroupware.org wel een eigen mail server geintegreerd heeft, toch wel handig als je als bedrijf in een keer wilt klaar zijn. Als de rest van de feature's dezelfde functionaliteit heeft als Exchange biedt (dus agenda en OWA bijvoorbeeld) kan het een goede concurent worden.

Zeker in samenwerking met SCO Authentication, je kan dan naadloos gebruikers op zowel Windows als Linux werkstations laten inloggen zonder dat de gebruikers twee afzonderlijke profielen moeten hebben.

Alleen dus jammer dat SCO (uit geldnood?) zichzelf in een kwaad daglicht heeft gesteld met de aanklachten...
edit:
Ik heb het over de profielen, niet over authenticatie, die inderdaad op basis van LDAP zullen zijn, daar werkt bijna elke server mee (Windows met LDAP en Mac OS X server met Open Directory om maar een paar voorbeelden te noemen). Het is al langer mogelijk om met een OS X machine op een AD domain in te loggen.

Nou die authenticatie is niet nieuw of zo, die gebeurt waarschijnlijk gewoon op basis van LDAP...en wat betreft de OpenGroupWare die is net begonnen en gratis (heel belangrijk) en dan ook nog eigenlijk niet eens klaar voor de productiesystemen....

SCO is daarbij ook nog is duur en qua hardware support zijn ze ook nog is gewoon slecht. Licenties worden gewoon nog op papier gezet ipv op internet of op een systeem met database.

SCO begon leuk te worden toen ze eindelijk Samba in hun OpenServer 5.0.7 release gingen intergreren, maar dat was ook nog is tering duur.....

Linux is daarbij gelukkig veel sneller qua ontwikkelingen en qua support ook, internet moet ik hierbij aan denken.

Wel eens gekeken naar Samsung Contact?

Off-topic:

AKA: HP OpenMail :)
Samsung heeft de code van HP overgenomen toen zij met OpenMail stopten.
90% van de code is nog steeds OpenMail

Anyway: goed product - ik gebruik het voor 120 clients - zonder problemen.

SCO waar jij het over hebt is overgenomen door Caldera (dat is een Linuxdistributeur). Caldera heeft zichzelf vervolgens SCO genoemd en begint enorm veel FUD te zaaien. Caldera is altijd al een baggerbedrijf geweest, en daar is helaas niets aan veranderd sinds ze SCO hebben overgenomen...

Zelfs al is het identiek, dan heeft SCO nog steeds geen poot aan de grond. Ze zullen moeten bewijzen dat deze code inderdaad hun eigendom is (voor dit stukje is het tegendeel al bewezen), en als het identiek is, dan zullen ze aan de hand van hun revisie systeem (RCS) moeten laten zien dat zij de code eerder hadden dan Linux. Onmogelijke opgave lijkt me...

patenten hebben een datum vriend :D je kan geen eigendom claimen als je geen patent hebt (immers is het een idee)

Patent op software sourcecode?

Ik heb er nog nooit van gehoord.

De linux kernel sourcecode is effe gauw 170 Mb groot. De groote van de SCO Unix source code zal best wel vergelijkbaar zijn. Hoe wou je daar in godsnaam patent op aanvragen? Dat kan een patent buro volgens mij echt nooit uigezocht krijgen of er geen code ergens gejat is.

en dan nog eens bij elke patch opnieuw patent aanvragen? of doen we dat elke maand...

Ja oke, je kan algoritmes patenteren in de VS en binnenkort ook in de EU. Dat is hier alleen niet relevant, want met een patent moet je je source wel openbaren en dat is iets wat de softwarebedrijven in dit geval niet willen. Microsoft gaat toch ook zeker niet de source van Windows openbaren. Het gaat dus om copyright van SCO en NDA's met IBM.

Wat een onzin. Patent vraag je aan op een idee, op een principe. Voor code geldt gewoon auteursrecht.

Het is een beetje van allebij.

Een patent vraag je aan op een nieuwe uitvinding om 20 jaar lang monopolie te krijgen. Dat kan in de USA ook op software code. In de EU komt dit meschien binnen kort ook nog.

De gewraakte code is ondermeer hier te vinden - In dit geval onder de BSD licentie.

Ik weet niet welke andere code er nog gekopieerd zou zijn volgens SCO, maar als dat ook code is die onder de BSD licentie valt dan heeft men bij SCO een groot probleem (veel geld uitgegeven en geen opbrengst...)

Indertijd heeft de toenmalige eigenaar (Edit: van Unix) zelfs een rechtszaak tegen de Univ. van Californie buiten de rechtzaal om bijgelegd omdat de Universiteit kon bewijzen dat er BSD code (zonder aan de copyright van die code te voldoen) in Unix is opgenomen - de copyrights waren zelfs uit de bewuste code verwijderd...

Als men nu juiste die BSD code als uitganspunt genomen heeft dat heeft men in het Linux kamp niets of weinig te vrezen. (Code onder de gewijzigde BSD licentie is compatible met de GPL en mag dus gewoon in de kernel worden opgenomen...)

De versie van BSD waar je naar linkt is een van de versies welke niet gebruikt mag worden zonder UNIX licentie. Alleen versies BSDlite of wat daarop gebaseerd is zijn legaal.

Natuurlijk maakt dat in dit geval niets uit want de code komt ook voor in eerdere versies van SysV UNIX. Dezelfde versies welke door Caldera een aantal jaar geleden onder een BSD achtige licentie geplaatst zijn. Inderdaad, dezelfde Caldera die nu SCO heet.
«  1  2  3  4  »

Op dit item kan niet meer gereageerd worden.

Volgende 21:50 RIAA: alleen p2p-grootverbruikers zijn het doelwit
Vorige 20:42 Palm OS aanwezig op 51 procent van verkochte PDA's in Q2
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011