Hoofdcategorieën
Device Settings

Wikipedia gaat betrouwbaarheid tekst met kleuren aangeven

Door Arie Jan Stapel, maandag 31 augustus 2009 09:13, views: 15.113

De online-encyclopedie Wikipedia is van plan om een feature te gaan toevoegen die een indicatie geeft over de betrouwbaarheid van de tekst. Het algoritme gaat ervan uit dat bijdragen betrouwbaarder zijn naarmate ze langer zijn blijven staan.

Doordat iedereen kan bijdragen aan Wikipedia, is vaak niet duidelijk hoe betrouwbaar de weergegeven informatie is. Onjuiste informatie wordt meestal snel weer gecorrigeerd, maar wie op een zeker moment een pagina bekijkt, kan op dat moment niet goed bepalen hoe betrouwbaar de daar gegeven informatie is.

Om hier iets aan te doen hebben onderzoekers van het Wiki Lab aan de universiteit van Californië het programma WikiTrust gemaakt. Dit bepaalt de betrouwbaarheid van de informatie aan de hand van twee eenvoudige richtlijnen. Ten eerste: hoe langer bepaalde informatie blijft staan, hoe groter de kans dat deze correct is. Ten tweede: bijdragen van een auteur die veel juiste informatie heeft geplaatst zijn waarschijnlijk correct.

WikiTrust, dat aan een Wikisite kan worden toegevoegd, bepaalt van elke auteur een betrouwbaarheidsgraad naar aanleiding van de tijdsduur waarop zijn stukken onveranderd online blijven. Op elke pagina krijgt vervolgens de tekst een kleurtje aan de hand van de betrouwbaarheid van de schrijver. Bij erg onbetrouwbare schrijvers is de achtergrond fel oranje, bij meer betrouwbare auteurs wordt het oranje vager, en bij de betrouwbaarste bijdragen is het weer het gewone wit.

WikiTrust bestaat al sinds november 2008, maar de WikiMedia Foundation heeft nu besloten om het  voor de gehele encyclopedie in te voeren, zo meldt Wired. Deze herfst zal er voor geregistreerde gebruikers een tabje met de naam 'Trust' verschijnen. Bij het klikken hierop verschijnen de oranje tinten, die de betrouwbaarheid aangeven, in de tekst.

Hoe het systeem in de praktijk zal gaan werken, moet nog worden afgewacht. Duidelijk is wel dat een zware aanslag op de computercapaciteit zal zijn om van ieder woord in de tekst de betrouwbaarheidsscore te gaan bepalen. De onderzoekers zijn er echter van overtuigd dat het programma efficiënt genoeg is om de computers niet te overbelasten.

WikiTrust

 

Volgende 09:58 Sharp brengt smartbook met 5"-scherm en Ubuntu uit
Vorige 08:31 Samsung werkt aan eigen OS op basis van Linux
Advertentie

Reacties

«  1  2  3  »

Leuk, is wel een handig algoritme, weet je eindelijk of de informatie echt betrouwbaar is zonder er nog 10 andere bronnen op na te slaan, maar het lijkt mij wel nogal lastig om een tekst te lezen dat gemarkeerd is met 10 verschillende kleuren (aangezien ze in de screen shot precies maar enkele woorden per keer markeren?)

Ik denk dat dat wel zal meevallen. Imo is het een hele goede manier om het aan te geven, aangezien kleur nog weinig word gebruikt in de Wiki. Met kleur kan je ook snel zien of het betrouwbaar is, terwijl de tekst nog wel te lezen is. Daarnaast kan je het natuurlijk altijd uitzetten als het irritant is :) .

Helaas geeft dit de grote advertenteerders (vooral de entertainment industrie) wel een voordeel, die plaatsen over het algemeen zeer veel "informatie" over hun produkten en kunnen, na verloop van tijd met de hoge betrouwbaarheid die ze daarmee winnen, natuurlijk ook weer makkelijk de feiten van relatief ongewenste zaken "aanpassen".

Een lijst met features is per definitie niet slechte informatie. Ik heb meer problemen met adverteerders die kritiek verwijderen. Als ik iets duur koop kijk ik de laatste tijd wel eerst eens naar wikipedia om te zien wat ik mag verwachten.

Ik weet niet of grote adverteerders zin hebben om hun goede naam op zo'n manier te grabbel te gooien.

Als ze dit een paar keer flikken, kan hun "score" denk ik even hard weer omlaag kelderen, waarna hun geloofwaardigheid weer inzakt, wat marketing-technisch gezien ook niet gunstig is.

Als het high-profile namen zijn, worden ze al scherper in de gaten gehouden. Hoge bomen en veel wind.

Het grote gevaar hierbij is dat wanneer wikipedia een stuk tekst als 'betrouwbaar' aanmerkt, dit nog sneller voor waar wordt aangezien. Dat is gevaarlijk, want in feite is het nog steeds een ongecontroleerd stuk tekst van een anonieme schrijver.

Het is niet ongecontroleerd, want als het fout is, wordt het meestal (snel) verbeterd en het is meestal ook niet door een anonieme schrijver geschreven aangezien het in het artikel gaat over geregistreerde gebruikers op wie deze tool wordt toegepast (aangezien men anders onmogelijk kan weten of andere stukken van hem onaangepast bleven denk ik).
Correct me if I'm wrong...

Tekst wordt niet als betrouwbaar aangemerkt. Delen van de tekst worden als "betrouwbaarheid verdacht" aangemerkt. Dat is een belangrijk verschil en als mensen dat soort verschillen niet kunnen duiden, dan zegt het meer over hun kwaliteiten tot het interpreteren van informatie dan over Wikipedia's kwaliteiten tot het verzamelen van informatie.

Eigenlijk -weet- je dat nog steeds niet... het maakt het alleen wel makkelijker om te zien of iets een recente edit is en daarmee wat sceptischer moet bekeken worden dan de andere tekst.

Maar die recente edit kan best 100% feit zijn - bet zo goed als dat een hele oude -foute- edit gewoon onopgemerkt kan zijn gaan; en de persoon die al die goede edits heeft gemaakt maakt ongetwijfeld ook wel eens een fout.

Het is dan ook meer een hulp toolje dan een daadwerkelijke 'review' van wat er geschreven is door mensen die verstand van het onderwerp hebben en zeggen "ja, dit klopt". Maar dan moet je ook bij die andere wiki zijn... waar veel minder op staat :)

Je leest de tekst in principe zonder kleuren, maar als je op een knopje klikt verschijnen ze en kun je beoordelen of die ene zin wel echt waar is.

Beide betrouwbaarheid testen lijken me onbetrouwbaar, als ik een expert ben op een klein vakgebied en daardoor net iets beter weet hoe iets werkt dan wat algemeen bekend is, zal ik op beide betrouwbaarheid testen laag scoren.

Ze kunnen beter een betrouwbaarheid test invoeren op basis van kwaliteit van de referenties.

Je zal in beginsel een lage betrouwbaarheid aangegeven krijgen, echter als je tekst goed is blijft hij staan en corrigeert hij het vanzelf naar betrouwbaar. Nu heb je geen enkel idee of een stuk tekst net is toegevoegd of dat het er al jaren staat. Voeg je op jouw vakgebied vaker stukken toe die lang blijven staan dan krijg je meteen een goede betrouwbaarheid toegekend. De kwaliteit van referenties lijkt mij nog veel lastiger te bepalen dan dit systeem. Eenvoudig maar waarschijnlijk wel efficient.

je kan toch de laatste wijzigingen zien als je die opvraagt?

Inderdaad. Maar dan zie je niet direct wat er gewijzigd is, alleen een (eventuele) beschrijving van wat er gewijzigd is. Dan moet je dat dus helemaal gaan uitspitten.

Uiteraard is deze techniek niet perfect, maar jouw referentiesysteem ook niet.
Bijvoorbeeld Tom Cruise zou gezien zijn uitgebreide carrière als acteur wel als een echte expert kunnen aangemerkt worden, maar als hij dan artikels over Scientology zou gaan verbeteren, waar hij lid van is, is het referentiesysteem weer niets meer waard (Scientology heeft de neigin om alle artikels in zijn eigen voordeel te verdraaien).
Men zou dan ook nog eens elk artikel in een bepaalde categorie moeten indelen (wat op zich al niet helemaal kan, aangezien er genoeg artikels over verschillende thema's zullen handelen) en daaraan referenties linken enzovoorts...
Het is dus nogal onmogelijk om een waterdicht systeem te creeëren, maar dit systeem (in het artikel) is imo toch een goed systeem...

[Reactie gewijzigd door svdnstee op maandag 31 augustus 2009 09:30]


Wikipedia is en blijft onbetrouwbaar, ik gebruik het heel veel, maar uiteindelijk is het vaak toch niet 100% zuiver, maar dit soort dingen helpt het wel. Ze kunnen niet alles controleren, zo ook niet de referenties doorlezen of het allemaal correct is, maar dit systeem gaat automatisch en zal wel echt helpen om mensen de juiste info aan te bieden.

Maar waarom zou je laag scoren als je meer weet dan de gemiddelde? Je gaat er vanuit dat mensen je informatie zullen wissen omdat ze het niet begrijpen? Maar daarvoor kan je juist de referenties erbij zetten zodat ze het kunnen nalezen.

Ik begrijp je punt wel dat het nooit perfect is, maar het is juist die imperfectie wat Wikipedia maakt wat het is, je zou dit nooit kunnen doen als niet iedereen de informatie zou kunnen wijzigen.

...maar uiteindelijk is het vaak toch niet 100% zuiver
The Encyclopedia Britannica is misschien procentueel gezien betrouwbaarder, maar die is vele malen kleiner. Maar ook EB is niet 100% zuiver.
Zo ook met artikelen op security.nl, nu.nl, nature.com, nasa.gov, etc.

Kwaliteit van referenties is lastiger geautomatiseerd te controleren. Kijken hoe lang een artikel blijft staan (want dan zal de info wel kloppen) is makkelijk door scripts te controleren.

Dit is wel een prima iets, nu staat er ergens vaag dat de inhoud van het artikel ter discussie staat. Nu hopen dat de kleuren niet al te fel zijn.
Ik snap niet dat het zo'n zware aanslag op de servers (computers?) moet zijn.
De tekst moet worden opgedeeld in auteur en dan opvragen hoe betrouwbaar hij is en hoe lang het er al staat. Gaat er aan liggen hoe ze het gaan implementeren... hoe moeilijk ze het zelf gaan maken.

Lol @ oranje tekst

[Reactie gewijzigd door epTa op maandag 31 augustus 2009 09:25]


Zou die oranje tekst nu gezien moeten worden als onbetrouwbaar of als meest belangrijk? :+

Het lijkt er op dat Wikipedia meer en meer ten onder gaat aan zijn eigen succes. Eerder al de beperking van editen van stukken door moderatie toe te passen door 'ervaren' wiki posters. Nu een 'betrouwbaarheids tag' aan de hand van een IMO dubieus algoritme op basis van tijd dat een artikel bestaat.
Als een onwaarheid lange tijd niet is bijgewerkt, wordt het dan opeens waar (betrouwbaar)?

Dat is nu juist het punt.
Door duidelijk onderscheid te maken tussen oude en nieuwe tekst en of deze tekst van een "vertrouwde" poster komen is het veel makkelijker geworden om de onzin van de feiten te scheiden.

Men gaat er van uit dat wanneer een tekst er een aanzienlijke periode staat, deze vaak genoeg gelezen is om eventuele fouten of onwaarheden aan het licht te brengen.
Wanneer een wijziging in zo'n tekst in uiterlijk duidelijk verschilt van de originele tekst valt deze dus meer op en zal er beter gekeken worden naar de juistheid van de wijziging.

Dit lijkt me zeer praktisch bij onderwerpen waarvan bekend is dat er veel gewijzigd wordt (bijv. scientology) of bij "grappen" (zoals bij het levensverhaal van Regilio Tuur).

Nee oranje tekst hoort gezien te worden als "recent gewijzigd door een persoon met een lagere betrouwbaarheid index" en als niets anders. Recente wijzigingen zijn inherent minder betrouwbaar, maar het zegt NIETS over de definitieve betrouwbaarheid van zowel de persoon of de tekst die er al langer staat. Elke ervaren Wikipedia gebruiker weet dit soort dingen.

WikiTrust is dus ook voornamelijk een tool voor editors om hun snel te wijzen op onderdelen van een pagina die ze misschien met hun ervaring eens dubbel zouden moeten bekijken. Voor lezers geeft het een natte vinger index met een makkelijke visuele methode voor een bepaald artikel. Het geeft ze MEER informatie, maar zoals altijd bij wikipedia laat het veel over aan de interpretatie van de lezer.

Trouwens die moderatie waar je het nog over had, is enkel in de Duitse en de Engelse versie, en in dat laatste geval gaat het voornamelijk gebruikt worden in gebieden die nu juist helemaal NIET te wijzigen zijn voor veel mensen omdat ze op slot staan vanwege vandalisme. Wat dat betreft zou je kunnen zeggen dat de encyclopedie dus juist weer meer open wordt.

Nee dat is lekker.. worden de stukken net een kermis aan kleuren..

Het idee is goed, maar hopelijk maken ze het dan wel zo dat je de kleuren ook uit kan zetten.

Nee: als het scherm oranje kleurt, ben je hoe dan ook beter af met een andere bron. In dat geval weet je dat onmiddelijk, dankzij deze nieuwe achtergrondkleur; Dat vind ik beter dan dat je eerst de tekst moet lezen en dan erachter komt dat het eigenlijk troep is. Dus: mooie toevoeging aan wikipedia.

Nee: als iedereen dat zou doen, zouden nieuwe stukken nooit meer gelezen worden (want die zijn helemaal oranje), en dan vanzelf wit worden ook al leest niemand ze, terwijl niemand ze corrigeert als er fouten in staan.

Ofwel: nieuwe en gecorrigeerde stukken krijgen dan helemaal geen kans meer.

Lezen.
Er staat dat er met een tabje dit dan wel desgewenst in kan worden geschakeld (alleen voor geregistreerde gebruikers).
Gewoon een betrouwbaarheidscheck, prima initiatief, antwoord op het grootste minpunt van wikipedia.

Natuurlijk blijven artikelen waar mensen heel weinig vanaf weten alsnog onbetrouwbaar (heel weinig mensen die het editen, waardoor tekst lang blijft staan).

Sommige artikelen (zelfs populaire) worden nauwelijks gecontroleerd. Voor die artikelen zal het dus weinig nut hebben. Als de tijd echter relatief aan de gemiddelde correctie-edit berekent wordt dan heeft de feature wel een kans. Het zou in ieder geval iets kunnen helpen.

Ik snap niet zo goed dat ze nou toch zo persé de betrouwbaarheids-uitstraling van Wikipedia willen vergroten...

Zelf gebruik ik Wikipedia als nuttige informatiebron omdat er zoveel bij elkaar staat. Als je ergens betrouwbare (is dat hetzelfde als: door een "instantie" of expert geschreven??) informatie vandaan wilt halen of je wilt de wiki-informatie checken, kun je terecht bij de bronnen.

Volgens mij was juist het streven om user content toe te laten het 'unique selling point' waarmee ze in het verleden de concurrentieslag met "betrouwbare / geverifieerde" encyclopediën gewonnen hebben.


Betrouwbaarheid aan de hand van de tijd dat het erop staat, tja.. ik ben op een aantal techniek pagina's waar ik toevallig veel van het onderwerp af wist, wel klinkklare onzin tegengekomen die er toch al 2 jaar op stond... (inmiddels helemaal gefixt :-) )

Ik snap niet zo goed dat ze nou toch zo persé de betrouwbaarheids-uitstraling van Wikipedia willen vergroten...
Lijkt me duidelijk... Velen roepen vaak dat ie onbetrouwbaar is.
Als je ergens betrouwbare (is dat hetzelfde als: door een "instantie" of expert geschreven??) informatie vandaan wilt halen of je wilt de wiki-informatie checken, kun je terecht bij de bronnen.
Vele artikelen hebben (te) weinig bronnen.
Volgens mij was juist het streven om user content toe te laten het 'unique selling point' waarmee ze in het verleden de concurrentieslag met "betrouwbare / geverifieerde" encyclopediën gewonnen hebben.
User content wordt nog steeds toegelaten. Bij die 0,001% die een editor is, kán men dan vervolgens opt-innen voor die kleurtjes. 'T is dus alleen maar een handige toevoeging waar je ook nog eens zelf voor moet kiezen.
Betrouwbaarheid aan de hand van de tijd dat het erop staat, tja.. ik ben op een aantal techniek pagina's waar ik toevallig veel van het onderwerp af wist, wel klinkklare onzin tegengekomen die er toch al 2 jaar op stond... (inmiddels helemaal gefixt :-) )
Zodra WikiTrust is doorgevoerd op Wikipedia, kan men ('eenvoudig') vele extra variabelen meenemen bij de bepaling van de betrouwbaarheid. Zoals: is de edit van een VMBO/MAVO-school van een anoniem account, of van een Universiteit? Hoevaak is de betreffende pagina gelezen? Er zijn vast nog vele variabelen waar ik zo snel niet aan denk. Zeer zeker invoeren doen dus, dat WikiTrust!! Er is eigenlijk geen nadeel te bedenken, anders dan dat 't meer energie kost. Maar we gaan toch langzamerhand naar 99% onuitputtelijke energiebronnen. (Langzaam, dat wel. Maar komen gaat 't zeker.)

Een soort Karma-systeem ;)

Maar even zonder dollen, goeie stap voorwaarts. Ik had al wat problemen met veel artikelen in de virtualisatie-sfeer (zeker als het over "cloud" gaat) die veel wijzigden en dan moet je maar kijken wie het schreef.. (de waarheid is een ander verhaal) en nu hoef je geen namen meer te onthouden.

Wel zou ik een derde regel toevoegen, ik zou het in kennis-gebieden indelen, iemand kan veel weten over piano's maar dat wil niks zeggen wat hij/zij weet over brandbestrijding..

akkoord over de derde regel. :-)

[Reactie gewijzigd door zeemeerman2 op maandag 31 augustus 2009 09:35]


Er zijn ook tweakers die op wetenschappelijk niveau studeren, vraag hen eens 'hoe betrouwbaar' wikipedia is. De wiki-auteurs kunnen een goed boek als bron nemen, maar als de overschrijver fouten maakt in het overnemen, of het boek niet geheel begrijpt dan wankelt het artikel al. Als niemand het corrigeert dan is het in mijn ogen niet betrouwbaarder hoor.

Voor andere zaken is het een leuke site met handige weetjes.

ontopic: ik denk dat het merendeel van de gebruikers niet geregistreerd is, aangezien dus ook niet iedereen gebruik zal maken van de nieuwe functie denk ik dat de aanslag op de cpu-capaciteit wel beperkt zal zijn..

[qoute]De wiki-auteurs kunnen een goed boek als bron nemen[/quote]
Of ze dénken dat 't een goed boek is, terwijl 't in 't echt onwetenschappelijk is.
...merendeel
Understatement van 't jaar ;)

Voor serieuze artikelen link je toch al sowieso naar de oorspronkelijk bron van het artikel? Dus daar zouden al geen wikipedia links in mogen voorkomen.

Ik hoop dat ze er ook rekening mee houden dat sommige stukken door heel weinig mensen bezocht worden. Stel ik maak een topic over één of ander vreemd onderwerp en het komende half jaar komen er vijf mensen langs op dat topic, dan is de kans groot dat mijn tekst(onafhankelijk van de kwaliteit er van)langer blijft staan dan in een topic over Michael Jackson.

En als jouw input op de site beperkt blijft tot dat ene lemma, is de kans dat jij een ervaren en betrouwbare editor bent, een stuk kleiner dan wanneer je de fouten uit de MJ-lemmas haalt ;)

@Dingen, hieronder: Het gaat om een kleur, in diverse tinten. Ik geloof niet dat dat een groot probleem is voor kleurenblinden ;)

Oranje op zwart kan wel degelijk een probleem zijn als je kleurenblind bent, omdat er dan te weinig contrast kan zijn tussen de tekst en de achtergrond, waardoor je de tekst niet meer kunt lezen.

Hebben kleurenblinden ook moeite met tekstselectie? O_o

Als je de tekst die je niet goed kunt lezen, selecteert, dan is het opeens blauw op wit. :)

Niet erg handig dat er alleen op basis van kleur onderscheid wordt gemaakt, aangezien toch zo'n beetje 7 a 8% van de mensen kleurenblind is.

Als ze een beetje nette HTML code afleveren (net css), kun je waarschijnlijk met stylish de kleuren wel aanpassen (mits je firefox gebruikt). Ik dacht dat Opera het al standaard in huis had. (geen browser war beginnen a.u.b.)

Als we goed willen doen voor 99,9% van de bevolking, moest Tweakers.net misschien maar een paar felle kleuren bevatten (of zwart-wit), contrastrijk en het standaard lettertype overal hanteren, lettergrootte enkele malen omhoog gooien, etc....

Volgens mij wil de massa dan liever iets anders, en een bijdrage leveren om die 7 à 8% met een eigen werktuig wat te laten behelpen. Schuin oplopende paden heb je veel, maar daarnaast zie je ook nog gewone treden, terwijl iedereen die wel goed te been is, beide kan gebruiken. Ook met reden waarom ze beide voorzien, en niet voor de meest 'compatibele' oplossing gaan.
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 09:58 Sharp brengt smartbook met 5"-scherm en Ubuntu uit
Vorige 08:31 Samsung werkt aan eigen OS op basis van Linux
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011