Dat zou ik juist niet zeggen: je hebt duizenden mensen die een bepaalde site (of enig ander object) voorzien van een tag, stel dat je dus een bepaald object wilt voorzien van een verkeerde tag, dan moet je een heleboel mensen die verkeerde tag laten toewijzen aan dat object. De reden hiervoor is dat er statistische methodes bestaan om die verkeerde tags eruit te filteren, het is zeker niet zo dat je bij bijvoorbeeld tag clouds direct alle tags die ooit aan dat object zijn toegewezen te zien krijgt. Je krijgt enkel de tags te zien waarvan de statistische waarschijnlijkheid dat ze juist zijn hoog genoeg ligt, net zoals bij verkiezingen niet lke partij een zetel toegewezen krijgt, maar dat hat aantal zetels verdeeld wordt door het aantal stemmen dat die partij krijgt. Zo krijgt iedere tag ook in feite een stem. (lees: die tag wordt toegewezen aan het object, wat beteknt dat er per toewijzing van die tag een persoon is die die tag toepasselijk vindt voor dat object).
De kans daarentegen dat je een (relatief grote) fractie van de taggers kan overtuigen om verkeerd te taggen is klein. Het grootste deel van de taggers doet dus echt at hij zielf wilt, verkeerd taggegn van enkele individuën is dus niet significant te noemen tegenover het taggedrag van de meeste mensen (dit geldt natuurlijk over het algemeen, in specifieke gevallen kan het steeds zijn dat bv. de eerste 10 tags verkeerd zijn, zolang er dan geen tags bijkomen blijft dat een verkeerd beeld geven, maar meestal wordt dat voor populaire content wel binnen het uur door de rest rechtgezet en verdwijnen die verkeerde tags dus).
Dat taggen kan je overigens nog met twee andere systemen vergelijken: het waarderen van replies zoals hier op de frontpage en het beoordelen van bepaalde content zoals op vele sites (IMDb, YouTube, Google Video, ...). Dit zijn weliswaar simpelere vormen van taggen, vermits je over een discrete (beperkte) hoeveelheid tags beschikt, maar het taggen steunt op net hetzelfde, zei het iets ingewikkelder.
Het beoordelen van een score van bepaalde content, bijvoorbeeld: Als enkeling kan je daar amper invloed op uitoefenen: stel dat er een gemiddelde score toegewezen is van 7 door 1500 gebruikers, als je dan met 10 mensen afspreekt om allemaal 0/10 te geven, dan wordt de nieuwe score 6,95, wat dus weer afgerond wordt naar 7. Spreek je datzelfde af met 100 mensen (of 100 bots, zo je wilt), dan kom je uit op 6,56, wat al eerder een verschil is, maar je moet er rekening mee houden dat je op internet net met 1500 mensen te maken hebt, maar met enkele tienduizenden op populaire sites, om daarvan eenzelfde significante fractie verkeerd te laten stemmen is niet simpel.
En dan wat betreft het waarderingssysteem zoals hier op Tweakers.net: ook daar kom je vaak genoeg fouten tegen, sommige paljassen vinden het blijkbaar leuk om gewoon pagina per pagina alle reacties op overbodig te modereren (ach ja, volgens mij komt dat omdat hun reactie steeds op overbodig gemodereerd worden, maar dan niet uit pure fun, maar omdat die reacties echt overbodig waren). Maar over het algemeen worden die waarderingen wel aangepast na verloop van tijd: een persoon die actief modereert en een reactie behulpzaam vindt, zal die waardering ook toekennen en dus de waardering 'overbodig' wegdoen daarmee.
In een perfecte omgeving spreek je natuurlijk over een oneindig aantal gebruikers en een oneindig tijdsverloop voordat de juistheid van de tags helemaal overeenkomt met de content. Spijtig genoeg is dat in de praktijk niet het geval, maar wel in de meeste gevallen genoeg benaderd om die tags als betrouwbaar te kunnen zien. Het aantal gebruikers van de content is op internet natuurlijk afhankelijk van het tijdsverloop (hoe meer tijd er verstrijkt, hoe meer gebruikers er die content gebruiken, dus hoe meer er getagged wordt). Vermits het taggen afhangt van de gebruikers, en de juistheid statistisch bepaald kan worden als men weet hoe veel gebruikers er zijn, kan men dus tags vrij nauwkeurig toewijzen in de meeste gevallen behalve: als het aantal gebruikers te laag is (dat zie je hier ook in de product review: als er te weinig gebruikers een review posten, staat er duidelijk bij dat er geen gemiddelde gemaakt kan worden, omdat het niet betrouwbaar is om dat te doen), dat er weinig gebruikers bepaalde content taggen ligt dan over het algemeen aan twee dingen: ofwel heeft die bepaalde sites gewoon niet veel gebruikers (je kan geen publieke tags significant gaan bepalen met 3 mensen, stel dat er 1 fraudulente persoon bij komt, dan beïnvloedt die merkbaar de resultaten), de andere mogelijkheid is dat de content nog veel te nieuw is: als je een artikel 5 minuten geleden gepost hebt, kan je moeilijk verwachten dat dat {juist} getagd wordt, de kans bestaat er natuurlijk dat er verkeerde tags worden toegewezen, maar na verloop van tijd worden die verkeerde tags weggerekend doordat andere tags in veel grotere aantallen voorkomen.