UvA-onderzoeker Xinyi Li heeft een automatische methode ontwikkeld om de kwaliteit van Wikipedia-pagina's te beoordelen. Omdat Wikipedia draait op bijdragen van mensen met verschillende meningen, is het soms lastig te bepalen of de inhoud klopt.
Li presenteerde het model van de onderzoeksgroep waarvan hij deel uitmaakt onlangs tijdens de 'European Conference on Information Retrieval' in Wenen. Een van de problemen waar Wikipedia tegenaan loopt, is dat van alle Wikipedia-artikelen slechts een klein deel handmatig op kwaliteit kan worden beoordeeld. Om alle pagina's op waarde te kunnen schatten, is een automatische evaluatiemethode nodig.
De methode die Li presenteerde, maakt behalve van de inhoud, gebruik van informatie over wie heeft bijgedragen aan een artikel. De meeste artikelen worden door meer dan één persoon geschreven, maar niet iedereen draagt evenveel bij. Ook blijkt dat het merendeel van de auteurs slechts over een beperkt aantal onderwerpen schrijft. Om de beste resultaten te bereiken wordt een combinatie gemaakt tussen informatie van bestaande, handmatige evaluaties van artikelen en de software van Li, iets wat volgens de auteurs een goed bruikbare oplossing is voor de kwaliteitsbeoordeling van de artikelen.
Door niet alleen te kijken naar de inhoud van een artikel, maar ook naar de deskundigheid en het aantal bijdragen van auteurs, is het via Li's methode makkelijker om de kwaliteit van een artikel te beoordelen. Op die manier zouden er geautomatiseerde waarschuwingen gegeven kunnen worden. Nu staan er af en toe waarschuwingen bij artikelen als er referenties ontbreken, als er weinig tekst is of als de schrijfstijl niet objectief is.