Internet Archive krijgt gratis toegang tot commerciële Wikimedia Enterprise-api

The Internet Archive krijgt gratis toegang tot een api van Wikimedia-projecten zoals Wikipedia. Google wordt de eerste betalende klant van de commerciële Wikimedia Enterprise-dienst, die tegen betaling wikiproducten ter beschikking stelt.

Wikimedia heeft de eerste officiële stappen gezet van het Wikimedia Enterprise-project. De stichting kondigde die enkele weken geleden al aan. Wikimedia Enterprise is een betaalde dienst voor bedrijven die content van wikidiensten overnemen, zoals Wikipedia-artikelen en -snippets of afbeeldingen van Wiktionary of Wikivoyage.

Wikimedia schrijft nu dat Google de eerste klant van de dienst wordt, maar geeft geen details over wat het internetbedrijf met de data gaat doen. De stichting schrijft daarnaast dat The Internet Archive gratis toegang krijgt tot de functies van Enterprise. Dat gebeurt zodat die instantie 'verder kan werken aan zijn missie om het web te archiveren'. Hoe The Internet Archive de dienst gaat gebruiken, maakt Wikimedia evenmin bekend.

De stichting heeft ook nieuwe functies uitgebracht die bedrijven sneller over de streep moeten trekken om lid te worden. Zo zijn er voortaan gratis trials beschikbaar voor bedrijven die de dienst willen proberen. Die hebben een maximum van 10.000 requests voor de api. Ook heeft de organisatie een tool gemaakt waarmee gebruikers kunnen berekenen wat Enterprise hen kost. Enterprise bestaat uit een api waarbij gebruikers kunnen betalen voor snapshots, maar ook per request.

Wikimedia zegt dat het ook betere documentatie heeft gemaakt voor het gebruik van de api. De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.

Door Tijs Hofmans

Nieuwscoördinator

22-06-2022 • 15:09

18

Reacties (18)

18
18
13
2
0
5
Wijzig sortering
Ik ben eigenlijk meer verrast over het bestaan van Wikimedia Enterprise en haar diensten zelf dan dit "nobele" gebaar.

Kort door de bocht doe je dus indirect gratis werk voor een bedrijf als je een artikel op Wikipedia aanpast. De vele beloften en constructie van stichting-zonder-winstoogmerk ten spijt.
Tenzij je een Wikipediaan bent (Dat denk ik niet gezien je niet vanuit de ik-vorm spreekt) zou ik niet zo snel spreken namens Wikipedianen als ik jou was. Elke Wikipediaan kan en mag een andere mening hebben.

Ik kan namens mijzelf (Wikipediaan met meer dan honderd gestarte artikelen en een veelvoud aan bewerkingen en bijdragen) spreken en ik heb er helemaal geen issue mee dat de Wikimedia Foundation dit doet. De Wikimedia Foundation doet ongelofelijk veel goede projecten en maakt het in de eerste plaats überhaupt mogelijk dat er een platform bestaat voor mensen om kennis te nemen en te geven.

Zolang die basisvorm en de basiswaarden die daarbij horen op Wikipedia beschikbaar blijven, mag iedereen verder doen wat ze willen met de data op Wikipedia*, daar is het immers voor gemaakt! Ik ben dan ook alleen maar blij als het werk dat ik geschreven heb, naast nuttig te zijn voor lezers, ook nog eens AI traint, Google's infokaartjes aanvult of verwerkt wordt in toekomstige assistenten of technologie die ik nog niet eens ken. Wikipedia is niet gemaakt om zelf rechten af te dwingen over wat je plaatst, maar juist het feit dat Wikipedia niet gaat bepalen en dicteren over wat anderen (inclusief dus de Foundation zelf) met mijn werk kunnen doen maakt het een werkelijk vrije encyclopedie, waar ik graag aan bijdraag!

Het bijdragen aan Wikipedia is iets wat ik doe uit ideologische overtuiging en intrinsieke motivatie, en het blaffen over dat iemand wel of niet mijn teksten mag gebruiken past hier niet bij.

Dit is, zoals ik al zei, mijn eigen mening. Andere Wikipedianen kunnen hier natuurlijk geheel anders over denken!

*Gegeven dat je aan bron/naamsvermelding doet.

Edit: spelling en grammatica

[Reactie gewijzigd door Helium-3 op 22 juli 2024 20:29]

Ze hebben misschien geen winstoogmerk, maar ze zijn wel enorm winstgevend. Jaren geleden hadden ze al genoeg gespaard om alles een paar jaar draaiende te houden, en in de tussentijd zijn ze alleen maar meer en meer winst gaan maken ondanks dat de kosten niet veel hoger worden op die schaal.
In fiscaal jaar 2019/2020 waren de reserves voor het eerst zo groot dat ze een paar (=2) jaar vooruit zouden kunnen. In de tussentijd (ofwel alleen jaar 2020/2021) zijn de kosten zelfs wat omlaag gegaan. Op basis van de reserve die ze nu hebben zouden ze 2,5 jaar vooruit kunnen...
bron: https://en.wikipedia.org/...ion#Financial_development
Wat niet heel lang is voor een bedrijf zonder stabiele inkomstenbron, overigens draaien ze ook al een tijd geen reclame meer met de vraag te doneren volgens mij.

Het klinkt mij als een goede oplossing, google (en vele anderen) geeft veel wikipedia info als ‘knowledge graph’ in zoekresultaten, zou best logisch zijn als ze daar voor betalen.
Als je kijkt naar https://stats.wikimedia.o...eViewsMonthlyCombined.htm , zie je dat tussen 2008 en 2019 het aantal page views ongeveer 2x zo groot is geworden. In dezelfde periode is volgens de door jouw gelinkte pagina de inkomsten 23x zo groot geworden.

Uitgaande dat ze Wikipedia zelf zouden kunnen hosten voor 2x de kosten van 2008, hebben ze momenteel voldoende reserve om de boel meer dan 20 jaar draaiende te houden, zonder een enkele donatie.

De realiteit is dat Wikipedia-het-bedrijf tegenwoordig bar weinig te doen heeft met Wikipedia-de-website. De jaarlijkse donatie-actie is enorm succesful, maar slechts een fractie daarvan gaat naar de website zelf. Ze geven meer uit aan reiskosten dan aan hosting!
Pageviews zegt niet alles. Mogelijk zijn er nu flink meer plaatjes en andere media en is de benodigde hosting met een veelvoud gestegen. Verder kijk je maar naar één van hun websites, terwijl het een familie van websites is die allemaal door dezelfde foundation gemanaged is.

Als ze idd leuke snoepreisjes doen, van mij mogen. Ik heb zoveel te danken aan Wikipedia en hun andere sites, waarom zou ik het ze misgunnen. Zelf ben ik ook blij als ik eens een zeldzame keer een leuk snoepreisje van het werk krijg, gun ik anderen ook wel _/-\o_

Heb je er moeite mee? Dan doneer je toch gewoon niet, en neem je niet hun nieuwe enterprise diensten af?
In 2014 hadden ze ~75 miljoen gespaard en waren hun kosten om Wikipedia online te houden ~25 miljoen per jaar, dus dat is gewoon niet waar. Je kan natuurlijk andere investeringen meerekenen zoals die tabel doet, maar dan komt het neer op de Amerikaanse gedachte van genoeg geld uitgeven zodat je op papier in de min staat en geen belasting hoeft te betalen ondanks dat je bakken vol geld verdient die je belangrijke kosten ruim dekken.
Heb je een bron want ik zie die cijfers niet terug in de financiële jaarverslagen?
2014 assets : 53475021
2014 expenses : 45900745
Dat doe je nu toch al, verschil is dat nu er mogelijk een deel ook gewoon binnen wikipedia blijft hangen ipv de scrapers die het gewoon doen zonder enige vorm van erkenning/credits.
Plus een API is veel efficiënter dan een scraper, dus lagere kosten en betrouwbaarder.
Ik heb dit 100x liever dan reclame. En bedrijfstoegang geven naar artikelen en crowd-sourced data is zeker niet verkeerd.
Wikimedia is een stichting zonder winstoogmerk. "Wikimedia Enterprise" is een service voor bedrijven die hun producten bouwen op de service van Wikimedia.

Wikimedia vraagt hiervoor geld want het onderhouden alle diensten en zorgen dat de dienst verder onafhankelijk kan blijven.

Als je vrijwillig content maakt voor de stichting doe je werk voor de stichting (geen bedrijf).

Dat bedrijven dit gebruiken was al mogelijk zonder de Enterprise API en gebeurde dus ook al.

Edit:
En alle content die je erop zet geef je af onder de (uit mijn hoofd) Creative Commons License. Iedereen mag het gebruiken, ook bedrijven, maar ze mogen geen geld vragen voor ditgene (nogmaals uit mijn hoofd, en ben geen jurist)

[Reactie gewijzigd door StefanJanssen op 22 juli 2024 20:29]

Dat laatste hangt af van het type creative commons licentie. Vaak staat er een combinatie van letters achter de vermelding dat er een CC (Creative Commons) licentie is, die aangeeft wat wel/niet mag onder die specifieke licentie:
  • BY – Credit must be given to the creator
  • NC – Only noncommercial uses of the work are permitted
  • SA – Adaptations must be shared under the same terms
  • ND – No derivatives or adaptations of the work are permitted
  • er zijn officieel 6 goedgekeurde combinaties met één of meerdere van de bovenstaande 4 opties
Dan is er nog CC0/CC-Zero, dan mag je er alles mee doen wat je wilt. Ook delen zonder bronvermelding. Wikimedia gebruikt ook nog werken in het publieke domein, dat is in de praktijk gelijk aan CC0 om het simpel te houden. Werken van auteurs die 75+ jaar geleden overleden zijn, komen over het algemeen vrij in het publieke domein (tenzij je het eigendom in een bedrijf/stichting stopt, zoals Disney doet met de werken van Walt disney bijv.). Als je iets CC0 geeft als licentie dan zeg je dus eigenlijk dat het al gelijk in het publieke domein vrijgegeven wordt door jou.

Naast CC licenties zijn er ook andere licenties, maar de CC licenties worden voornamelijk door Wikimedia gebruikt en door velen anderen.

Enkel CC(-XX-(XX-(XX))) vermelden als je iets schrijft is al genoeg om het die licentie te geven. Geen papierwerk of formulieren niets :)
De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.
Heeft een klant die groot genoeg is om een 'grotere' API te gebruiken niet veel meer aan een volledige download met alle artikelen? Die kunnen ze dan zelf verwerken en eens in de zoveel tijd (geautomatiseerd) opnieuw downloaden, en dan hoeven ze niet te klooien met requests om de data een voor een op te halen.
Het is nogal lomp om dagelijks heel wikipedia te downloaden zodat je altijd recente data hebt. Kan me voorstellen dat er meer dan genoeg artikelen zijn die niet elke dag bekeken worden. Zeker gezien de grote hoeveelheid verschillende talen per artikel.
Zo heel groot is die database niet, en het is een stuk efficiënter om dagelijks een dump in te laden naar een database die je direct kan aanspreken dan om die via een API stukje voor stukje binnen te trekken.

Het is niet voor niets dat veel databronnen expliciet op die manier werken (dump aanbieden als primaire verbinding, API alleen voor enkele calls) want dat is veel schaalbaarder.
Mooi nieuws
En krijgen we nou geen emails en soms een periode met flinke banners die vragen om donaties meer dan?

Op dit item kan niet meer gereageerd worden.