Internet Archive krijgt gratis toegang tot commerciële Wikimedia Enterprise-api

The Internet Archive krijgt gratis toegang tot een api van Wikimedia-projecten zoals Wikipedia. Google wordt de eerste betalende klant van de commerciële Wikimedia Enterprise-dienst, die tegen betaling wikiproducten ter beschikking stelt.

Wikimedia heeft de eerste officiële stappen gezet van het Wikimedia Enterprise-project. De stichting kondigde die enkele weken geleden al aan. Wikimedia Enterprise is een betaalde dienst voor bedrijven die content van wikidiensten overnemen, zoals Wikipedia-artikelen en -snippets of afbeeldingen van Wiktionary of Wikivoyage.

Wikimedia schrijft nu dat Google de eerste klant van de dienst wordt, maar geeft geen details over wat het internetbedrijf met de data gaat doen. De stichting schrijft daarnaast dat The Internet Archive gratis toegang krijgt tot de functies van Enterprise. Dat gebeurt zodat die instantie 'verder kan werken aan zijn missie om het web te archiveren'. Hoe The Internet Archive de dienst gaat gebruiken, maakt Wikimedia evenmin bekend.

De stichting heeft ook nieuwe functies uitgebracht die bedrijven sneller over de streep moeten trekken om lid te worden. Zo zijn er voortaan gratis trials beschikbaar voor bedrijven die de dienst willen proberen. Die hebben een maximum van 10.000 requests voor de api. Ook heeft de organisatie een tool gemaakt waarmee gebruikers kunnen berekenen wat Enterprise hen kost. Enterprise bestaat uit een api waarbij gebruikers kunnen betalen voor snapshots, maar ook per request.

Wikimedia zegt dat het ook betere documentatie heeft gemaakt voor het gebruik van de api. De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.

Wat vind je van dit artikel?

Geef je mening in het Geachte Redactie-forum.

Door Tijs Hofmans

Redacteur

22-06-2022 • 15:09

18 Linkedin

Reacties (18)

Wijzig sortering
Ik ben eigenlijk meer verrast over het bestaan van Wikimedia Enterprise en haar diensten zelf dan dit "nobele" gebaar.

Kort door de bocht doe je dus indirect gratis werk voor een bedrijf als je een artikel op Wikipedia aanpast. De vele beloften en constructie van stichting-zonder-winstoogmerk ten spijt.
Reageer
Tenzij je een Wikipediaan bent (Dat denk ik niet gezien je niet vanuit de ik-vorm spreekt) zou ik niet zo snel spreken namens Wikipedianen als ik jou was. Elke Wikipediaan kan en mag een andere mening hebben.

Ik kan namens mijzelf (Wikipediaan met meer dan honderd gestarte artikelen en een veelvoud aan bewerkingen en bijdragen) spreken en ik heb er helemaal geen issue mee dat de Wikimedia Foundation dit doet. De Wikimedia Foundation doet ongelofelijk veel goede projecten en maakt het in de eerste plaats überhaupt mogelijk dat er een platform bestaat voor mensen om kennis te nemen en te geven.

Zolang die basisvorm en de basiswaarden die daarbij horen op Wikipedia beschikbaar blijven, mag iedereen verder doen wat ze willen met de data op Wikipedia*, daar is het immers voor gemaakt! Ik ben dan ook alleen maar blij als het werk dat ik geschreven heb, naast nuttig te zijn voor lezers, ook nog eens AI traint, Google's infokaartjes aanvult of verwerkt wordt in toekomstige assistenten of technologie die ik nog niet eens ken. Wikipedia is niet gemaakt om zelf rechten af te dwingen over wat je plaatst, maar juist het feit dat Wikipedia niet gaat bepalen en dicteren over wat anderen (inclusief dus de Foundation zelf) met mijn werk kunnen doen maakt het een werkelijk vrije encyclopedie, waar ik graag aan bijdraag!

Het bijdragen aan Wikipedia is iets wat ik doe uit ideologische overtuiging en intrinsieke motivatie, en het blaffen over dat iemand wel of niet mijn teksten mag gebruiken past hier niet bij.

Dit is, zoals ik al zei, mijn eigen mening. Andere Wikipedianen kunnen hier natuurlijk geheel anders over denken!

*Gegeven dat je aan bron/naamsvermelding doet.

Edit: spelling en grammatica

[Reactie gewijzigd door Helium-3 op 22 juni 2022 21:24]

Reageer
Ze hebben misschien geen winstoogmerk, maar ze zijn wel enorm winstgevend. Jaren geleden hadden ze al genoeg gespaard om alles een paar jaar draaiende te houden, en in de tussentijd zijn ze alleen maar meer en meer winst gaan maken ondanks dat de kosten niet veel hoger worden op die schaal.
Reageer
In fiscaal jaar 2019/2020 waren de reserves voor het eerst zo groot dat ze een paar (=2) jaar vooruit zouden kunnen. In de tussentijd (ofwel alleen jaar 2020/2021) zijn de kosten zelfs wat omlaag gegaan. Op basis van de reserve die ze nu hebben zouden ze 2,5 jaar vooruit kunnen...
bron: https://en.wikipedia.org/...ion#Financial_development
Reageer
Wat niet heel lang is voor een bedrijf zonder stabiele inkomstenbron, overigens draaien ze ook al een tijd geen reclame meer met de vraag te doneren volgens mij.

Het klinkt mij als een goede oplossing, google (en vele anderen) geeft veel wikipedia info als ‘knowledge graph’ in zoekresultaten, zou best logisch zijn als ze daar voor betalen.
Reageer
Als je kijkt naar https://stats.wikimedia.o...eViewsMonthlyCombined.htm , zie je dat tussen 2008 en 2019 het aantal page views ongeveer 2x zo groot is geworden. In dezelfde periode is volgens de door jouw gelinkte pagina de inkomsten 23x zo groot geworden.

Uitgaande dat ze Wikipedia zelf zouden kunnen hosten voor 2x de kosten van 2008, hebben ze momenteel voldoende reserve om de boel meer dan 20 jaar draaiende te houden, zonder een enkele donatie.

De realiteit is dat Wikipedia-het-bedrijf tegenwoordig bar weinig te doen heeft met Wikipedia-de-website. De jaarlijkse donatie-actie is enorm succesful, maar slechts een fractie daarvan gaat naar de website zelf. Ze geven meer uit aan reiskosten dan aan hosting!
Reageer
Pageviews zegt niet alles. Mogelijk zijn er nu flink meer plaatjes en andere media en is de benodigde hosting met een veelvoud gestegen. Verder kijk je maar naar één van hun websites, terwijl het een familie van websites is die allemaal door dezelfde foundation gemanaged is.

Als ze idd leuke snoepreisjes doen, van mij mogen. Ik heb zoveel te danken aan Wikipedia en hun andere sites, waarom zou ik het ze misgunnen. Zelf ben ik ook blij als ik eens een zeldzame keer een leuk snoepreisje van het werk krijg, gun ik anderen ook wel _/-\o_

Heb je er moeite mee? Dan doneer je toch gewoon niet, en neem je niet hun nieuwe enterprise diensten af?
Reageer
In 2014 hadden ze ~75 miljoen gespaard en waren hun kosten om Wikipedia online te houden ~25 miljoen per jaar, dus dat is gewoon niet waar. Je kan natuurlijk andere investeringen meerekenen zoals die tabel doet, maar dan komt het neer op de Amerikaanse gedachte van genoeg geld uitgeven zodat je op papier in de min staat en geen belasting hoeft te betalen ondanks dat je bakken vol geld verdient die je belangrijke kosten ruim dekken.
Reageer
Heb je een bron want ik zie die cijfers niet terug in de financiële jaarverslagen?
2014 assets : 53475021
2014 expenses : 45900745
Reageer
Dat doe je nu toch al, verschil is dat nu er mogelijk een deel ook gewoon binnen wikipedia blijft hangen ipv de scrapers die het gewoon doen zonder enige vorm van erkenning/credits.
Reageer
Plus een API is veel efficiënter dan een scraper, dus lagere kosten en betrouwbaarder.
Reageer
Ik heb dit 100x liever dan reclame. En bedrijfstoegang geven naar artikelen en crowd-sourced data is zeker niet verkeerd.
Reageer
Wikimedia is een stichting zonder winstoogmerk. "Wikimedia Enterprise" is een service voor bedrijven die hun producten bouwen op de service van Wikimedia.

Wikimedia vraagt hiervoor geld want het onderhouden alle diensten en zorgen dat de dienst verder onafhankelijk kan blijven.

Als je vrijwillig content maakt voor de stichting doe je werk voor de stichting (geen bedrijf).

Dat bedrijven dit gebruiken was al mogelijk zonder de Enterprise API en gebeurde dus ook al.

Edit:
En alle content die je erop zet geef je af onder de (uit mijn hoofd) Creative Commons License. Iedereen mag het gebruiken, ook bedrijven, maar ze mogen geen geld vragen voor ditgene (nogmaals uit mijn hoofd, en ben geen jurist)

[Reactie gewijzigd door StefanJanssen op 22 juni 2022 15:40]

Reageer
Dat laatste hangt af van het type creative commons licentie. Vaak staat er een combinatie van letters achter de vermelding dat er een CC (Creative Commons) licentie is, die aangeeft wat wel/niet mag onder die specifieke licentie:
  • BY – Credit must be given to the creator
  • NC – Only noncommercial uses of the work are permitted
  • SA – Adaptations must be shared under the same terms
  • ND – No derivatives or adaptations of the work are permitted
  • er zijn officieel 6 goedgekeurde combinaties met één of meerdere van de bovenstaande 4 opties
Dan is er nog CC0/CC-Zero, dan mag je er alles mee doen wat je wilt. Ook delen zonder bronvermelding. Wikimedia gebruikt ook nog werken in het publieke domein, dat is in de praktijk gelijk aan CC0 om het simpel te houden. Werken van auteurs die 75+ jaar geleden overleden zijn, komen over het algemeen vrij in het publieke domein (tenzij je het eigendom in een bedrijf/stichting stopt, zoals Disney doet met de werken van Walt disney bijv.). Als je iets CC0 geeft als licentie dan zeg je dus eigenlijk dat het al gelijk in het publieke domein vrijgegeven wordt door jou.

Naast CC licenties zijn er ook andere licenties, maar de CC licenties worden voornamelijk door Wikimedia gebruikt en door velen anderen.

Enkel CC(-XX-(XX-(XX))) vermelden als je iets schrijft is al genoeg om het die licentie te geven. Geen papierwerk of formulieren niets :)
Reageer
De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.
Heeft een klant die groot genoeg is om een 'grotere' API te gebruiken niet veel meer aan een volledige download met alle artikelen? Die kunnen ze dan zelf verwerken en eens in de zoveel tijd (geautomatiseerd) opnieuw downloaden, en dan hoeven ze niet te klooien met requests om de data een voor een op te halen.
Reageer
Het is nogal lomp om dagelijks heel wikipedia te downloaden zodat je altijd recente data hebt. Kan me voorstellen dat er meer dan genoeg artikelen zijn die niet elke dag bekeken worden. Zeker gezien de grote hoeveelheid verschillende talen per artikel.
Reageer
Zo heel groot is die database niet, en het is een stuk efficiënter om dagelijks een dump in te laden naar een database die je direct kan aanspreken dan om die via een API stukje voor stukje binnen te trekken.

Het is niet voor niets dat veel databronnen expliciet op die manier werken (dump aanbieden als primaire verbinding, API alleen voor enkele calls) want dat is veel schaalbaarder.
Reageer
Mooi nieuws
En krijgen we nou geen emails en soms een periode met flinke banners die vragen om donaties meer dan?
Reageer


Om te kunnen reageren moet je ingelogd zijn


Nintendo Switch (OLED model) Apple iPhone SE (2022) LG G1 Google Pixel 6 Call of Duty: Vanguard Samsung Galaxy S22 Garmin fēnix 7 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2022 Hosting door True

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee