Internet Archive krijgt gratis toegang tot commerciële Wikimedia Enterprise-api

The Internet Archive krijgt gratis toegang tot een api van Wikimedia-projecten zoals Wikipedia. Google wordt de eerste betalende klant van de commerciële Wikimedia Enterprise-dienst, die tegen betaling wikiproducten ter beschikking stelt.

Wikimedia heeft de eerste officiële stappen gezet van het Wikimedia Enterprise-project. De stichting kondigde die enkele weken geleden al aan. Wikimedia Enterprise is een betaalde dienst voor bedrijven die content van wikidiensten overnemen, zoals Wikipedia-artikelen en -snippets of afbeeldingen van Wiktionary of Wikivoyage.

Wikimedia schrijft nu dat Google de eerste klant van de dienst wordt, maar geeft geen details over wat het internetbedrijf met de data gaat doen. De stichting schrijft daarnaast dat The Internet Archive gratis toegang krijgt tot de functies van Enterprise. Dat gebeurt zodat die instantie 'verder kan werken aan zijn missie om het web te archiveren'. Hoe The Internet Archive de dienst gaat gebruiken, maakt Wikimedia evenmin bekend.

De stichting heeft ook nieuwe functies uitgebracht die bedrijven sneller over de streep moeten trekken om lid te worden. Zo zijn er voortaan gratis trials beschikbaar voor bedrijven die de dienst willen proberen. Die hebben een maximum van 10.000 requests voor de api. Ook heeft de organisatie een tool gemaakt waarmee gebruikers kunnen berekenen wat Enterprise hen kost. Enterprise bestaat uit een api waarbij gebruikers kunnen betalen voor snapshots, maar ook per request.

Wikimedia zegt dat het ook betere documentatie heeft gemaakt voor het gebruik van de api. De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Tijs Hofmans

Nieuwscoördinator

Feedback • 22-06-2022 15:09 18

22-06-2022 • 15:09

Lees meer

Internet Archive verliest beroepszaak, mocht geen e-boeken uitlenen - update Nieuws van 5 september 2024

Internet Archive heeft al dagen last van ddos-aanvallen Nieuws van 29 mei 2024

Platenlabels dagvaarden The Internet Archive om archiveringsproject vinylplaten Nieuws van 13 augustus 2023

Wikipedia vernieuwt websitelay-out met sticky header en inhoudsopgave Nieuws van 18 januari 2023

Medewerker The Internet Archive publiceert bibliotheek met 565 Palm OS-apps .Geek van 27 november 2022

The Internet Archive legt archief aan over begindagen digitale communicatie .Geek van 6 oktober 2022

Wikipedia gaat in beroep tegen Russische boete voor desinformatie over Oekraïne Nieuws van 13 juni 2022

Organisatie achter Wikipedia stopt met aannemen donaties in cryptovaluta Nieuws van 2 mei 2022

Wikimedia Foundation-vrijwilligers stemmen tegen accepteren van cryptodonaties Nieuws van 13 april 2022

Google ontwikkelt geautomatiseerde dataset die Wikipedia-afbeeldingen beschrijft Nieuws van 22 september 2021

Wikimedia-stichting start bedrijf dat voor geld content aan techbedrijven levert Nieuws van 18 maart 2021

Meer producten en artikelen

Internet Wikimedia Wikipedia

IT-banen

Meer vacatures

Reacties (18)

-Moderatie-faq

Wijzig sortering

RoestVrijStaal 22 juni 2022 15:23

Ik ben eigenlijk meer verrast over het bestaan van Wikimedia Enterprise en haar diensten zelf dan dit "nobele" gebaar.

Kort door de bocht doe je dus indirect gratis werk voor een bedrijf als je een artikel op Wikipedia aanpast. De vele beloften en constructie van stichting-zonder-winstoogmerk ten spijt.

Helium-3

@RoestVrijStaal • 22 juni 2022 17:54

Tenzij je een Wikipediaan bent (Dat denk ik niet gezien je niet vanuit de ik-vorm spreekt) zou ik niet zo snel spreken namens Wikipedianen als ik jou was. Elke Wikipediaan kan en mag een andere mening hebben.

Ik kan namens mijzelf (Wikipediaan met meer dan honderd gestarte artikelen en een veelvoud aan bewerkingen en bijdragen) spreken en ik heb er helemaal geen issue mee dat de Wikimedia Foundation dit doet. De Wikimedia Foundation doet ongelofelijk veel goede projecten en maakt het in de eerste plaats überhaupt mogelijk dat er een platform bestaat voor mensen om kennis te nemen en te geven.

Zolang die basisvorm en de basiswaarden die daarbij horen op Wikipedia beschikbaar blijven, mag iedereen verder doen wat ze willen met de data op Wikipedia*, daar is het immers voor gemaakt! Ik ben dan ook alleen maar blij als het werk dat ik geschreven heb, naast nuttig te zijn voor lezers, ook nog eens AI traint, Google's infokaartjes aanvult of verwerkt wordt in toekomstige assistenten of technologie die ik nog niet eens ken. Wikipedia is niet gemaakt om zelf rechten af te dwingen over wat je plaatst, maar juist het feit dat Wikipedia niet gaat bepalen en dicteren over wat anderen (inclusief dus de Foundation zelf) met mijn werk kunnen doen maakt het een werkelijk vrije encyclopedie, waar ik graag aan bijdraag!

Het bijdragen aan Wikipedia is iets wat ik doe uit ideologische overtuiging en intrinsieke motivatie, en het blaffen over dat iemand wel of niet mijn teksten mag gebruiken past hier niet bij.

Dit is, zoals ik al zei, mijn eigen mening. Andere Wikipedianen kunnen hier natuurlijk geheel anders over denken!

*Gegeven dat je aan bron/naamsvermelding doet.

Edit: spelling en grammatica

[Reactie gewijzigd door Helium-3 op 22 juli 2024 20:29]

Oon @RoestVrijStaal • 22 juni 2022 15:31

Ze hebben misschien geen winstoogmerk, maar ze zijn wel enorm winstgevend. Jaren geleden hadden ze al genoeg gespaard om alles een paar jaar draaiende te houden, en in de tussentijd zijn ze alleen maar meer en meer winst gaan maken ondanks dat de kosten niet veel hoger worden op die schaal.

bvdbos @Oon • 22 juni 2022 15:54

In fiscaal jaar 2019/2020 waren de reserves voor het eerst zo groot dat ze een paar (=2) jaar vooruit zouden kunnen. In de tussentijd (ofwel alleen jaar 2020/2021) zijn de kosten zelfs wat omlaag gegaan. Op basis van de reserve die ze nu hebben zouden ze 2,5 jaar vooruit kunnen...
bron: https://en.wikipedia.org/...ion#Financial_development

WoutervOorschot

@bvdbos • 22 juni 2022 17:41

Wat niet heel lang is voor een bedrijf zonder stabiele inkomstenbron, overigens draaien ze ook al een tijd geen reclame meer met de vraag te doneren volgens mij.

Het klinkt mij als een goede oplossing, google (en vele anderen) geeft veel wikipedia info als ‘knowledge graph’ in zoekresultaten, zou best logisch zijn als ze daar voor betalen.

laurxp @bvdbos • 22 juni 2022 17:49

Als je kijkt naar https://stats.wikimedia.o...eViewsMonthlyCombined.htm , zie je dat tussen 2008 en 2019 het aantal page views ongeveer 2x zo groot is geworden. In dezelfde periode is volgens de door jouw gelinkte pagina de inkomsten 23x zo groot geworden.

Uitgaande dat ze Wikipedia zelf zouden kunnen hosten voor 2x de kosten van 2008, hebben ze momenteel voldoende reserve om de boel meer dan 20 jaar draaiende te houden, zonder een enkele donatie.

De realiteit is dat Wikipedia-het-bedrijf tegenwoordig bar weinig te doen heeft met Wikipedia-de-website. De jaarlijkse donatie-actie is enorm succesful, maar slechts een fractie daarvan gaat naar de website zelf. Ze geven meer uit aan reiskosten dan aan hosting!

tweakuwe @laurxp • 22 juni 2022 20:09

Pageviews zegt niet alles. Mogelijk zijn er nu flink meer plaatjes en andere media en is de benodigde hosting met een veelvoud gestegen. Verder kijk je maar naar één van hun websites, terwijl het een familie van websites is die allemaal door dezelfde foundation gemanaged is.

Als ze idd leuke snoepreisjes doen, van mij mogen. Ik heb zoveel te danken aan Wikipedia en hun andere sites, waarom zou ik het ze misgunnen. Zelf ben ik ook blij als ik eens een zeldzame keer een leuk snoepreisje van het werk krijg, gun ik anderen ook wel $_/-\o_$

Heb je er moeite mee? Dan doneer je toch gewoon niet, en neem je niet hun nieuwe enterprise diensten af?

Oon @bvdbos • 22 juni 2022 18:47

In 2014 hadden ze ~75 miljoen gespaard en waren hun kosten om Wikipedia online te houden ~25 miljoen per jaar, dus dat is gewoon niet waar. Je kan natuurlijk andere investeringen meerekenen zoals die tabel doet, maar dan komt het neer op de Amerikaanse gedachte van genoeg geld uitgeven zodat je op papier in de min staat en geen belasting hoeft te betalen ondanks dat je bakken vol geld verdient die je belangrijke kosten ruim dekken.

bvdbos @Oon • 22 juni 2022 19:08

Heb je een bron want ik zie die cijfers niet terug in de financiële jaarverslagen?
2014 assets : 53475021
2014 expenses : 45900745

SinergyX @RoestVrijStaal • 22 juni 2022 15:33

Dat doe je nu toch al, verschil is dat nu er mogelijk een deel ook gewoon binnen wikipedia blijft hangen ipv de scrapers die het gewoon doen zonder enige vorm van erkenning/credits.

unglaublich @SinergyX • 22 juni 2022 20:51

Plus een API is veel efficiënter dan een scraper, dus lagere kosten en betrouwbaarder.

Nimja @RoestVrijStaal • 22 juni 2022 15:34

Ik heb dit 100x liever dan reclame. En bedrijfstoegang geven naar artikelen en crowd-sourced data is zeker niet verkeerd.

StefanJanssen @RoestVrijStaal • 22 juni 2022 15:37

Wikimedia is een stichting zonder winstoogmerk. "Wikimedia Enterprise" is een service voor bedrijven die hun producten bouwen op de service van Wikimedia.

Wikimedia vraagt hiervoor geld want het onderhouden alle diensten en zorgen dat de dienst verder onafhankelijk kan blijven.

Als je vrijwillig content maakt voor de stichting doe je werk voor de stichting (geen bedrijf).

Dat bedrijven dit gebruiken was al mogelijk zonder de Enterprise API en gebeurde dus ook al.

Edit:
En alle content die je erop zet geef je af onder de (uit mijn hoofd) Creative Commons License. Iedereen mag het gebruiken, ook bedrijven, maar ze mogen geen geld vragen voor ditgene (nogmaals uit mijn hoofd, en ben geen jurist)

[Reactie gewijzigd door StefanJanssen op 22 juli 2024 20:29]

tweakuwe @StefanJanssen • 22 juni 2022 20:22

Dat laatste hangt af van het type creative commons licentie. Vaak staat er een combinatie van letters achter de vermelding dat er een CC (Creative Commons) licentie is, die aangeeft wat wel/niet mag onder die specifieke licentie:

BY – Credit must be given to the creator
NC – Only noncommercial uses of the work are permitted
SA – Adaptations must be shared under the same terms
ND – No derivatives or adaptations of the work are permitted
er zijn officieel 6 goedgekeurde combinaties met één of meerdere van de bovenstaande 4 opties

Dan is er nog CC0/CC-Zero, dan mag je er alles mee doen wat je wilt. Ook delen zonder bronvermelding. Wikimedia gebruikt ook nog werken in het publieke domein, dat is in de praktijk gelijk aan CC0 om het simpel te houden. Werken van auteurs die 75+ jaar geleden overleden zijn, komen over het algemeen vrij in het publieke domein (tenzij je het eigendom in een bedrijf/stichting stopt, zoals Disney doet met de werken van Walt disney bijv.). Als je iets CC0 geeft als licentie dan zeg je dus eigenlijk dat het al gelijk in het publieke domein vrijgegeven wordt door jou.

Naast CC licenties zijn er ook andere licenties, maar de CC licenties worden voornamelijk door Wikimedia gebruikt en door velen anderen.

Enkel CC(-XX-(XX-(XX))) vermelden als je iets schrijft is al genoeg om het die licentie te geven. Geen papierwerk of formulieren niets

Oon 22 juni 2022 15:30

De gratis api voor het opvragen van Wikimedia blijft gewoon bestaan, maar de stichting zegt dat die vrij rudimentair is en niet optimaal werkt voor grote klanten.

Heeft een klant die groot genoeg is om een 'grotere' API te gebruiken niet veel meer aan een volledige download met alle artikelen? Die kunnen ze dan zelf verwerken en eens in de zoveel tijd (geautomatiseerd) opnieuw downloaden, en dan hoeven ze niet te klooien met requests om de data een voor een op te halen.

Robbierut4 @Oon • 22 juni 2022 16:31

Het is nogal lomp om dagelijks heel wikipedia te downloaden zodat je altijd recente data hebt. Kan me voorstellen dat er meer dan genoeg artikelen zijn die niet elke dag bekeken worden. Zeker gezien de grote hoeveelheid verschillende talen per artikel.

Oon @Robbierut4 • 22 juni 2022 18:48

Zo heel groot is die database niet, en het is een stuk efficiënter om dagelijks een dump in te laden naar een database die je direct kan aanspreken dan om die via een API stukje voor stukje binnen te trekken.

Het is niet voor niets dat veel databronnen expliciet op die manier werken (dump aanbieden als primaire verbinding, API alleen voor enkele calls) want dat is veel schaalbaarder.

Silent7 22 juni 2022 15:24

Mooi nieuws
En krijgen we nou geen emails en soms een periode met flinke banners die vragen om donaties meer dan?

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (18)

Sorteer op:

Weergave: