Internet Archive heeft al dagen last van ddos-aanvallen

Internet Archive en zijn Wayback Machine hebben sinds afgelopen weekend last van ddos-aanvallen. Dat maakt de stichting achter deze diensten bekend. Het kan daardoor voorkomen dat de diensten van de organisatie onbereikbaar zijn.

De ddos-aanvallen begonnen op zondag, meldt Internet Archive in een blogpost. Internet Archive, waar miljoenen historische documenten, websites en media beschikbaar zijn, is daardoor zelf mogelijk niet goed bereikbaar. Ook de Wayback Machine, waarmee snapshots van webpagina's bekeken kunnen worden, heeft last van de aanvallen. Volgens de organisatie zijn alle collecties veilig.

Internet Archive gaf de afgelopen dagen updates over de situatie op sociale media. Gisteravond zei de organisatie dat het nog steeds last heeft van een ddos-aanval. De bron van de aanval is onbekend, hoewel Internet Archive zegt dat zijn digitale 'bibliotheken en andere kennisinstituten' de laatste tijd steeds vaker het doelwit zijn van dergelijke ddos-pogingen.

Door Daan van Monsjou

Nieuwsredacteur

29-05-2024 • 16:05

39

Submitter: wildhagen

Reacties (39)

39
39
22
2
0
10
Wijzig sortering
SN_BLACKMETA claimt de DDOS-aanval op Internet Archive. https://twitter.com/DarkW...tatus/1795474755211899221
https://twitter.com/DarkW...95482920804913380/photo/1

Voor zover je het kan geloven..
Ik dacht dat ze altijd DDoS aanvallen hadden, aangezien hun Wayback machine en archive altijd super langzaam zijn.

Beste is meerdere tabs te openen, en dan hopen dat daar iets van laadt of reageert.
Ja, behoorlijk sloom en grotere downloads hebben ze netjes gearchiveerd maar zijn via browsers niet eens binnen te halen omdat ze worden afgebroken.

Maar, grappig genoeg is er een workaround. Ze zitten in San Francisco. Zet je VPN op San Francisco en je snelheid gaat van enkele KB's naar MB's. Kwam hierachter nadat ik met een random US locatie al verschil in snelheid zag, per toeval. Toen bleek het internet vol te staan met de VPN-op-San-Francisco-truc.
Wie heeft daar nou baat bij?
Om toe te voegen aan de speculaties: een hoop mensen, organisaties en overheden zullen het minder plezierig vinden dat bepaalde onwelgevallige webpagina's en gegevens gearchiveerd zijn. Het lijkt me onwaarschijnlijk dat een scriptkiddie de capaciteit bij elkaar kan rapen op een schaal waar Internet Archive langdurig last van heeft.
Het lijkt me onwaarschijnlijk dat een scriptkiddie de capaciteit bij elkaar kan rapen op een schaal waar Internet Archive langdurig last van heeft.
Internet Archive (IA) heeft vaker last van capaciteitsproblemen, dus de schaal van IA sluit niet uit dat een willekeurig persoon (scriptkiddy) voldoende capaciteit heeft / kan krijgen om de Wayback Machine plat te leggen.
IA is een non-profit zonder oneindige diepe zakken en de gemiddelde scriptkiddie kan voor een fractie van een bitcoin een botnet huren.
Was het niet zo dat je op het darkweb binnen 10 minuten een organisatie gevonden hebt die zo'n beetje elke site compleet plat kan DDOS'en zolang je hen maar betaald? En die bedragen zijn lager dan dat je denkt.
Niet alle DDoS-attacks hebben direct een concreet doel, soms is het ook 'gewoon' om te laten zien dat men het kan, voor de 'lol' zeg maar. Of als 'oefening' voor een grotere aanval op een meer concreet doelwit, met wel een doel.

Triest is het zeker maarja, sommigen scheppen er blijkbaar plezier en lol in om dit soort dingen te doen...

Hopelijk weet men deze aanval snel af te slaan en komt alles weer goed online.
Wellicht een ddos verkoper die zijn waren test of laat zien aan potentiële klanten...
trieste script kiddies die denken dat ze stoer zijn.
Kinderen die zich vervelen...
Iedereen die last van heeft dat ze publieke informatie vereeuwigen.
Overheden/bedrijven die stilletjes zaken veranderen in websites om er maar even eentje te noemen.
Censuur werkt niet zo goed als 't ergens anders nog beschikbaar blijft ook
Maar dan blijven de oudere pagina's toch gewoon beschikbaar in het archief? Alleen nu even niet.
GPT zich aan het trainen met de data in het archief :+ ?
Je zet het er waarschijnlijk neer als grap, maar ik heb vanmorgen op een aantal websites van klanten van mij alle AI-bots geblokkeerd samen met een aantal andere bots. Voornamelijk Amazon en Semrushbot waren echt enorm aan het spammen, tientallen requests per seconde schoten langs. Via een .htaccess op de Useragent er een 403 forbidden van gemaakt.

Na het blokkeren van deze bots was er 95% minder CPU-load en 75% minder dataverkeer. Echt een krankzinnig verschil. Ze zullen ook niet aanbieden om een snellere server te kopen voor me, of m'n dataverkeer- of stroom-rekening te betalen.
Maar het is al langskomen dat er bots zijn (ook van AI) die robots.txt gewoon negeren. :/

Mensen denken dat AI er zomaar is, en niets kost. Het is zo fantastisch en iedereen gebruikt het tegenwoordig om een antwoord te geven. Terwijl je dus daar al met wat kennis doorheen kan prikken.

Ik gok dus zeker dat zij hier last van hebben, ook genoeg andere sites.
Zolang ze een UserAgent meegeven, kun je ze eenvoudig blokkeren met een .htaccess bestand.
Maar dat is dan wachten tot ze gewoon mozilla oid meegeven als useragent..
Inderdaad, of dat er een nieuwe bot opduikt met een andere useragent. Of dat ze zonder bijbedoelingen een andere useragent gebruiken. Of dus inderdaad dat ze het faken naar iets wat legitieme users ook gebruiken die je niet wilt uitsluiten, iets wat ik zelf ook wel eens doe in mijn scripts naar API's omdat 't anders niet werkt.

Dit is specifiek handwerk, leuk voor even, maar zo zou het niet moeten zijn. Bots zijn prima, ze maken het web zelfs voor een deel, maar die moeten zich gewoon aan de standaarden houden. Zeker als het van grote bedrijven met een reputatie komt mag je dat verwachten. En zeker ook dat spammen is echt not-done en nergens voor nodig. Zelfs met een blokkade heeft je server dan nog steeds continue die blokkades te verwerken.

[Reactie gewijzigd door crazyboy01 op 22 juli 2024 15:08]

Wie gegevens wilt weren uit de gezamenlijke herinneringen van de mensheid, staat gegarandeerd aan de verkeerde kant van de geschiedenis.

Wie wil doneren aan the internet archive zodat ze zich beter kunnen beschermen tegen dergelijke aanvallen, kan dat doen via https://archive.org/donate
Ik snap niet dat dit soort dingen nog een issue is met diensten als Cloudflare. Hang het daar achter en je probleem is opgelost.
Cloudflare kost alleen best wel wat geld. Geld dat dit soort organisaties vaak óf niet hebben, óf liever aan nuttigere (lees: inhoudelijker voor hun doelen) zouden willen besteden.

Daarnaast is Cloudflare een hulpmiddel, geen wondermiddel. Ook als je Cloudflare hebt kan je nog altijd down gaan, of op zijn minst vertraging oplopen, als de aanval zodanig groot is dat ook Cloudflare het loodje zou kunnen leggen. De kans is erg klein, maar niet onmogelijk.

Een echt wondermiddel wat gegarandeerd 100 procent helpt tegen een aanval die maar groot en zwaar genoeg is, is er nog altijd niet, en ik verwacht die ook niet op korte of middellange termijn.
Cloudflare kost alleen best wel wat geld.
Best een hoop geld ... Was een paar dagen geleden nog een blog van een gokbedrijf (dat ja, legaal werkte), over hoe ze (ze hadden een business 250$/maand account) constant gepushed werden door Cloudflare met berichten over issues, dat dan eigenlijk sales waren. En dan kwam de bom, u moet ons 10k betalen / maand voor enterprise klanten. Hoeveel data gebruikte ze? 80TB (dat was de 10K aanbod).

https://robindev.substack...are-took-down-our-website

Beetje discussie over prijs (CF dat niet wilde schikken) en toen het duidelijk was dat ze ook aan het onderhandelen waren bij een competitor, ... domein verwijderd, domein verwijderd, domein verwijderd, domein verwijderd, ... En dan een mail van "uw account is suspended".

Edit: Om duidelijk te maken, ze hebben AL de data verwijderd van het account, en dan pas kwam de "suspended" mail (waar ze claimen dat ze gewoon geen nieuw domains konden toevoegen maar de rest bleef werken). Kwam enorm wraakachtig over.

Voor de mensen dat denken dat 80TB / maand veel is, dat is eigenlijk niets en kost je nauwelijks een 100 Euro bij een provider zoals Hetzner. En gans de discussie van online gokken of whatever us niet relevant, als ze legaal werkte. Is niet de enige want waren nog een hoop andere mensen dat commentaar gaven dat hetzelfde ook bij hun voorviel. Dat men "technisch issues" gebruikte om mensen direct naar sale te duwen (de contact was sales), en als je niet mee inging, plop, we verwijderen uw wegen TSO / Technische issues.

Krijg al lang de indruk (ook van dat filmpje hoe ze mensen ontslaan) dat ze in geldnood zitten en volop aggressive te werk gaan nu. Probleem is, dat hun prijzen nogal ... 0, 250, ???? zijn. Aka, met opzet onoverzichtelijke na de 250 en blijkbaar als je betaal voor de 250 optie, dat men reageerde "u hebt iets dat u wilt beschermen, ... want anders betaal je niet voor de service". Is speculatie van mij maar viel op in discussies dat het nogal vaak de legal bedrijven waren dat men achterging dat een business account namen.

Weet 1 ding, zet nooit gans je code/data op hun workers, r2, ... want als je zoiets voor krijgt, kan de schade aan je bedrijf enorm zijn.

[Reactie gewijzigd door Verwijderd op 22 juli 2024 15:08]

url
Bizar verhaal. Cloudflare heeft niet gereageerd?

[Reactie gewijzigd door Polderviking op 22 juli 2024 15:08]

Bizar verhaal. Cloudflare heeft niet gereageerd?
Heb nog geen enkel update gezien van het verhaal, niet van de poster, niet via reddit of hackernews

Ironisch, neem dat verhaal, en neem nu dit:

https://blog.polyhaven.co...ws-a-month-for-under-400/

80TB traffic, op een 20$ account, geen piep waar ze van hoorde. Technisch 40% want 2 accounts, maar de meeste data zit op 1 account.

Ik denk gewoon dat CloudFlare dachten, die mannen zijn illegaal bezig en we kunnen ze is goed chanteren? Of Cloudflare had schrik dat hun IPs gebanned zouden worden (aka BYOIP) maar als je 10K betaalde per maand, dan zou dat ok zijn? En extra note: Het was 120k (jaar cost) in 1 keer betalen!

Hoe meer ik rond zoek, hoe meer ziet van mensen dat TBs data doorjagen, niets mee gebeuren, andere dat direct op Enterprise gepushed worden, andere dat business betalen en geen piep horen.

En enorme "randomness" hoe Cloudflare hun interne sales werken, en meer (in mijn gevoel van) "is die groot genoeg om geld uit te krijgen, ja? Gaan we volop achter.".

Een tip: Als je host van data over cloudflare of andere diensten, maak altijd meer accounts aan en split je data:

* Je host data (main domain)
* Je images (andere domain)
* Andere data (nog een ander domain)

Kost je iets meer maar is in mijn mening veiliger. Dan val je minder op en heb je ook minder kans dat als er iets misloopt, ineens ALLES plat gaat. En je domains, zet je ook bij andere domain providers, niet enkel bij Cloudflare! Die all in all diensten zijn enorm gevaarlijk als er is iets misloopt, en je managed je risico met het verdelen van je data / assets.

[Reactie gewijzigd door Verwijderd op 22 juli 2024 15:08]

Als Cloudflare principieel wil doen over de business die ze niet willen hebben hadden ze dat gewoon moeten zeggen.

Ik snap best dat ze niet willen dealen met IP blokkade's die kunnen voorvloeien uit online casino's, en ik vraag me ook wel af of we van die poster het hele verhaal hebben gekregen, maar je moet sowieso niet met een tegenbod komen als je eigenlijk geen diensten wil verlenen en gewoon roepen dat Cloudflare niets voor ze kan betekenen en hun spulleboel moeten wegmigreren per x termijn.
Dan was het volgens mij gewoon klaar geweest.

Dat Cloudflare na zo'n lange tijd pas ziet dat deze klant ze geld kost is ook niet probleem v.d. klant.
Maar goed dit hele verhaal is wellicht wat te ver offtopic om al te diep op in te zoomen onder dit nieuws artikel.

[Reactie gewijzigd door Polderviking op 22 juli 2024 15:08]

Cloudflare is natuurlijk ook niet gratis hè...
Wie wil doneren aan the internet archive zodat ze zich beter kunnen beschermen tegen dergelijke aanvallen, kan dat doen via https://archive.org/donate
Sorry, maar zo slecht boert The Internet Archive nog niet:
https://projects.propubli...7/202313169349300956/full
Ze hielden afgelopen jaar bijna $5 miljoen over en ze zijn aardig hun schulden aan het weg werken.

Ze hebben bv. in 2019 ergens $18 miljoen aan uitgegeven:
https://projects.propubli...7/202013219349323056/full

Ik ben heel happy met de dienst die The Internet Archive levert, maar het is net als veel andere organisaties niet altijd even duidelijk in wat het doet en de kans is groot dat je donaties voor verschillende nevenactiviteiten worden gebruikt waar je geen weet van heb of baat bij hebt.
>zo slecht boert The Internet Archive nog niet:
gelukkig maar, zaken zoals "Hachette v. Internet Archive Lawsuit" kosten handenvol geld.
Zeker als het een vervolgverhaal wordt : https://blog.archive.org/tag/lawsuit/

>Ze hebben bv. in 2019 ergens $18 miljoen aan uitgegeven:
https://blog.archive.org/...ive-truck-takes-a-detour/
't zal eerder upgrades van datacenters zijn dan een nieuwe internet-archive-truck ;) van de wikipedia
"
The Archive also has data centers in three Californian cities: San Francisco, Redwood City, and Richmond. To reduce the risk of data loss, the Archive creates copies of parts of its collection at more distant locations, including the Bibliotheca Alexandrina[45][46] in Egypt and a facility in Amsterdam.[47]
A propos : is het je al niet opgevallen dat de references op WikiPedia moeten verwijzen naar de kopie op archive.org omdat het origineel al 'verdampt' is?
Gedoneerd, dank :)
Hmm, zelf niks van gemerkt, maar wel heel vervelend dat dit gaande is. Irritant pestgedrag dit.
Ik merkte het een paar dagen geleden al, kon niets bereiken, en volgens downforeveryoneorjustme.com lag de site er op dat moment al zeker zes uur uit. Triest dat iemand zo'n non-profit met een DDOS aanvalt...
Beetje kansloos om hun te gaan DDoS'en. Wat bereik je er mee? :+
donateur sinds 2017 hier. Als je wilt weten wat het internet was voordat het "vijf grote websites met screenshots van de vier andere" en interesse hebt aan de minder populaire software geschiedenis, of met je neus op een dode link botst, kan je niet zonder hen. En hoe groter de verzameling hoe kostbaarder (en kostelijker) het archief wordt.
https://longnow.org/semin...sal-access-all-knowledge/
"What is the Library of Alexandria most famous for?" Kahle asked. "For burning! It's all gone!" To maintain digital archives, they have to be used and loved, with every byte migrated forward into new media every five years. For backup, the whole Internet Archive is mirrored at the new Bibliotheca Alexandrina in Egypt and in Amsterdam. ("So our earthquake zone archive is backed up in the turbulent Mideast and a flood zone. I won't sleep well until there are five or six backup sites.")
Referentie van bovenstaande
het internet was voordat het "vijf grote websites met screenshots van de vier andere"
[url="https://blog.samuelmaddock.com/posts/the-end-of-indie-web-browsers/"]
Enshittification arises when the everyday mediocre sociopaths who run tech companies are freed from the constraints that act against them. When the web – and its browsers – were a big, contentious, diverse, competitive space, it was harder for tech companies to collude to capture standards bodies like the W3C to secure even more dominance. As the web turned into Tom Eastman's "five giant websites filled with screenshots of text from the other four," that kind of collusion became much easier:

Op dit item kan niet meer gereageerd worden.