Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 105 reacties

The Internet Archive, de organisatie die tracht een back-up te maken van het hele internet, gaat een mirror opzetten in Canada. De organisatie wil zich hiermee voorbereiden op 'een web dat aan banden gelegd kan worden' onder het bewind van Donald Trump.

internet archive logoThe Internet Archive stelt dat 'de geschiedenis van bibliotheken er een van verlies is, door bijvoorbeeld natuurrampen, politiek of het falen van het instituut zelf'. De organisatie vreest dat de verkiezing van Republikein Donald Trump tot president van de Verenigde Staten ook zo'n bedreiging gaat worden voor het archief. Volgens de organisatie zullen controle, privacyschendingen en censuur onder het nieuwe regime alleen maar toenemen.

Volgens Motherboard heeft de komende Amerikaanse president Donald Trump tijdens zijn verkiezingscampagne al harde uitspraken gedaan over internet. De techindustrie 'zou het moeten dichttimmeren' om de verspreiding van extremisme tegen te gaan. Hij anticipeerde daarbij direct op verdedigers van de vrijheid van meningsuiting en bestempelde ze als 'dwazen'.

De organisatie vraagt om donaties om de operatie uit te voeren. Het geheel zou 'miljoenen' kosten. Het archief wordt wekelijks aangevuld met driehonderd miljoen webpagina's met een totale grootte van dertien tot vijftien terabyte. In totaal heeft The Internet Archive tegenwoordig meer dan dertig petabyte aan data in huis. De organisatie werkt samen met Wikipedia om bronnen in stand te houden, maakt talloze klassieke games speelbaar in de browser, biedt een virusmuseum en heeft een Firefox-add-on gemaakt die 404's vervangt door archiefpagina's. De bekendste toepassing van de organisatie is waarschijnlijk The Wayback Machine.

Moderatie-faq Wijzig weergave

Reacties (105)

Eigenlijk raar dat ze blijkbaar überhaupt alleen servers in de VS hebben. Geografisch verspreiden is met dit soort projecten een must. Canada vind ik nog niet eens de meest logische keuze, een ander continent is beter.
Snap dat het geld kost, maar toch.

Denk dat het "gevaar van Trump" trouwens behoorlijk zal meevallen, kan legio betere redenen verzinnen voor een mirror/backup; maar dat terzijde.
Ja, want 50 petabyte aan opslag verdeeld over 20.000 harddisks (welke al verdeeld zijn over 4 Amerikaanse datacentra) kun je ook zo gemakkelijk backuppen.

Het is juist logisch dat alles op (enkele) plekken opgeslagen wordt, het is natuurlijk niet zo dat Cloudflare/AWS een kopie van al deze data kan vasthouden en op deze schaal 'even' uitbreiden naar wereldwijde locaties is praktisch onbetaalbaar, laat staan voor non-profits.
Niemand zei dat het makkelijk was, enkel dat het verbaasd dat ze alles in één land hebben gegooid.

Het lijkt me trouwens stug dat archive.org geen backups heeft. Dat zou je zelfs ironisch kunnen noemen. Ik zie ook niet in wat cloudflare of aws ermee te maken hebben en waarom die alle data zouden moeten cachen. Die cachen bijna nooit complete sites... Enkel key-elements, frequent opgevraagde data en data die specifiek ingesteld is om gecached te worden in het CDN. Voor de rest is het niet veel meer dan een veredelde reverse-proxy (vandaar dat je nog wel eens van die cloudflare error pages krijgt met "host does not respond" enzo), die het niet boeien wat de locatie van de server waar de data vandaan moet komen is.

Als ze zoals jij zegt de data verspreiden met 12.500 schijven per locatie - zelfs dan is nog de vraag waarom alle 4 die locaties perse in de VS moesten staan. :)
Spreiden is ook dan slim, lijkt me. Als 1 land gaat zitten fucken verlies je hoogstens een kwart van je data - en alle 4 de locaties een backup/mirror laten houden van één andere locatie scheelt dan al een hoop.
Om maar wat te noemen. :) En ja, ik weet dat het allemaal veel centen kost en ze leven op donaties. (Die non profit status boeit niet, daar kan je ook miljarden mee omzetten hoor. (Nee, ik zeg niet dat zij dat doen.))

Ze zullen er vast een reden voor hebben, of het nou geld is of iets anders, om de infrastructuur zo op te bouwen en alles in een land te zetten - maar ik vind het niet bepaald onredelijk dat ik me er oprecht over verbaas. :)

[Reactie gewijzigd door WhatsappHack op 30 november 2016 08:49]

ArchiveTeam.org (dat is een loszand-groepje mensen die hard werken aan het archiveren van het internet.) Ze houden van diverse websites bij hoe het ermee staat en wanneer ze bijna wegvallen van het internet proberen ze de data te redden.

Zij stellen over Archive.org:
Internet Archive seems stable at the moment but its 28 petabytes of data aren't mirrored anywhere else, the code for their system isn't open source and generally they're a single point of failure for a large amount of the web's history. Why should there be only 1 internet archive?

Hoe stug het ook lijkt, archive.org heeft dus nog echte back-ups. Ironisch inderdaad.
Als je met zulke aantallen aan opslag praat ga je het niet meer hebben over "backuppen". Dan praat je over het repliceren van data tussen nodes en datacenters.

edit:
Deze reactie had op WhatsappHack gemoeten..

[Reactie gewijzigd door vali op 30 november 2016 08:31]

Dat ligt er maar net aan op wat voor manier de data wordt weggeschreven en bewaard... Ook met zoveel data kan je een backup maken. Dat je er veel opslag voor nodig hebt zorgt niet dat het dan geen backup is maar replicatie... Dat is geen onderdeel van de criteria om een onderscheid te maken tussen backups en replicatie.

Een goed ding om te onthouden is dat je eigenlijk altijd het liefst replicatie én backups hebt. :) En dan zelfs nog 't liefste van verschillende momenten in de tijd. Maarja, dat wordt een luxe probleem met zoveel data.
Dat is geen onderdeel van de criteria om een onderscheid te maken tussen backups en replicatie.
Dat is het juist wel. De replicatie wordt namelijk vooraf uitgedacht voordat je überhaupt met de data gaat werken. Objectstorage is flink in de opmars en dat is ook niet gek want met zulke grote hoeveelheden opslag kan je niet meer met raidoplossingen werken, maar moet je de data repliceren over vele nodes.

Met Objectstorage is het wel weer mogelijk om te bepalen hoelang bepaalde data opgeslagen kan worden, maar echt een backup van verschillende momenten in tijd is niet mogelijk. Dit moet worden afgehandeld door een applicatie.
Dat is allemaal leuk en aardig, maar dat zegt nog steeds niets over het feit dat je er een backup van kan maken... :)

Volgens mij beschrijf je nu ook niet echt replicatie trouwens, maar data distributie. Je laat me iets zien dat data over verschillende nodes wegschrijft, dat wil nog niet zeggen dat die data ook replicated is. :/ Als er maar één versie is op één locatie, dan is er geen sprake van replicatie. Wat je omschrijft is dan niet veel meer dan een hele grote RAID0. ;) (Om het even heel simpel te stellen.) Als de data echter constant redundant is en wordt opgeslagen kan je spreken van replicatie, zoals bij een RAID1. :) En je kan spreken van replicatie + distributie als we het hebben over gedistribueerde data die ook nog eens gerepliceerd wordt. Zoals een RAID10 opstelling. Ik gebruik de RAID termen nu even om het verschil helemaal helder te maken, dat vormt een makkelijker plaatje en t vergelijkt zo lekker simpel. :)

Zowel distributie als replicatie zijn overigens niet per definitie back-ups. ;)
Immers, met een RAID1 als ik "rm -rf /*" draai, dan zorgt de data replicatie ervoor dat alle schijven in de array leeggegooid worden. (Bij een RAID10 ook overigens. ;() En dat is dan ook exact de reden waarom een RAID de noodzaak voor backups niet wegneemt. (En bij enkel distributie (zonder replicatie dus) is het nog veel erger... Raak bijvoorbeeld 1 schijf in een RAID0 kwijt en je kan al je data vaarwel wuiven. ;))
Ergo: Replicatie != Backups. :) En zelfs distributie + replicatie != backups.
Het enige dat een backup is... Is een backup. :P

Snap je m'n punt met betrekking tot terminologie? :)
(En ja, ik weet dat je voorbeeld niet om RAID-oplossingen gaat. Ik gebruik dat enkel om m'n omschrijvingen makkelijker uit te leggen.)
Ik snap het wel overigens... Tegenwoordig zie je dat bij distributie ook meteen een replicatie laag wordt toegevoegd. Logisch, want als je over 100 nodes je data wil wegschrijven en het verliezen van 1 node betekend dat je het risico loopt al je data kwijt te zijn - dan is er iets flink mis met je ontwerp. :') Maar dan nog staat replicatie dus niet gelijk aan een back-up, zoals ik met 't RAID1 voorbeeld probeerde uit te leggen.

Het enige dat je nu omschrijft is een mogelijke manier om grote hoeveelheden data op te slaan over verschillende nodes, maar dat zegt niets over wat die data is... Is het een live versie van de site? (Die aldanniet standby staat voor DR of als live-mirror dient) Of is het een historische backup?
Of ik m'n data nou back-up en dit op tape wegschrijf, of ik schrijf het weg naar een openstack systeem zoals je linked zegt dus enkel iets over het medium en de techniek om de back-up op te slaan, maar het zegt niet dat we het dan opeens niet meer over een back-up hebben... En zo te zien spreken we ook niet per definitie van replicatie in het voorbeeld dat je geeft.

Het verschil tussen een backup en replicatie is niet de methode van opslag, maar eerder de frequentie waarmee de data wordt bijgewerkt en of er een historie wordt bijgehouden. Ik probeer het te jip-en-janneken, maar dat is nog best lastig eigenlijk.
Replicatie kan wel gebruikt worden voor back-up achtige doeleinden als we het hebben over Disaster Recovery, maar replicatie staat ook dan niet per definitie gelijk aan een back-up in deze context... Je hebt een kopie, dat zeker - een backup locatie dus, bijvoorbeeld... Maar nog niet perse een backup van de data in de zin van statische data die niet direct wordt beïnvloed door wijzigingen in de data op de bron.

[Reactie gewijzigd door WhatsappHack op 30 november 2016 09:28]

Leuk dat je het aanhaalt, er is zelfs al een project langere tijd gaande om het archive wereldwijd verspreid neer te zetten, http://archiveteam.org/index.php?title=INTERNETARCHIVE.BAK

Voor de duidelijkheid, archiveteam is niet verbonden aan archive.org, er wordt alleen veel gebruik gemaakt van archive.org. Tevens zijn er een toevallig team members die bij IA werken.

Je kan hierbij ook de geografische verspreiding zien van de clients
http://iabak.archiveteam.org/
Backupception, een andere partij die een backup maakt van "de backup van het internet". :) Archiving the archive. :P

Heel mooi om te zien, en dank voor de link. :D
Archiveteam doet veel meer, vooral het snel grijpen van sites die gaan sterven (denk nu voor nederland aan nujij.nl), maar omdat archive.org eigenlijk de enige plek is waar dit te dumpen is zonder problemen wordt daar vaak gebruik van gemaakt. Sommige projecten zijn 100+TB groot en kan je niet zomaar plaatsen.
Volgens mij beschrijf je nu ook niet echt replicatie trouwens, maar data distributie. Je laat me iets zien dat data over verschillende nodes wegschrijft, dat wil nog niet zeggen dat die data ook replicated is.
Dat doe ik wel. Zou eens onderzoeken wat Objectstorage precies inhoud, want volgens mij heb je er nog weinig kaas van gegeten. Op zich niet erg want het is vrij nieuw techniek, maar je moet niet andere verkeerde woorden in de mond leggen.
... Raak 1 schijf in een RAID0 kwijt en je kan al je data vaarwel wuiven. )
Nee hoor, want je hebt de andere nodes nog waar de data opstaat. Je werkt met het Ring principe en iedere schrijf is losstaand aangemeld, dus niet als 1 grote raid 1.
Het enige dat je nu omschrijft is een mogelijke manier om grote hoeveelheden data op te slaan over verschillende nodes, maar dat zegt niets over wat die data is... Is het een live versie van de site
Dat is ook exact wat grote partijen tegenwoordig doen. Microsoft, Google, Amazone en bv. Facebook. Werken met raid oplossingen is verledentijd en uiteraard zullen er back-ups worden gemaakt, maar dat wordt achteraf uitgedacht.

[Reactie gewijzigd door vali op 30 november 2016 09:32]

"Nee hoor, want je hebt de andere nodes nog waar de data opstaat"

Dan is de data dus gerepliceerd... en niet uitsluitend gedistribueerd. En dus spreken we al niet meer van een situatie die gelijk is aan een RAID0, dus is je antwoord misplaatst. :)
Als je data nog op andere nodes staat, is het eerder te vergelijken met een RAID1 of 10; niet met een RAID0... RAID0 kent namelijk geen datareplicatie, enkel distributie.

"Dat is ook exact wat grote partijen tegenwoordig doen. Microsoft, Google, Amazone en bv. Facebook. Werken met raid oplossingen is verbeteren tijd en uiteraard zullen er back-ups worden gemaakt, maar dat wordt achteraf uitgedacht."

Fijn dat je nu blijkbaar toch wel zelf ook doorhebt dat er een verschil zit tussen distributie, replicatie en backups... :P

[Reactie gewijzigd door WhatsappHack op 30 november 2016 09:32]

Als je data nog op andere nodes staat, is het eerder te vergelijken met een RAID1 of 10; niet met een RAID0... RAID0 kent namelijk geen datareplicatie, enkel distributie.
Misschien in grote lijnen, maar het lijkt qua werking verre weg op. Dit omdat je het replicatie process volledig in handen hebt en kan bepalen hoe dit verloopt. Als je kapotte schrijf toegevoegd tot een raid 5 en/of10 wordt het replicatie process gelijk in gang gezet, dit hoeft bij objectstorage niet. Ook heb je de mogelijkheid om repliceren lagere prio te geven om geen belasting te geven op je omgeving.
Fijn dat je nu blijkbaar toch wel zelf ook doorhebt dat er een verschil zit tussen distributie, replicatie en backups
Mij hoef je dat niet uit te leggen hoor, ik ben hier niet de gene die termen door elkaar haalt.
Dan is de data dus gerepliceerd... en niet uitsluitend gedistribueerd
Ook dat is mogelijk, maar zulke stof ga ik pas uitleggen als men pas de basis begrijpt van objectstorage.

[Reactie gewijzigd door vali op 30 november 2016 09:41]

"Misschien in grote lijnen, maar het lijkt qua werking verre weg op. Dit omdat je het replicatie process volledig in handen hebt en kan bepalen hoe dit verloopt. Als je kapotte schrijf toegevoegd tot een raid 5 en/of10 wordt het replicatie process gelijk in gang gezet, dit hoeft bij objectstorage niet. Ook heb je de mogelijkheid om repliceren lagere prio te geven om geen belasting te geven op je omgeving."

Zoals ik al zei gebruikte ik RAID als voorbeeld om beter uit te leggen wat ik bedoel en waar de verschillen zitten. Dat het niet hetzelfde is en dat je in jou voorbeeld meer (selectieve) controle hebt doet daar niets aan af.


"Mij hoef je dat niet uit te leggen hoor, ik ben hier niet de gene die termen door elkaar haalt"

Misschien heb je je koffie nog niet op ofzo, maar deze discussie is ontstaan omdat jij zei dat je met zoveel data niet kan spreken van backups maar enkel van replicatie...

vali in 'nieuws: Internet Archive wil mirror in Canada uit angst voor Amerika...
"Als je met zulke aantallen aan opslag praat ga je het niet meer hebben over "backuppen". Dan praat je over het repliceren van data tussen nodes en datacenters."

Ik had het in de post waar je op reageert specifiek over backups *en* mirrors. (Mirror in de zin van replicatie dus...)
Misschien dat er ergens een miscommunicatie zit, maar ik ben niet de gene die zei dat je niet van een backup kan spreken maar moet spreken van replicatie. :P Dat was jij. ;)
Ik had het in de post waar je op reageert specifiek over backups *en* mirrors. (Mirror in de zin van replicatie dus...)
Misschien dat er ergens een miscommunicatie zit, maar ik ben niet de gene die zei dat je niet van een backup kan spreken maar moet spreken van replicatie. Dat was jij.
Komt eerder als je met zulke grote hoeveelheden data werkt je niet zo snel meer spreekt over het woord "backup" zoals jij blijkbaar bedoelt. Dat is iets voor de developers om mogelijk te maken voor hun desbetreffende tool, niet voor de beheerders van de storage. Zo kan je bijvoorbeeld zeer gemakkelijk Owncloud draaien op een objectstorage omgeving.

Het woord backup is niks meer dan het veilig stellen van de data mocht er een failure ontstaan. Dat jij het nu hebt over het terug halen van een bestand en versiebeheer ging het bij mij inderdaad oorspronkelijk niet over.

[Reactie gewijzigd door vali op 30 november 2016 10:21]

Komt eerder als je met zulke grote data werkt je niet zo snel meer spreekt over het woord "backup"
Waarom niet dan? :) Ik snap niet zo goed vanuit welk oogpunt je dat zegt. Let me elaborate:
Of ik nou 1KB, 500TB of heel archive.org back-up: het blijft een back-up... Ja toch? :)
Dat is wat ik meteen al heb gezegd: de hoeveelheid data die je back-upt is niet relevant voor de terminologie die je moet gebruiken. Dat is voornamelijk relevant voor de opslagmethode of de frequentie van wijzigingen aan de data.

Dat het door de hoeveelheid data lastig is om een back-up te maken en er specifieke opslag technieken nodig zijn om de back-up op te slaan, o.a. met distributie en/of replicatie als extra laag - verdeeld over meerdere nodes, verandert niets aan het feit dat je een back-up kan maken en ook nog altijd zal spreken van een back-up als je er eentje maakt. :)

Nogmaals: als ik jou gedachtengang volg, dan is een backup geen backup meer als ik de backup opsla op een storage systeem dat gebruik maakt van distributie en/of replicatie... Dat slaat toch nergens op? :)
Als ik dus een backup maak en die over vijf tapes moet verdelen omdat ie te groot is voor een enkele tape, ik distribueer de data dus over meerdere tapes, dan is het opeens geen backup meer? :X Dat is toch een even kromme redenatie? ;)

De opslagmethode, eg: distributed + replicated, zegt niets over het datatype; in dit geval een statische back-up.
Wat boeit de hoeveelheid data nou? Replicatie is replicatie, distributie is distributie, en een backup is een backup - ongeacht de hoeveelheid data.
Het woord backup is niks meer dan het veilig stellen van de data mocht er een failure ontstaan. Dat jij het nu hebt over het terug halen van een bestand en versiebeheer ging het bij mij inderdaad oorspronkelijk niet over.
Afhankelijk van de context klopt dat ja... En misschien toch ook niet helemaal, dat ligt ook weer aan de context en hoe je dit bedoeld...

Ik wil absoluut niet vervelend doen, maar als je bedoelt in de zin van "als een harde schijf kapot gaat, dan heeft een ander schijf nog exact dezelfde data omdat ze naar elkaar repliceerden": eigenlijk spreek je dan van redundantie in plaats van een back-up (in de zin van (semi-)statische gegevens). :P Als we puur naar datamanagement kijken dan he, niet naar spreektaal of andere betekenissen; want daar ging het niet over.
Pas in het geval dat je na dataloss, corruptie of onbedoelde/foute wijzigingen aan de data de boel kan herstellen naar een ander punt in de tijd, spreek je van het terugzetten van een back-up. (Vandaar dat het ook een back-up heet... Een stap terug doen naar een andere situatie :))

Als een hardware onderdeel kapot gaat en dat maakt niets uit omdat een tweede hardware onderdeel de taken stug door blijft zetten - dan ben je redundant. (Of als een tweede cluster de boel direct overneemt, zoals bij Disaster Recovery.)
... Maar nog niet perse geback-upt. Dan komt inderdaad het kunnen terughalen van bestanden en/of versiebeheer om de hoek kijken, en *dat* is wat een back-up daadwerkelijk is als we het over datamanagement hebben. :)
Veel moderne DR software kan trouwens versiebeheer toepassen op replicatie, oa via snapshots. Dat zijn wel vormen van back-ups. :P

Een RAID1, om weer even naar die voorbeelden terug te gaan, biedt je niet perse een back-up: het is redundant opgeslagen (dankzij replicatie) waardoor een failure niet meteen dataloss als resultaat heeft...
Soms zegt men dan "I'm glad the back-up drive is still working!", maar eigenlijk was het geen back-up drive omdat hij altijd al onderdeel was van je array met de bedoelde functies om redundantie te verkrijgen via replicatie... Dat het dan toch geen back-up is, is vanwege de nature van replicatie in die opzet. Een verwijderd bestand dat replicated is, is immers overal weg - en dus niet back-upped.
Je hebt hier dan een beetje het probleem dat een back-up multi-interpretabel is met een dubbele betekenis in de spreektaal - maar als we er goed naar kijken in de context van datamanagement en kritisch kijken naar de terminologie en de betekenis: dan zijn er subtiele, maar hele duidelijke, verschillen... Wat ze in spreektaal zeggen zal me dan een rotzorg zijn eigenlijk.
Ik denk dat jij hier nu ook de spreektaal gebruikt/een andere context pakt voor het woordje "back-up", dan de term die je eigenlijk zou moeten gebruiken als we er technisch naar kijken.
Iets waar ik me, niets persoonlijks trouwens :), flink aan kan ergeren. Wil iemand nou frequente backups (met retentie, hopelijk), of willen ze realtime replicatie? Nogal een verschil! (Het liefst doen ze beiden :))

Ik bedoel, ik heb niet ontkend en zal ook niet ontkennen dat replicatie als een vorm van back-uppen te zien is (redundant maken) als je dat woord in een andere context gebruikt - puur vanwege het feit dat je mogelijk toegang zal hebben tot de gerepliceerde gegevens als de bron offline gaat om wat voor reden dan ook. :) Je "backup location", zullen we dan maar zeggen - want dan wordt backup gebruikt in de zin van redundantie ipv de optie om terug te gaan naar een eerder tijdstip, in spreektaal. Al vind ik dan "the redundant location" accurater, maar dat zal allemaal wel. :D
Maar daar hadden we het niet over! Dus niet relevant.

Over het algemeen is replicatie real-time of near-real-time zolang zowel bron als mirror online zijn, terwijl over het algemeen een back-up een statisch gegeven is die aldanniet periodiek bijgewerkt wordt: maar over het algemeen niet real-time. Eens per dag, week of maand is het meest gangbare - en dan het liefst met een zekere retentie ipv slechts één backup te maken en die steeds te overschrijven. Of vaker, maar dan moet je inderdaad een goed versiebeheer hebben met een behoorlijke retentie voor file changes; anders doe je wederom niets anders dan repliceren... Koppijn materiaal.
TimeMachine van Apple bijvoorbeeld is daar een leuk voorbeeld van. :)

Misschien dat ik aan het mierenneuken ben hoor, maar ik vind het wel belangrijk om de verschillen duidelijk neer te pennen en te onthouden. :)

[Reactie gewijzigd door WhatsappHack op 30 november 2016 11:43]

Nogmaals: als ik jou gedachtengang volg, dan is een backup geen backup meer als ik de backup opsla op een storage systeem dat gebruik maakt van distributie en/of replicatie... Dat slaat toch nergens op?
Geen idee waar je die redenatie hebt gelezen, want dat heb ik nooit gezegd.
Ik denk dat jij hier nu ook de spreektaal gebruikt/een andere context pakt voor het woordje "back-up", dan de term die je eigenlijk zou moeten gebruiken als we er technisch naar kijken.
Iets waar ik me, niets persoonlijks trouwens , flink aan kan ergeren. Wil iemand nou frequente backups (met retentie, hopelijk), of willen ze realtime replicatie? Nogal een verschil! (Het liefst doen ze beiden
Je moet bij het ontwerp van je storage rekening houden welke kant je op wilt gaan. Als je met zulke grote aantallen werkt moet je gebruik maken van een oplossing waarbij je bij hardware uitval zekerheid hebt dat je geen dataverlies hebt. Dit is de basis en backup (versie beheer en terug halen van een bepaalde bestand/map/ect) komt daarna pas. CIA triad principe komt hier zeker bij kijken.

Ik ging in op dit stukje:
The Internet Archive, de organisatie die tracht een back-up te maken van het hele internet, gaat een mirror opzetten in Canada. De organisatie wil zich hiermee voorbereiden op 'een web dat aan banden gelegd kan worden' onder het bewind van Donald Trump.
Hier kan je opvatten dat ze de data overpompen naar een datacenter(s) en hiermee de data veilig stellen in Canada. Thats it. Mochten ze gebruik maken van Objectstorage dan kan je dit zeer gemakkelijk realiseren. Dit staat (zoals ik al meerdere keren had aangegeven) helemaal los van versie beheer ect.
Maar nog niet perse geback-upt. Dan komt inderdaad het kunnen terughalen van bestanden en/of versiebeheer om de hoek kijken, en *dat* is wat een back-up daadwerkelijk is als we het over datamanagement hebben
Dat klopt helemaal, vandaan dat ik vermelde dat dit buiten het opslag architectuur ontwerpt moet worden. Zelf werk ik vrij veel met Spectrum Protect van IBM en dit is zeker mogelijk.
Misschien dat ik aan het mierenneuken ben hoor, maar ik vind het wel belangrijk om de verschillen duidelijk neer te pennen en te onthouden.
Als je echt in de materie wilt duiken, onderzoek eens hoe het platform werkt. Zeker de moeite waard. Zelf heb ik nu vrij groot project achter de rug en door de toenemende vraag van de hoeveelheden TB's aan data, komen er vrij snel weer flink wat nodes bij.

[Reactie gewijzigd door vali op 30 november 2016 18:48]

Het verschil tussen backup en replicatie is meer dat een backup transactional is en een known state in time waarborgt.
Op het moment van maken is het ook een replica.
Backup is ook niet direct een archief....

Repliceren is waarborgen dat de actuele state op meer dan een plaats beschikbaar is, ie. het is een proces.

ipfs zou wel een een antwoord op heel veel issues kunnen zijn.
https://ipfs.io/
RAID wordt dus vervangen door RAIS
RAID = Redundant Array of Independent/Inexpensive Disks
RAIS = Redundant Array of Independent/Inexpensive Servers
Niet helemaal als je de term RAIS letterlijk neemt. Ik zou met dit soorten technieken niet meer denken in "raid" aangezien de opbouw totaal anders is.
Data blocks of each stream are striped across the array servers. A fast packet switch is used to connect server and client stations. Each server has a dedicated network segment, and each client contacts the server one by one . Each server has its own storage, CPU, and network segment, the server capacity increases with the number of servers.
In a manner more usually associated with very high cost SMP architectures. RAIS (“Redundant Array of Inexpensive Servers”) achieves this by turning a cluster of independent servers into a single large server running applications across a virtualised network of nodes.
RAIS does the same for cluster based network management and will have the same far reaching consequences across the world of enterprise computing.
RAIS models for servers the same capability as RAID does for disks, offering variations of scale and redundancy depending on the configuration chosen.
Therefore, just as RAID stripes and mirrors data across multiple independent disks and code of an application program across multiple independent nodes of a cluster. The applications see only a single logical shared memory which functions as a binary compatible Symmetric Multiprocessor (SMP) system.
Wat een beetje in de buurt komt is RAIN.

[Reactie gewijzigd door vali op 1 december 2016 14:27]

En daarna heb je het gewoon over de backup. Het is niet zo dat de noodzaak tot backup vervalt na zoveel TB, die wordt eigenlijk alleen maar groter. Google heeft bijv. alles gewoon netjes op tape staan zoals het hoort.
Haha, nou volgens mij helemaal niet. Als Google een fuckup maakt en je bent een berg data kwijt, dan kun je ernaar fluiten. Je maakt mij niet wijs dat een Google flip naar de tape-kamer loopt en jouw bestanden eruit gaat opvissen.
Das leuk voor je, maar het is wel zo. Misschien eerst even zoeken voordat je wat roept?
Trump mag de volgende Supreme Court justice aanstellen dus hij gaat het leven van Amerikanen voor decennia bepalen en verpesten.
Liever dat Trump die aanstelt, dan Clinton. Als Scalia vervangen zou worden door een rechter uit het Clinton kamp, dan was de balans helemaal zoekgeweest. En dan had je pas een probleem gehad, en een supreme court die niet meer representatief is.

Het is dus een goed iets dat een overleden conservatieve rechter nu vervangen gaat worden door een andere conservatieve rechter, en qua verdeling verandert er dan weinig tot niets in vergelijking met de situatie voordat Scalia is overleden - dus ik zie niet helemaal in hoe dit het verpesten van levens is... Het is juist eerlijk.
als je verplaatst naar Canada kan je net zo goed gelijk naar Europa gaan, door "de cloud" maakt dat fysiek niet veel verschil meer, hoogstens de data zelf overpompen via internet of fysiek is dan wat lastiger.
Besef je wat een cloud feitelijk is? Is gewoon iets fysieks wat een bedrijf moet kopen en onderhouden, niet een magisch iets wat je zonder moeite even verplaatst of aanpast.
zoals ik aangaf, hoogstens de data overzetten zal meer of minder tijd kosten. Maar qua compute maakt het weinig uit gezien het vooral ruwe dataopslag is. Het is geen database van honderden gigabytes lijkt mij..
Het is een database van 1000-en Terabytes.... (28 PB >= 28.000 TB >= 28.000.000 GB )
Dus ja de data overzetten zal iets meer tijd in beslag nemen. Ze hebben al jaren geleden een systeem the Internet Archive ontwikkeld. De PETA -box.
(http://www.enterprisestor...etabytes-to-PetaBoxes.htm & https://archive.org/web/petabox.php )
Observatie was dat het lang niet data @rest is, er moet veel deduplicatie etc. gedaan worden, er is dus ook veel processing power nodig.
ik bedoelde een database in de zin van tabellen ;), niet in de zin van ruwe HTML's, dat is gewoon puur opslag, niet een database die een mega zware cpu/rammn config vraagt omdat het anders niet behapbaar is.
Ik denk dat The Internet Archive niet ruwe html is....

Daarnaast is een database een "structured" bevraagbare data verzameling. Dat zijn niet noodzakelijkerwijs tabellen. Key/value stores zijn ook databases, die kunnen in een Relationeel model zijn gegoten maar dat hoeft niet.

Van pagina's is een timeline gemaakt waarbij verschillen op enig moment worden vastgelegd.
je database zal dan geen honderden gigabytes zijn schat ik in, al kan ik daar uiteraard geen oordeel over vellen, maar de daadwerkelijke html's van de paginas (zonder afbeeldingen) zullen de meeste ruimte gaan innemen
Het rare is dat ze ooit "goed" begonnen zijn:
PETABOX HISTORY 6/2004

* The first 100TB Rack operational in Amsterdam as of June 2004.
Waarom ze nu alleen nog in de VS zitten, is apart. Maar zal iets met donateurs te maken hebben schat ik.
ik heb ooit begrepen dat dit bij XS4ALL was.
XS4ALL doneerde de benodigde rack ruimte en de alle andere Datacenter diensten,
"http://webwereld.nl/e-commerce/16318-xs4all-steunt-internet-archive"
Vraag me ook af of Trump echt de enige reden is. Een aantal maanden voor het offline halen van what.cd waren er gesprekken tussen de beheerders van what.cd en The Internet Archive over het archiveren van metadata. What.cd was namelijk niet alleen een grote private tracker voor muziek, maar ook een gigantische database van zeldzame releases, uitgelekte demo's, bootlegs, etc. Als The Internet Archive plannen heeft dit soort gegevens te gaan indexeren en archiveren (die op zichzelf meestal niet illegaal zijn, maar wel nauw verbonden aan illegale uitwisseling van auteursrechtelijk materiaal), zou het zomaar kunnen dat er weerstand komt vanuit de Amerikaanse Copyrightloby.
De metadata van WCD is gearchiveerd door archive.org. Het is alleen niet publiek toegankelijk. https://archive.org/details/whatcdcrawl&tab=about
Inderdaad, ik ben ook nogal verbaast dat ze het niet ook gerepliceerd hebben naar andere wereld-delen. Toch maar even zelf een kopietje trekken? ;-)
Ze repliceren naar Egypte/Amsterdam volgens wikipedia:
"To prevent losing the data in case of e.g. a natural disaster, the Archive attempts to create copies of (parts of) the collection at more distant locations, currently including the Bibliotheca Alexandrina[12] in Egypt and a facility in Amsterdam.[13]" - https://en.wikipedia.org/wiki/Internet_Archive

[Reactie gewijzigd door michiel_ op 30 november 2016 09:05]

Ik hoop dat het "gevaar van Trump" meevalt, maar als je ziet wat voor lui hij om zich heen verzamelt, dan is dat gevaar heel realistisch.

Edit : hee wat leuk, de scorekaart wordt weer verkeerd ingezet.
Dank.

[Reactie gewijzigd door fastbikkel op 30 november 2016 10:23]

Sorry maar wat een aanstellerij. Acht jaar geleden waren er ook mensen die riepem hoe verschrikkelijk Obama wel niet zou zijn, en wat is daar van uitgekomen? Ik ben het oneens met bijna alles waar Obama voor staat, en er zijn ook mensen die dat met Trump hebben, maar "een web dat aan banden gelegd kan worden" onder het bewind van Donald Trump is wel heel vergezocht.

Mijn donatie krijgen ze niet. Niet met de reden die ze ervoor hebben. Wat surveillance en privacyschendingen betreft zijn ze alleen maar hypokriet bezig, want dat is nu onder Obama ook aan de orde.

Een backup hebben is nooit verkeerd, maar de reden die ze ervoor aanhalen is de grootste kolder.

Of Trump een goede president zal zijn zullen we de komende jaren achter komen, maar als je hem als één of andere dictator bestempelt ben je wel erg close minded. Zelfde geldt voor de mensen die dat over Obama zeiden.
Inderdaad, beetje vergelijkbaar met de dreigementen hier dat "het licht uit gaat" als we tegen een EU referendum (grondwet) stemmen, of voor Wilders, of tegen de Oekraïne, etc. Jammer.
Helaas is dat precies waar ons hele politieke stelsel op draait, met succes! Angst is de grootste drijfveer voor economie en dus onze westerse samenleving. Geopolitieke crisis, financiële crisis, terrorisme, klimaatopwarming door mens.... Allemaal dingen die in mindere of meerdere mate een kern van waarheid hebben, maar opgeblazen worden om meer geld voor te krijgen :)

Nu hecht ik alleen niet zoveel waarde aan de bron van dit artikel, Motherboard. Die zijn fel anti Trump en naar mening totaal niet objectief en te gekleurd.
Trump heeft gezegd dat hij vrije meningsuiting aan banden wil leggen. Obama niet. Dààrom wil men er nu dringend werk van maken.
Hij heeft eerst 4 maanden de tijd om zich te bewijzen als president dus helemaal vast staat het ook niet, al is de kans klein dat hij zijn gouden koffer weer in moet pakken :)

[Reactie gewijzigd door Innersteps op 30 november 2016 09:10]

Een backup hebben is nooit verkeerd, maar de reden die ze ervoor aanhalen is de grootste kolder.
Nou, dat is nog maar de vraag? In het boek "Delete: The Virtue of Forgetting in the Digital Age" van Viktor Mayer-Schönberger staat een meerdere analysen waarin gesteld wordt dat alles altijd maar archiveren een rem is op de ontwikkeling van de mensheid. Het hindert het voortschreidend inzicht.
We mogen ons best eens afvragen of het hebben van een Internet archive (en een Google cache) eigenlijk wel zo wenselijk is.
Je ben het eens met bijna alles waar Obama voor staat.
Sorry maar of je heb dan gewoon niet zijn punten gelezen en roep je maar wat of je heb last van het alleen op de wereld syndroom.
Dat soort logica is nou net waarom ze nu een mandarijn met het iq van een mandarijn verkozen hebben.

Bijna al zijn punten waren goed bedoeld en gericht op wat goed is voor iedereen ipv alleen wat rijke stinkerds die bevoordeeld het leven ingekomen zijn en er alles aan doen om dat ook te blijven.
Dat veel van mijn uitvoeringen barsten van de compromissen komt doordat hij nooit en de senaat en het huis tegelijkertijd achter zich gehad heeft.
En dat komt weer omdat er creatief met kiesmannetjes de republikeinen voorgetrokken word.
Zo zie je maar dat je met minder stemmen toch verkozen kan worden.
Het amerikaanse kies systeem is dan ook defect en oneerlijk en van de 45 presidenten heeft 5 keer degene met de minste stemmen gewonnen.
Dat is een fout marge van 9% wat bij een verkiezing onacceptabel zou moeten zijn.
Daarnaast is van die 5 keer 4x het voordeel bij de rep. terecht gekomen en bij de 5de keer wat het dem vs dem omdat er geen rep. kandidaat meer over was.

Maar goed ik hoop dat trump 4 zware jaren krijgt en dat we een dubbel dip in de recessie krijgen al kost me dat wat geld puur zodat de mensen kunnen zien dat Obama geen invloed had op wat er gebeurd is maar wel overal de schuld van kreeg en dat trump er ook niks beters van kan bakken.

Verder ben ik het wel met je eens dat hij helemaal niets aan het internet kan veranderen.
Het is immers niet zo dat al het verkeer via de usa gaat en we van hun afhankelijk zijn. sterker nog het overgrote deel van "het internet" bevind zich buiten de US.

[Reactie gewijzigd door computerjunky op 30 november 2016 13:38]

Jouw donatie krijgen ze niet omdat ze qua surveillance en privacyschendingen hypocriet bezig zijn ??
Wist niet dat The Archive aan surveillance en privacyschendingen deed. En wat heeft Obama daar nu mee te maken ?
Je zou dus ook geen donatie geven aan Rode Kruis Nederland (te vervangen door iets anders) omdat de Nederlandse regering surveillance doet ?
Ze krijgen mijn donatie niet omdat de reden die ze ervoor aanhalen (mogelijke surveillance en privacyschendingen door Trump) nergens op slaat omdat dat nu onder Obama ook al aan de orde is. Dus niet zoals jij beweert dat ik zei dat The Archive aan surveillance en privacyschendingen doet. Want voor zover mij bekend is, is dat niet aan de orde.
Ik vermoedde wel dat je iets anders bedoelde maar deze zin
Mijn donatie krijgen ze niet. Niet met de reden die ze ervoor hebben. Wat surveillance en privacyschendingen betreft zijn ze alleen maar hypokriet bezig,
kan ik toch maar lezen als jij die zegt dat de organisatie aan surveillance doet.

Grote verschil tussen Trump en Obama (over dit topic) is dat ik Obama nooit heb horen zeggen dat hij de mogelijkheid wil om "internet af te sluiten". En als je bepaalde pagina's wil blokkeren en zo, heeft het niet zoveel zin als er dan een archief een backup van die pagina zit. Het is dan zeer aannemelijk dat ook de archieven onder vuur komen te liggen.

Mijn eerste reactie bij het bericht was "mee surfen op anti trump en het einde van de wereld"-gevoel. Ze wilden waarschijnlijk al jaren een kopie in Canada maar nu zien ze een kans om geld in te zamelen door het algemene gevoel.
Maar aan de andere kant, better safe than sorry
Ze krijgen mijn donatie niet omdat de reden die ze ervoor aanhalen (mogelijke surveillance en privacyschendingen door Trump) nergens op slaat omdat dat nu onder Obama ook al aan de orde is. Dus niet zoals jij beweert dat ik zei dat The Archive aan surveillance en privacyschendingen doet. Want voor zover mij bekend is, is dat niet aan de orde.
Ze hebben alle redenen om te twijelen aan Trump. Straks ga je nog beweren dat Trump de vrijheid van meningsuiting hoog in het vaandel draagt? Hij heeft letterlijk gezegd dat hij deze wil inperken, terwijl Obama zowat het omgekeerde heeft gezegd. Zet je Trump hoedje (made in China) maar af, het beperkt je zicht.
Als je doelt op de MAKE AMERICA GREAT AGAIN! - petjes, deze worden gewoon in de USA gemaakt. De made in China zijn namaak. Verder heb ik geen enkele onderbouwing van je reactie gezien en ik verbaas me er dan ook over dat je een +1 krijgt.
Ik heb juist meer vertrouwen in de vrijheid van meningsuiting onder Donald Trump dan die onder Hillary Clinton nu uitkwam dat de massamedia zichzelf al gelijkschakelden nog voor Hillary Clinton president was. Daarom begrijp ik dit werkelijkheid omkerende artikeltje niet.
Ik vind Trump de minst kwade van de twee en ik wantrouw de media al sinds het begin van de verkiezingen. Maar het is hoe dan ook goed dat IA zich gaat mirroren naar andere landen.
Ja want een flapuit die 4x failliet gegaan is, niet betaald voor verleende services en daarmee bedrijven om zeep helpt, 90% van de dingen die uit ze mond flappen ter plekke verzint en totaal geen plannen heeft kan veel beter voor stabiliteit en vooruitgang zorgen dan iemand die weet hoe het zaakje in elkaar steekt en waarvan de man voor grote economische groei gezorgd heeft.

Tot nu toe is dat wat ie wel aangekondigd heeft financieel onhaalbaar en word iedereen die nu op hem gestemd heeft daar alleen maar slechter van omdat de belastingen omhoog zullen moeten.
En als Amerikanen ergens een hekel aan hebben zijn het wel belastingen.
De denken daar allemaal dat de kapot worden belast maar hebben geen idee hoe het er in de rest va de wereld aan toe gaat en dat daar de belastingen tot 4x zo hoog zijn.

Onder hillary had bill en grote invloed gehad en hij weet hoe het beestje in elkaar zit. maar mensen luisteren liever naar de onzin uit de media.
Het feit dat de FBI baas rep. is zal ook niet helpen natuurlijk door wederom een onzinnig onderzoek voor de zoveelste keer te heropenen vlak voor de verkiezingen.
Oriënteer je ook eens wat breder dan wat de Nederlandse media je voor waar voorschotelen: https://www.youtube.com/watch?v=7LYRUOd_QoM
  • Clinton Cash: The Untold Story of How and Why Foreign Governments and Businesses Helped Make Bill and Hillary Rich, Peter Schweizer, Harper Paperbacks 2016, ISBN 9780062369291
Grappig dat je er vanuit gaat dat ik naar de Nederlandse media kijk aangezien ik helemaal niet naar Nederlandse zenders kijk.
Als ze typetjes als sylvana op de tv laten zijn ze mijn tijd toch echt niet waard.

Filmpje verteld overigens halve waarheden zelf even onderzoek doen ipv filmpjes geloven dacht ik zo.

http://moneynation.com/hillary-clinton-net-worth/

Mooi lijstje met waar hun geld daadwerkelijk vandaan komt.
Zoveel krijg ik niet om mijn mening te geven helaas...

Bereken dan meteen even hoeveel ze weg gegeven heeft en hoeveel trump weg gegeven heeft na aftrek van niet betaalde diensten door 4 faillissementen...

[Reactie gewijzigd door computerjunky op 30 november 2016 20:48]

Kom op zeg Money Nation is niet veel meer dan een Glossy als Linda voor mensen geinteresseerd in centen en bovendien geven deze vijf editors slechts het geregistreerde verhaal weer. Niets lees ik bijvoorbeeld over de arabische inleg in de Clintonfoundation, handig voor gunstige wapenhandel van deze arabieren tegen cash geld aan de Clintons.

http://www.washingtontime...inton-president-for-sale/
tja je kan moeilijk invoeren wat niet geregistreerd is...
Iets wat niet geregistreerd is kan je dus ook niet als argument gebruiken omdat niemand het echt zeker weet.
Ik heb juist meer vertrouwen in de vrijheid van meningsuiting onder Donald Trump dan die onder Hillary Clinton nu uitkwam dat de massamedia zichzelf al gelijkschakelden nog voor Hillary Clinton president was. Daarom begrijp ik dit werkelijkheid omkerende artikeltje niet.
Ik heb/had in beide geen vertrouwen.
Trump is IMO wel beter voor de wereld als al hij doet wat hij zegt. Hij blijft in zijn VS hok en zal zich niet met de rest van de wereld bemoeien.

Wat nu aan de gang is in het Midden-Oosten is naar mijn mening voor een groot deel door de VS veroorzaakt.

Hopelijk stabiliseert de wereld zich meer zonder VS bemoeienis.
En hopelijk gaat de EU ook een keer zelf denken waardoor ze niet meer afhankelijk van de VS zal zijn.

En voor de middenklasse en lager in de VS. Onder Hillary zouden ze hun kinderen nog steeds niet naar de Universiteit kunnen sturen.
Ik denk dat voor de VS Bernie Sanders de beste keuze was geweest.

Zie: VPRO Tegenlicht Still Berning

IMO heeft de VS door hun effectief 2 partijen systeem erg weinig te kiezen.
Ik hoop niet dat Nederland ooit een twee partijen systeem zal krijgen zoals bijvoorbeeld de VS en GB.
Ik moet er niet aan denken dat de VVD en de PvdA de enige partijen zouden zijn.
Dit dus. Geen idee waarom jij gedown mod wordt maar 100% dit.
Edit: Laat ook maar, ik heb geen eens zin de discussie aan te gaan eigenlijk.

[Reactie gewijzigd door Heedless op 30 november 2016 10:32]

Hoe gaat dit eigenlijk in z'n werk, en hoeveel petabytes en weet ik wat nog meer gaat dit naar schatting zijn?
Het betreft een mirror, dus net als de huidige capaciteit van ruim 30 Petabyte zal dat ruim 30 Petabyte zijn, en er ook 13 tot 15 Terrabyte per week bij komen.
in totaal meer dan 30 petabytes zoals in het artikel staat?
Staat in het artikel: "... met een totale grootte van 13 tot 15 terabyte." ;) Valt best mee dus.

Oh, never mind: dat komt er wekelijks bij... wow. :)

"In totaal heeft The Internet Archive tegenwoordig meer dan 30 petabyte aan data in huis."

[Reactie gewijzigd door Reptile209 op 30 november 2016 08:11]

Dat is de aanvulling per week ;)
Jaa klopt had het wel gelezen maar bedoel dan inderdaad als er elke week zoveel bij komt, wat de schatting is van het totale aantal petabytes, want op een gegeven moment moeten ze een keer stoppen neem ik aan, en dan het totale aantal?
Is er niet een wikileaks/piratebay concept mogelijk waarbij particulieren een deel van hun schijf beschikbaar stellen voor replicatie/backup. Heb er wel 100gb voor over..
Daar kijken ze bij Archive.org ook naar. Al is het heel erg moeilijk om te zeker te weten of je alle stukjes data nog op meerdere plekken hebt staan. Elke maand van alle deelnemers de checksums opvragen is bijvoorbeeld onvoldoende. Want de checksums kun je opslaan zonder dat je de data nog echt hebt. Daarnaast is het archief werkelijk ENORM.
Elke maand van alle deelnemers de checksums opvragen is bijvoorbeeld onvoldoende. Want de checksums kun je opslaan zonder dat je de data nog echt hebt. Daarnaast is het archief werkelijk ENORM.
Dan vraag je toch checksums van willekeurige gecombineerde delen van de data?

Waar een wil is, is een weg. Waar een onwil is, is een omweg.
Was gisteren een item over op de radio. Gevraagd naar concrete uitspraken of aangekondigde maatregelen van Trump stond een woordvoerder met de mond vol tanden.

Ook in de in het artikel vermelde links zie ik weinig waarvan ik zenuwachtig word. Dat die ISIS-glossy wat lastiger te vinden wordt is - gezien ermee gepoogd wordt mensen te radicaliseren - volgens mij niet zo'n probleem. Neem aan dat er op 'the internet archive' ook geen kinderporno te vinden is. Is dat dan ook censuur?

Hoofdmoot van het verhaal is dat ze 'miljoenen' nodig zullen hebben voor deze operatie, en dat ze daarvoor sponsors zoeken.... Tja.
Hij wil mensen die een vlag verbranden in de gevangenis steken. Qua beperken van vrije meningsuiting kan dat tellen lijkt me...
Wat een onzin, ze hebben al jaren geleden zelf censuur toegestaan. Waardoor nu al reeds een groot deel van het Internet niet meer te vinden is in het archive. Je kunt namelijk met terugwerkende kracht je site er af laten halen.

En dan zeuren ze over Trump?! :')
Weet jij of die data onzichtbaar is voor het publiek of ook echt verwijderd?

Daarnaast is het als "bibliotheek van het internet" natuurlijk erg dom om koppig iets niet te verwijderen terwijl een rechter of de wet je daartoe dwingt.
"Weet jij of die data onzichtbaar is voor het publiek of ook echt verwijderd?"
Die discussie kun je altijd voeren, maar dan nog vindt ik deze stichting wat dubieus... Ze hebben allemaal grappige dingen gere-released de laatste jaren maar de wayback machine is gigantisch achteruitgagaan door de omgang met robots.txt.

"Daarnaast is het als "bibliotheek van het internet" natuurlijk erg dom om koppig iets niet te verwijderen terwijl een rechter of de wet je daartoe dwingt."
- Bij een court-order, TUURLIJK verwijder je het dan. Het gaat mij om de discussie van het gebruik van robots.txt om regressive censuur toe te passen.

(zie ook bijv: https://archive.org/post/...ay-attention-to-robotstxt)

Probleem is eigenlijk niet eens dat ze robots.txt volgen, maar dat ze veel kritiek er op krijgen en gewoonweg weigeren hun besluit te verklaren.
Nee, een dergelijke elitaire stichting op een ivoren toren is mij geen cent waard.
Lastige zaak, als ze Seagate nou achter zich krijgen om een aantal van hun nieuwe SSD's te doneren (tegen kostprijs, exclusief R&D) dan komen ze al een heel eind.

Seagates 60 TB SSD
3.5 inch
12 Gbps SAS
+/- 15 watt

Of natuurlijk Toshiba's nieuwe SSD's.

Toshiba 100 TB SSD
3 GB/s read - 1 GB/s write

Zijn dure dingen, echter qua productie en materiaal, en omdat dit voor een goed doel is, kan het in principe voor een hele lage prijs verkocht worden. Hierdoor is voor het hele archief niet eens 1 rack nodig.
Vind internet al flink stuk minder vrij dan 10-15 jaar geleden. Niet eens op gebied van download beleid. Maar onafhankelijke informatie bronnen. Het is allemaal eenheidsworst en het gevaarlijkste vind ik dat google nu even gaat vertellen wat echt nieuws of fake nieuws is. Vertrouw wat ik op liveleak kijk meer dan wat ze op rtl nieuws brengen en dan dat je op steeds minder websites op nieuws mag reageren vind ik ook maar een slecht gegeven. Zie nu.nl, ik vond altijd het mooiste om de reacties te lezen, niet dat ik t met iedereen eens ben, maar een andere kijk erop krijgen is niks mis mee.
Als ze censuur willen voorkomen zouden ze ook Canada moeten mijden als de pest. Canada was ooit een privacy vriendelijk land maar intussen loopt het in de pas met de VS en schendt ook op grote schaal de privacy op basis van diverse anti-terreur wetten. Momenteel is Ijsland nog één van de weinige landen waarvan ook de politici doordrongen zijn van het feit dat privacy een groot goed is dat met hand en tand bewaakt moet worden.
Censuur en (een gebrek aan) privacy zijn twee verschillende dingen.

[Reactie gewijzigd door Frumbasjt op 30 november 2016 13:18]


Om te kunnen reageren moet je ingelogd zijn



Nintendo Switch Google Pixel Sony PlayStation VR Samsung Galaxy S8 Apple iPhone 7 Dishonored 2 Google Android 7.x Watch_Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True