Internet Archive meldt mijlpaal van 10 petabyte

Non-profitorganisatie Internet Archive heeft de 10.000.000.000.000.000-ste byte gearchiveerd. De digitale bibliotheek, waar onder andere de Wayback Machine onderdeel van uitmaakt, heeft er zestien jaar over gedaan om de opslaghoeveelheid van tien petabyte te bereiken.

De mijlpaal van 10 petabyte werd door medewerkers, vrijwilligers en liefhebbers van het project gevierd bij het statige hoofdkwartier van de non-profit, in San Francisco. Tegelijkertijd meldt de organisatie dat het toegang verleent aan een set data van 80 terabyte, die aan de Wayback Machine is toegevoegd.

10 petabyte Internet Archive

De Wayback Machine slaat websites van tijd tot tijd op zodat oudere versies behouden blijven en internetters ze terug kunnen zien. Internet Archive startte 9 maart 2011 met de recente captureronde en stopte 23 december 2011, waarbij 2.713.676.341 items van 2.273.840.159 url's vastgelegd werden. De lijst van sites was afkomstig uit Alexa's lijst van de miljoen meestbezochte sites wereldwijd. De vastgelegde items zijn opgeslagen als WARC-bestanden, die tekst, plaatjes en video bevatten. De organisatie geeft op aanvraag toegang tot de datasets.

Tenslotte meldt Internet Archive in een andere mededeling voor het eerst de opslag van alle literatuur van een volk compleet te hebben, namelijk dat van de Balinezen.

Wayback Machine Hosts Crawled

Door Olaf van Miltenburg

Nieuwscoördinator

27-10-2012 • 17:23

92

Reacties (92)

92
89
52
5
2
17
Wijzig sortering
Toch soms wel weer leuk om even terug in de tijd te gaan, http://web.archive.org/we...1914/http://tweakers.net/
Terugbladerend naar de eerste Tweakers pagina in 1999 zie ik dat Duke Nukem Forever gereviewed wordt. Dat heeft even geduurt..
http://web.archive.org/we.../http://www.tweakers.net/
Ahahahaha die comment van delaregulus is echt te mooi voor woorden om die weer te zien.

Vraag me af of hij nog steeds windows 2000 gebruikt anno 2012 :Y)
Leuker vond ik dat Windows 98 SE 'binnenkort' uitkomt :p
haha, leuk tegenover Windows 8 :)

http://web.archive.org/we.../http://www.tweakers.net/
Reactie gepost door Robert - Dinsdag 27 April 1999 - 12:51
Maar wanneer..... -zucht-
Nou Robert, over 12 jaar ;)
Met Backblaze Storage Pods kun je 45 drives in een 4U server kwijt. Dit is met 3TB schijven een totaal van 135TB. In een standaard 42U rack kun je dus 10 Pods kwijt voor een totale opslag van 1350TB. Voor 10 petabyte heb je dus 8 tot 9 racks nodig, afhankelijk van de vorm van RAID.

Wat kost zoiets nou? De kosten van één Pod:

- 45 schijven van 3TB: €5.625
- 4 SATA RAID kaarten: €150
- 2 voedingen: €400
- Moederbord en processor: €280
- Geheugen: €40
- Backblaze Storage Pod behuizing: €600

€7.095 voor een enkele Pod. Voor 10 petabyte zijn 75 pods nodig, wat op een totaal van €532.125 uitkomt.
Wie betaald die non-profit organisatie eigenlijk? Wie heeft er zoveel geld voor over al die capaciteit te betalen om oude 'zooi' (en heel soms iets nuttigs) naar boven te kunnen halen?
What is the nonprofit status of the Internet Archive? Where does its funding come from?
The Internet Archive is a 501(c)(3) nonprofit organization. It receives in-kind and financial donations from a variety of sources, including, but not limited to: Alexa Internet, the Kahle/Austin Foundation, the Alfred P. Sloan Foundation, the William and Flora Hewlett Foundation, and you.
Bron: The Internet Archive - Frequently Asked Questions
Waarvoor en hoevaak gebruiken mensen dit nou, behalve dan om voor de grap is een site te bekijken van toen hij net begon en de designs nog bestonden uit een hoop bewegende Gifjes?
Vraag me af of het aantal bezoekers dit allemaal wel kan financieren.
Ik ken zelf niemand die deze site met enige regelmaat gebruikt.
Ze leven ook niet van de bezoekers maar vooral van donaties en subsidies.
Ik gebruik em af en toe wel serieus hoor (google cache trouwens ook)

Simpel gezegd, je wil wel eens iets teruglezen/vinden van een url die niet meer bestaat, 9 van de 10 keer kan je die url bij de wayback machine of bij google cache alsnog opvragen om de pagina te kunnen lezen/bekijken.

Ik zou eerlijk gezegd graag zien dat ze met google aan tafel gaan zitten, google slaat namelijk zo mogelijk nog veel meer data op, laat ze iig hun cache altijd beschikbaar maken voor de wayback machine, grote kans dat ze binnen een jaar de 20petabyte passeren. (omdat google zich niet alleen op de miljoen meest bezochte sites richt)
Hoevaak gebruik je het gemeentelijk archief? Zelfde vraag, zelfde antwoord ben ik bang, misschien zegt het meer over de persoon zelf dan over het nut van de instantie

We leven in een wegwerpmaatschappij, dat is ondertussen wel een vaststaand feit. Hoeft nog niet te betekenen dat kennis ook automatisch wegwerpmateriaal is
Geweldige dienst, zo bekijk ik af en toe oude websites met computer oplossingen die offline zijn gehaald.
Mooi grafiek maar al die kleuren verwarren mij en ik zie niet waar grijs bij hoort.
Grijs is overig lijkt me, die te klein zijn om en eigen taartpunt te krijgen.
Grijs zullen overige domeinen zijn, zoals .eu, .be etc.
Als ze de volledige lijst erin moeten verwerken wordt het een kliederboel :p
Heel af en toe bekijk ik nog wel eens mijn oude websites, uit 2004. Erg leuk om te zien. Ongetwijfeld bestaat het over 30 jaar nog. Mooie historische vastleggingen. Jammer dat de layout afbeeldingen niet opgeslagen worden, maar ook wel begrijpenlijk.
Wow, nu ik dit zo las ging ik even kijken of de site die ik in 2004 runde er op staat; en jawel! :o
Ik dacht voorheen dat zulke initatieven enkel de grote websites crawlden.
Bij sites die ik nu terugkijk zitten de layout afbeelding er wel bij hoor.
Zie: http://web.archive.org/we...1914/http://tweakers.net/
Anoniem: 325463 @Diecke27 oktober 2012 18:13
Dat komt omdat t.net die oude spul nog niet heeft weggegooid :P
Nee hoor.

http://web.archive.org/we...tweakers.net/g/if/1/1.gif

Ze zijn pas wat later begonnen met het opslaan van afbeeldingen *en* dat was vooral in het begin beperkt tot de populairdere sites.
Mooi kunnen ze gewoon die weer gebruiken ipv T7 ;).

Jullie kunnen ook niet tegen een grapje. Gezien de vele klachten wel terecht
Overigens op een tablet is het kom ik zojuist achter helemaal waardeloos. Geen enkel nieuws zonder te scrollen. Als ik mijn TF dockted heb.

[Reactie gewijzigd door Kevinp op 22 juli 2024 21:42]

Ah.. het was dus NIET Apple die er mee begon:

22:00 Franse consumentenbond klaagt Apple en Sony aan :+

Iedereen die de afgelopen week zat te zeuren over de layout van tweakers moet gewoon even op jouw link kijken! Ziet deze er toch wat cleaner uit!

[ontopic] Ik vind de wayback machine een erg leuk iets, kijk er zelf ook regelmatig op. Een van mijn allereerste websites uit 1999 is er nog op te vinden, fantastisch om dat terug te zien!
Jammer dat de layout afbeeldingen niet opgeslagen worden, maar ook wel begrijpenlijk.
Je moet ook exact dezelfde browser van x jaar terug gebruiken, om te kunnen zien of er verschil is. Neem ik aan?
Heb je de site die je wou testen, ook geopend in een x jaar oude versie van de toen meest gebruikte browser(s)?
Dat is echt insane veel man! Een petabyte is ongveer 1000TB en dan 1000000GB toch?
Snap niet dat je gedownmod wordt. Wil ook wel eens weten hoeveel TB/GB dit dan is.
Ik weet niet hoe het officieel zit. Maar volgens mij heeft wiki hier toch een groot aantal fouten op staan.

een Byte is 8 bits. De afkorting KB is automatisch 1024^1 bytes.

Echter dat de HD fabrikanten deze afkortingen verkloot hebben omdat ze zelf niet kunnen rekenen. is dat nu ineens 1000^1 volgens wiki.

Nu weet ik dus niet precies wat het officieel is maar van een KiB heb ik nog nooit gehoord. En niemand niet. Ze moeten niet ineens afkortingen gaan verzinnen omdat ze zelf de verkeerde hoeveelheid bytes in een KB hebben gestopt en dan zeggen. "Ja maar dan doen we het goede maar een andere afkorting geven".

Anyhow, jammer dat daar in het begin niet eens iemand een rechtszaak over is begonnen. Dat zou in mijn ogen volkomen terecht zijn.

edit:
Ik zie dat ik gelijk heb:
http://nl.wikipedia.org/wiki/Kilobyte
Daar staat een uitleg, en inderdaad. Omdat ze een fout hebben gemaakt hebben ze maar de goede een andere afkorting gegeven. Omdat de mensen te dom zijn ofzo |:(

[Reactie gewijzigd door Kevinp op 22 juli 2024 21:42]

Mijn beste, how wrong you are. Om te beginnen is een byte al niet gedefinieerd als 8 bit. In de jaren 60/70/80 werden er ook bytes gebruikt (op niet x86 systemen) die kleiner of groter waren dan 8 bits. De correcte definitie van een byte is dan ook het kleinst adreseerbaar gedeelte van het computergeheugen. Direct ook de reden waarom bij dataoverdracht gerekend word in bits per seconde en niet in bytes per seconde.

Verder stelt het SI systeem, een systeem dat internationaal een hele hoop standaarden beheerd en dat al lang bestond van voor het computertijdperk, dat een kilo gelijk is aan 1000, mega gelijk is aan 1000000 en zo verder, met andere woorden: veelvouden van 1000.

Wanneer een HDD fabrikant dus gaat stellen dat een GB volgens hen een veelvoud van duizend is dan hebben zij het volste recht om deze claim te maken omdat zij volgens de internationaal erkende standaarden gelijk hebben. En vergis je niet, die fabrikanten zijn inderdaad in de VS ooit hiervoor veroordeeld geweest, daarom dat je op de schijven vandaag expliciet de melding vind om hoeveel bytes het gaat. De rechter heeft hier niet alleen genegeerd dat de fabrikanten de internationale standaarden correct toepassen, maar ook dat een schijf die geformateerd is gewoon al bytes verliest aan de opslag van het bestandssysteem.

Reeds in de jaren 90! heeft men vanuit de ICT wereld dit probleem erkend. In de jaren 70 en 80 was er nog geen probleem. Kilo was bijna 1000, mega was nog ongeveer een miljoen, maar in de jaren 90 begon men met giga en begon de afwijking dan ook groter te worden. Toen is dus beslist om met de binaire prefix te komen. Waarbij men een i plaatst tussen de SI eenheid en de byte in de afkorting om aan te tonen dat het hier om veelvouden van 1024 gaat ipv 1000.

Het is ook niet omdat jij nog nooit van kiB gehoord hebt dat dat ineens fout is en dat anderen het fout gebruiken of een fout gemaakt hebben. Sinds wanneer ben jij de standaard die we moeten volgen? Er is trouwens steeds meer software die ondersteuning heeft voor de binaire prefix. Enkel MS blijft halsstarrig vasthouden aan het gebruik van de foutieve prefix wat ik zeer spijtig vind.

En de NL wiki pagina is totaal waardeloos, daar staat amper informatie op en daar staat, in tegenstelling tot je eigen claim, niet op vermeld dat er ook maar iemand een fout heeft gemaakt. Zelfs de uitleg over k en K klopt niet, want mega en giga zijn altijd caps geweest in het SI stelsel, de reden waarom velen dus KB schreven was simpelweg omdat MB, GB en TB wel correcte afkortingen zijn. Zelfs de definitie van bit als b en byte als B is gecontesteerd. Zowel b als B word in de praktijk gebruikt voor byte. Het is daarom aan te raden om bit telkens voluit te schrijven. Mbit ipv Mb dus.
Iedereen in de computer wereld gebruikte 1k = 1024. Ook HDD-vendors. Pas ergens halverwege de jaren negentig begonnen de HDD-fabrikanten met 1k = 1000. En hoogst waarschijnlijk was het er eentje die slim moest doen, en toen moesten de anderen mee. Dus niet: "dan hebben zij het volste recht om deze claim te maken". De maakten die claim namelijk niet. Dat kwam pas later. Puur om marketing-technische redenen.

Zijn er vendors die zeggen: "Wij hebben geen Gigabit-Ethernet, nee: wij hebben 1.07Gigabit-Ethernet !!!" ? Nee. Want niet iedereen is van die flauwekul gediend.

Het is vergelijkbaar met de grappenmakers bij routers en switches. Die begonnen van de een op de andere dag ook opeens de bandbreedte van hun devices te verdubbelen.
Eerst was het: deze switch heeft 50 poorten met 10GigEthernet. Dus de capaciteit is 500 Gbps.
Toen opeens was het: "Maar iedere poort kan 10Gig in en 10Gig uit. Dus twee keer zo veel !"
En opeens was precies dezelfde box geupgrade tot een "Terabit System !".

Allemaal marketing flauwekul.
Zelfs de uitleg over k en K klopt niet, want mega en giga zijn altijd caps geweest in het SI stelsel, de reden waarom velen dus KB schreven was simpelweg omdat MB, GB en TB wel correcte afkortingen zijn. Zelfs de definitie van bit als b en byte als B is gecontesteerd. Zowel b als B word in de praktijk gebruikt voor byte.
Da's toch wel sterk, hoor... Gedrag goedkeuren alleen maar omdat 't vaak voorkomt??
Als M en G altijd caps geweest zijn, dan kan je dat daarmee nog niet zomaar doortrekken naar andere letters! Onzin.
"Zowel b als B word in de praktijk gebruikt voor byte."
Natuurlijk. Alleen diegenen die b als byte gebruiken, doen het altijd al fout.
Net zoals iemand wel eens "is" i.p.v. "eens" gebruikt in een zin: komt ook vaak voor. Maar dat maakt 't nog niet goed!
Nu weet ik dus niet precies wat het officieel is maar van een KiB heb ik nog nooit gehoord. En niemand niet.
Speak for yourself :) Dat laatste zinnetje is nergens voor nodig. Jij bepaalt niet wat iedereen weet ;)

De kiB is gewoon een SI-eenheid die in 2005 is aangenomen (zie rechter kantlijn van de eerder genoemde link). Veel officiëler wordt het niet met eenheden.

Je hebt wel gelijk dat vroeger een kilobyte gewoon 1024 byte was, behalve als je hdd-fabrikant was. Geheugenfabrikanten deden wel weer netjes 1024 bytes per kB. Maar in netwerksnelheden werd weer in bits gerekend en dan was kilo weer wel 1000 geloof ik. Dat werd allemaal erg verwarrend, dus die keuze voor kilo vs. kibi vind ik wel logisch.
Zo ver ik weet is alleen de HDD wereld die het voor zichzelf makkelijk heeft gemaakt (door een kB (kleine k) te verzinnen voor de 1000 versie). Als je een 10mbit kaartje hebt moest je dat delen door 8 om naar de MB varriant te komen.Allemaal erg verwarrend, maar computers werken nou eenmaal met alles in een factor 2.
Nee hoor. Alleen RAM geheugen gebruikt Base2, om natuurkundige redenen werkt dat nou eenmaal zo.

Data opslag en -transport gebruiken gewoon Base10. Opslag is al sinds de eerste computers Base10. Charles Babbage's Analytical Engine uit 1837 gebruikte al Base10 en dat is nooit verandert.

Of je het nou over ponskaarten, tape, HDD, DVD etc. hebt, het is allemaal Base10 (enige uitzondering was de floppydisk die om onverklaarbare redenen een combinatie van Base2 en Base10 gebruikt).

Data transport precies hetzelfde, netwerkverbindingen worden ook aangeduid in Base10. Waarom denk je dat ethernet gewoon 10/100/1000 is en niet 8/128/1024?

[Reactie gewijzigd door Maurits van Baerle op 22 juli 2024 21:42]

Nee hoor. Alleen RAM geheugen gebruikt Base2, om natuurkundige redenen werkt dat nou eenmaal zo.

Data opslag en -transport gebruiken gewoon Base10. Opslag is al sinds de eerste computers Base10. Charles Babbage's Analytical Engine uit 1837 gebruikte al Base10 en dat is nooit verandert.

Of je het nou over ponskaarten, tape, HDD, DVD etc. hebt, het is allemaal Base10 (enige uitzondering was de floppydisk die om onverklaarbare redenen een combinatie van Base2 en Base10 gebruikt).

Data transport precies hetzelfde, netwerkverbindingen worden ook aangeduid in Base10. Waarom denk je dat ethernet gewoon 10/100/1000 is en niet 8/128/1024?
Onzin. Alles in je computer is binair, dus base 2. Zelfs je harddisk en bijna alle andere opslag. Uitzonderingen zijn bv. tri-state poorten of MLC SSDs, maar die zijn niet decimaal. Harddisks zijn magnetisch en hoeveel polen hebben magneten?
Dat sommige tools kilo vertalen naar 10^3 en andere naar 2^10 doet daar niets aan af. Dat Base-10 verhaal is enkel en alleen User Interface weergave.
Wij hebben 10 vingers, en toch gebruiken we nauwelijks BCD (binary coded decimal). Hadden we 16 vingers dan hadden we nog steeds dezelfde computers gemaakt puur en alleen omdat de basisch electronische componenten binair zijn en het efficient is om dan ook alle combinaties te gebruiken.
Waarom denk je dat er hex-editors zijn en niet deca-editors?
Ik zou zeggen, kijk verder dan de schil, pak je soldeerbout en bouw eens een processor bordje compleet met wat firmware in assembly.

Transport is, voor een digital signaal, ook binair. Die 10/100/1000 mbit/s geeft niet aan wat er getranporteerd wordt maar geeft de bandbreedte (theoretisch maximaal) aan, en die is niet exact.
Op het diepste transportlaag is het wezenlijke signaal analoog (en dus niet binair en helemaal niet decimaal) en wordt de uiteindelijke bandbreedte wordt beperkt door materialen, omstandigheden en naturkundige limieten.

Die ethernet kabels zijn gecertificeerd voor 10/100/1000 mbit/s. Dat is wat dat betekent.

[Reactie gewijzigd door Durandal op 22 juli 2024 21:42]

Wij hebben 10 vingers, en toch gebruiken we nauwelijks BCD (binary coded decimal).
In sommige omgevingen (banken, verzekeraars en ook wel groothandels) zijn EBCDIC-computers als de AS/400*) en IBM-mainframes erg geliefd.


*)Ook wel iSeries en hoe IBM ze deze maand nu weer wil noemen
De meningen zijn duidelijk verdeeld. Maar als een kilogram 1000 gram is, een kilometer 1000 meter is, een kilojoule 1000 joule is en een kilocalorie 1000 calorieën is. Dan lijkt mij het toch ergens logisch dat een kilobyte 1000 byte is.
Zo moeilijk is het niet. Een Kb = Kilobits en een KB = kilobytes.
De standaardverdeling zoals bij kg = 1000 gram zit op het vlak van de bits.
Dus 1000 bits = 1kb
en de bytes zijn 8 bits, dus daardoor krijg je 1024 bytes = 1kb. Dat is zo en dat blijft zo. Je kunt het niet anders doen omdat je altijd 8 bits in 1 byte blijft houden.
Een Kb = Kilobits en een KB = kilobytes.
Een Kb is een Kelvin bit, wat dat ook mag zijn :).
En een KB is een Kelvin byte.
en de bytes zijn 8 bits, dus daardoor krijg je 1024 bytes = 1kb. Dat is zo en dat blijft zo. Je kunt het niet anders doen omdat je altijd 8 bits in 1 byte blijft houden.
Wat een k is heeft simpelweg gewoon niks mee te maken hoeveel bits er in een byte zitten. Wil je van 1024 een eenheid maken, prima: maar dan niet k want dat is reeds sinds de 18e eeuw gedefinieerd als 1000.
En het is ook helemaal geen probleem om die 1024 anders te noemen. Precies dat is nu ook (te laat, nl. pas in 2005) gebeurd: 1 kibibyte = 1024 byte.
Je hebt wel gelijk dat vroeger een kilobyte gewoon 1024 byte was
Welnee, daar heeft ie helemaal niet gelijk in.
Tuurlijk, 't werd wel massaal zo gebruikt, maar dat maakt 't niet minder fout.
Omdat ze een fout hebben gemaakt hebben ze maar de goede een andere afkorting gegeven. Omdat de mensen te dom zijn ofzo |:(
De pot verwijt de ketel :X

Goed, eens zien, wat betekent kilo? Kilogram = 1000 gram, kilometer = 1000 meter, kiloton = 1000 ton, kilohertz = 1000 hertz, kilojoule = 1000 joule. Wie haalt het dan in z'n hoofd een kilobyte 1024 byte te noemen? 8)7 Een kilobyte is dus gewoon 1000 byte, einde verhaal. Nu, ik ben akkoord dat 1024 byte in veel gevallen interessanter is, dus is de nieuwe term kibibyte ingevoerd, afgekort KiB. Easy-peasy toch?
Niet weer die discussie. Ik heb vóór 1998 geleerd dat 1KB = 1024Byte. Dat is me bijgebleven als enige correcte notatie.
Ik heb vóór 1998 geleerd dat 1KB = 1024Byte. Dat is me bijgebleven als enige correcte notatie.
Tja, sommige mensen zijn nu eenmaal koppig... En veel mensen houden niet van verandering (in dit geval het eindelijk loslaten van een faliekant foute definitie).
Je moet trouwens de kleine k schrijven. 1kB=1000 bytes. Niet meer en niet minder. De foute definitie '1kB = 1024 bytes' is destijds waarschijnlijk door één of andere marketingafdeling in 't leven geroepen, simpelweg omdat 2^10 ongeveer 't zelfde is als 10^3. Maar da's natuurlijk allesbehalve wetenschappelijk of volgens een wereldstandaard.

[Reactie gewijzigd door kimborntobewild op 22 juli 2024 21:42]

De foute definitie '1kB = 1024 bytes' is destijds waarschijnlijk door één of andere marketingafdeling in 't leven geroepen, simpelweg omdat 2^10 ongeveer 't zelfde is als 10^3. Maar da's natuurlijk allesbehalve wetenschappelijk of volgens een wereldstandaard.
Helemaal, helemaal de wereld op zijn kop.

Computers zijn ontworpen en gebouwd door wetenschappers. En wetenschappers introduceren hun eigen taal en termen en begrippen. Dat is hun goed recht.

En de computer science wereld is begonnen met 1k = 1024. Als je bytes in een file telde. Of de grootte van een HDD. Als je bits/seconde telt in een netwerk verbinding. Enzovoorts. En iedereen wist precies wat het betekende. Geen verrassingen.

Toen kwam marketing.
En in het bijzonder de marketing-smeerlappen van de HDD fabrikanten.
Ik weet niet wie er mee begonnen is. Maar het is begonnen met HDDs.
Die telden opeens 1MB = 1 miljoen.
In plaats van 1024x1024.
Wat echt iedereen deed voordat deze flauwekul begon.
Hele generaties computer-wetenschappers, computer-professionals, en zelfs computer-amateurs, allemaal keken ze verbaasd wat die eikels nu weer flikten.

Als je een echte Terabyte HDD hebt, dan kun je er op zetten: 1 TB.
Dat zijn 1099511627776 bytes.
Maar als je net doet alsof je slimmer bent dan 50 jaar computer historie, en net doet alsof 1TB = 1 biljoen bytes, dan kun je op je verpakkingsmateriaal zetten: 1.1 Terabytes ! (Beetje afronden ook maar direct).
Fantastisch, Marketing heeft er zo maar 10% opslagcapaciteit bij gemaakt !
Zonder al te veel kosten. Dat is pas productief ! Dat is pas innovatief ! Daar kunnen die sukkels van engineering nog een puntje aan zuigen !

Leve Marketing.
Daar komen pas echt de vernieuwingen en verbeteringen vandaan !

[Reactie gewijzigd door 280562 op 22 juli 2024 21:42]

En in het bijzonder de marketing-smeerlappen van de HDD fabrikanten. Ik weet niet wie er mee begonnen is. Maar het is begonnen met HDDs. Die telden opeens 1MB = 1 miljoen.
In plaats van 1024x1024. Wat echt iedereen deed voordat deze flauwekul begon.
'Ik weet niet wie er mee begonnen is.'
Het gaat er eerder om wie ermee begonnen is 1k fout te definiëren als 1024, en 1M als 1024^2, en 1G als 1024^3, etc. Iets wat sowieso niet houdbaar is op de lange termijn, juist omdat (zoals je zelf ook al aangeeft) het verschil op een gegeven moment zo groot is dat de betreffende machten van 2 te ver zullen afliggen van de machten van 10.
Verder is het helemaal niet zo dat iedereen 1M als 1024x1024 zag; kijk maar naar de floppies van destijds die '1,44MB' hadden: daarin zat notabene een vermenigvuldiging van 1024x1000 verwerkt. Kilo en kibi doorelkaar heen! Logisch hoor! Ja inderdaad logisch, al deze verwarring, als je kilo plots als 1024 gaat definiëren.
Precies om dit soort verwarring en de verwarring omtrend opslagcapaciteit op harddisks is k definiëren als 1024 al vanaf het begin fout geweest.
Als je een echte Terabyte HDD hebt, dan kun je er op zetten: 1 TB. Dat zijn 1099511627776 bytes.
Nee, want 1TB=1000000000000 byte en niet 1099511627776 bytes. http://nl.wikipedia.org/wiki/Terabyte:
"Een terabyte, afgekort TB, is strikt genomen 1000 gigabytes ofwel 1.000.000.000.000 bytes (10^12 B )."
En:
"In de praktijk wordt de terabyte ook gebruikt voor 1024 GiB = 1.099.511.627.776 B (240 B ), maar dit gebruik wordt ontraden."
Beste gryz, je moet dus eindelijk eens met je tijd mee :).

[Reactie gewijzigd door kimborntobewild op 22 juli 2024 21:42]

Ik heb dat ook geleerd, maar ook dat dan een hoofdletter K moet worden gebruikt, dus KB ("kilo"-byte). De normale kilo wordt met een kleine letter K geschreven, zoals kg, km en kΩ.
Helaas had men zich destijds niet gerealiseerd dat Mega, Giga, Tera, Peta, Exa en opvolgenden allemaal met hoofdletters worden afgekort.
Hoofdletter K is Kelvin :)
Ik heb vóór 1998 geleerd dat ...
vroeger dacht men dat de aarde plat was en je er af kon vallen als je te ver zeilde. Belgrado is trouwens de hoofdstad van Servië en niet van Joegoslavië

Kijk eens naar de verpakking van een harde schijf, daarop staat in kleine lettertjes vermeld dat ze een veelvoud van 1000 gebruiken en niet de binaire benaming

[Reactie gewijzigd door dasiro op 22 juli 2024 21:42]

vroeger dacht men dat de aarde plat was en je er af kon vallen als je te ver zeilde.
Hou eens op met die mythe. Dat is onzin.
De grieken hadden al berekend wat de omtrek van hun bolvormige aarde was.
Vóór de grieken waren er al zeilschepen, dus in die zin kan je niet beweren dat men nooit heeft vermoed dat je van de rand van de aarde af kon zeilen.
1024 'Past' in het binaire stelsel. So what? Waarom dan opeens de term kilo een andere betekenis geven? (Ergens in de jaren 80 door wat marketingmensen waarschijnlijk.) Onzin. Altijd al onzin geweest. Als het iets anders is (en 1024 is echt iets anders dan 1000), dan moet je 't ook een andere naam geven om verwarring en erger: fouten te voorkomen.
Ik weet niet hoe het officieel zit. Maar volgens mij heeft wiki hier toch een groot aantal fouten op staan.
Je geeft zelf al aan dat je niet weet hoe 't officieel zit. Nogal arrogant dat je dan toch durft te spreken van een groot aantal fouten op wiki.
een Byte is 8 bits. De afkorting KB is automatisch 1024^1 bytes.
Wat heeft je eerste zinnetje in vredesnaam te maken met (de conclusie?) in je tweede zinnetje?
Echter dat de HD fabrikanten deze afkortingen verkloot hebben omdat ze zelf niet kunnen rekenen. is dat nu ineens 1000^1 volgens wiki.
Lulkoek; 1kB is altijd al 1000 bytes geweest. Dat 't qua marketing (zeker in het 'begintijdperk' van de PC) makkelijker is om 1024 te hanteren, doet daar niks aan af.
Nu weet ik dus niet precies wat het officieel is maar van een KiB heb ik nog nooit gehoord. En niemand niet.
Er zijn ook weinig mensen die weten wat hydrazine is. Bestaat dat dan opeens ook niet?
Ze moeten niet ineens afkortingen gaan verzinnen omdat ze zelf de verkeerde hoeveelheid bytes in een KB hebben gestopt en dan zeggen. "Ja maar dan doen we het goede maar een andere afkorting geven".
Het enige goede is k=1000 en niet 1024, en dat is 'altijd' al zo geweest (in elk geval al vele jaren voordat er sprake was van harddisks en PC's). Dus dat is niet wat er veranders is. Wat er veranderd is, is dat er in 2005 definities bij zijn gekomen - juist omdat zoveel mensen de foute definitie hanteerden van k=1024 in de computerwereld.
...omdat ze zelf de verkeerde hoeveelheid ...
Bovendien slaat 't woordje zelf hier helemaal nergens op, want de groep mensen die k=1024 vinden is juist een hele andere groep dan de mensen die vinden dat k=1000.
Anyhow, jammer dat daar in het begin niet eens iemand een rechtszaak over is begonnen. Dat zou in mijn ogen volkomen terecht zijn.
Er is wel al eens een rechtszaak over geweest. In de USA. Tegen harddisk-fabrikanten. Omdat zij de werkelijke juiste hoeveelheid schijfruimte op de harddisk weergaven, i.p.v. de 1024-veelvouden. Dit niet omdat ze niet gelijk hadden, maar omdat de rechter en/of jury vond dat er moest worden uitgegaan van dom publiek die niet wist dat k echt 1000 is en niet 1024.
Volkomen foute uitspraak dus.
edit:
Ik zie dat ik gelijk heb:
http://nl.wikipedia.org/wiki/Kilobyte
Daar staat een uitleg, en inderdaad. Omdat ze een fout hebben gemaakt hebben ze maar de goede een andere afkorting gegeven. Omdat de mensen te dom zijn ofzo |:(
Nu maak je weer de fout dat diegenen die k als 1024 bestempelden, dezelfde mensen zijn die de KiB, MiB etc. bedacht hebben.
Sinds 1795 staat de k voor kilo, oftewel 1000. En maak je geen zorgen, de hardeschijf fabrikanten hebben de SI prefixen altijd correct toegepast, dus ik denk dat die rechtzaak kansloos was geweest.
Als je iemand aan wilt klagen, pak dan de geheugenfabrikanten, die altijd teveel hebben geleverd. (En dat nog steeds doen)
En maak je geen zorgen, de hardeschijf fabrikanten hebben de SI prefixen altijd correct toegepast, dus ik denk dat die rechtzaak kansloos was geweest.
Helaas; in de USA is er een HD-fabrikant veroordeeld voor 't terecht hanteren van de SI-prefixen - louter en alleen omdat een groot deel van het publiek ten onrechte 1kB als 1024 byte zag. (Dus niet omdat dat werkelijk zo was.)
Spreek voor jezelf, ik wist jaren geleden al het verschil tussen KB en KiB
10.000.000.000.000.000 bytes is in onze begrippen iets minder dan 8.882 terabyte tebibytes.
(Uitgegaande van dat een kilobyte 1024 bytes is, een megabyte 1024 kilobytes, etc).

Dan heb je dus ruim vierentwintighonderd 4TB schijven nodig. Stel dat je er in een flinke pc 8 kwijt stopt, heb je 300 pc's nodig. Dan wordt het ineens veel behapbaarder.
Theoretisch past dat in één kamer, als je ze 7 hoog, 7 breed en 7 diep stapelt.

Dus nu weet je hoe "veel" het is. Een kamertje waarschijnlijk half vol met computers gevuld met 4TB schijven.

[Reactie gewijzigd door Nas T op 22 juli 2024 21:42]

Of 62 setjes van één maal deze i.c.m. twee keer deze.

Gevuld met 4Tb. schijven kost zo'n setje een kleine €13.000, dus voor een goede 8 ton ben je klaar :) .
Ja, en als een schijf het niet meer doet (een redelijk grote kans bij 1000+ schijven) ben je ook klaar. Dit gaat richting een miljoen voor de schijven alleen.
Anoniem: 249623 @iThinkSo28 oktober 2012 10:14
Zekers nog nooit van Object gebaseerd opslaan, ook wel cloud opslag genoemd. Alle stukkies zijn verdeeld (in drievoud) over het datacentrum. De kans dat ze allemaal kapot gaan is nihil en je hebt lang niet zoveel schijven nodig als met conventionele opties.

[Reactie gewijzigd door Anoniem: 249623 op 22 juli 2024 21:42]

Het zal toch érgens op één of andere schijf moeten staan :P
Beetje simplistisch gedacht dit

IA heeft ten minste 2 keer wat ze hier vernoemen, al is het op tapes
Of 512 modeletjes van deze omgerekend 12 server racks (42U) vol. Kosten lopen ook direct de pan uit... $12,50 per GB :+
FOUT, lees gewoon de eerste zin, of het plaatje, of de wiki-link waarop je reageert.

dat zijn de foutieve afleidingen die in de informatica al lang zijn rechtgetrokken naar hun binaire benamingen: kibi, mebi, gibi, tebi, pebi, ...
ik krijg in mijn pc 16 schijven en het is geen rack model (Sharkoon Rebel 12). hangt gewoon af van hoe groot de tower is en als je zelf een kast bouwt krijg je genoeg in 1 kast :p, maar neit al te min dat is veel data en elke dag komt er bij zodus, zelfs met 150pc's (van 16schijven 4TB) kom je tekort.
Nou laat ik je uit de droom helpen, dit soort dingen zijn dus echt niet opgeslagen op "pc's" zoals je die in je kamer hebt staan. Alles staat netjes in 19" cabinets waar gigantisch veel NAS systemen in hangen. Denk ook wel dat dit verspreid is over een aantal data centers in verschillende landen aangezien zo'n hoeveelheid data op 1 plek opslaan gewoon vragen is om problemen ;)
Anoniem: 480323 @Nas T28 oktober 2012 22:19
Mag je er ook nog van uit gaan dat ze raid 5 of raid 10 toepassen waarbij je alles keer 1.33 of 2 mag optellen.
En uiteraard daarvan weer een back-up.
Tenzij ze het risico willen nemen om wat data te verliezen:')
Anoniem: 24417 @Detmer27 oktober 2012 18:13
10 miljoen gigabyte, als ik het goed heb :)
Een vol 42" rack bevat 450 3.5" harddrives.
Uitgaande van 3TB drives zijn dat dus 7,5 racks, of 11 racks met 2TB drives.
650 TB per rack: http://archive.org/web/petabox.php
Overigens staat een deel daarvan ook in Amsterdam. _/-\o_

[Reactie gewijzigd door ColdRain op 22 juli 2024 21:42]

Het eerste plaatje daar werkt niet. Alleen de oude (rode) daaronder.
Tja het grootste nadeel van het Internet vind ik is dat oude websites met content niet vaak meer beschikbaar zijn door allerlei vernieuwingen aan de website. Denk aan de lay-out of gewoon simpelweg omdat websites ophouden te bestaan. Als je kijkt naar de analoge wereld van boeken, geschriften en foto's, zie je dat deze door vele drukken vaak bewaard blijven. Ik vind het dan ook een pracht initiatief om zo een soort back up te hebben van bepaalde momenten van het Internet. :)
Vind het echt leuk om te zien, al is het maar de nostaligie hoe je website was in bv 2002, of wat er toen allemaal te vinden was op internet. Waar je vroeger gewoon een videoband pakte of foto's, is het wat moeilijker dit te doen met websites.

Maar hoe bekostigen ze dit eigelijk? Ziekelijk veel opslag en zag neem ik aan ook behoorlijk wat dataverkeer generen.

[Reactie gewijzigd door SinergyX op 22 juli 2024 21:42]

Op dit item kan niet meer gereageerd worden.