Internet Archive gaat rauwe onderzoeksgegevens opslaan

Het Internet Archive krijgt een nieuwe doorzoekbare database die gevuld moet worden met ongepubliceerde wetenschappelijke gegevens. Universiteiten kunnen de informatie toevoegen via een speciale Firefox-extensie.

internet archive logo Het idee om onbewerkte onderzoeksgegevens toe te voegen aan het internetarchief is afkomstig van het Center for History and New Media van de George Mason universiteit. Het centrum denkt dat aantekeningen, tussentijdse bevindingen en andere onderzoeksgegevens net zo interessant kunnen zijn voor de academische wereld als de uiteindelijke wetenschappelijk publicatie.

De Andrew W. Mellon Foundation heeft het Internet Archive daarom 700.000 dollar, en de universiteit een half miljoen dollar, toegekend om het streven te verwezenlijken. Het centrum wil daartoe de Firefox-extensie Zotero inzetten. Hiermee kunnen onderzoekers gegevens op het web verzamelen en beheren en automatisch informatie over herkomst van gebruikte citaten verkrijgen.

Het Center for History and New Media wil Zotero zo aanpassen dat wetenschappers materiaal met een klik online kunnen zetten. Een extra motivatie om informatie te uploaden, vormt het feit dat het Internet Archive ingescande handgeschreven aantekeningen omzet in tekstbestanden. De vraag is hoeveel academici Zotero al gebruiken, of overgehaald kunnen worden dit te gaan doen. Bovendien zou het project in de problemen kunnen komen door auteursrechtenkwesties, zo tekent Ars Technica aan.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Olaf van Miltenburg

Nieuwscoördinator

Feedback • 14-12-2007 14:19 10

14-12-2007 • 14:19

Lees meer

Internet Archive komt met nieuwe console-emulators in Console Living Room Nieuws van 27 december 2013

Internet Archive plaatst gameklassiekers en applicaties in Jsmess-emulator Nieuws van 27 oktober 2013

Internet Archive claimt grootste historische softwarearchief Nieuws van 15 april 2013

The Internet Archive maakt content beschikbaar via bittorrent Nieuws van 8 augustus 2012

Internet Archive wil ingekorte url's gaan veiligstellen Nieuws van 26 november 2009

Wayback Machine krijgt modulair datacenter met 2 petabyte opslag Nieuws van 22 maart 2009

KB gaat Nederlandse websites archiveren Nieuws van 5 september 2006

Europees internetarchief deze maand van start Nieuws van 1 februari 2006

Microsoft mag deel British Library online zetten Nieuws van 5 november 2005

Yahoo gaat meehelpen aan digitale bibliotheek Nieuws van 3 oktober 2005

Internet Archive aangeklaagd wegens opslaan website Nieuws van 13 juli 2005

Internet Archive uitgebreid met een petabyte aan opslag Nieuws van 23 juni 2005

Meer producten en artikelen

Wetenschap Websites en community's Bedrijfsnieuws Internet

IT-banen

Meer vacatures

Reacties (10)

-Moderatie-faq

Wijzig sortering

Ruudjah 14 december 2007 14:25

Zogenaamde 'dark data' is in potentie erg interresant. Zoals Edison zei: "ik heb niet gefaald. Ik heb alleen tig manieren ontdekt hoe het niet moet". Mislukte, half gelukte of deels gelukte wetenschappelijke projecten leveren een berg data op waar niets mee wordt gedaan. Zou deze kunnen worden gebruikt bij lopende onderzoeken, dan is het heel goed mogelijk dat oude inzichten in nieuwe gebieden kunnen worden toegepast. Ook zijn de manieren hoe andere onderzoekers in het verleden 'gefaald' hebben interresant, dit kan een lopend onderzoek een stuk efficienter maken.

Vorak 16 december 2007 23:22

Laat een onderzoek nou vooral om de onderzoeksmethodiek gaan en niet om de raw data die er mee gevonden wordt

Marcel 14 december 2007 14:49

[mierenneuk modus]
"Raw data" vertalen naar "rauwe gegevens"? Moet ik ze eerst koken?

Ruwe gegevens lijkt me een betere en meer gepaste omschrijving

kzin

@Marcel • 14 december 2007 15:23

Misschien toch niet zo'n gekke vertaling rauw vs gekookt:

Raw data is data that has not been processed for use. A distinction is sometimes made between data and information to the effect that information is the end product of data processing. Raw data that has undergone processing is sometimes referred to as cooked data.

bron

simon @Marcel • 16 december 2007 23:36

Ruwe data is eigenlijk een betere omschrijving, maar bekt minder. En koppen makers willen goed klinkende, uitnodigende en grappige koppen.

Garyu 14 december 2007 14:50

Hmm, ik ben juist wel blij met de voorselectie aan data die collega's maken. Juist het feit dat publicaties peer-reviewed worden zorgt ervoor dat je niet alle 'troep' krijgt te lezen die je weleens als reviewer te zien krijgt.

Ik bedoel, het is leuk hoor dat ik mijn aantekeningen kan uploaden en dat anderen daar potentieel wat interessants in vinden. Maar ik denk niet dat iemand daar ook echt doorheen gaat lopen wroeten in de hoop een ruwe diamant te vinden.

Ik heb meer vertrouwen in de samenwerkingen tussen onderzoekers waar onderzoeksgegevens gedeeld worden dan in dit soort half-anonieme vergaarbakken van voor een groot deel nutteloze informatie. Als ik alleen al kijk naar de hoeveelheid papier die hier in de bibliotheek staat waar nooit iemand naar kijkt, dan wil ik niet weten hoeveel nutteloos spul er in zo'n algemene zolderkamer-van-het-internet opgeslagen gaat worden, waardoor je door de grote hoeveelheid rommel juist de diamanten nooit zal vinden...

Maar goed, wie weet wordt het wat.

Ruudjah @Garyu • 14 december 2007 15:12

Mits redelijk gedocumenteerd kan een zoekmachine natuurlijk wel uitkomst bieden. Juist het aanbieden van deze informatie op het internet snijdt hout, vanwege je eigen argument:

Als ik alleen al kijk naar de hoeveelheid papier die hier in de bibliotheek staat waar nooit iemand naar kijkt,

. Eindelijk krijgt de ruwe 'dark data' nut met behulp van moderne indexeer- en zoektchnologieën.

ingdas @Garyu • 14 december 2007 15:42

Het is dan ook niet bedoeld om zomaar wat in te lezen.
Ik denk dat dit vooral handig kan zijn als je zelf van plan bent een experiment te doen en wilt weten of iemand anders al eens iets gelijkaardigs gedaan heeft. Zoja, wat waren zijn/haar resultaten dan? Zo wordt niet nodeloos hetzelfde experiment gedaan dat toch enkel mislukt.
Tuurlijk lijkt me dit systeem niet bruikbaar zonder goeie zoekmachine maar ik geloof dat dat niet zo ingewikkeld meer is in de huidige tijden

ashemedai 14 december 2007 15:54

Grappig ik heb dit al een jaar geleden besproken met het hoofd e-Publishing van de EUR (waar ik toentertijd werkte). Het idee dat daar leefde was dus inderdaad ook om ' raw data' op te slaan om zo peer reviews beter te maken. Het is leuk om iemands resultaten te lezen, maar verifiëren zit er doorgaans niet bij. Op deze manier kan iedereen met de relevante kennis dit wel doen. Komt uiteindelijk het onderzoek ten goede.

Het probleem zal waarschijnlijk bij onderzoek wat mede betaald wordt door bedrijven moeilijker worden.

Josh_Uil 16 december 2007 00:19

Historisch onderzoek in alle mogelijke gearchiveerde papieren bronnen is in het elektronische tijdperk verloren gegaan aangezien de tussenfasen niet werden opgeslagen. Nu zal de historicus een ontwikkeling kunnen vaststellen en beschrijven.

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (10)

Sorteer op:

Weergave: