Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 10 reacties

Het Internet Archive krijgt een nieuwe doorzoekbare database die gevuld moet worden met ongepubliceerde wetenschappelijke gegevens. Universiteiten kunnen de informatie toevoegen via een speciale Firefox-extensie.

internet archive logoHet idee om onbewerkte onderzoeksgegevens toe te voegen aan het internetarchief is afkomstig van het Center for History and New Media van de George Mason universiteit. Het centrum denkt dat aantekeningen, tussentijdse bevindingen en andere onderzoeksgegevens net zo interessant kunnen zijn voor de academische wereld als de uiteindelijke wetenschappelijk publicatie.

De Andrew W. Mellon Foundation heeft het Internet Archive daarom 700.000 dollar, en de universiteit een half miljoen dollar, toegekend om het streven te verwezenlijken. Het centrum wil daartoe de Firefox-extensie Zotero inzetten. Hiermee kunnen onderzoekers gegevens op het web verzamelen en beheren en automatisch informatie over herkomst van gebruikte citaten verkrijgen.

Het Center for History and New Media wil Zotero zo aanpassen dat wetenschappers materiaal met een klik online kunnen zetten. Een extra motivatie om informatie te uploaden, vormt het feit dat het Internet Archive ingescande handgeschreven aantekeningen omzet in tekstbestanden. De vraag is hoeveel academici Zotero al gebruiken, of overgehaald kunnen worden dit te gaan doen. Bovendien zou het project in de problemen kunnen komen door auteursrechtenkwesties, zo tekent Ars Technica aan.

Moderatie-faq Wijzig weergave

Reacties (10)

Zogenaamde 'dark data' is in potentie erg interresant. Zoals Edison zei: "ik heb niet gefaald. Ik heb alleen tig manieren ontdekt hoe het niet moet". Mislukte, half gelukte of deels gelukte wetenschappelijke projecten leveren een berg data op waar niets mee wordt gedaan. Zou deze kunnen worden gebruikt bij lopende onderzoeken, dan is het heel goed mogelijk dat oude inzichten in nieuwe gebieden kunnen worden toegepast. Ook zijn de manieren hoe andere onderzoekers in het verleden 'gefaald' hebben interresant, dit kan een lopend onderzoek een stuk efficienter maken.
Laat een onderzoek nou vooral om de onderzoeksmethodiek gaan en niet om de raw data die er mee gevonden wordt
[mierenneuk modus]
"Raw data" vertalen naar "rauwe gegevens"? Moet ik ze eerst koken? ;)
Ruwe gegevens lijkt me een betere en meer gepaste omschrijving
Misschien toch niet zo'n gekke vertaling rauw vs gekookt:
Raw data is data that has not been processed for use. A distinction is sometimes made between data and information to the effect that information is the end product of data processing. Raw data that has undergone processing is sometimes referred to as cooked data.
bron
Ruwe data is eigenlijk een betere omschrijving, maar bekt minder. En koppen makers willen goed klinkende, uitnodigende en grappige koppen.
Hmm, ik ben juist wel blij met de voorselectie aan data die collega's maken. Juist het feit dat publicaties peer-reviewed worden zorgt ervoor dat je niet alle 'troep' krijgt te lezen die je weleens als reviewer te zien krijgt.

Ik bedoel, het is leuk hoor dat ik mijn aantekeningen kan uploaden en dat anderen daar potentieel wat interessants in vinden. Maar ik denk niet dat iemand daar ook echt doorheen gaat lopen wroeten in de hoop een ruwe diamant te vinden.

Ik heb meer vertrouwen in de samenwerkingen tussen onderzoekers waar onderzoeksgegevens gedeeld worden dan in dit soort half-anonieme vergaarbakken van voor een groot deel nutteloze informatie. Als ik alleen al kijk naar de hoeveelheid papier die hier in de bibliotheek staat waar nooit iemand naar kijkt, dan wil ik niet weten hoeveel nutteloos spul er in zo'n algemene zolderkamer-van-het-internet opgeslagen gaat worden, waardoor je door de grote hoeveelheid rommel juist de diamanten nooit zal vinden...

Maar goed, wie weet wordt het wat.
Mits redelijk gedocumenteerd kan een zoekmachine natuurlijk wel uitkomst bieden. Juist het aanbieden van deze informatie op het internet snijdt hout, vanwege je eigen argument:
Als ik alleen al kijk naar de hoeveelheid papier die hier in de bibliotheek staat waar nooit iemand naar kijkt,
. Eindelijk krijgt de ruwe 'dark data' nut met behulp van moderne indexeer- en zoektchnologieŽn.
Het is dan ook niet bedoeld om zomaar wat in te lezen.
Ik denk dat dit vooral handig kan zijn als je zelf van plan bent een experiment te doen en wilt weten of iemand anders al eens iets gelijkaardigs gedaan heeft. Zoja, wat waren zijn/haar resultaten dan? Zo wordt niet nodeloos hetzelfde experiment gedaan dat toch enkel mislukt.
Tuurlijk lijkt me dit systeem niet bruikbaar zonder goeie zoekmachine maar ik geloof dat dat niet zo ingewikkeld meer is in de huidige tijden ;)
Grappig ik heb dit al een jaar geleden besproken met het hoofd e-Publishing van de EUR (waar ik toentertijd werkte). Het idee dat daar leefde was dus inderdaad ook om ' raw data' op te slaan om zo peer reviews beter te maken. Het is leuk om iemands resultaten te lezen, maar verifiŽren zit er doorgaans niet bij. Op deze manier kan iedereen met de relevante kennis dit wel doen. Komt uiteindelijk het onderzoek ten goede.

Het probleem zal waarschijnlijk bij onderzoek wat mede betaald wordt door bedrijven moeilijker worden.
Historisch onderzoek in alle mogelijke gearchiveerde papieren bronnen is in het elektronische tijdperk verloren gegaan aangezien de tussenfasen niet werden opgeslagen. Nu zal de historicus een ontwikkeling kunnen vaststellen en beschrijven.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True