Tweakers Podcast #314 - Apple-roasts, glaslasers en bieralgoritmes

Deze week praten Wout Funnekotter, Jurian Ubachs, Arnoud Wokke en Daan van Monsjou over een mogelijke toekomst voor VR, algoritmes om bier te verbeteren, de verjaardag van Rollercoaster Tycoon, de aanklacht tegen Apple in de VS en data opslaan op glas.

0:00 Intro
0:21 Opening
1:29 .post
21:35 Eerste ervaring met Vision Pro
36:36 Bier verbeteren met algoritmes
41:48 Rollercoaster Tycoon is jarig
48:20 Justitie roast Apple
1:03:35 Data opslaan op glas
1:18:19 Sneakpeek

Door Arnoud Wokke

Redacteur Tweakers

28-03-2024 • 06:00

15

Reacties (15)

15
15
3
0
0
12
Wijzig sortering
Jullie hadden het over Grover. Maar de prijzen die jullie noemen (en dus de usecase dus) klopt niet helemaal,

De prijzen zijn namelijk als je de hardware 12+ maanden huurt. Die drone kost gewoon 115 euro voor 1 maand huur, als ik de eerste en beste prijs online aanhoud dan zie ik hem bij bol voor 550, dus de huurprijs is zo’n 20% van de nieuwprijs, niet echt voordelig voor meenemen op vakantie
Als ik kijk naar de Switch OLED, dan is €34,90 voor 1 maand (circa 10% van de nieuwprijs).
Dat is toch best behapbaar? Als je 5 jaar lang 1x per jaar een Switch een maand huurt, zit je op €174,50. Dat is alsnog goedkoper dan de nieuwprijs en je zit niet vast aan het eerste model Switch.

Hangt blijkbaar beetje af wat je kiest en wat het vraag aanbod is? De oudere drones lijken een stuk goedkoper per maand.
@arnoudwokke Volgens mij kun je Roblox - ook beschikbaar in Nederland - classificeren als een Super App, heel veel kleine mini games, die gebruikers ook zelf kunnen maken en in de app beschikbaar kunnen maken voor anderen.
Over die glasplaat opslag:
Als iemand met een geschiedenis studie achtergrond ben ik hier heel blij mee. Ik hoop dit (ook) wordt gebruikt voor opslag van informatie die we voor een historisch archief willen bewaren. Daar klinkt het ideaal voor. Dat je informatie niet kunt overschrijven is dan juist een plus. (De juiste) papieren hebben zich de eeuwen wel bewezen, met digitale opslag moeten we dat nog maar zien. We weten in ieder gavel dat huidige opslagmedia daar ongeschikt voor zijn (en je dus met backups moet werken en regelmatig de hardware moet vervangen).
Ik vind het toch best leuk dat we nog steeds documenten hebben van samenlevingen die eeuwen en zelfs milenia geleden al in elkaar gestort zijn. Het zou wat dat betreft ook mooi zijn als je in het slechtste geval over een paar duizend jaar een archeoloog zo'n glasplaat terug terugvindt.
Archeologisch gezien lijkt mij een glasplaat voor opslag wel minder interessant. Een papieren document dat zeg 1000 jaar oud is, kun je waarschijnlijk nog wel van zien dat het tekst en informatie uit de oudheid is, maar zou je dit ook kunnen zeggen als over 1000 jaar iemand een glasplaat vind? Tenzij de technieken in die tijd vergelijkbaar zijn met de technieken van nu, is het goed mogelijk dat over 1000 jaar zo'n glasplaat eerder gezien wordt als een simpel stuk glas. En dan heb ik het er nog niet over of iemand over 1000 jaar wel enig idee heeft over hoe er informatie uit dat glas gehaald kan worden. Of hoe toekomstbestendig de informatie op zo'n opslag over 1000 jaar nog is.
We kunnen nog een hoop wat we duizend jaar geleden konden. Je weet het maar nooit, maar wat dat betreft maak ik me daar niet teveel zorgen over. Wat wel verloren is zijn individuele documenten. Het is makkelijker om een concept van iets te herinneren dan elk individuele uitvoering . Plus dat je onderzoek kunt doen en opnieuw achter informatie te komen.

Neemt niet weg dat ik het hier heb over relatief betere manieren van opslag van (digitale) informatie vergeleken met gebruikte methoden, niet over een absolute 100% zekerheid. Die ga je nooit hebben.
Ik vind het toch best leuk dat we nog steeds documenten hebben van samenlevingen die eeuwen en zelfs milenia geleden al in elkaar gestort zijn. Het zou wat dat betreft ook mooi zijn als je in het slechtste geval over een paar duizend jaar een archeoloog zo'n glasplaat terug terugvindt.
Ben ik het mee eens. Alleen ik vraag mij af of wij tegenwoordig niet veel meer data opslaan dan vroeger en is dit niet te veel om het voor een toekomstige historicus leuk te houden? Al onze anonieme berichten onder shorts (Instagram, TikTok, Youtube), reacties op Tweakers, Reddit-threads. Dan hebben we ook nog de miljoenen kattenfilmpjes.

De nieuwsartikelen inclusief de reacties van Tweakers uit het jaar 2000, vind ik soms leuk om terug te lezen. Het is een tijdcapsule met een inkijkje naar hoe mensen toen dachten en leefde (en natuurlijk een stukje nostalgie, ik ben inmiddels ook 36). Maar het is vooral heel behapbaar. Neem bijvoorbeeld (helemaal in thema opslag):
nieuws: Standaard voor recordable DVD bekendgemaakt (toen werd de bluray nog gezien als soort DVD).
nieuws: Uitstel voor Blu-ray DVD dreigt onder druk filmindustrie
Ben ik het mee eens. Alleen ik vraag mij af of wij tegenwoordig niet veel meer data opslaan dan vroeger en is dit niet te veel om het voor een toekomstige historicus leuk te houden? Al onze anonieme berichten onder shorts (Instagram, TikTok, Youtube), reacties op Tweakers, Reddit-threads. Dan hebben we ook nog de miljoenen kattenfilmpjes.
Het werk van de historicus verandert, maar dat is nu ook al, zeker als je onderzoek doet naar bepaalde periodes. Vroege middeleeuwen is de uitdaging om uberhaupt iets te vinden, maar 19e eeuw is al een ander verhaal. laat staan als je iets over de vorige eeuw wilt onderzoeken.
Wat je bijvoorbeeld tegenwoordig al een tijdje kunt doen is full text search loslaten op een bibliotheek (als de documenten gedigitaliseerd zijn natuurlijk). Laatste jaren zie je dat dit ook dat handschriftherkenning steeds beter begint te worden.
Een ander groot voordeel is dat je kwantitatief onderzoek kunt doen en zo nieuwe ontdekkingen kunt doen, of juist een geschiedkundige hypothese sterker kunt maken (of weerleggen).
En tot slot kun je het ook gebruiken voor hele nieuwe doelen dan waarvoor het ooit opgeschreven is. Een leuk voorbeeld vind ik dat oude scheepsjournaals gebruikt zijn voor het maken van weermodellen.

Hoewel die glasplaten daar niet over gaan. Ik denk dat die meer bedoeld zijn om bepaalde data die we nu belangrijk vinden duurzaam op te slaan.

[Reactie gewijzigd door PrimusIP op 23 juli 2024 09:39]

Feral Interactive heeft ook in de switch en linux wereld een stevige reputatie voor ports opgebouwd. Onder andere Alien Isolation en grid voor switch en total war en moderne tomb raiders voor linux.
Ik heb ook een aantal Feral Interactive Linux versies van bepaalde spellen gespeeld, en over het algemeen is het gewoon goed. De laatste Tomb Raiders en Alien Isolation heb ik goede herinneringen aan.
Ik ben bezig geweest met het toegankelijk maken van de data uit commoncrawl.org - alle html pagina's en PDF bestanden van de afgelopen 10 jaar - voor de organisatie waar ik werk.
--+
Side note: commoncrawl.org is de databron waarop chatGPT is getraind.
--+

Er is nu een geautomatiseerde flow waar een medewerker aangeeft van welke merknaam data nodig is, en deze wordt dan automatisch opgehaald, bewerkt en geclassificeerd zodat het beschikbaar is voor de interne AI.

Het archief bevat 92 datasets (elk volledige kopieren van alle publieke tekst op alle websites van een bepaald moment) waarvan de laatste zo'n 450TB is, elk van deze heeft een index van zo ongeveer 250GB.

Onze flow zoekt in die 92 indexen tegelijk in 30 tot maximaal 2 minuten de data die we nodig hebben, daarna wordt de data via een parallel proces met enkele honderden computers tegelijk opgehaald, bewerkt, gefilterd, ontdubbelt, geclassificeerd en klaar gemaakt voor de AI-modellen, in grofweg 10 seconden.

De indexen zijn zo extreem snel (reken maar na 92*250GB = 23TB is veel in 30 seconden), doordat ze zijn opgedeeld in stukjes, verschillende Apache Parquet bestanden en folder structuur filters. Om snel de juiste tijdsperiode, (sub 5x)domeinnaam, bestandstype etc te vinden.

De truc is ook dat ze alle bestanden achterelkaar als een paar 4.7GB grote bestanden hebben geplakt en de index als resultaat geeft welke bytes je van dat grote bestand moet downloaden. Dat scheelt weer heel veel kleine bestandjes en namen etc.

Ik verwacht dat je als je op glas archiveert - bijvoorbeeld alle internet data - dat je slimme indexen bouwd om heel snel heel precies de data op te kunnen vragen die je nodig hebt.

Op deze manier hebben we dus de data die we nodig hebben gevonden, opgehaald en klaar voor gebruik in 45 tot 130 seconden uit meer dan 30 Petabyte aan data.

Voor de mensen die nu denken, wow, dat kost veel geld. Nee, we betalen tussen de €4,- en €15,- per dag voor deze flow - incl. logging, databases etc.
De computers betalen we per milliseconde dat ze een taak uitvoeren. Vandaar dat het in kosten niets uit maakt of we we 4 of 90.000 tegelijk laten draaien. De database betalen we per verwerkte hoeveelheid data in de query. En de opslag per opgeslagen hoeveelheid data (wat hebben we gedownload).

[Reactie gewijzigd door djwice op 23 juli 2024 09:39]

Ik heb gelezen ergens dat glas eigenlijk een vloeistof is en heel langzaam verzakt. Is dit niet van invloed op de opslag?
Glas is een amorfe. Het is niet vast maar ook niet vloeibaar. Zodra je de temperatuur omhoog doet wordt het vloeibaar en bij lage temperatuur weer vast.
Een klein ding nog over piracy en dat er concurrentie is.

Er word aangehaald dat er concurrentie is onderling maar niet met hetzelfde aanbod. Je zou het kunnen vergelijken met de NS en Arriva, beide hebben treindiensten in nederland, maar het is niet alsof jou traject door NS word gedaan je naar de concurrent kan gaan en voortaan met arriva reist.

Ik wil piracy absoluut niet goed praten maar je ziet in markten zoals de muziek, dat als er meerde platforms zijn die grof weg hetzelfde aanbieden (zelfde content) de piraterij helemaal weg valt.

Overigens, er word vaak gedaan alsof piraterij van series en films gratis is maar je bent al snel wat kwijt qua stroom voor een nas, de harddisks die maar 5 jaar mee gaan zoals benoemd in de podcast, de nzb subscriptions, de usenet accounts. Voor je het weet zit je op 30 euro per maand. Mensen willen prima betalen voor gemak, de vraag met piraterij is of je de content creators dit bedrag betaald of shady sites. In de muziek wereld is het gelukt :)
Over de tycoon games gesproken. Ik speelde vandaag project highrise (voor geïnteresseerden: de spirituele opvolger van SimTower). En ik bedacht me: heeft die lading Sim en Tycoon games destijds een hele generatie nineties gamers klaargestoomd voor middenmanagement?

Op dit item kan niet meer gereageerd worden.