Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door Jeffrey van Maurik

Van de zolder naar de Valley: Zapaday (video)

15-10-2011 • 16:20

33 Linkedin Google+

Het zal niet de eerste keer zijn dat een internetbedrijf een traditioneel businessmodel om zeep helpt. Als het aan Zapaday ligt, gebeurt dat ook met nieuwsagenda's. De start-up uit Amsterdam wil een openbare nieuwskalender introduceren, waaraan iedereen informatie kan toevoegen. Organisaties betalen nu nog veel geld voor dergelijke agenda's, bijvoorbeeld om te bepalen wanneer een nieuwsaankondiging het best kan worden gedaan. Tweakers.net ging voor de vierde aflevering van Van de zolder naar de Valley op bezoek bij Zapaday.

Reacties (33)

Wijzig sortering
Hallo, namens Zapaday wat meer over de techniek van Zapaday. Tweakers heeft vragen gesteld over techniek aan Henk-Jan, CTO van Zapaday, maar er was een probleem met geluidsopname. Misschien is dat de reden dat we er niets van terugzien.

In het kort:
PHP, JQuery
Lazy loading, microformats
MySQL met master/slave replication, table partitioning
Memcache voor query data
Servers (apache + php + mysql slave) deels fysiek (Dell), deels vps (Tilaa, Rackspace, Denit)
Round-robin DNS load balancing
Custom crawlers en feedburners met patroonherkenning, filters, deduping
Verder SVN, Mantis. Synchronisatie van kalenders met Google Calendar, Outlook, ical/webcal.
Nu bezig met CDN en eigen Hadoop cluster (MapReduce). Op de roadmap staat overstap naar AWS/EC2 inclusief Elastic MapReduce.
Interessant om te lezen. Zijn die crawlers ook in PHP geschreven? Is het niet handiger om zoiets te coden in een taal als F# zodat je heel simpel meerdere bronnen parallel binnen kunt trekken en met regex en dergelijken kunt filteren? Moet je ook per bron aangeven hoe deze informatie er uit ziet? Op de ene site staat een titel bijvoorbeeld tussen H3 tags en op de andere tussen H4 tags. Of werken jullie daar anders om heen?

Verder vroeg ik me af welke database engine jullie gebruiken. Ik kan me voorstellen dat bijvoorbeeld COUNT operaties heel traag zijn met InnoDB.
Onze news scanners crawlen met PHP, met regexp, parallel, gaat prima. Voor sommige (belangrijke) bronnen geven we inderdaad specifiek aan welke tags gescraped moeten worden en hoe. Voor deduping, sociale functies en analytics gaan we naar MapReduce.

InnoDB is idd trager. We scheiden opslag en weergave tabellen, met redundante weergave-tabellen. Tellers zijn voorberekend/geaggregeerd en worden regelmatig herberekend.
Goed concept alleen ik denk dat de informatie waardevoller is. Dus niet het zelf publiceren maar het distribueren van de informatie cq verkopen. Heb het namelijk ook wel eens gehad, ging ik naar Rome en dan wil je toch weten zijn er nog festiviteiten of wordt er nog gevoetbald. Als je die info weet te bundelen en dat bijv. kan aanbieden aan reisorganisatie naast de reis kan je een leuke cent verdienen. Zorg jij gewoon dat je de app levert.

Edit: woord vergeten ;)

[Reactie gewijzigd door florosas op 15 oktober 2011 16:42]

Inderdaad. Als bedrijven voor bepaalde onderwerpen / plaatsen etc. alle punten die gaan gebeuren daar of over dat ding willen hebben, overzichtelijk in een plaats, dat je dat aan kunt gaan bieden voor geld, of een maandelijkse fee, zodat je elke maand / of meermaals per maand een update daar over krijgt.

Ze kunnen het ook zelf zoeken op de site, maar als je dit goed uitwerkt en netjes weet te bundelen is hier volgens mij wel redelijk wat geld mee te verdienen.

Ik moet alleen eerst nog eens zien hoe ze dit gaan aanpakken ( het hele concept an sich ), idee is mooi. Maar hoe gaan ze met alle data om die ze straks krijgen, de verwachting is in ieder geval dat ze een hele hoop te verwerken krijgen. Word alles handmatig gecontroleerd, of laat je bepaalde accounts standaard door met af en toe een willekeurige steekproef op betrouwbaarheid.
Zo zijn er nog wel wat punten te vinden, maar ik geloof wel dat ze hier over na hebben gedacht :)

Het idee klinkt in ieder geval erg goed, en ben dan ook zeer benieuwd hoe dit gaat uitpakken in de toekomst.
Gewoon met een spider, de informatie staat op het web het enige wat je nog moet doen is het in een database krijgen. Wat je bedrijven en organisatie's wel kunt laten doen is het toevoegen van informatie. Dit kan dan tegen betaling bijvoorbeeld Daarnaast kun je ook nog dingen pushen tegen betaling, het voordeel van deze info is dat er relatief makkelijk geld mee te verdienen valt. . Dit concept mits het goed uitgewerkt word is goud waard in mijn ogen.
Interessant concept. Als iemand op zoek is naar een specifieke onderwerp, dan is waarschijnlijk Google de grootste concurrent..

Als je zoekt in Google naar

"when does battlefield 3 come out"

Geeft Google zelf als antwoord:

"Best guess for Battlefield 3 Release Date is October 25, 2011
Mentioned on at least 4 websites including bf3blog.com, gamestop.com and enterbf3.com - Show sources - Feedback"

Maar een site die de toekomst categoriseert klinkt als een interessant concept.
Al zie ik nog niet helemaal het verdien model, maar ik heb ook geen verstand van die business.


Geheel offtopic.. Maar zit hier in het buitenland op een trage internet verbinding.. Na 20 minuten bufferen eindelijk ingeladen, ik zet hem fullscreen.. Springt ie naar 'HD' waardoor het bufferen weer van voor af aan begint.. AAARGH :(

[Reactie gewijzigd door pim op 15 oktober 2011 19:22]

Ik ben normaal wel positief over ondernemende mensen, maar dit concept vind ik niet erg overtuigend. En waarschijnlijk binnenkort al overbodig.

De groep die op een bepaalde datum gaat zoeken lijkt mij wat klein. Hij noemt wel een aantal beroepen die het nuttig kunnen inzetten, maar dan kom je met het tweede probleem: je moet wel compleet zijn.
Bij Google ben je er zeker van dat alle data erin staan (want Google indexeert praktisch het volledige internet). Bij dit concept zullen de gegevens nooit zo compleet zijn.

Verdienmodel is ook wat slap voor een club die al drie jaar bezig zijn en nog in alpha zitten.

Ik hoop voor ze dat ze snel cashen en niet te lang wachten. Onderdeel van HTML5 is Microdata. Dat zorgt er voor dat je de inhoud van je HTML pagina nog verder gaat beschrijven zodat het beter te interpreteren is voor een geautomatiseerd proces. Zo kun je bij een straatnaam en woonplaats aangeven dat het om een adres gaat, bij een naam dat het om een persoon gaat, bij een filmtitel dat het een film is enzovoort. Zie ook Wikipedia. En hetzelfde geldt voor datums. Combineer die zaken en Google's natte droom komt uit, nog gerichter zoeken. Het zal nog even duren voordat websites dit massaal ondersteunen, maar ik zet in op Microdata+Google en niet een losse bron waarbij je maar mag hopen dat het completer is.
Volgens mij is dit zo'n soort bedrijf waar bv. een Google of Microsoft zeer veel interesse in gaan tonen als het echt draait. Het doel van Google is om ALLE informatie ooit te vergaren, dus ook waarschijnlijk events die in de toekomst gaan plaatsvinden, 't zou me dus niet verbazen mocht Google dit bedrijf ooit willen overnemen en integreren in hun searches.

M'n 2de punt.. 't is een leuk en goed concept, de beta zal zeker een serieuse maturiteit hebben, want er is echt wel serieus werk in gestoken, alleen vind ik de naam enorm slecht, kan er wel iets uit opmaken, maar ik denk als je het aan 100 mensen gaat vragen, dat bijna niemand kan zeggen.. ah.. dat kan je vinden op die site en dat vind ik best wel jammer.

Op dit item kan niet meer gereageerd worden.


Apple iPhone 11 Nintendo Switch Lite LG OLED C9 Google Pixel 4 FIFA 20 Samsung Galaxy S10 Sony PlayStation 5 Smartphones

'14 '15 '16 '17 2018

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2019 Hosting door True