Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 33 reacties, 6.490 views •

Het zal niet de eerste keer zijn dat een internetbedrijf een traditioneel businessmodel om zeep helpt. Als het aan Zapaday ligt, gebeurt dat ook met nieuwsagenda's. De start-up uit Amsterdam wil een openbare nieuwskalender introduceren, waaraan iedereen informatie kan toevoegen. Organisaties betalen nu nog veel geld voor dergelijke agenda's, bijvoorbeeld om te bepalen wanneer een nieuwsaankondiging het best kan worden gedaan. Tweakers.net ging voor de vierde aflevering van Van de zolder naar de Valley op bezoek bij Zapaday.

Reacties (33)

Reactiefilter:-133032+124+29+31
Moderatie-faq Wijzig weergave
Hallo, namens Zapaday wat meer over de techniek van Zapaday. Tweakers heeft vragen gesteld over techniek aan Henk-Jan, CTO van Zapaday, maar er was een probleem met geluidsopname. Misschien is dat de reden dat we er niets van terugzien.

In het kort:
PHP, JQuery
Lazy loading, microformats
MySQL met master/slave replication, table partitioning
Memcache voor query data
Servers (apache + php + mysql slave) deels fysiek (Dell), deels vps (Tilaa, Rackspace, Denit)
Round-robin DNS load balancing
Custom crawlers en feedburners met patroonherkenning, filters, deduping
Verder SVN, Mantis. Synchronisatie van kalenders met Google Calendar, Outlook, ical/webcal.
Nu bezig met CDN en eigen Hadoop cluster (MapReduce). Op de roadmap staat overstap naar AWS/EC2 inclusief Elastic MapReduce.
Interessant om te lezen. Zijn die crawlers ook in PHP geschreven? Is het niet handiger om zoiets te coden in een taal als F# zodat je heel simpel meerdere bronnen parallel binnen kunt trekken en met regex en dergelijken kunt filteren? Moet je ook per bron aangeven hoe deze informatie er uit ziet? Op de ene site staat een titel bijvoorbeeld tussen H3 tags en op de andere tussen H4 tags. Of werken jullie daar anders om heen?

Verder vroeg ik me af welke database engine jullie gebruiken. Ik kan me voorstellen dat bijvoorbeeld COUNT operaties heel traag zijn met InnoDB.
Onze news scanners crawlen met PHP, met regexp, parallel, gaat prima. Voor sommige (belangrijke) bronnen geven we inderdaad specifiek aan welke tags gescraped moeten worden en hoe. Voor deduping, sociale functies en analytics gaan we naar MapReduce.

InnoDB is idd trager. We scheiden opslag en weergave tabellen, met redundante weergave-tabellen. Tellers zijn voorberekend/geaggregeerd en worden regelmatig herberekend.
Goed concept alleen ik denk dat de informatie waardevoller is. Dus niet het zelf publiceren maar het distribueren van de informatie cq verkopen. Heb het namelijk ook wel eens gehad, ging ik naar Rome en dan wil je toch weten zijn er nog festiviteiten of wordt er nog gevoetbald. Als je die info weet te bundelen en dat bijv. kan aanbieden aan reisorganisatie naast de reis kan je een leuke cent verdienen. Zorg jij gewoon dat je de app levert.

Edit: woord vergeten ;)

[Reactie gewijzigd door florosas op 15 oktober 2011 16:42]

Inderdaad. Als bedrijven voor bepaalde onderwerpen / plaatsen etc. alle punten die gaan gebeuren daar of over dat ding willen hebben, overzichtelijk in een plaats, dat je dat aan kunt gaan bieden voor geld, of een maandelijkse fee, zodat je elke maand / of meermaals per maand een update daar over krijgt.

Ze kunnen het ook zelf zoeken op de site, maar als je dit goed uitwerkt en netjes weet te bundelen is hier volgens mij wel redelijk wat geld mee te verdienen.

Ik moet alleen eerst nog eens zien hoe ze dit gaan aanpakken ( het hele concept an sich ), idee is mooi. Maar hoe gaan ze met alle data om die ze straks krijgen, de verwachting is in ieder geval dat ze een hele hoop te verwerken krijgen. Word alles handmatig gecontroleerd, of laat je bepaalde accounts standaard door met af en toe een willekeurige steekproef op betrouwbaarheid.
Zo zijn er nog wel wat punten te vinden, maar ik geloof wel dat ze hier over na hebben gedacht :)

Het idee klinkt in ieder geval erg goed, en ben dan ook zeer benieuwd hoe dit gaat uitpakken in de toekomst.
Gewoon met een spider, de informatie staat op het web het enige wat je nog moet doen is het in een database krijgen. Wat je bedrijven en organisatie's wel kunt laten doen is het toevoegen van informatie. Dit kan dan tegen betaling bijvoorbeeld Daarnaast kun je ook nog dingen pushen tegen betaling, het voordeel van deze info is dat er relatief makkelijk geld mee te verdienen valt. . Dit concept mits het goed uitgewerkt word is goud waard in mijn ogen.
Interessant concept. Als iemand op zoek is naar een specifieke onderwerp, dan is waarschijnlijk Google de grootste concurrent..

Als je zoekt in Google naar

"when does battlefield 3 come out"

Geeft Google zelf als antwoord:

"Best guess for Battlefield 3 Release Date is October 25, 2011
Mentioned on at least 4 websites including bf3blog.com, gamestop.com and enterbf3.com - Show sources - Feedback"

Maar een site die de toekomst categoriseert klinkt als een interessant concept.
Al zie ik nog niet helemaal het verdien model, maar ik heb ook geen verstand van die business.


Geheel offtopic.. Maar zit hier in het buitenland op een trage internet verbinding.. Na 20 minuten bufferen eindelijk ingeladen, ik zet hem fullscreen.. Springt ie naar 'HD' waardoor het bufferen weer van voor af aan begint.. AAARGH :(

[Reactie gewijzigd door pim op 15 oktober 2011 19:22]

Als je de Battlefield 3 release date wilt weten kun je beter gewoon iets als "battlefield 3 release date" intikken op Google. Een zoekmachine is geen mens waar je in volle zinnen tegen moet praten ;)
Ik ben normaal wel positief over ondernemende mensen, maar dit concept vind ik niet erg overtuigend. En waarschijnlijk binnenkort al overbodig.

De groep die op een bepaalde datum gaat zoeken lijkt mij wat klein. Hij noemt wel een aantal beroepen die het nuttig kunnen inzetten, maar dan kom je met het tweede probleem: je moet wel compleet zijn.
Bij Google ben je er zeker van dat alle data erin staan (want Google indexeert praktisch het volledige internet). Bij dit concept zullen de gegevens nooit zo compleet zijn.

Verdienmodel is ook wat slap voor een club die al drie jaar bezig zijn en nog in alpha zitten.

Ik hoop voor ze dat ze snel cashen en niet te lang wachten. Onderdeel van HTML5 is Microdata. Dat zorgt er voor dat je de inhoud van je HTML pagina nog verder gaat beschrijven zodat het beter te interpreteren is voor een geautomatiseerd proces. Zo kun je bij een straatnaam en woonplaats aangeven dat het om een adres gaat, bij een naam dat het om een persoon gaat, bij een filmtitel dat het een film is enzovoort. Zie ook Wikipedia. En hetzelfde geldt voor datums. Combineer die zaken en Google's natte droom komt uit, nog gerichter zoeken. Het zal nog even duren voordat websites dit massaal ondersteunen, maar ik zet in op Microdata+Google en niet een losse bron waarbij je maar mag hopen dat het completer is.
volledig mee eens, op zich was het idee goed, maar op dit moment zie ik er de meerwaarde niet zo zeer van. naast het feit dat hun winstgevendheid twijfelachtig is, is ook de trage ontwikkeling wel een probleem. hij heeft mij niet echt ge´nteresseerd kunnen krijgen ondanks het feit dat het er nu niet is. zapaday vind ik trouwens wel een erg "corney name", een erg gedwongen toekomstig populaire naam.
Volgens mij is dit zo'n soort bedrijf waar bv. een Google of Microsoft zeer veel interesse in gaan tonen als het echt draait. Het doel van Google is om ALLE informatie ooit te vergaren, dus ook waarschijnlijk events die in de toekomst gaan plaatsvinden, 't zou me dus niet verbazen mocht Google dit bedrijf ooit willen overnemen en integreren in hun searches.

M'n 2de punt.. 't is een leuk en goed concept, de beta zal zeker een serieuse maturiteit hebben, want er is echt wel serieus werk in gestoken, alleen vind ik de naam enorm slecht, kan er wel iets uit opmaken, maar ik denk als je het aan 100 mensen gaat vragen, dat bijna niemand kan zeggen.. ah.. dat kan je vinden op die site en dat vind ik best wel jammer.
Jammer dat er in deze video niks vertelt over de techniek achter Zapaday :'(
Het viel mij ook al op dat ze een stuk geslotener deden over de inhoud.
In de andere filmpjes werden ook wat scripters gesproken, hier totaal niet... :X
Zo interessant vind ik het eerlijk gezegt niet.. Leuk om ff tussendoor te horen dat het een LAMP config is bijvoorbeeld.. Maar bijvoorbeeld wat voor database ze gebruiken.. Alle databases voldoen prima.. Tenzij het echt een mega project zou zijn een service hosten als Gmail, dan is de technologie erachter interessant.. Maar voor websites die voorlopig nog op een server draaien..

[Reactie gewijzigd door pim op 15 oktober 2011 19:58]

Dit lijkt me een hele handig tool, zelf zit ik vaak zat te zoeken naar bijvoorbeeld de startdatum van een nieuwe seizoen van een televisie show. En zo zijn er nog wel tal van dingen die ik kan bedenken waar ik graag van op de hoogte wordt gebracht. Hopelijk kan dit allemaal met zapaday, want dan ga ik het denk ik zeker gebruiken.
Daarvoor heb je TVrage.com.
Als je XBMC gebruikt helemaal ideaal, icm TVRage addon zie je direct wanneer de volgende aflevering of seizoen wordt uitgezonden en of een serie is geannuleerd. Vooral dat is handig aangezien bijna alle goeie series worden geannuleerd, handig om te weten.
Da's dus weer een aparte dienst... dit zou een combinatie van heel veel informatie kunnen worden, dan moet je het alleen nog op een overzichtelijke manier zien weer te geven zodat iedereen kan vinden wat hij/zij zoekt...

Lijkt mij wel een idee met potentie...
Ik vind dit tot nu toe ook zeker niet het beste filmpje. Wordt een aantal keer bijna hetzelfde verteld en te weinig details vrijgegeven. Jammer, maar kijk wel weer uit naar het volgende filmpje!

Vraag me trouwens sterk af in hoeverre dit concept de lange voorbereiding en investering er op korte termijn weer uit kan halen. Ik vind het businessmodel niet echt heel vooruitstrevend... Toch benieuwd hoe de beta er uit komt te zien!
Ik mis het grote winstplan hier ook een beetje in, meerwaarde van het concept zal er voor sommige mensen ongetwijfeld zijn, al haal ik de relevante 'data' gewoon van niche/branche webistes, en zal vermoedelijk hun site niet gaan gebruiken.
Wat mij opvalt is dat alle ontwikkelaars nogal schrale werkplekken hebben. Iedereen lijkt op een laptop te werken met maar 1 scherm, en sommige mensen werken niet eens op een los keyboard+muis. Lijkt me redelijk waardeloos werken als je daar 5 dagen per week mee aan de slag moet.

Ook wel opvallend dat ze dus al 3 jaar bezig zijn, en al met een 2e investeringsronde bezig zijn, terwijl er nog geen dubbeltje omzet is gemaakt. Zelfs als het dan succesvol wordt, hebben ze waarschijnlijk bij voorbaat het grootste gedeelte van het bedrijf al verkocht voordat ze begonnen zijn. (waarbij je er vanuit mag gaan dat ale het geld van de investering in het bedrijf zit en de oprichters dus niet veel overhouden)
Persoonlijk vind ik dit in tegenstelling tot andere reageerders dit concept redelijk kansloos, ik denk dat dit een van velen is.

Ik bedoel Het idee is al meer dan 3 jaar oud -> Dan had je er toen dus gelijk in moeten springen + er wat van maken.

Nu vind ik dit een beetje achterhaald en vraag ik me af of dit niet inmiddels al bestaat..? Google + anyone?

[Reactie gewijzigd door 3DDude op 16 oktober 2011 02:18]

Ik twijfel ook idd, kan een hierop handig inspelend bedrijf niet hetzelfde maken doen met een Facebook App? Waarbij ze dan gelijk een potentiele 500 miljoen toch al geregistreerde gebruikers hebben? Wat mond op mondreclame en (video) reviews en er hebben zich zo tien/honderdduizenden gebruikers aangemeld.

Datzelfde zie ik bij Zapaday niet zo snel gebeuren.
Klinkt als een goed en veelbelovend concept, maar ik vraag me af of de web 2.0 insteek die uitgaat van user generated content, wel zo'n succes wordt. De vraag zal zijn hoe ver dit gaat, kan bijvoorbeeld iedereen zomaar data van een 'event' aanpassen, of de omschrijving? En hoe gaan ze dat in godsnaam managen met zo'n klein team, zeker als ze al de gescrapte data moeten checken.

Op dit item kan niet meer gereageerd worden.



LG G4 Battlefield Hardline Samsung Galaxy S6 Edge Microsoft Windows 10 Samsung Galaxy S6 HTC One (M9) Grand Theft Auto V Apple iPad Air 2

© 1998 - 2015 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True