Hoofdcategorieën
Device Settings

Zoekmachines helpen ontwikkelaars data te structureren

Door Joost Schellevis, vrijdag 3 juni 2011 14:16, views: 14.028

Google, Bing en Yahoo werken samen om ontwikkelaars te helpen data te structureren. Met html-attributen kunnen webdevelopers de context van gegevens specificeren door aan te geven om wat voor informatie het gaat.

Ontwikkelaars kunnen aan html-elementen microdata-attributen toevoegen, waarmee ze kunnen aangeven welke soort informatie wordt weergegeven. Op dit moment is microdata nog een concept-document en geen W3C-standaard, maar Google, Bing en Yahoo hebben toegezegd het formaat te gaan ondersteunen. De drie zoekmachines hebben samen een website opgezet om ontwikkelaars te ondersteunen bij het inzetten van microdata.

Onder meer informatie over organisaties, gebeurtenissen, personen en locaties kan worden toegevoegd, waarbij specifieke informatie kan worden onderverdeeld. Zo kan iemands naam of telefoonnummer van het relevante attribuut worden voorzien, zodat zoekmachines begrijpen dat het om dergelijke informatie gaat. Ook informatie over films, boeken en tv-series kan worden gespecificeerd, waarbij informatie zoals de releasedatum en uitgever kan worden toegevoegd.

Het is niet de eerste keer dat Microsoft, Google en Yahoo samenwerken. In 2006 kondigden de drie zoekmachines ondersteuning voor sitemaps aan, een door Google ontwikkelde standaard om de directorystructuur van websites in kaart te brengen. Microsoft en Yahoo werken bovendien hecht samen; Yahoo gebruikt technologie van Microsoft voor zijn zoekmachine.

schema.org

Volgende 14:52 Computex: Zalman toont concept-behuizingen
Vorige 13:50 E3: Tomb Raider verschijnt in najaar 2012
Advertentie

Reacties

«  1  2  »

Heel goed dit. Op deze manier wordt het voor gebruikers makkelijker om de informatie te zoeken die ze willen, en de zoekmachines zelf zullen sneller te werk kunnen gaan lijkt me

Sneller te werk gaan lijkt me niet, eerder het omgekeerde want de microdata moet geanalyseerd worden (voor zover de eindgebruiker er iets van merkt natuurlijk). De zoekresultaten zullen hopelijk wel relevanter zijn.

Tegenover het zelf proberen uit te vogelen of iets een telefoonnummer, ISBN of random cijferreeks is, is dat dit weer wel sneller ;)

Waarbij je aanneemt dat de "oude methode" (die jij omschrijft) komt te vervallen. Ik neem echter aan (assumptions...) dat de "nieuwe methode" naast/op de "oude methode" wordt toegepast; immers: het zal nog jaren (zo niet decennia) duren voordat iedereen deze metadata gaat gebruiken.

En dan zet ik nog mijn vraagtekens bij hoe "eerlijk" men dit gaat gebruiken. Ik heb nu al een vaag vermoeden dat er allerlei "shady" figuren hier misbruik van gaan maken. Misbruik als in: bepaalde metadata toevoegen die 'onjuist' is om zo toch maar gevonden worden; net zoals het zich in de nineties nog loonde je metatags vol te douwen met populaire zoektermen toen er alleen nog maar meta-zoekmachines waren.

/edit:
Ah, ik zie dat mijn collega dat mooier verwoordde :P
In z'n algemeenheid voorzie ik in microdata wel veel potentie voor blackhat SEO's die nu allerlei truukjes kunnen bedenken om bepaalde context aan woorden te hangen die wel of niet relevant zijn voor een bepaalde pagina :)

[Reactie gewijzigd door RobIII op vrijdag 3 juni 2011 15:11]


het zal nog jaren (zo niet decennia) duren voordat iedereen deze metadata gaat gebruiken.
Ik had juist gedacht aan enkele maanden tot enkele jaren. Zeker ook met Googles chromebook in het achterhoofd. Ik meen me namelijk te herinneren dat ze het voor doorsnee gebruikers gemakkelijker gaan maken een website te bouwen. Waarom denk je zo lang?
En dan zet ik nog mijn vraagtekens bij hoe "eerlijk" men dit gaat gebruiken.
Dat is alleen van toepassing op heel erg commerciële websites. Internet is meer dan een marktplaats, zeker ook in de toekomst als steeds meer menselijke behoeften worden vervuld en versimpeld.

Ik had juist gedacht aan enkele maanden tot enkele jaren.
Het web is nog vergeven van de HTML3.0 websites, DHTML scriptjes die allerlei kwinkslagen maken voor Netscape 3 en ga zo maar door. Nee, dat gebeurt niet in een paar maanden of jaren. Was 't maar zo mooi :P
Zeker ook met Googles chromebook in het achterhoofd.
Wat heeft een chromebook er mee van doen? Als 't al eens een relevant marktaandeel krijgt zie ik nog niet hoe een "laptop"/"netbook"/"you_name_it" hier relevant is behalve dat er Chrome op draait...
Ik meen me namelijk te herinneren dat ze het voor doorsnee gebruikers gemakkelijker gaan maken een website te bouwen.
Alsof dat alleen van toepassing is op een chromebook :?
Dat is alleen van toepassing op heel erg commerciële websites.
Juist niet; het zal "misbruikt" worden door de shady types; porno, viagra en ga zo maar door. De grote commerciële sites zullen, als ze het al toepassen, proberen zo correct mogelijk toe te passen.
Internet is meer dan een marktplaats, zeker ook in de toekomst als steeds meer menselijke behoeften worden vervuld en versimpeld.
En dat slaat op je betoog omdat... :? Ik zie 't even niet, sorry.

Euhm was XML/XHTML hier niet voor bedoeld?

Dat is inderdaad zo. Maar aangezien XHTML en XML niet de algemene standaard (geworden) zijn, is het ook nuttig om andere standaarden te voorzien van een "infosysteem" lijkt mij.

html geeft niet veel informatie weg, met html 5 wel wat meer maar je kan bijvoorbeeld niet op een eenduidige manier aangeven wat de contactgegevens van een bedrijf zijn, of een kalender van evenementen publiceren, enz.

Met microdata en met name rdfa kan je dat wel. Het gaat hier om het absoluut 100% nauwkeurig en gedetailleerd in kaart brengen van informatie, op zo'n manier dat applicaties het ook kunnen begrijpen en vooral linken.

Een bekend voorbeeld is rss. Door in plaats van alleen zomaar op een pagina je nieuws neer te kwakken kun je een rss feed aanbieden waarin de informatie heel precies beschreven wordt. Dat is leuk, want dan kunnen allerlei applicaties er veel meer mee, zoals je waarschijnlijk wel weet. Dit is alleen mogelijk doordat rss een standaard is die applicaties kunnen snappen, met generieke xml heb je dat nog niet.

Het voordeel van microdata / rdfa is dat het in de pagina zelf verwerkt kan worden, je hoeft hier dus niet zoals bij rdf een losstaand document aan te bieden.

[Reactie gewijzigd door Antipater op vrijdag 3 juni 2011 14:57]


Je bent misschien in de war met RDF/XML, een weergaveformaat voor RDF dat bestaat naast RDFa. In Drupal kun je HTML-tags met rdfa attributen semantisch definiëren. Vervolgens zet het CMS die gegevens (als aan de juiste eisen is voldaan) in de database weg als RDF. Daardoor kan de data ook worden uitgeschreven in andere RDF-formaten, bijvoorbeeld RDF/XML of Turtle. Uit de reactie van Grauw leid ik af dat de term Microdata in dit artikel slaat op weer een ander weergaveformaat. Het zijn allemaal verschillende RDF-interfaces.

Edit: ik had microdata verkeerd geïnterpreteerd. Ik dacht dat het een verzamelterm was maar het is gewoon een alternatief voor rdfa.

[Reactie gewijzigd door whatdoesitwant op zondag 5 juni 2011 12:07]


Op dit moment is microdata nog een concept-document en geen W3C-standaard, maar Google, Bing en Microsoft hebben toegezegd het formaat te gaan ondersteunen.
Ik dacht dat de zoekmachine Bing eigendom was van Microsoft en dat wanneer moederbedrijf Microsoft iets aanvaard, dochter Bing dat ook zal moeten doen.

Het is een goede algemene ontwikkeling voor het web om ontwikkelaars data te helpen structureren. Bijgevolg zullen de zoekmachines ook beter hun weg doorheen hun sites vinden en zo efficiënter met minder rekenwerk de juiste informatie kunnen leveren.

Dat zal waarschijnlijk een typfoutje zijn en zou: Google, Bing en Yahoo moeten zijn zoals in de hoofding wordt aangegeven.

On topic:
Een hele goede ontwikkeling vind ik dit! De pageranking tactics die Google gebruikt vind ik toch maar een vrij ingewikkelde bedoening om jou pagina beter te laten scoren in searches.

Is een typo en reeds doorgegeven...

[...]

Ik dacht dat de zoekmachine Bing eigendom was van Microsoft en dat wanneer moederbedrijf Microsoft iets aanvaard, dochter Bing dat ook zal moeten doen.
Waarschijnlijk bedoelen ze hier iplv Bing of Microsoft ook Yahoo, zoals de titel ook illustreerd. Die 3 zijn toch de grote jongens op dat gebied.

Erg bewerkelijk lijkt me, maar een goed idee! Zo kan informatie beter gekoppeld worden aan een specifiek onderwerp en zodoende beter doorzocht worden.

Ik ben erg benieuwd wat ze hier van gaan maken. Het doet me ergens ook denken aan het <section>, <article> idee van HTML5

idd, maar ipv het toevoegen van nog meer tags aan de HTML standaard doet Microformats het met specifieke attribuutwaarden - een iets lossere standaard, zeg maar.

Het is juist de combinatie van de semantiek in HTML5 + microformats die een bijzonder goed resultaat kan geven de zoekmachines lijkt me.

<section> en <article> zijn meer bedoeld om duidelijker te maken hoe de pagina is opgebouwd (een screenreader zou bv. een optie kunnen bieden om beginnen te lezen vanaf het eerste niet header en footer element, of een browser die aan de hand van de <nav>s (evt. genest in <section>s) een outline kan genereren). Daarentegen is microdata bedoeld om op een hele gestructureerde manier informatie op te geven. Een voorloper (volgensmij) van microdata ware microformats, daarbij ging het puur om class namen. Een element met class="product" waarin een element met class="price" staat, weten de zoekmachines redelijk zeker van dat het de prijs van het product zal zijn. Het zou dan ook onzinnig zijn om voor alles waaraan je een semantische waarde kunt toekennen een eigen tag te maken. Een <price>10.00</price> heeft geen voordeel boven een <span class="price">10</span>.

hoe verschilt dit tov ARIA? zeker met het kunnen linken van elementen aan elkaar lijkt mij ARIA krachtiger.

Kijk, een beetje impuls aan het Semantic Web. Het is niet bepaald OWL, maar het heeft zeker weg van RDF en met die schema's hebben niet alleen zoekmachine's profijt.

http://en.wikipedia.org/wiki/Semantic_Web

Een vrij oud concept in een nieuwe jasje laten we hopen dat het deze keer aanslaat

Dit is wel een grote stap richting beter zoekresultaten, vraag me wel af hoeveel problemen je op je nek haalt als je site voorziet van al deze niet standaard attributen. Kan me voorstellen dat niet elke browser er even goed mee omgaat.

Ik denk wel dat de gemiddelde browser onbekende attributen simpelweg negeert. Het zijn immers slechts attributen.

Klopt, dit geldt voor alle browsers. HTML validators zullen er misschien eerst nog even over zeuren omdat het geen officiële standaard is, maar dat hoeft niemand tegen te houden naar mijn idee.

Ik denk juist dat de browsers er wel goed mee zullen kunnen omgaan;
Google heeft Chrome en Microsoft heeft Internet Explorer. Die twee browsers beslaan toch wel een groot deel van de browsermarkt.

http://arstechnica.com/web/news/2011/05/web-browser-market-share-upgrade-analysis.ars

Het is goed dat Google en Microsoft deze voorstellen doen omdat zij de machtigste bedrijven zijn in www-land en zo het web naar een hoger niveau kunnen tillen.

Ik vind dit een rare titel bij het artikel. Het is toch juist dat de ontwikkelaars de zoekmachines helpen?

Microdata-attributen en de working draft wordt door W3C en de HTML WG opgezet en onderhouden en de toezegging is alleen dat zoekmachines dit gaan ondersteunen.

Terecht lijkt me want zoekmachines willen namelijk context kunnen herleiden uit content. Hoe meer de ontwikkelaar dat doet (gestandaardiseerd wel te verstaan), hoe makkelijk het wordt voor zoekmachines, hoe simpeler het wordt om onderlinge relaties te leggen, zonder dat je daar extra algoritmes voor hoeft te bedenken.

In z'n algemeenheid voorzie ik in microdata wel veel potentie voor blackhat SEO's die nu allerlei truukjes kunnen bedenken om bepaalde context aan woorden te hangen die wel of niet relevant zijn voor een bepaalde pagina :)

Het is een wederkerige relatie. Ik geloof dat de titel van het artikel slaat op de website schema.org, die heel letterlijk ontwikkelaars helpt met het gebruik van microdata.

Als google jouw reviews, blogs of evenementen beter weet te vinden en presenteren dan ben je daar als ontwikkelaar mee geholpen omdat het jouw content toegankelijker maakt.

Het is misschien beter voor de zoeker en waarschijnlijk sneller voor de zoekgiganten maar denk niet dat veel web-ontwikkelaars hun website gaan aanpassen aangezien ze met huidige methodes al een goede index van je website kunnen maken

Er kan sowieso rekening mee gehouden worden bij de bouw van nieuwe sites. En bestaande sites kunnen ermee worden verbeterd. Voor grotere bedrijven kan ik me best voorstellen dat dit uit kan.

De kracht van deze microformats zal de komende jaren namelijk alleen maar toenemen. Je ziet bijvoorbeeld nu al dat Google bepaalde stukjes informatie van je site heel specifiek kan vinden, zoals een recensie-cijfer, en die op de resultatenpagina kan weergeven. Ook kernzaken als openingstijden, contactpersonen enzovoort komen met microformats direct en duidelijk beschikbaar voor zoekmachines. Dat soort zaken kunnen enorm krachtig zijn en kunnen, mits handig ingezet, voor een flinke omzet-boost zorgen.

[Reactie gewijzigd door geert1 op vrijdag 3 juni 2011 15:01]


Als blijkt dat de zoekmachines je site een hogere ranking geven als je dit veelvoudig toepast zou het wel eens heel snel kunnen aanslaan :Y)
SEO
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 14:52 Computex: Zalman toont concept-behuizingen
Vorige 13:50 E3: Tomb Raider verschijnt in najaar 2012
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011