Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Adobe helpt zoekmachines om dynamische flashcontent te indexeren

Adobe heeft aangekondigd dat het met Google en Yahoo gaat samenwerken om flashcontent op websites en in rich internet applications beter te indexeren. Google heeft de technologie al in gebruik genomen.

Macromedia Flash-logoFlashcontent op dynamische websites blijkt door zoekmachines lastig te indexeren, met als gevolg dat dergelijke informatie moeilijk of niet vindbaar is. Rich internet applications hebben te kampen met hetzelfde euvel. Adobe heeft nu 'geoptimaliseerde' versies van zijn flashtechnologie aan Google en Yahoo geleverd om dit probleem aan te pakken.

De software, bestaande uit een serie api's, is een aanvulling op de Google-spidersoftware met als doel om swf-bestanden beter te kunnen doorzoeken. De huidige spiders kunnen weliswaar statische informatie als tekst en hyperlinks uit flashcontent destilleren, maar dynamische content bleef tot nu toe onzichtbaar voor de webcrawlers. Een gemuleerde browsersessie, waarbij dynamische flashcontent wordt ingeladen, moet de content voor de spiders toegankelijk maken.

Adobe heeft laten weten dat ontwikkelaars van flashcontent en rich internet applications niets aan hun code hoeven te veranderen. Google zal naar verwachting al deze week de vers geïndexeerde flashcontent voor het grote publiek doorzoekbaar maken. Yahoo zal de Adobe-technologie in een toekomstige versie van zijn zoekmachine gaan verwerken. Adobe heeft overigens nog geen overeenkomst met Microsoft kunnen sluiten en de techniek zal voorlopig dan ook niet in de Live Search-zoekmachine opduiken.

Door

Redacteur

42 Linkedin Google+

Reacties (42)

Wijzig sortering
Dit is niet erg goed nieuws voor visueel gehandicapten. Als Google Flash gaat indexeren is er minder nut voor een cht toegankelijke HTML-versie, en raken de visueel gehandicapten de dupe hiervan. Hopelijk komt Adobe ook met hulp voor developers van screen readers. Ik vermoed echter van niet, want commercieel is dat veel minder interessant.
Flash ondersteunt gewoon de verschillende Accessibility interfaces voor de browsers. Tja, als de ontwikkelaar hier niks mee doet... Maar ja, dat probleem heb je bij html applicaties ook als ze niet aangeven wat/wel niet een knop is e.d.

[Reactie gewijzigd door alienfruit op 2 juli 2008 18:18]

Ik ben erg benieuwd hoe ze dit voor elkaar spelen. Zal de "browser" de dynamische content ophalen doormiddel van het klikken op regionen en dan te kijken wat er veranderd in het geheugen? Of zou die (net als een programma als fidler) als proxy tussen de flash app en het internet fungeren om zo de responses uit te lezen

Ik kan me niet voorstellen dat iedere site namelijk even makkelijk te indexeren is. Stel je hebt 10 knoppen die iets doen naast elkaar (menu) dan kan ik me voorstellen dat ie die allemaal aanklikt. Maar een site als b.v. Dance valley (net gezien, erg mooi) lijkt me al een stuk lastiger..

Verder ben ik ook benieuwd, indien ze bijvoorbeeld de scritps uitlezen (welke frames worden aangeroepen en die dan afsprelen), in hoevere "afgesloten" content dan niet perongeluk naar voren komt.


Oh nog wel 1tje... ok stel hij vind de resultaten, hoe zorgt google dan dat je bij het aanklikken op het juiste deel terecht komt? Of moet je dan zelf eerst de hele rits aanknoppen moeten afklikken om het te vinden...

[Reactie gewijzigd door ultimasnake op 1 juli 2008 13:03]

Ik ben benieuwd of dit tot een verandering in opstelling van met name Google leidt. Een aantal jaren geleden waren Flash websites enorm populair vanwege de mogelijkheden, die het gaf voor wat betreft vormgeving en dynamiek.

Google heeft om wat voor reden dan ook deze websites links laten liggen, waardoor deze niet of nauwelijks vindbaar bleken (ik spreek hier uit eigen ervaring). Hierdoor is Flash geleidelijk weer gedegradeerd tot veredelde plaatjes. Heel jammer. Ik zou het persoonlijk toejuichen als de weg terug wordt ingeslagen. Flash is een prachtig stuk gereedschap, dat zijn plaats verdient tussen alle andere webtechnieken.
Dit gaat waaschijnlijk wel een impuls geven aan Flex. Aan de ene kant mooi omdat Flex best een mooi product is, maar aan de andere kant hoop ik dat Sun opschiet met JavaFX en nog op tijd is om goede concurrentie te gaan bieden aan Adobe. Rich internet applications zullen we namelijk steeds meer gaan zien en ik hoop dus dat een goed en open formaat de standaard gaat worden. Wat Flash/Flex op het moment niet is.
Ik zie hier toch een behoorlijk groot probleem.

Als Google nu via een API alle content doorgespeeld krijgt van Adobe hoe kan Google dan nagaan of de content daadwerkelijk relevant is voor die applicatie en of er ook echt een (virtuele) pagina voor bestaat?

De API van Adobe moet het dus mogelijk maken om duidelijke cloaking technieken (bijv. witte tekst op een witte background) visueel te maken via de API, en dit moet zowel met gewone timeline sites werken als met actionscript heavy sites die extern data binnen halen en dan bijv. dynamisch teksten etc. veranderen. Misschien dat Google dat dan per klik gaat bekijken, maar dan krijg je weer het probleem dat je na de klik de hele stage kan laten veranderen na bijv. een halve minuut oid, en dat moet Google maar net allemaal zien af te vangen.

Ik ben dus bang dat dit een hoop vervelende figuren de kracht geeft om Google flink om de tuin te leiden en dat dit de index flink zal kunnen gaan vervuilen met nutteloze spam sites.

Ik had liever gezien dat Adobe een meer constructieve oplossing zou ontwikkelen.

Ze zouden bijvoorbeeld een standaard object kunnen maken wat altijd bestaat en waar aangegeven kan worden binnen flash of iets als een (virtuele) pagina gezien kan worden en dan per pagina kan aangegeven worden wat de titel, description en (what the hell) keywords zijn en hoe je daar moet komen (als browser zijnde ;-) ).

Natuurlijk kan daar nog veel mees informatie aan meegegeven worden om te voorkomen dat iemand een login window kan bypassen bijvoorbeeld, maar dit zou de basis zijn.

Degene die oplet ziet de vergelijking met HTML, en dat klopt, want dat is wat Flash vaak mist, structuur en specificatie. Als die structuur en specificatie er dan wel is in goede Flash sites dan is die elke keer weer anders omdat Adobe geen standaard heeft gemaakt.

Dus ik zou graag zeggen, Adobe kijk alsjeblieft even naar HTML5 en de kant dat die jongens opgaan, want dat is echt een stap vooruit!
http://www.neuroproductions.be

Als je naar deze website kijkt en er een beetje in navigeert, zal je misschien opvallen dat de URLbalk verandert en er een nieuwe url in komt te staan. Deze website is dusdanig aangepast (dmv van swfObject, iets met javascript e.d.), dat hij google-vriendelijk is. Je kunt dus ook worden doorgelinkt naar een beepald deel van de website, terwijl hij toch in flash is gemaakt. Dit vereist dus duidelijk wat moeite, maar mij lijkt het wel mogelijk dat het proces zo ongeveer wordt omgekeerd, zodat niet de developer de code hoeft aan te passen, maar dat de google-engine op een andere manier zoekt (wat nu dus ook zo lijkt te zijn).

Wat bedoel je trouwens met "Het blijft volgens mij onmogelijk om met flash een complexe relatie tussen content op te bouwen, wat wel eenvoudig kan met een html website."?
het is een trucje waarmee ze de 'location'-balk aanpassen en eigenlijk niet eens de 'request' die naar een eventuele server verstuurd wordt ..

namelijk door het 'hash' teken te gebruiken ('#') deze staat normaal voor 'anchorlinks' binnen een pagina, en de content die na de 'hash' komt wordt niet daadwerkelijk naar een server verstuurd maar enkel clientside gebruikt (Flash zal er echter wel toegang toe hebben aangezien dat clientside draait; evenals javascript).

nadeel is imho wel dat het voor juist zoekmachine spiders niets uitmaakt, aangezien die juist 'hash-links' niet indexeren omdat ze geen 'serverside' waarde hebben..
het biedt wel een mogelijkheid om bv content te bookmakren waardoor de gebruiksvriendelijkheid wel toeneemt.

Overigens is dat ook een punt voor zoekmachine's... indexeren zal mogelijk wel gaan, maar zodra je geen direkte 'link-naar-content' krijgt van een zoekmachine is het weinig gebruiksvriendelijk...
hooguit wijst de zoekmachine je er nu op dat er 'ergens' in die flashsite de door jou gezochtte content staat, maar daarheen moet je dan zelf op zoek gaan, zonder voorheen te weten _hoe_ er te komen, wat nog wel een behoorlijke zoektocht kan blijken te zijn, als je ziet hoe sommige flash-sites qua usability in elkaar steken.

[Reactie gewijzigd door RM-rf op 1 juli 2008 13:33]

dat is gewoon het aanbieden van alternatieve content specifiek voor indexering...
dat heeft niet direkt te maken met he 'indexeren' van flash-content, maar is een trucje dat nu al mogelijk is om ervoor te zorgen dat flashcontent goed vindbaar is met zoekmachine's...
dat vergt echter altijd wat meer voorbereiding (en SEO)

overigens lijkt juist het bookmarken dmv van die '#'-truc niet te werken... dmv die bookmarks zijn pagina's niet meer terug te vinden, hij hangt op een standaard 'view-pagina' waarbinnen geen content getoond wordt .. is dat niet een bugje? in theorie moet dat wel kunnen werken.

'overigens die link hoef je niet de hele tijd te posten hoor, die is volgens mij al prima door google geindexeert :) ;)
het verschil tussen HTML en XML is dan ook dat XML hooguit structuur biedt, maar geen enkele declaratie van die structuur ....
HTML doet dat wl; definieert of tekst gestructurerd is in alinea's, headers, ordererd of unordered List e.d.... onderling gelinked dmv hyperlinks...

na het 'mislukken' van XHTML (omdat de meerwaarde tov HTML4.01 praktisch gezien vrijwel nihil was) is juist dt dat ook de verdere ontwikkeling die men voor HTML5 voorzien heeft, namelijk et uitbouwen van specifiek die declaratieve waarde van HTML tov een 'puur' structureel data-format als XML.
Nu alleen nog indexeren voor RIA gebaseerd op HTML/JavaScript. De helft van die webapplicaties worden ook niet lekker geindexeerd. Overigens kunnen oplossingen zoals Roundcube (webmail client) of GMail ook bijzonder traag zijn.

[Reactie gewijzigd door alienfruit op 2 juli 2008 18:17]

Op dit item kan niet meer gereageerd worden.


Call of Duty: Black Ops 4 HTC U12+ LG W7 Samsung Galaxy S9 Dual Sim OnePlus 6 Battlefield 5 Microsoft Xbox One X Apple iPhone 8

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank en Intermediair de Persgroep Online Services B.V. © 1998 - 2018 Hosting door True

*