Google werkt momenteel aan methodes om automatisch teksten op webformulieren in te vullen. Het bedrijf wil zo pagina's naar boven halen waar zijn webcrawlers normaal gesproken niet bij kunnen.
Dat maakte de zoekgigant onlangs bekend op het Webmaster Central Blog van het bedrijf. De experimenten om meer content te ontsluiten beperken zich vooralsnog tot sites van 'hoge kwaliteit', aldus Jayant Madhavan en Alon Halevy van Googles Crawling and Indexing Team. Ze benadrukten daarbij dat instructies in een eventueel robots.txt-bestand, waarmee webmasters kunnen voorkomen dat bepaalde stukken van hun sites worden geïndexeerd, worden gerespecteerd. Met de tests wil het bedrijf naar eigen zeggen een stap dichter bij het vervullen van zijn mission statement komen: het organiseren en beschikbaar maken van informatie.
Voor menu's en check- en radiobuttons kunnen de algoritmes, om het zogeheten invisible web zichtbaar te maken, door de beschikbare keuzes heenlopen. In textboxen worden woorden ingevoerd die voorkomen op de site waar het formulier wordt aangetroffen.
Een voormalig collega van Halevy, Anand Rajaraman, schrijft op zijn eigen weblog dat de gebruikte technologie afkomstig is van het bedrijf Transformic, dat in 2005 door Google werd overgenomen. Voordat dit bedrijf werd opgestart, werkten Halevy en Rajaraman op de universiteit van Washington samen aan het probleem van het automatisch bepalen van textbox-invoer.