GitHub maakt nieuwe codezoekmachine op basis van Rust algemeen beschikbaar

GitHub heeft zijn codezoekmachine Code Search algemeen beschikbaar gemaakt. Het platform heeft de onderliggende technologie de afgelopen twee jaar herschreven naar Rust, waardoor het zoeken naar code veel sneller moet gaan.

GitHub schrijft dat GitHub Code Search uit de bètafase is gehaald en nu algemeen beschikbaar is voor iedere gebruiker van het platform. Code Search is een tool waarmee gebruikers kunnen zoeken naar specifieke codesnippets van zichzelf of andere ontwikkelaars in openbare repository's. GitHub heeft ook een blogpost geschreven over hoe het de zoekmachine van de grond af aan heeft herschreven naar een nieuwe engine. Die noemt het bedrijf Blackbird.

De zoekmachine is gebaseerd op Rust. Dat zou volgens GitHub efficiënter zijn dan alternatieven zoals grep, dat voor veel andere zoekmachines wordt gebruikt. Rust zou beter schalen met de hoeveelheden code die GitHub heeft. De zoekmachine kan daarmee 640 queries per seconde doen en 120.000 documenten per seconde indexeren.

Volgens GitHub is de nieuwe Code Search ongeveer twee keer zo snel als de oude zoekmachine. Het bedrijf heeft er ook nieuwe functies aan toegevoegd. Zo is het mogelijk om met regular expressions te zoeken. Ook kunnen gebruikers met meer syntaxissen zoeken naar code. Code Search wordt ook op een andere manier vormgegeven, waarmee het geïntegreerder wordt in de navigatiestructuur van het platform.

GitHub Code Search

Door Tijs Hofmans

Nieuwscoördinator

09-05-2023 • 19:57

10

Reacties (10)

10
10
6
2
0
2
Wijzig sortering
De zoekmachine is gebaseerd op Rust. Dat zou volgens GitHub efficiënter zijn dan alternatieven zoals grep, dat voor veel andere zoekmachines wordt gebruikt.
Met het stuk in de blog post "Just use grep?" word niet bedoelt dat andere zoekmachines "grep" gebruiken. grep is simpelweg een klein *NIX tooltje om (lokaal) een een stuk tekst in een bestand te zoeken. Niemand gaat dat als basis voor een search engine gebruiken. Nagenoeg iedere zoek machine zal altijd op basis van een vorm van index werken.
Inderdaad. Ik zat de samenvatting ook met verbazing te lezen. Voor de helderheid: men gebruikte SOLR en later ElasticSearch en nu dus de eigen engine.
Werkt nog steeds niet bij mij. Ik zie wel de filters aan de linkerkant, maar niet de zoekresultaten zoals bij de oude zoekmachine. Ook niet met adblock uit. Ik heb het tijdens de bèta tot tweemaal toe aan de ontwikkelaars gemeld, maar telkens werd mijn feedback gewist.

[Reactie gewijzigd door TheVivaldi op 26 juli 2024 06:50]

Ik merkte vandaag ook opeens dat de zoek functie anders was.

Deze werkt veel beter nu.

Voorbeeld: Eerst krijg je altijd maar 1 regel resultaat als je op een bepaald woord zocht. Ook al kwam die meerdere keren in dezelfde bron bestand voor. Nu kan ik ook de andere plekken in de bestanden direct in het zoekresultaat vinden. Alleen daarvoor al geweldige verbetering. Super nodig als je in open source software aan het snuffelen bent.

[Reactie gewijzigd door jorisvergeerTBA op 26 juli 2024 06:50]

Het is mooi hoe Rust zo'n enorme opmars maakt, en nu als eerste en enige andere taal gebruikt mag worden naast C om drivers te schrijven voor de Linux kernel.

Het zal nog wel even duren, maar ik denk dat geleidelijk aan C en C++ in veel projecten wel vervangen zullen worden.
Ik denk dat veel mensen chatgpt tegenwoordig gebruiken omdat die tegenwoordig redelijk kant en klare code kan leveren die precies doet wat je wil
Dat is toch wel een probleem als ChatGPT getraind is op code met een conflicterende licentie (bijvoorbeeld non-commercial use, de verplichting om de auteur te noemen etc).
Ik moet de eerste nog tegenkomen die daar ChatGPT voor gebruikt en ik kom dagelijks toch een hoop ontwikkelaars van over heel de wereld tegen…
Code Search wordt ook op een andere manier vormgegeven, waarmee het meer geïntegreerd wordt in de navigatiestructuur van het platform.

Wat een....eh..... rust :+
Ik vind de resultaten van de GitHub search vrijwel altijd teleurstellend, vaak worden dingen niet gevonden ook al zijn ze juist gespeld, en gedeeltelijke matches lijken al helemaal niet te werken...

Nu maar hopen dat dit verbeterd is in de nieuwe engine.

[Reactie gewijzigd door learn_more op 26 juli 2024 06:50]

Op dit item kan niet meer gereageerd worden.