Ik ben sterk geïnteresseerd in deze technologie en was toevaliig eergisteren nog op de website beland. Enigszins spijtig van de java-dependency (daar zou lucy, een rewrite in C, een oplossing moeten voor zijn).
Heb je er ervaring mee? Bestaan er (opensource) PHP-frontends voor (dat zou mij het meest interesseren zodat ik het kan incorporeren in mijn dossierprogramma...)?
/EDIT: Nevermind - heb intussen info gevonden over Zend_Search_Lucene, een port naar PHP die blijkbaar standaard in het Zend Framework verwerkt zit. Ziet er *smoking* uit!!
[Reactie gewijzigd door zenlord op donderdag 10 december 2009 14:57]
Kijk ook even naar Sphinx:
http://www.sphinxsearch.com/ razendsnel en ik heb het idee dat Sphinx makkelijker te implementeren is dan Lucene. Ook geen Java (als dat een probleem is voor je), PHP interface is beschikbaar.
Lucene moet ik zelf nog eens naar gaan kijken, integratie met Drupal lijkt behoorlijk OK te zijn, gebruik op dit moment Sphinx om 50 miljoen documenten te indexeren en dat bevalt eigenlijk nog super, lucene lijkt echter wat beter te zijn in segmenteren/filteren.
Even (heel vluchtig) gekeken, maar zie toch al een nadeel tov Lucene: Sphinx zoekt enkel in SQL, dus niet gewoon in het filesystem / map die ik middels PHP zou willen laten indexeren.
maw: ik zou mijn programma al sterk moeten uitbreiden door alles in dbases te zetten vooraleer ik er zou kunnen in zoeken. Misschien doe ik dat wel nog, maar in tussentijd lijkt Lucene net wat ik nodig heb.
Toch bedankt voor de tip!
Lucene doet alleen tekst, daarentegen. Je kunt natuurlijk wel makkelijk door directories crawler, maar dan heb je ook nog zoiets als Apache Tika nodig (parsers) welke je documenten omzetten naar tekst.