Software-update: Apache Lucene Java 3.0.0

De Apache Software Foundation heeft enkele dagen geleden een nieuwe versie van Lucene Java uitgebracht met 3.0.0 als het versienummer. Lucene kan worden ingezet als een onderdeel van een zoekmachine, het kan namelijk volledige tekst-indexering uitvoeren. Lucene Java is, zoals de naam van de applicatie al enigszins laat doorschemeren, de uitgave die in Java geschreven wordt. Voor meer informatie verwijzen we jullie door naar deze pagina. De aankondiging van versie 3.0.0 ziet er als volgt uit:

Lucene Java 3.0.0 available

The new version is mostly a cleanup release without any new features. All deprecations targeted to be removed in version 3.0 were removed. If you are upgrading from version 2.9.1 of Lucene, you have to fix all deprecation warnings in your code base to be able to recompile against this version.

This is the first Lucene release with Java 5 as a minimum requirement. The API was cleaned up to make use of Java 5's generics, varargs, enums, and autoboxing. New users of Lucene are advised to use this version for new developments, because it has a clean, type safe new API. Upgrading users can now remove unnecessary casts and add generics to their code, too. If you have not upgraded your installation to Java 5, please read the file JRE_VERSION_MIGRATION.txt (please note that this is not related to Lucene 3.0, it will also happen with any previous release when you upgrade your Java environment).

Lucene 3.0 has some changes regarding compressed fields: 2.9 already deprecated compressed fields; support for them was removed now. Lucene 3.0 is still able to read indexes with compressed fields, but as soon as merges occur or the index is optimized, all compressed fields are decompressed and converted to Field.Store.YES. Because of this, indexes with compressed fields can suddenly get larger.

While we generally try and maintain full backwards compatibility between major versions, Lucene 3.0 has some minor breaks, mostly related to deprecation removal, pointed out in the 'Changes in backwards compatibility policy' section of CHANGES.txt. Notable are:

IndexReader.open(Directory) now opens in read-only mode per default (this method was deprecated because of that in 2.9). The same occurs to IndexSearcher.

Already started in 2.9, core TokenStreams are now made final to enforce the decorator pattern.

If you interrupt an IndexWriter merge thread, IndexWriter now throws an unchecked ThreadInterruptedException that extends RuntimeException and clears the interrupt status.

See CHANGES for details.

Binary and source distributions are available here. Maven artifacts are available here.

Versienummer	3.0.0
Releasestatus	Final
Besturingssystemen	Windows 7, Linux, BSD, Windows XP, macOS, UNIX, Windows Server 2003, Windows Vista, Windows Server 2008
Website	Apache
Download	http://www.apache.org/dyn/closer.cgi/lucene/java/
Licentietype	Voorwaarden (GNU/BSD/etc.)

Vorige download Volgende download

Door Japke Rosink

Meukposter

Feedback • 10-12-2009 12:55 5

10-12-2009 • 12:55

Bron: Apache

Update-historie

06-'22	Apache Lucene 9.2.0	1
02-'21	Apache Lucene & Solr 8.8.0	0
06-'19	Apache Lucene & Solr 8.1.1	3
07-'18	Apache Lucene & Solr 7.4.0 / 6.6.5	0
01-'18	Apache Lucene 7.2.1	4
05-'12	Apache Lucene 3.6.0	0
06-'11	Apache Lucene 3.2.0	1
12-'10	Apache Lucene Java 3.0.3 / 2.9.4	4
12-'09	Apache Lucene Java 3.0.0	5
11-'09	Apache Lucene Java 2.9.1	0

Meer historie

Lees meer

Lucene

geen prijs bekend

Programming Software development Development tools Java Web services Zoekmachines

Reacties (5)

-Moderatie-faq

Wijzig sortering

gimbal 10 december 2009 14:12

wonderbaarlijke technologie is Lucene. binnen een fractie van een seconde kan het duizenden zoekresultaten opleveren, gebaseerd op geindexeerde text data. De zoek queries die je er dan nog op los kunt laten zijn ook zeer krachtig, beter en makkelijker dan je het met een select query op een database zou kunnen fabriceren.

zenlord @gimbal • 10 december 2009 14:43

Ik ben sterk geïnteresseerd in deze technologie en was toevaliig eergisteren nog op de website beland. Enigszins spijtig van de java-dependency (daar zou lucy, een rewrite in C, een oplossing moeten voor zijn).

Heb je er ervaring mee? Bestaan er (opensource) PHP-frontends voor (dat zou mij het meest interesseren zodat ik het kan incorporeren in mijn dossierprogramma...)?

/EDIT: Nevermind - heb intussen info gevonden over Zend_Search_Lucene, een port naar PHP die blijkbaar standaard in het Zend Framework verwerkt zit. Ziet er *smoking* uit!!

[Reactie gewijzigd door zenlord op 22 juli 2024 18:37]

bartvb

@zenlord • 10 december 2009 16:17

Kijk ook even naar Sphinx: http://www.sphinxsearch.com/ razendsnel en ik heb het idee dat Sphinx makkelijker te implementeren is dan Lucene. Ook geen Java (als dat een probleem is voor je), PHP interface is beschikbaar.

Lucene moet ik zelf nog eens naar gaan kijken, integratie met Drupal lijkt behoorlijk OK te zijn, gebruik op dit moment Sphinx om 50 miljoen documenten te indexeren en dat bevalt eigenlijk nog super, lucene lijkt echter wat beter te zijn in segmenteren/filteren.

zenlord @bartvb • 10 december 2009 18:23

Even (heel vluchtig) gekeken, maar zie toch al een nadeel tov Lucene: Sphinx zoekt enkel in SQL, dus niet gewoon in het filesystem / map die ik middels PHP zou willen laten indexeren.

maw: ik zou mijn programma al sterk moeten uitbreiden door alles in dbases te zetten vooraleer ik er zou kunnen in zoeken. Misschien doe ik dat wel nog, maar in tussentijd lijkt Lucene net wat ik nodig heb.

Toch bedankt voor de tip!

tweakerbee @zenlord • 10 december 2009 22:45

Lucene doet alleen tekst, daarentegen. Je kunt natuurlijk wel makkelijk door directories crawler, maar dan heb je ook nog zoiets als Apache Tika nodig (parsers) welke je documenten omzetten naar tekst.

Op dit item kan niet meer gereageerd worden.

Update-historie

Lees meer

Reacties (5)

Sorteer op:

Weergave: