Lucene

Lucene
Utvikler(e)Apache Software Foundation
Utgitt 30. mars 2000
Nyeste versjon9.10.0 (20. februar 2024)[1]
Kodelagerhttps://github.com/apache/lucene
PlattformJava Virtual Machine
Operativsystemmultiplattform
Skrevet iJava
TypeSøkealgoritme
LisensApache License 2.0[2]
Nettstedlucene.apache.org (en)
lucene.apache.org (en)

Lucene på Commons

Apache Lucene er et fri/åpen kildekode programvarebibliotek for informasjonsgjenfinning, opprinnelig utviklet i programmeringsspråket Java av Doug Cutting. Lucene støttes av Apache Software Foundation og utgis under Apache programvarelisens.

Lucene har blitt portert til andre programmeringsspråk inkludert Delphi, Perl, C#, C++, Python, Ruby og PHP.[3]

Historie

Lucene ble opprinnelig skrevet av Doug Cutting i 1999.[4] Den var opprinnelig tilgjengelig for nedlasting fra sin hjemmeisde på SourceForge. Siden ble den en del av Apache Software Foundations Jakarta produktfamilie av åpen/fri kildekode skrevet i Java. Dette skjedde i september 2001. Lucene ble et eget toppnivås Apache prosjekt i februar 2005. I 2010 ble Solr og Lucene slått sammen til en kodebase. Gjennom årene har Lucene inkludert en rekke underprosjekter som for eksempel Lucene Java, Droids, Lucene.Net, Lucy, Mahout, Solr, Nutch, Open Relevance Project, PyLucene og Tika. De fleste av disse, inkludert Solr er siden flyttet ut som separate Apache-prosjekter.

Egenskaper og bruk

Lucene egner seg for enhver applikasjon som trenger full-tekst indeksering og søk, og Lucene har generelt blitt anerkjent[5][6] for sin anvendelse i implementeringen av Internett søkemotorer og lokalt søk på separate nettsteder. Lucene er motoren i flere mer komplette søkemotorer for ulike formål, blant annet Solr, Nutch og Attivio AIE.

Sentralt i Lucene's logiske arkitektur er ideen om et dokument som inneholder felter med tekst. Denne fleksibiliteten gjør at Lucene's API er uavhengig av fil-format. Tekst på formatene PDFer, HTML, Microsoft Word, OpenDocument m.fl. kan alle indekseres så lenge tekstlig informasjon kan trekkes ut.

Prosjekter basert på Lucene

Lucene er i seg selv kun et indekserings- og søke-bibliotek, og inneholder ikke søkerobot eller funksjonalitet for tolkning av HTML. Men det finnes flere prosjekter som utvider Lucenes funksjonalitet:

  • Apache Nutch tilbyr vevgjennomgang (vev crawling) og parsing av HTML
  • Apache Solr – er en komplett søkemotor-tjener, utgitt som åpen kildekode
  • ElasticSearch – er en komplett søkemotor-tjener
  • Compass er et Java søkemotor-rammeverk bygget på toppen av Lucene.[7]

Tilgang på kompetanse

Det er et levende utvikler- og bruker-miljø rundt Lucene, som raskt og effektivt kan svare på spørsmål eller rette feil. Det er også flere ulike kommersielle konsulentfirmaer som kan tilby kursing, konsulenthjelp, skreddersøm/videreutvikling og support-kontrakter.

Se også

Referanser

  1. ^ «Release 9.10.0». 20. februar 2024. Besøkt 19. mars 2024. 
  2. ^ https://github.com/apache/lucene/blob/main/LICENSE.txt.
  3. ^ Lucene implementations
  4. ^ «Better Search with Apache Lucene and Solr» (PDF). 19. november 2007. Arkivert fra originalen (PDF) 31. januar 2012.  «Arkivert kopi» (PDF). Arkivert fra originalen (PDF) 31. januar 2012. Besøkt 3. mai 2012. 
  5. ^ Petra Perner. Machine Learning and Data Mining in Pattern Recognition: 5th International Conference, Springer Verlag, isbn=978-3-540-73498-7, page 387, 2007.
  6. ^ GNU/Linux Semantic Storage System Arkivert 1. juni 2010 hos Wayback Machine.
  7. ^ «Compass hjemmeside». Arkivert fra originalen 30. januar 2009. Besøkt 9. mars 2009. 

Bibliografi

  • Gospodnetic, Otis (2009). Lucene in Action, 2nd edition. Manning Publications. ISBN 1933988177. 
  • Gospodnetic, Otis (2004). Lucene in Action. Manning Publications. ISBN 978-1-932394-28-3. 

Eksterne lenker

  • (en) Offisielt nettsted Rediger på Wikidata
  • (en) Apache Lucene – kategori av bilder, video eller lyd på Commons Rediger på Wikidata
  • (en) Compass project Arkivert 24. februar 2023 hos Wayback Machine.
  • (en) Lucene FAQ
  • (en) Luke – Lucene Index Toolbox Arkivert 4. september 2023 hos Wayback Machine.
  • v
  • d
  • r
Toppnivåprosjekt
  • Abdera
  • Accumulo
  • ActiveMQ
  • Ambari
  • Ant
  • Aries
  • Apache HTTP Server
  • APR
  • Avro
  • Axis
  • Axis2
  • Bloodhound
  • Buildr
  • Camel
  • Cassandra
  • Cayenne
  • Chemistry
  • Click
  • CloudStack
  • Cocoon
  • Continuum
  • Cordova
  • CouchDB
  • cTAKES
  • CXF
  • Deltacloud
  • Derby
  • Directory
  • Drill
  • Empire-db
  • Felix
  • Flex
  • Flink
  • Flume
  • Forrest
  • Geronimo
  • Gora
  • Gump
  • Hadoop
  • Hama
  • HBase
  • Hive
  • Jackrabbit
  • James
  • JMeter
  • Kafka
  • Lucene
  • Mahout
  • Marmotta
  • Maven
  • MINA
  • mod_perl
  • MyFaces
  • Nutch
  • ODE
  • OFBiz
  • Oozie
  • OpenEJB
  • OpenJPA
  • OpenNLP
  • OpenOffice
  • PDFBox
  • Phoenix
  • POI
  • Pig
  • Pivot
  • Qpid
  • River
  • Roller
  • Samza
  • ServiceMix
  • Shindig
  • Shiro
  • Sling
  • Spark
  • Stanbol
  • Storm
  • SpamAssassin
  • Sqoop
  • Struts
  • Subversion
  • Tapestry
  • Thrift
  • Tiles
  • Tomcat
  • Traffic Server
  • Turbine
  • Tuscany
  • UIMA
  • Velocity
  • Wave
  • Wicket
  • Wink
  • Xalan
  • Xerces
  • XMLBeans
  • ZooKeeper
ASF logo
Commons-prosjekter
  • BCEL
  • BSF
  • Daemon
  • Jelly
Lucene-prosjekter
Hadoop-prosjekter
  • Hadoop
  • HDFS
Andre prosjekt
  • Batik
  • Chainsaw
  • FOP
  • Ivy
  • Log4j
  • Log4Net
  • XAP
Inkubator-prosjekt
  • XAP
Apache Attic
  • AxKit
  • Beehive
  • Bluesky
  • Cactus
  • Jakarta
  • Excalibur
  • Harmony
  • HiveMind
  • Lenya
  • Slide
  • Shale
  • stdcxx
  • iBATIS
Lisenser
  • Kategori
  • Commons-side Commons
Oppslagsverk/autoritetsdata
GND