Gründe und Vorteile der neuen Such-Engine Solr 3

Die seit der Implementierung von DC-X und die dadurch gemachte Umstellung von Oracle Text zu Apache Solr/Lucene 1.4 ist nun schon eine ganze Weile vergangen und die Software in die Jahre gekommen. Zwar weitgehend stabil, wird diese Version bei vielen DC-X Kunden sehr erfolgreich eingesetzt. Die Versionen des 3.x Zweiges sind die direkten Nachfolger von 1.4. Der aktuelle Release 3.6 beinhaltet eine Reihe von Verbesserungen. Angefangen von einigen Bugfixes, die auch schon in DC-X Systemen auftraten. Bis hin zu Optimierungen von weniger Hauptspeicherverbrauch und marginalen Performanz-Verbesserungen, die viele Kunden gerne sehen. Herauszuheben sind vor allen Dingen die neuen besseren Merge-Strategien, die ein dann doch so aufwendiges Index-Optimieren dann nicht mehr so wichtig machen. Das heißt im Klartext, das Zusammenführen von Segmenten ist soweit optimiert worden, das die Fragmentation weniger stark durchgreift. Was besonders bei Systemen mit viel Bewegung interessant ist, also unserem DC-X Systemen mit Agenturen und mit RSS-Feeds.
Als neue Funktionalität wäre dann das Join-Feature zu erwähnen, welches so ähnlich arbeitet wie ein Datenbank-Join und so relevante Informationen zu Abfragen herausgeben kann. Diese könnte eine Liste von Themen sein, die eine bestimmte Publikation betreffen. Ein weiterer wichtiger Grund auf Solr 3.6 zu gehen, ist das Solr immer nur die Vorgänger-Version eines Indexes unterstützt und lesen kann. Da DC-X schon bald auf die zukünftige Solr 4.0 Version gehen wird, von der sich noch weitere Performanzsteigerungen erhofft werden, macht dieses durchaus Sinn. Somit könnten ein Reindizierungslauf vermieden werden, welche ja auch immer viel Arbeit außerhalb der Produktionszeit und Systembelastungen voraussetzt.

 

© 2012 DIGITAL COLLECTIONS, All rights reserved