MENÜ
Internetagentur Bonn - Illustration

Apache Solr - die vielfältig einsetzbare Volltextsuche

Dokumente, Daten und Dateien suchen in TYPO3

Die mächtige und beliebte Such-Software Apache Solr (gesprochen: "Solar") ist eine Open-Source-Suchplattfom, die auf der Java-Bibliothek Apache Lucene basiert. Stärken von Solr sind unter anderem Vielseitigkeit, Schnelligkeit, Zuverlässigkeit und Fehlertoleranz. Mit ihrer Vielzahl an Einsatzmöglichkeiten stellt sie TYPO3-Extensions, wie die bekannte Indexed Search, klar in den Schatten. Auch bei großen Web-Projekten mit umfangreichem Traffic ist Solr die richtige Wahl. Die Indexierung der Inhalte erfolgt beinahe in Echtzeit.


Individuelle Solr-Umsetzung für MISEREOR


Apache Solr mit TYPO3

Solr analysiert, indexiert und durchsucht (TYPO3-)Content und -Inhaltselemente aller Art, Newsartikel, Produktbeschreibungen bei Online Shops und E-Commerce-Portalen, außerdem Dateien im PDF-, XML-Format oder in den Microsoft-Office-Formaten sowie Grafiken.

Nachfolgend stellen wir Ihnen die vielen Funktionen, Features und Vorteile der TYPO3-Solr-Extension vor.


Solr: Leistungsstärke und Schnelligkeit durch Indexierungskonzept

Besonders bei umfangreichen Webseiten empfiehlt sich die Solr-Extension, da tausende von Seiten in Millisekunden erfolgreich durchsucht werden können.

Anders als die Extension Indexed Search nutzt Solr für TYPO3 die sogenannte Index-Queue, welche nicht auf den Aufruf einer aktualisierten Seite im Frontend wartet, sondern bereits das Backend auf Änderungen überwacht und somit deutlich zeitnaher indiziert.

Solr indiziert und durchsucht TYPO3-Content und -Inhaltselemente aller Art, Newsartikel, Produktbeschreibungen bei Online Shops und E-Commerce-Portalen, außerdem Dokumente (PDF, Microsoft Word ...). Auch Grafiken (JPEG, PNG, ...) werden in der Trefferliste ausgegeben.

Inhalte von Dokumenten können mit Hilfe von Apache Tika extrahiert werden. Apache Tika steht ebenfalls als TYPO3-Extension zur Verfügung.

Solr-Konzept und -Integration von fixpunkt

fixpunkt konzipiert Ihre Solr-Volltext-Suchmaschine und realisiert sie in Ihrem TYPO3-Web. Diese Kunden bieten Ihren Besuchern bereits individuelle Solr-Lösungen.

Eingabe eines Suchbegriffs

Bei der Eingabe eines Suchbegriffs erscheinen (aus dem vorhandenen indizierten Content) automatisch Vervollständigungs-Vorschläge.

Bei dem Verdacht auf einen Eingabefehler werden alternative Begriffe, die eventuell gemeint waren, vorgeschlagen (bei Google: "Meintest du: ..." oder "Ergebnisse für ..."). Diese Vorschläge werden in der Regel dem vorhanden Content entnommen, können sich auf Wunsch aber auch auf andere Quellen beziehen (Duden).

Durch die Erkennung des Wortstammes können sämtliche Formen des Begriffs gesucht werden (Suchbegriff "Spende": Spendenformular, Spenden-Shop, Testamentspende etc.)

Ein sehr nützliches Feature ist die Möglichkeit, Begriffe zu bestimmen, die nicht in der Suchergebnisliste erscheinen sollen.

Bei der Synonymsuche können völlig unterschiedliche, aber gleichbedeutende Begriffe gleichgesetzt und die Treffer beider in einer Liste ausgegeben werden (Beispiel: Zoo, Tiergarten).

Suchergebnis-/Trefferliste

Die Suchergebnisliste ist mit Hilfe von Kategorien (Facetten) sortiert und kann durch deren hinzufügen oder ausschalten gefiltert werden.

Durch Markierung (farblich, Fettung ...) kann der gesuchte Begriff leicht und intuitiv in der Suchergebnisliste wahrgenommen werden.

Die Suchergebnisliste kann danach gewichtet werden, in welchem Kontext ein Begriff erscheint (z.B. in einer Überschrift oder im Fließtext).

Ähnlich den bezahlten Ergebnissen, die jeder von Google-Trefferlisten kennt, können Ergebnisse unabhängig von eingesetzten Filtern immer an den Anfgang der Liste gesetzt werden.

Die Trefferliste kann nach verschiedenen Kriterien sortiert werden.

Bei mehrsprachigen Seiten wird die Ausgabe der Trefferliste nur in der entsprechenden Sprache gewährleistet.

Bei der Ausgabe der Suchergebnisse werden eingeschränkte Rechte berücksichtigt, Dokumente und Inhalte mit Zugangsbeschränkung also nicht gelistet.

Die Technik hinter Solr

Apache Solr ist ein in Java programmierter Such-Server für Webprojekte, der auf der Open-Source-Bibliothek Lucene basiert. Diese ist ein Projekt der Apache Software Foundation - einer großen und sehr aktiven Entwickler-Community.

Solr ist für vertikale Suchmaschinen auf statischen Webseiten besonders geeignet. Die zugrunde liegende Bibliothek Lucene liefert Funktionen und Klassen, um eine individuell auf den Kundenwunsch hin konfigurierte Suchmaschine zu entwickeln. Hierfür bringt Lucene zahlreiche Suchoptionen mit, die aber von Solr um viele weitere Möglichkeiten ergänzt werden.

Mehr zu Solr

Unsere Solr-Kunden

Ihr Ansprechpartner für Solr

Michael Hueber
Geschäftsführung
0228 42162-11
E-Mail