Zur Recherche im GVI und zur Einbindung des GVIs in eigene Anwendungen empfehlen wir die native Search-API von Solr. Diese erlaubt es alle fortgeschrittenen Möglichkeiten des GVI zu nutzen und ist deutlich schneller als die über Adapter/Gateways angebunden Schnittstellen.
Funktionen, die sich nur über die Search-API realisieren lassen sind unter Anderen: Sucheinschränkungen(Facetten/Drill downs), Suchvorschläge, Autovervollständigung, Einstellbare Relevanzsortierung, Gruppierung, ...
Solr vs. SRU
Beides sind moderne REST-Webschnittstellen mit denen sich leicht einfache Recherche-Klienten erstellen lassen.
SRU wurde als Nachfolger von Z39.50 entwickelt und erbt davon viele Ideen und Konzepte. Damit erleichtert es die Modernisierung von Systemen mit Z39.50, ist aber in der Anwendung ähnlich eingeschränkt.
Die API von Solr hat dagegen ein deutlich weiteres Konzept von Suche und beschränkt sich nicht auf bibliografische Daten und Formate. Das erschwert etwas den Einstieg eröffnet aber die oben angesprochenen neuen Möglichkeiten.
Solr vs. Z39.50
Im Gegensatz zu SRU ist Z39.50 ein verbindungsorientiertes Protokoll. So ist es nicht möglich Anfragen im Browser ohne weitere Software zu formulieren. Der einzige Vorteil von Z39.50 ist die weite Verbreitung.
Dokumentation der Solr-API
- Suche über die Search API: https://solr.apache.org/guide/8_8/query-syntax-and-parsing.html
- Vervollständigung im Suchschlitz über die Terms API: https://solr.apache.org/guide/8_8/the-terms-component.html
Konfigurationsdaten
Die Kenntnis der API ist leider nur die halbe Wahrheit.
Um sinnvolle Anfragen zu formulieren ist es notwendig die Namen der konfigurierten Suchfelder zu kennen.
Zum exakten Nachvollziehen der Suchergebnisse sind aber auch zusätzliche Informationen nötig. Zum Beispiel ob die Suchfelder wortweise oder als Phrase verarbeitet werden und mit welchen Daten die Suchfelder gefüllt werden.
- Suchfelder: Die formale Definition der Suchfelder finden Sie in der Datei schema.xml
- Suchvoreinstellungen: In der Datei solrconfig.xml sind neben technischen Voreinstellungen auch Vorgaben für die Interpretation von Suchanfragen festgelegt.
- Datenaufbereitung: Die Titeldaten werden im Format Marc oder MarcXML angeliefert. Mit der Open Source Software SolrMarc werden die Dateien eingelesen, interpretiert und in den Index eingetragen.
Gesteuert wird dies über die Datei index.properties und vom GVI-Team entwickelte Erweiterungen GVIIndexer.java.
Für Ungeduldige eine Kurzinfo beispielhafter Suchfelder.
Feldname | Kurzbeschreibung |
id | Die eindeutige Datensatzkennung |
fullrecord | Die originalen Daten in MarcXML |
consortium | Das ISIL des liefernden Verbundes |
author | Alle Verfasser und beteiligte Personen. Auch in Originalschrift (Wortweise Suche, ohne Sonderzeichen und in Kleinschreibung) |
author_facet | Alle Verfasser und beteiligte Personen. Auch in Originalschrift (Phrasensuche ohne Suchoptimierungen) |
author_sort | Erster ‚author‘ mit Berücksichtigung von Nichtsortierzeichen. |
author_norm | Kopie des Feld ‚author‘ ergänzt um eventuell verfügbare Synonyme und Schreibweisen aus der GND |