Unser Motto: Perpetual Beta
Die vorhandenen Bibliothekskatalogsysteme sind aufgrund der Rahmenbedingungen ihrer historischen Entwicklung und ihrer monolithischen Konzeption wenig flexibel an aktuelle Suchstandards und die Verwaltung elektronischer Medien anzupassen. Das hybride Angebot an klassischen Printmedien einerseits und elektronischen Dokumenten anderseits sowie die erhebliche, stetig wachsende Vielfalt an Medientypen und Zugangsvarianten stellen die elektronischen Kataloge der Bibliotheken vor große Herausforderungen. Zur Erschließung dieses Medien-Mixes bedarf es neuer moderner Suchsysteme [3,5,17].
In Bibliotheken ist bisher übliche Praxis, den Nachweis verschiedener Medientypen über viele unterschiedliche externe Systeme abzuwickeln. Die Problematik dieser heterogenen Nachweissituation ist Kunden kaum transparent zu machen. Durch ihre Recherche-Erfahrungen mit Suchmaschinen wie Google erwarten Nutzer demgegenüber ein einfaches und einheitliches Suchinterface für alle Fragestellungen und einen möglichst direkten Zugriff auf die relevanten Volltexte. Um dieser Nachfrage in Zukunft besser gerecht zu werden, führen viele wissenschaftliche Bibliotheken sog. Discoverykataloge ein[23] .
Die E-LIB der SuUB Bremen arbeitet bereits seit 2004 als einheitlicher Katalog elektronischer und gedruckter Medien auf Basis von selbst entwickelter Suchmaschinentechnologie. Alle wesentlichen Medien und Dienste der Bibliothek werden unter einer Suchoberfläche angeboten, um die übliche heterogene Nachweissituation der verschiedenen Medientypen soweit wie möglich aufzulösen.
Das Projekt verfolgt das Ziel, alle lokalen Bestände vor Ort und alle für Bremer Nutzer im Zugriff extern verfügbaren Medien in einem einzigen Retrievalsystem zur Verfügung zu stellen und neu entwickelte Verfahren zur Unterstützung von assoziativen Suchprozessen anzubieten [1,2,6-11]. In dem von der Bibliothek kontrollierten Suchraum der Bremer E-LIB finden sich derzeit ca. 110 Mio. Nachweise - zu über 95% elektronische Volltexte.
Die E-LIB Bremen versteht sich gleichzeitig als Produktivsystem und Entwicklungsumgebung für neue Services zur Unterstützung von Retrievalvorgängen. Im Rahmen des Informatikjahrs 2006 gewann das System gemeinsam mit zwei anderen Projekten den vom BMBF geförderten bundesweiten Wettbewerb Bibliotheksinnovation 2006.
Die Suchtechnik basiert auf einem lokal gepflegten Gesamtindex von heterogenen, aggregierten Metadaten (local indexing). Die Organisation dieser Daten erledigt das System CiXbase, das neben der Anwendung in Bremen u.a. auch in der Schweiz an der ETH Zürich (NEBIS) [14] eingesetzt und weiterentwickelt wurde. Typische Vorteile einer Suchmaschine unter Nutzung eines lokalen Gesamtindexes sind die hohe Antwortgeschwindigkeit, die homogene Trefferpräsentation der Suchmaschine und eine ausgeglichene Gewichtung aller Ressourcen. Die erweiterte lokale Datensammlung eröffnet zusätzliche Möglichkeiten, die vorhandenen Nachweise als eine Wissensbasis für neue Formen der Treffermengenanalyse zu nutzen, die während der Suche auf der Menge der Resultate prozessiert werden können. Dazu gehören z.B. klassische Drill-Down Techniken (facettierte Suche), die eine formale und inhaltliche Filterung erzielter Treffersets erlauben und die bereits in vielen modernen Suchmaschinen zum Standard gehören.
Eine wichtige neue Strategie der E-LIB ist die kontextsensitive Unterstützung der Nutzer durch verschiedene Zusatzfunktionen, die auf Basis einer statistischen und computerlinguistischen Auswertung der Metadaten von Treffersets angeboten werden.
Stand 05.2022
Im Kontext der Open Archive Initiative stellen mehr als 8000 universitäre Dokumentenserver weltweit Ihre Open Access Publikationen online zur Verfügung. Die Elektronische Bibliothek Bremen bietet seit 2004 Nachweise von Volltexten aus Open Access Archiven zur Recherche an. Die Open Access Daten werden dabei gemeinsam mit den bekannten Artikelangeboten klassischer Verlage völlig gleichberechtigt im Katalog angezeigt. Während zu Projektbeginn die Metadaten einzelner, für den lokalen Standort gezielt ausgewählter Archive in Bremen selbst geharvestet wurden, ist es seit 2011 möglich, den gesamten Metadatenbestand des Projekts BASE der UB Bielefeld für die Bremer Suchmaschine zu nutzen. (Herzlichen Dank dafür an die Kollegen/innen der UB Bielefeld!). Der Nachweis dieser frei verfügbaren Open Access Dokumente im Bibliothekskatalog ist ein Novum und dient neben der Erschließung dieser Medien auch dem Marketing von Open Access als Publikationskultur. Vor der Integration der Metadaten des Projekts BASE werden die dort verfügbaren 160 Millionen Datensätze zum Einsatz in der Bremer E-LIB umfangreich vorgefiltert.[24].
Alle Metadaten der Artikelebene ermöglichen einen Direktlink auf den Volltext bei den Verlagen. Die Zugriffslinks sind bereits in der Trefferliste verfügbar. Für lizenzpflichtige E-Medien werden Informationen über die Zugriffskonditionen angeboten. Das Gesamtangebot von Nachweisen wird durch Integration weiterer Metadatenpakete kontinuierlich erweitert.
Abb.: ca. 110 Mio. Medien sind in der E-LIB Suche verfügbar (über 95% als elektronische Volltexte)
(Verwaltung der Journal-Lizenzen via FOLIO-ERM in der Umstellung)
Zum Aufbau der lokalen Nachweisbasis werden unterschiedliche Typen und Formate von Metadaten importiert und nach ressourcenspezifischen Anpassungenin in einem Suchraum zusammengeführt. Der vereinheitlichte Metadatenpool wird dann unter Verwendung von Algorithmen aus der Suchmaschinentechnik indexiert (statistical balanced B*-Trees) und dient anschließend als Basis für die Suchmaschine. Die E-LIB Software basiert auf dem Indexierungssystem Osiris/CiXbase – arbeitet daher ohne bekannte Systeme wie z.B. Lucene, SOLR. Die Datenorganisation basiert auf einer Objektdatenbank mit einem Inverted Index (genau wie Lucene). Die Anwendung wird über CGI vom Browser angesprochen und liefert die Ergebnisse im XML-Format. Die XML-Daten werden clientseitig über eine XSL-Transformation anhand einer mitgelieferten Layoutvorlage in eine HTML-Präsentation umgewandelt.
Die Trennung von Struktur und Layout ermöglicht eine nahezu vollständige Interoperabilität der Metadaten und vereinfacht deren Weitergabe an andere Informationsysteme. Sinnvolle Exportformate für Zitate sind dabei in erster Linie verschiedene bibliographische Datenbankformate wie RIS, Endnote etc. Der Datenaustausch mit einer Literaturverwaltungssoftware verläuft immer dann besonders elegant, wenn die Daten innerhalb einer Browsersession an ein ebenfalls Web-basiertes System direkt übergeben werden können. Metadaten der E-LIB Bremen können auf Knopfdruck direkt an web-basierte Systeme wie Zotero oder RefWorks übergeben werden.
Die Präsentation der Metadaten im XML-Format RSS erlaubt die plattformunabhängige Bereitstellung von Literaturzusammenstellungen bzw. Rechercheergebnissen als RSS-Feed, um Nutzern die Möglichkeit zu eröffnen, sich gezielt, über neue Medien zu bestimmten Themen zu informieren.
Exportmöglichkeiten für bibliographische Metadaten:
Die Suchmaschine präsentiert ihre Ergebnisse in zweispaltigem Design: neben der Trefferliste in der linken Hauptspalte werden in der zweiten Spalte im rechten Drittel der Anzeige Zusatzfunktionen wie Drill-Down und Empfehlungsdienste angeboten - die Eingabezeile der Suchmaschine steht während des gesamten Suchprozesses immer zur Verfügung.
Die Suchfunktion der E-LIB ist seit November 2010 komplett in die neue Webseitenstruktur der Bilbliothekshomepage integriert. Auf allen Webseiten aus dem Bibliotheksangebot ist der Suchschlitz immer verfügbar und auf jeder Ergebnispräsentation der Suchmaschine sind die Menüfunktionen der Bibliothekswebseite verfügbar.
Im Juni 2013 wurde das Layout der Ergebnispräsentation grundlegend überarbeitet. Nun werden die Informationen zur aktuellen Verfügbarkeit auch bei Printmaterialien bereits in der Kurztrefferliste angezeigt.
Die Recherche in einem großen Suchraum liefert jedoch oft unübersichtliche Treffermengen. Der Suchprozess muss daher durch geeignete Verfahren zur Präzisierung von Sucheingaben unterstützt werden. Neben formalen und inhaltlichen Drill-Down-Funktionen zur Einschränkung der Ergebnisse finden sich in der E-LIB Bremen eine Reihe von weiteren Empfehlungsassistenten, die ebenfalls auf statistischen Verfahren der Treffermengenanalyse beruhen. Während der Recherche erhält der Nutzer damit erweiterte Möglichkeiten zur Modifikation der Suchstrategie im Sinne einer "Entdeckenden Suche" [16]. Die thematische Suche verläuft danach als mehrstufige, iterative Navigation in einem semantischen Netz, das durch die Gesamtheit aller vorhandenen Sacherschließungselemente der bibliographischen Daten gebildet wird.
Dazu wird das Material an kontrolliertem Vokabular einer Treffermenge analysiert, statistisch ausgewertet und anschließend zeitgemäß optisch aufbereitet als Tag Cloud präsentiert. Das Ergebnis der Analyse bzw. das Relevanzprofil der resultierenden Tag Cloud ist dabei sowohl vom gewählten Begriff, als auch vom vorhandenen Titelmaterial und dessen inhaltlichen Erschließungselementen abhängig.
Wichtigste Funktionen des Suchinterfaces
Abb.: Tag Cloud-Auswertung für das Thema "Resistenz gegen Malaria" und
Datenbankempfehlung für "Englischunterricht"
Das Ranking sortiert die Suchergebnisse einer Anfrage im Idealfall nutzergerecht in der Reihenfolge absteigender Relevanz bezogen auf die Sucheingabe.
Im Kontext bibliothekarischer Suchmaschinentechnik beruht das Ranking bisher weitgehend auf rein textstatistischen Verfahren (TF/IDF - Termfrequenz und inverse Dokumenthäufigkeit). Dabei wird die Ähnlichkeit und Häufigkeit der Anfragebegriffe mit den entsprechenden Begriffen der Dokumenttitel und -beschreibungen verglichen, statistisch analysiert und gewichtet. Textstatistische Verfahren berücksichtigen dabei allerdings bisher viele, für ein Relevanz Ranking interessante Parameter noch nicht - darunter z.B. die Aktualität und Popularität der Medien. Dies sind Faktoren, die bei bekannten Internetsuchmaschinen einen erheblichen Anteil der Rankingberechnung ausmachen. In der Literatur sind seit neuestem bereits theoretische Ansätze für weitere, nicht-klassische Rankingverfahren für Bibliotheksysteme beschrieben[18].
Die E-LIB Bremen setzt seit Sommer 2011 zusätzlich auf eine Modifikation des Treffer-Rankings über Aktualitäts- und Popularitätsfaktoren der Medien wie Klickstatistik, Auflagen- und Exemplarzahl. Bei gleicher textstatistischer Relevanz werden dabei die Titel mit einer auffälligen Nutzerklickstatistik, hoher erreichter Auflagenzahl oder vielen in Bremen vorhandenen Exemplaren gegenüber anderen Titeln in der Gesamt-Relevanzbewertung leicht bevorzugt. Als Konsequenz werden diese Titel in der Kurzanzeige vor anderen Titeln angezeigt.
Bei der Suche nach "Biochemie" kann auf diese Weise bei vielen Treffern und einer sehr hohen Anzahl von textstatistisch gleich zu bewertenden Titeln die am Standort wichtigen und stark nachgefragten Lehrbücher zu Beginn einer Trefferpräsentation angezeigt werden[20-22].
Die Analyse und geeignete Behandlung von 0 Treffer Ergebnissen ist ein besonders vielversprechendes Einsatzgebiet von Rechercheassistenten. Keine oder nur geringe Trefferzahlen sind in der Regel entweder auf das Fehlen entsprechender Titel in der Datenbasis oder auf Rechtschreibfehler in den Eingabebegriffen zurückzuführen. Die Suchmaschine der E-LIB verfügt dazu über eine Rechtschreibkontrolle unter Nutzung des Prinzips des Levenshtein-Distanz Algorithmus, die aufgrund des vorhandenen Indexmaterials mehrsprachig arbeiten kann.
Abb.: Rechtschreibkorrektur einer falschen Eingabe
In speziellen Fällen sind die gesuchten Medien in der lokalen Datenbasis jedoch nicht vorhanden. Die E-LIB Bremen lädt bei 0 oder geringen Trefferzahlen überregional verfügbare Nachweise aus dem Verbundsystem des GBV (via SRU) nach und bietet so bei den einzelnen Titeln die Bestellfunktion auf Knopfdruck und ohne Medienbruch. Auf diese Weise ist es auch möglich, Treffer aus externen bibliographischen Nachweissystemen unter Berücksichtigung der Zugangskonditionen direkt zum lokalen Trefferset zu kombinieren.
Abb.: Bei fehlendem Bestand in der Wissensbasis der Bremer E-LIB können Treffer aus dem Verbundkatalog des GBV automatisch nachgeladen werden
Zukünftig wird die intelligente Kombination von lokalem Metaindex und "Federated Search"-Techniken die jeweiligen Vorteile beider Verfahren ausnutzen, die sich so optimal gegenseitig ergänzen können.
Universitätsbibliotheken operieren im Bereich der Informationsversorgung nicht mehr isoliert auf dem Campus. Anbieter anderer Dienstleistungen (wie z.B. universitäre Lernsysteme) sollen zukünftig auf Bibliotheksdienste automatisch aufsetzen können. Dies erfordert eine neue service-orientierte Architektur der Schnittstellen der Bibliothekssysteme, die auch außerhalb der Bibliothekswelt verstanden wird.
Die E-LIB verfolgt das Ziel, neben den klassischen Such-Diensten auch neue Sichten auf die verfügbare Metadatensammlung anzubieten, um Literaturdatenmanagement auf dem Campus optimal zu unterstützen. Um die Angebote der E-LIB Bremen direkt und ohne Umwege auch im Kursmanagementsystem der Universität Bremen (Stud.IP) nutzen zu können, steht die Suchfunktion der E-LIB über eine SRU-Schnittstelle innerhalb dieser Arbeitsumgebung bereit. Dabei werden die Resultate einer Recherche im Look&Feel der Lernumgebung präsentiert.
Da die Suchmaschine mehrere Millionen elektronische Medien - darunter auch Tausende von E-Books mit Direktzugang bereitstellt, ist die Zusammenstellung rein elektronischer Semesterapparate auf Basis dieses Dienstes leicht möglich [9,10].
Neben der reinen Suchfunktion sind viele der E-LIB Dienste so modular aufgebaut, dass Sie als eigenständige Services von externen Systemen integriert und nachgenutzt werden können, dazu zählen z.B. die Tag Cloud Umfeldanalyse und die Erkennung des fachlichen Kontextes von Anfragen, die Grundlage für die Datenbankempfehlungen sind.
Wenn die vorhandene Datenbasis eine entsprechende Größe erreicht, fachlich umfassend und gleichmäßig verteilt ist, kann man davon ausgehen, dass die Dienste einen gewissen Grad der Unabhängigkeit vom lokal vorhandenen Bestand erreichen können und damit universell in anderen Systemen nachnutzbar sind.
Die Fachzuordnung einer Anfrage über die E-LIB wird derzeit bereits produktiv durch den Katalog der UB Heidelberg (HEIDI) und den Katalog des Projekts Beluga der SUB Hamburg nachgenutzt.