Schmid, Ernst-Georg:

Datenbankgestützte Substanzbeschaffung in der forschenden Chemieindustrie

Duisburg (2010), 186 S. : Ill., graph. Darst.
Dissertation / Fach: Wirtschaftswissenschaften
Mercator School of Management - Fakultät für Betriebswirtschaftslehre
Duisburg, Essen, Univ., Diss., 2010
Abstract:
Die Speicherung und Suche chemischer graphischer Datentypen wie Strukturen und Reaktionen in relationalen Datenbanksystemen ist ein in Wissenschaft und Industrie etabliertes Verfahren. Aufgrund der rechenintensiven Algorithmen zur Erkennung von (Sub)Graphen-Isomorphismus benutzen solche Systeme in der Regel schnellere Selektionsmechanismen, um die Menge potentieller Kandidaten bereits im Vorfeld einzuschränken. Dabei werden verbreitet Selektionsmechanismen eingesetzt, die auf numerischen und binären Vektoren, Fingerprints genannt, basieren, mit einer klaren Dominanz binärer Fingerprints aufgrund ihrer Geschwindigkeitsvorteile bei bitweisen Operationen und der besseren Speichereffizienz. Die beiden am Häufigsten eingesetzten binären Finger- prints sind einerseits Pfad-generiert, andererseits Wörterbuch-generiert, wobei beide spezifische Schwächen, insbesondere blinde Stellen, aufweisen. Um diese Schwächen zu überwinden, benutzt die Pgchem::Tigress Erweiterung für das objektrelationale Datenbankmanagementsystem PostgreSQL einen hybri- den binären Fingerprint, der aus einem invarianten Pfad-generierten Teil und einem Substruktur-generierten Teil besteht, welcher extern durch ein Wörterbuch von Sub- strukturmustern konfiguriert werden kann. Diese Arbeit stellt einen neuartigen Ansatz vor, um für beliebige Strukturdaten mittels dynamischer diskreter Optimierung die optimierte Konfiguration des Wörterbuchs für den Substruktur-generierten Teils des Fingerprints zu finden. Mittels des Einsatzes des in dieser Arbeit entwickelten Verfahrens kann die notwendige Rechenleistung zum Betrieb eines chemischen Informationssystems um durchschnittlich 42 Prozent reduziert werden. Durch den so verbesserten Anfragedurchsatz lassen sich der Umstieg auf die nächsthöhere verfügbare Leistungsstufe eines Servers vermeiden und so signifikante Opportunitätserlöse bei den Betriebskosten realisieren.

Dieser Eintrag ist freigegeben.