Datenbankgestützte Substanzbeschaffung in der forschenden Chemieindustrie – ein algorithmischer Optimierungsansatz
Dipl.-Oec. Schmid, Ernst-Georg
Dateibereich 24687
3,22 MB in einer Datei, zuletzt geändert am 05.08.2010
| Datei | Dateien geändert am | Größe |
|---|---|---|
| schmid_diss.pdf | 05.08.2010 17:02:16 | 3,22 MB |
Die Speicherung und Suche chemischer graphischer Datentypen wie Strukturen und
Reaktionen in relationalen Datenbanksystemen ist ein in Wissenschaft und Industrie
etabliertes Verfahren. Aufgrund der rechenintensiven Algorithmen zur Erkennung
von (Sub)Graphen-Isomorphismus benutzen solche Systeme in der Regel schnellere
Selektionsmechanismen, um die Menge potentieller Kandidaten bereits im Vorfeld
einzuschränken.
Dabei werden verbreitet Selektionsmechanismen eingesetzt, die auf numerischen und
binären Vektoren, Fingerprints genannt, basieren, mit einer klaren Dominanz binärer
Fingerprints aufgrund ihrer Geschwindigkeitsvorteile bei bitweisen Operationen und
der besseren Speichereffizienz. Die beiden am Häufigsten eingesetzten binären Finger-
prints sind einerseits Pfad-generiert, andererseits Wörterbuch-generiert, wobei beide
spezifische Schwächen, insbesondere blinde Stellen, aufweisen.
Um diese Schwächen zu überwinden, benutzt die Pgchem::Tigress Erweiterung
für das objektrelationale Datenbankmanagementsystem PostgreSQL einen hybri-
den binären Fingerprint, der aus einem invarianten Pfad-generierten Teil und einem
Substruktur-generierten Teil besteht, welcher extern durch ein Wörterbuch von Sub-
strukturmustern konfiguriert werden kann.
Diese Arbeit stellt einen neuartigen Ansatz vor, um für beliebige Strukturdaten mittels
dynamischer diskreter Optimierung die optimierte Konfiguration des Wörterbuchs für
den Substruktur-generierten Teils des Fingerprints zu finden.
Mittels des Einsatzes des in dieser Arbeit entwickelten Verfahrens kann die notwendige
Rechenleistung zum Betrieb eines chemischen Informationssystems um durchschnittlich
42 Prozent reduziert werden. Durch den so verbesserten Anfragedurchsatz lassen sich
der Umstieg auf die nächsthöhere verfügbare Leistungsstufe eines Servers vermeiden
und so signifikante Opportunitätserlöse bei den Betriebskosten realisieren.
Lesezeichen:
Dokumententyp:
Wissenschaftliche Abschlussarbeiten » Dissertation
Fakultät / Institut:
Mercator School of Management - Fakultät für Betriebswirtschaftslehre » Technology and Operations Management » Wirtschaftsinformatik und Operations Research
Dewey Dezimal-Klassifikation:
300 Sozialwissenschaften » 330 Wirtschaft
Stichwörter:
Datenbank, Substanzbeschaffung, Chemieindustrie, Fingerprint, Graphen, Isomorphismus, chemoinformatics, Informationssysteme, Optimierung, Operations Research
Beitragende:
Prof. Dr. rer. oec. Chamoni, Peter [Betreuer(in), Doktorvater]
Prof. Dr. Kimms, Alf [Gutachter(in), Rezensent(in)]
Prof. Dr. Kimms, Alf [Gutachter(in), Rezensent(in)]
Sprache:
Deutsch
Kollektion / Status:
Dissertationen / Dokument veröffentlicht
Datum der Promotion:
21.07.2010
Promotionsantrag am:
18.06.2010
Dateien geändert am:
05.08.2010
Medientyp:
Text
