Logo von PhysikOnline Dies ist ein Archiv der BioKemika, zur Verfügung gestellt von PhysikOnline

Im Rahmen vom Vintage-Projekt des studentischen eLearning am Fachbereich 13 der Goethe-Universität werden alte studentische Projekte wieder erreichbar gemacht. Weitere Infos. Diese Kopie der BioKemika ist Read-Only, es ist kein Login zum Verändern der Informationen möglich.

Portal:Bioinformatik/Datenbanken

Aus BioKemika

Wechseln zu: Navigation, Suche

Was finde ich in diesem Portal?

Dieses Portal soll dir einen Überblick über die Inhalte und Nutzung von wichtigen online-Datenbanken mit biochemischen Inhalten verschaffen. Am wichtigsten sind hier wohl die Datenbanken mit Informationen über Proteine und Gene, es werden jedoch auch Datenbanken für organische Verbindungen oder verschiedene Organismen aufgeführt. Die wichtigsten Datenbanken sind in größeren Web-Portalen organisiert. Das wohl bekannteste und wichtigste Web-Portal ist NCBI, das zahlreiche Datenbanken zusammenfasst. Viele der im Folgenden genannten Datenbanken sind auf NCBI zu Hause.

Einige Anmerkungen vorneweg

Wenn du dich unter den vielen Datenbank-Angeboten zurecht finden willst, solltest du dir einige Dinge ständig vor Augen führen: Zunächst einmal gibt es sehr viele Datenbanken mit ähnlichen oder sogar identischen Daten - man spricht von Redundanz. Die Unterschiede zwischen den Datenbanken liegen in der "Darstellung", der "Sortierung" sowie der "Selektion" der Informationen. "Selektion" meint, dass andere Datenbanken, so genannte primäre Datenbanken, als Quelle für viele Informationen einer sekundären Datenbank dienen, jedoch nicht alle Daten der entsprechenden primären Datenbank auch verwendet werden. Während bestimmte primäre Datenbanken wie GenBank für Nukleinsäuren oder UniParc für Protein-Sequenzen einfach alle öffentlich verfügbaren Sequenzen enthalten, so werden nur die "guten Daten" für den Datensatz in der sekundären Datenbank verwendet - und "gut" kann von Datenbank zu Datenbank unterschiedlich sein. Ebenso sollte man beachten: Auf eine primäre Datenbank kommen im Internet im Allgemeinen mindestens 100 sekundäre Datenbanken. Zum Stichwort "Darstellung" sind die online-Tools zu nennen, die auf den Datenbank-Seiten implementiert sind und mit denen die Informationen auf unterschiedliche Weise betrachtet werden können. Die Daten werden in unterschiedlichen Datenbanken sehr unterschiedlich dargestellt: Mal sieht man eine endlos-lang erscheinende Ergebnis-Tabelle mit zahlreichen Querverlinkungen zu anderen Datenbanken (Stichwort: Vernetzung); Ein anderes mal sieht man eine recht unübersichtliche, auf Text basierende Ergebnis-Datei wie das GenBank-Format für Nukleinsäure-Sequenzen - Diese Dateien entsprechen quasi den Rohdaten ohne jegliche Art der Vernetzung. Zum Stichwort "Sortierung" einige Wort mehr: Es gibt z.B. Datenbanken, die es ermöglichen anhand von globalen Stoffwechselkarten bis zum Enzym und der entsprechenden Organischen Struktur, die in der enzymatischen Reaktion umgesetzt wird zu navigieren. Andere Enzym-Datenbanken bauen ihre Hierarchie nach den EC-Nummern der Enzyme auf. wiederum andere sortieren Proteine nach ihren konservierten Domänen oder fassen alle verwandten Proteine aus verschiedenen Organismen in einen Datenbank-Eintrag zusammen.

Die folgenden, beschriebenen Datenbanken sind häufig Teile von großen Web-Portalen. Zwei Web-Portale sind für Biochemiker besonders wichtig: NCBI (→Homepage, National Center for Biotechnology Information) und EBI (→Homepage, European Bioinformatic Institute). Beide Web-Portale beinhalten äquivalente Datenbanken und Tools, mit entsprechenden Stärken und Schwächen - Es ist hauptsächlich reine Geschmackssache, welche Funktionen aus welchem Web-Portal genutzt werden. Vergleiche und entscheide selbst!
Eine Datenbank ist besonders interessant: Die DBD (→Homepage, Database of Biological Database) ist eine Datenbank für biologische Datenbanken. Eine Stichwortsuche oder ein alphabetischer Index bringen dich schnell zu potentiellen Zielen für deine Suchanfrage...