Wenn man die Bestandteile von Zellen oder auch des gesamten (z.B. menschlichen) Organismus ansieht, dann findet man im Wesentlichen ein relativ überschaubares Spektrum von Substanzklassen. Wasser ist bekanntermaßen das am häufigsten vorkommende Molekül des menschlichen Körpers, alle anderen Verbindungen agieren also in diesem wässrigen Milieu. Neben einigen Ionen sind das folgende größere Verbindungen:
- Lipide, also Fette, die vor allem wichtig sind, da sie unsere Zellmembranen, die äußeren Grenzschichten der Zellen, bilden
- Kohlenhydrate, also Zucker, sie sind in erster Linie Energielieferanten und -speicher
- Proteine, die vielleicht vielfältigste Substanzklasse; sie bilden z.B. Gerüste und andere Strukturen; Proteinkomplexe katalysieren vor allem aber auch biologische Reaktionen, dann bezeichnet man sie als Enzyme
- Nukleinsäuren, die in zwei Formen vorliegen: der Desoxyribonukleinsäure (DNA; A vom engl. acid) und der Ribonukleinsäure (RNA)
Lipide und Kohlenhydrate werden hier nicht weiter behandelt, ihre Funktion wird aber in einem Hintergrundartikel zur Zellbiologie erläutert. Wir wenden uns also den letzteren beiden Substanzklassen zu: Nukleinsäuren und Proteinen.
Aufbau und Replikation der DNA
Die Bezeichnung Desoxyribonukleinsäure ergibt sich einerseits durch ihren Entdeckungszusammenhang (der Tübinger Chemiker Friedrich Miescher isolierte die Substanz 1869 erstmals aus Zellkernen – lat.: nuclei – und nannte sie dementsprechend nuclein), andererseits durch ihre chemische Struktur. Das Rückgrat der DNA, sozusagen also die Wendel der Treppe, bildet ein besonderer Zucker, die Desoxyribose, deren ringförmige Einheiten miteinander durch Phosphatgruppen verknüpft sind. Dieses Rückgrat ist immer das gleiche: an allen Stellen des Genoms, bei allen Menschen, ja sogar bei allen Tieren und Pflanzen, die bisher bekannt sind.
Die “Sequenz” der DNA und damit ihre individuelle Einzigartigkeit ergibt sich durch die Abfolge der Sprossen der Wendeltreppe, der so genannten Nukleotide. Diese Sprossen werden gebildet aus je zwei Nukleotiden, die sich gegenüberliegen. Wie in Abbildung 1 erkennbar paart Adenin dabei immer mit Thymin (sie bilden zwei Wasserstoffbrücken zwischen einander) und Cytosin immer mit Guanin (sie bilden drei Wasserstoffbrücken zwischen einander). Die Abkürzungen für diese vier Nukleotide sind A, T, C und G. Auf diese Art kann man eine DNA-Sequenz also als Abfolge dieser vier Buchstaben angeben, z.B. ACGTGTGCATGTCTGA. Da die Nukleotide immer dieselben Partner haben, ist der Gegenstrang der Doppelhelix damit auch schon definiert und wird daher üblicherweise nicht angegeben. Die Nukleotide folgen also aufeinander in zwei parallelen Strängen, wobei sie mit den jeweils entsprechenden Nukleotiden des Gegenstrangs Wasserstoffbrücken bilden. Diese Stränge sind zu der berühmten Doppelhelix gewunden. Damit aber nicht genug. Um von dieser Doppelhelix auf die lichtmikroskopisch sichtbaren Chromosomen zu gelangen wird dieser DNA-Faden noch mehrfach ineinander gedrillt und gewunden; dazu mehr im Artikel zum Genom.
Wir wollen uns stattdessen noch der Replikation der DNA widmen, also dem Prozess in dem die DNA-Stränge kopiert werden, damit nach einer Zellteilung die beiden Tochterzellen wieder den gesamten genetischen Code beinhalten. Dazu möchte ich ein weiteres Mal einen kurzen geschichtlichen Rückblick anstellen und eine Arbeit vorzustellen, die schon von etlichen Anderen als das “schönste Experiment der Biologie” bezeichnet wurde.
Im letzten Absatz des Artikels, im dem James Watson und Francis Crick 1953 die Doppelhelix als Struktur der DNA vorschlagen schreiben sie:
It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic material. [2]
Dennoch dauerte es noch 5 Jahre bis Matthew Meselson und Franklin Stahl in einem genialen Experiment das Prinzip der DNA-Replikation aufklärten. Sie ließen Bakterien in einer speziellen Nählösung wachsen, die das schwerere Stickstoffisotop N15 enthält. DNA enthält soviel Stickstoff, dass man Bakterien, die das schwere Isotop in ihr Genom eingebaut haben durch Zentrifugation von Bakterien trennen kann, die die normale Form des Stickstoffs N14 in ihrer DNA verwenden. Nachdem sie die Bakterien in ein normales (N14 beinhaltendes) Nährmedium gegen hatten, erhielten sie nach der ersten Zellteilung eine Bakteriengeneration mit mittelschwerer DNA, nach der zweiten Zellteilung zerfiel die Bakterienpopulation in zwei Gruppen: eine Hälfte hatte mittelschwere DNA (50% N15, 50% N14) wohingegen die andere Hälfte nur noch das normale N14 in ihrer DNA eingebaut zu haben scheinten. Dies deutete darauf hin dass DNA semikonservativ repliziert wird, d.h. dass die Stränge aufgetrennt werden und zu jedem Matrizenstrang der komplementäre Strang neu aufgebaut wird. Beide Tochterzellen erhalten nun also einen Strang, der auch schon in der Mutterzelle vorhanden war und einen neu synthetisierten Strang.
An dieser semikonservativen Replikation sind mehrere Proteinkomplexe beteiligt, von denen hier nur zwei erwähnt werden sollen: so genannte Helikasen trennen die beiden Doppelstränge voneinander, woraufhin DNA-Polymerasen entlang der beiden elterlichen DNA-Stränge die neuen jeweils entsprechenden Gegenstränge aufbauen. Als Polymerasen bezeichnen Biologen alle Enzyme, die Nukleinsäuren aufbauen (polymerisieren). Entsprechend den beiden Typen von Nukleinsäuren wird daher zwischen DNA-Polymerasen und RNA-Polymerasen unterschieden. Von Letztgenannten wird im folgenden Abschnitt die Rede sein.
Transkription: von der DNA zur mRNA
Wir haben im vorigen Abschnitt schon kurz regulatorische Abschnitte besprochen, die die Aktivität von Genen steuern, d.h. wann sie „abgelesen“ werden. Dazu gehören Bereiche unmittelbar vor dem Gen (Promotoren) und Bereiche, die in beträchtlichem Abstand vor dem Gen, mitten im Gen, oder auch weit hinter dem Gen liegen können (Enhancer). Diese Promotoren und Enhancer repräsentieren Bindestellen für bestimmte Proteine (Transkriptionsfaktoren), die teilweise nur unter bestimmten Bedingungen im Zellkern vorliegen. Dadurch wird reguliert wo, wann und in welchem Maße das entsprechende Gen abgelesen (exprimiert) wird. Von den gerade “benötigten” Genen fertigen dann RNA-Polymerasen eine Abschrift an. Was aber bedeutet das, eine RNA-Abschrift bzw. ein RNA Transkript?
RNA unterscheidet sich chemisch gesehen nur sehr wenig von DNA: die Zuckerkomponente in der RNA hat ein Sauerstoffatom zusätzlich (deswegen heißt die DNA Desoxyribonukleinsäure bezogen auf das Fehlen dieses Sauerstoffes) und das Nukleotid Thymin ist durch das ähnliche Nukleotid Uracil ausgetauscht. Demensprechend lautet ein RNA-Code beispielsweise AGCUGCUAAGCUG. Dieses RNA-Molekül, das also als Gegenstrang zu einem Abschnitt der DNA entstanden ist, wird nun aus dem Zellkern hinaus ins Cytoplasma transportiert wo es als Matrize für den Bau eines Proteins dient. Aufgrund dieser Botenfunktion wird diese Form der RNA messenger RNA (kurz mRNA) genannt.
RNA – ein lange Zeit unterschätztes Molekül
Die Gene, als DNA-Abschnitte, bleiben also sicher im Genom des Zellkerns verwahrt. Letztliches Produkt vieler Gene sind Proteine, von denen je nach Zustand der Zelle immer eine unterschiedliche Anzahl und Zusammensetzung gebraucht wird. Die mRNA stellt also die Vermittlerin dar; es sind die Kopien all jener Gene deren Proteinbauplan ins Cytoplasms raus geschickt werden soll. Lange Zeit glaubte man, dass sich die Funktion der RNA als chemische Verbindung im Wesentlichen auf diese Übermittlungsleistung beschränkt. Man konnte kaum mehr irren.
An anderer Stelle habe ich bereits erwähnt, dass vermutlich über 50% des Genoms transkribiert wird, obwohl nur 1-2% auch tatsächlich für Proteine codieren. Das bedeutet, dass in unseren Zellen eine enorme Vielfalt an Transkripten herumwabert, die wohl – davon ist auszugehen – ein sehr breites Spektrum an Funktionen ausübt. Viele dieser nicht-Protein-codierenden RNA Moleküle (non-coding RNAs, kurz ncRNAs) sind daran beteiligt die Aktivität der Gene zu regeln. So wie viele Proteine auch, können sie an die DNA binden und dort die Zugänglichkeit des Gens für die RNA-Polymerase erhöhen oder auch verringern, wodurch das Gen vermehrt oder vermindert abgelesen wird. Zwei weitere Formen von funktionell aktiven RNA-Molekülen werden im folgenden Abschnitt erläutert, wenn es darum geht zu erklären, wie aus der mRNA ein Protein gebaut wird.
Translation – von der RNA zum Protein: Der genetische Code
Bislang habe ich nur beschrieben wie ein Abschnitt der einen Art von Nukleinsäure (DNA) in ein Stückchen anderer Nukleinsäure (RNA) umgeschrieben wird, das hatten wir als Transkription bezeichnet. Im nächsten Schritt passiert nun allerdings das eigentlich Magische: nach der mRNA Vorlage wird im Zytoplasma ein ganz spezifisches Protein gebaut, also ein Molekül einer völlig anderen Substanzklasse.
Proteine sind aus Aminosäuren aufgebaut, deren exakte chemische Beschreibung hier unwichtig erscheint. Relevant für unsere Zwecke ist es zu verstehen, dass alle 20 Aminosäuren, aus denen unsere Proteine aufgebaut sind, über einen Abschnitt verfügen indem sie sich alle gleichen. An diesem Ende des Moleküls werden die Aminosäuren zu einer Kette zusammengehängt, wenn das Protein gebaut wird. Noch wichtiger für die Funktion des Proteins ist aber der spezifische Teil des Moleküls, der sozusagen von der Kette weg nach außen ragt. Hier unterscheiden sich die Aminosäuren, einige sind geladen, andere elektrisch neutral; einige orientieren sich preferentiell zum Wasser hin, andere vom Wasser weg (man spricht von hydrophilen und hydrophoben Resten). Hydrophobe Anteile eines Proteins klumpen sich daher z.B. zusammen (um möglichst wenig dem umliegenden Wasser ausgesetzt zu sein), was dem Protein eine individuelle Struktur verleiht. Einige Proteine bilden helicale Strukturen; diese treten vor allem bei Proteinen auf, deren besondere Aufgabe in der Gewährung von Zugfestigkeit oder Stabilität ist, beispielsweise wenn es um das Keratin von Haaren oder Fingernägeln geht. Andere Proteine falten sich so, dass Stellen entstehen, die chemische Gruppen kurzfristig annehmen und wieder abgeben können, solche Proteine spielen als Enzyme in unserem Metabolismus (z.B. bei der allgegenwärtigen Spaltung von Zucker zur Energiegewinnung) eine zentrale Rolle.
Aber zurück zur Herstellung eines Proteins: wie wird die mRNA denn nun in eine Abfolge von Aminosäuren übersetzt? Hauptakteur in diesem Prozess ist das Ribosom, ein Komplex aus Protein und ribosomaler RNA (kurz rRNA). Auch noch eine weitere Klasse von RNA-Molekülen spielt hier eine entscheidende Rolle, die transfer RNA (tRNA). Und die letzte Komponente, die hier eingeführt werden muss, ist die zentrale Zauberformel, die Übersetzungstabelle: der genetische Code. Wir haben bislang noch nicht behandelt, in welcher Form die vier Nukleotide der DNA bzw. RNA die 20 verschiedenen Aminosäuren codieren. Würden immer zwei Nukleotide für eine Aminosäure codieren so ergäben sich 2^4, also 16 Möglichkeiten, d.h. wir könnten nur 16 verschiedene Aminosäuren codieren. Um also 20 verschiedene Aminosäuren eindeutig auf der DNA bzw. RNA abzubilden benötigt es eine Codierung in Triplets. Immer drei aufeinander folgende Nukleotide codieren für eine bestimmte Aminosäure. Da dies, bei vier verschiedenen Nukleotiden, 3^4, also 64 verschiedene Möglichkeiten ergibt, gibt es einige Aminosäuren die durch verschiedene Triplets codiert werden können. Interessanterweise ist der genetische Code universal, d.h. er ist (im Wesentlichen) in allen Tiere und sogar Pflanzen derselbe. Diese universelle Übersetzung wird oft in einer so genannten Code-Sonne dargestellt, wie sie in Abbildung 3 gezeigt ist.
Die mRNA kommt also aus dem Zellkern in das umliegende Cytoplasma. Dieses ist voll von Ribosomen, die sofort anfangen an die mRNA zu binden und an ihr entlanglaufend die Sequenz abzuscannen. Sobald sie auf die Abfolge AUG, das universelle Start-Codon (ein Codon bezeichnet ein Triplet auf der mRNA) treffen, beginnen sie mit ihrer Arbeit. Dabei binden sie, spezifisch für jedes erdenkliche Codon, eine spezifische tRNA. Die tRNA ist ein kleeblattförmiges Stück RNA an deren einem Ende das entsprechende Gegenstück für ein spezifisches Codon ist (das Anticodon), während an ihrem anderen Ende die entprechende Aminosäure sitzt. Die tRNA mit dem Anticodon UAC (und damit dem Gegenstück für unser Start-Codon AUG) ist immer mit der Aminosäure Methionin beladen. Und da AUG das Start-Codon für jedes Protein darstellt, ist die erste Aminosäure im Aufbau eines Proteins immer Methionin (auch wenn dieses Methionin oft nachträglich wieder entfernt wird).
Von hier aus rutscht das Ribosom immer ein Triplet weiter und “fängt” wieder die entsprechende tRNA ein, die dann spezifisch zu dem nächsten Codon die entsprechende Aminosäure herantransportiert. Beim Weiterrutschen werden die Aminosäuren mittels sogenannter Peptidbindung verknüpft, wodurch eine wachsende Kette von Aminosäuren entsteht, die das Protein bildet. Die jeweilige tRNA, dann ihrer Aminosäure entledigt, wird entlassen, woraufhin sie von entsprechenden Enzymen immer wieder mit der ihr eigenen Aminosäure beladen werden kann.
Noch während die Aminosäurenkette wächst, wirken die elektrischen und chemischen Eigenschaften der inkorporierten Aminosäuren (die ja z.B. hydrophobe oder hydrophile Abschnitte haben können). Dies bewirkt, dass sich das Protein auf spezifische Art faltet. So kann sich zum Beispiel ein Transkriptionsfaktor bilden, also ein Protein, dass wiederum beim Ablesen von Genen auf der DNA beteiligt ist. Und so fängt das Spiel wieder von vorne an…
[1] Picture modified according to CC BY-SA 3.0 from Zephyris, original: https://en.wikipedia.org/wiki/DNA (8.2.2016)
[2] Watson, J. D.; Crick, F. H. C. (1953): Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid. In Nature 171 (4356), pp. 737–738. DOI: 10.1038/171737a0.