Was sind also Gene? – Nun ja, die haben was mit DNA zu tun. Wenn Sie auch nicht mehr über Gene wissen als das, dann ist das kein Grund zur Schande. Der Begriff “Gen” war seit jeher unscharf und er ist es bis heute geblieben. Um dies verständlich zu machen wurde dieser Artikel in zwei Teile geteilt: der erste, geschichtliche Teil erklärt die Herkunft und Entwicklung des Genbegriffs, während sich der zweite Teil auf die heutige Vorstellung von einem Gen bezieht. Dabei soll klar werden, dass trotz, oder gerade wegen des Umfangs an Forschungsarbeit zu dieser Frage, heute nicht mal Genetikern vollständig klar ist, worum es sich denn bei den Genen letztlich genau handelt.
Kurzer historischer Exkurs zum Genbegriff
Erstmals wurde der Begriff des „Gens“ 1909 von dem dänischen Botaniker Wilhelm Johannsen verwendet. Er schrieb damals
bloß die einfache Vorstellung soll Ausdruck finden, daß durch „etwas” in den Gameten eine Eigenschaft des sich entwickelnden Organismus bedingt oder mitbestimmt wird oder werden kann. Keine Hypothese über das Wesen dieses „etwas” sollte dabei aufgestellt oder gestützt werden. […] Es drückt nur die sichergestellte Tatsache aus, dass viele Eigenschaften des Organismus durch besondere, trennbare und somit selbständige ‘Zustände’, ‘Grundlagen’, ‘Anlagen’ – kurz, was wir eben Gene nennen wollen – bedingt sind. [1]
Ein Gen soll nach Johannsen also reine Denk- oder Rechnungseinheit sein, ohne dass über seine – nennen wir es “materiellen Korrelate” spekuliert werden müsste oder sogar sollte. Dennoch ist das vergangene Jahrhundert geprägt davon, diesem Korrelat auf die Spur zu kommen. Schon vor Johannsen wurde gezeigt dass der Zellkern, später – etwas genauer – das Chromatin, eine Struktur, die ihren Namen einzig der Tatsache verdankt, dass sie sich mit geeigneten Farbstoffen einfärben lässt, Träger der Erbinformation ist (wenn ihre Einheiten auch erst später “Gene” genannt wurden). Um die Jahrhundertwende auf das zwanzigste Jahrhundert wurde dann zunächst klar, dass die färbbare Substanz in den Zellkernen, das Chromatin, identisch ist mit den Chromosomen, fadenförmige Strukturen die seit einiger Zeit mit Hilfe von Mikroskopen in Zellen während der Zellteilung beobachtet werden konnten. Somit war klar, dass diese Strukturen nicht etwa bei der Zellteilung auftauchen und danach wieder verschwinden, sondern in Form des Chromatins ständig in den Zellkernen erhalten bleiben und Träger der gerade erst wiederentdeckten Mendel’schen Merkmale waren. Nun ging die Jagd nach der Erbinformation und dem was wir vorhin ihre “Korrelate” genannt hatten erst so richtig los.
Eine herausragende Forschergruppe in diesem Zusammenhang war die Gruppe um Thomas Hunt Morgan, die anfing mit Hilfe der Fruchtfliege (die man sehr einfach und kostengünstig züchten kann) mit enormen Individuenzahlen die Vererbung von Merkmalen zu untersuchen. In ihrem “Fly room” an der Columbia University konnten Sie nun die Kopplung von Genen untersuchen, also die Beobachtung, dass eben nicht jeder Faktor unabhängig voneinander vererbt wird (wie es Mendel noch beschrieben hatte), sondern dass bestimmte Merkmale oft gemeinsam vererbt werden. Sie fingen an zu beschreiben, wie häufig diese Kopplung unterbrochen ist und hatten plötzlich die geniale Idee, dass dies damit zusammenhängen könnte, wie weit die Korrelate dieser Merkmale auf den Chromosomen voneinander entfernt sind. Mit dieser Idee, einer linearen Abfolge von Genen und den experimentellen Daten über die Häufigkeit ihrer gemeinsamen oder getrennten Vererbung konnte Sie nun Genkarten erzeugen, also einzelne Merkmale, die man an Fruchtfliegen erkennen und beschreiben konnte, auf den Chromosomen zu lokalisieren.
An diese Einsicht schlossen sich nun eine Reihe weiterer Fragen an, allem Voran wieder die Frage nach der Substanz, wenn es denn eine solche gibt, der Gene. Denn Chromosomen, so haben Biochemiker analysiert, bestehen aus Proteinen, also Eiweißmolekülen und einer relativ einfachen chemischen Verbindung, die aufgrund ihres Vorkommens im Zellkern (lat: nucleus) Nukleinsäure genannt wurde. Der common sense in den biologischen Wissenschaften war damals, dass eigentlich nur Proteine die Träger der Erbinformation sein können; Proteine können komplexe Strukturen bilden und – auch das war damals schon bekannt – biochemische Reaktionen katalysieren, wohingegen die etwas kryptischen Moleküle DNA und RNA einen viel zu einfachen Aufbau zu haben schienen, um in irgendeiner Art und Weise Information codieren zu können.
Ein nächster Meilenstein, in der Geschichte der Genetik stellt ein Experiment des britischen Mediziners Frederick Griffiths aus dem jahre 1928 dar. Man kannte damals bereits den Erreger der spanischen Grippe und Griffiths arbeitete an einem Impfstoff. Er wusste, dass wenn er den Erreger, einen so genannten smooth (S) strain von Pneumokokken, in Mäuse injiziert, diese relativ rasch sterben. Ein anderer, so genannter rough (R) strain, von Pneumokokken, ist ungefährlich und kann in Mäuse injiziert werden, ohne dass diese Schaden erleiden. Wenn man den krankheitsauslösenden smooth strain mit Hitze abtötet, dann wird er ebenfalls ungefährlich und die damit injizierten Mäuse überleben. Wenn er allerdings, die abgetöteten Bakterien des smooth strain zusammen mit lebenden Bakterien, des eigentlich harmlosen rough strain mischt und injiziert, dann sterben die Mäuse. Und er folgerte daraus völlig zutreffender Weise, dass etwas in den abgetöteten Zellen die lebenden aber harmlosen Zellen so verändern, bzw. wie er es nannte, transformieren kann, dass sie eben auch tödlich wirken. Was es aber nun (chemisch gesehen) war, dass diese Transformation, also diese Übertragung von Information bzw. Fähigkeit (in diesem Fall der Pathogenität) bewirkt, das blieb weiter unklar.
Erst 1944 wurde durch ein geniales Experiment von drei Forschern, Oswald Avery, Colin MacLeod and Maclyn McCarty, zur Überraschung der gesamten Fachwelt, gezeigt, dass DNA und nicht Protein das informationstragende Molekül ist. Sie vereinzelten die zellulären Bestandteile, die als Informationsträger in Frage kamen – DNA, RNA, Lipide, Kohlenhydrate und die immer noch als Favoriten gehandelten Proteine – und bemerkten, dass nur DNA in der Lage war biologische Eigenschaften von einer Bakterienart auf eine andere zu übertragen, sie zu transformieren. Wir sind nun also in der Geschichte der Genetik so weit gelangt, wie ich eingangs das Basiswissen eines exemplarischen Lesers eingeschätzt hatte: Gene, die Einheiten unserer Vererbung, haben etwas mit DNA zu tun.
Auf einmal stand also DNA im Zentrum des Interesses und der Wettlauf nach der Aufklärung der DNA-Struktur begann. Auf dieses Kapitel in der Geschichte der Genetik soll aus Sparsamkeitsgründen und weil diese Geschichte schon so oft erzählt wurde, nur hingewiesen werden: letztlich waren es eben James Watson und Francis Crick, die 1953, unter eher fragwürdiger Zuhilfenahme eines von Rosalind Franklin erzeugten Röntgenbeugungsmuster, als Struktur des DNA-Moleküls eine Doppelhelix vorschlugen und damit ins Schwarze trafen.
Nun war also klar, dass es diese chemisch so einfach aufgebaute Säure, DNA, die Trägerin der Erbinformation sein muss. Und man kannte nun also auch ihre chemische und räumliche Struktur. Es war aber immer noch nicht klar, wie denn die DNA in der Lage ist Information zu speichern und auch zu transportieren, im Falle von Bakterien auch „horizontal“, also innerhalb ein und derselben Generation, im Falle von uns Tieren nur über die Generationen hinweg, also von Eltern auf ihre Kinder.
Auf die Arbeiten, die schließlich diesen Mechanismus aufklärten, möchte ich hier gar nicht mehr im Detail eingehen, obwohl diese den vielleicht wichtigsten Schritt in der Geschichte der Genetik darstellen. Größtenteils war es der Verdienst der Forschungsgruppe um Marshall Nirenberg, die in akribischer Kleinstarbeit tatsächlich die Art und Weise der Informationsspeicherung, also den genetischen Code aufgeklärt hat und damit unser Standardmodell vervollständigten. Immer genau drei Basen, also Einheiten auf der DNA (Adenin, Cytosin, Thymin oder Guanin) codieren für eine spezifische Aminosäure, aus denen all unsere Proteine aufgebaut sind. Und verblüffenderweise ist dieser Code absolut universell: welche drei Basen in welche Aminosäure übersetzt werden, ist in jedem Organismus gleich. Damit waren nun die wesentlichsten Fragen zur Natur der Informationsspeicherung und -übertragung weitestgehend geklärt. Francis Crick formulierte aus diesen Einsichten einige Jahre später das so genannte “Zentrale Dogma der Molekularbiologie”: Der Informationsfluss erfolgt immer von DNA (über RNA) zum Protein, niemals umgekehrt; eine Idee die die Forschung in diesem Bereich jahrzehntelang leitete, wenn auch relativ schnell klar wurde, dass diese Vorstellung zu kurz greift.
An dieser Stelle können wir rekapitulieren, dass sich also über die Zeit die Vorstellung festigte, dass ein Gen einem abgrenzbaren Stück DNA entspricht. Dieses Stück DNA wird im Zellkern in RNA umgeschrieben und diese RNA wird in ein Protein von durch die DNA-Sequenz definiertem Aufbau übersetzt. Mehr über die hinter diesen für jegliche Biologie so zentralen Prozesse erfährt der Leser im Artikel DNA-RNA-Protein. Nun aber noch kurz zu den heute vorherrschenden Vorstellungen über Gene und ihren Aufbau.
Das “Gen” heute: ein Konzept in der Krise?
Die moderne Biologie weist oft die eine oder andere Ambivalenz auf; so auch beim Genbegriff. Teils der Überzeugung, die Agnostik Johannsens überwunden zu haben, teils in reiner Missachtung dieser, wurde und wird immer noch sehr lebhaft diskutiert, worum es sich also bei den materiellen Korrelaten der Gene handelt. Und dieser Spagat zwischen den rapide wachsenden Erkenntnissen über die Natur unseres Erbgutes und dem ursprünglichen Genkonzept führt dazu, dass wir heute, vielleicht mehr denn je, unsicher geworden sind, was wir mit diesem Begriff anstellen sollen. So schreibt etwa auch Helen Pearson in einem 2006 erschienen Artikel mit dem simplen und bezeichnenden Titel “What is a gene?”:
The more expert scientists become in molecular genetics, the less easy it is to be sure about what, if anything, a gene actually is. [2]
Nach den im ersten Abschnitt beschriebenen Erkenntnissen formulierte man also die “Ein-Gen-ein-Protein”-Hypothese: ein definierter Abschnitt auf dem DNA-Strang liefert den Bauplan zur Herstellung eines bestimmten Proteins, welches dann Struktur- oder Katalysatorfunktionen in der Zelle verrichtet. Auch wenn ich in weiterer Folge diskutieren will, warum diese Ansicht so massiv ins Wanken gerät, dass die Zweckmäßigkeit des Genbegriffs vielleicht generell in Frage gestellt werden muss, denke ich es ist hilfreich zunächst dennoch eine Synopse aus der gängigen Lehrmeinung zu geben, die rudimentär widerspiegelt welche Vorstellung der praktizierende Forscher (oder auch Arzt) im Alltag von einem Gen hat:
Ein Gen hat einen definierten Anfang und ein definiertes Ende; dadurch auch eine definierte Länge. Der Start eines Gens wird durch bestimmte charakteristische Sequenzen markiert. Diese Sequenzen bilden Bindungsstellen für die Proteine, die an der Anfertigung einer RNA-Kopie des Abschnittes beteiligt sind. Analog dazu finden sich am Ende eines Gens bestimmte Sequenzen, die die Proteine veranlasst von der DNA abzufallen. Per Definition gehören diese regulatorischen Elemente, obwohl sie nicht zu dem Bereich gehören, der in RNA übersetzt wird, zu dem Gen dazu. Dies beinhaltet auch weiter entfernt liegende Elemente der DNA, wenn sie auf die Regulation der Aktivität, das heißt des Maßes, in dem das Gen abgelesen wird, Einfluss haben. Solche Fernwirkungen von so genannten Enhancer Regionen sind tatsächlich keine Seltenheit im Genom und wir sind weit davon entfernt, sie alle identifiziert zu haben.
Es wird also nur ein Teil des Gens überhaupt erst in RNA umgeschrieben (wie das geschieht wird hier erklärt), diese Teile des Gens werden Exons genannt. Dazwischen liegen Bereiche, die ausgespart werden, also gar nicht erst in der RNA-Abschrift (dem Transkript) der Sequenz landen, die Introns. Das Transkript besteht nun also aus einer Aneinanderreihung aller Exons eines Gens (im Durchschnitt sind das etwa acht). Von dieser RNA-Sequenz wird allerdings wiederum nur ein Teil als Bauplan für das entsprechende Protein abgelesen und übersetzt (auch dieser Prozess wird hier genauer erklärt), dieser Teil wird dementsprechend als kodierende Sequenz bezeichnet.
Nach der Vorlage eines bestimmten Gens wird also auf diese Art ein ganz bestimmtes Protein gebaut. Gleichzeitig mit dem Wettlauf um die vollständige Sequenzierung des humanen Genoms liefen auch jede Menge groß angelegter Wetten bezüglich der Anzahl der Gene (im gerade eben beschriebenen Sinn), die der Mensch denn nun besitzt. Erste Schätzungen rangierten dabei zwischen 100.000 und 500.000. Interessanterweise wurde mit zunehmendem Einblick ins Genom diese Zahl immer weiter nach unten korrigiert und heute liegen wir bei etwa 20.000 Genen (das sind sogar ein paar weniger als beispielsweise in der Maus).
Exons, also Abschnitte die zu RNA-Abschnitten übersetzt werden und dann als Bauanleitung für Proteine dienen machen dabei nur etwa 1-2% des Genoms aus, was dazu führte, dass der Rest des Genoms gerne als “Junk-DNA” bezeichnet wurde – ein Überrest aus vergangener Zeit und heutzutage nutzlosem Müll. Auch diese Ansicht musste revidiert werden, denn wir schätzen heute, dass vermutlich über 50% unseres Genoms zumindest in RNA transkribiert wird. Allerdings wird eben nur ein kleiner Teil dann auch als Matrize für den Proteinbau verwendet, der Rest der Transkripte bleibt RNA. Durch diese Einsicht wurde die RNA in den vergangenen Jahrzehnten zu einem boomenden Forschungsobjekt. Zunächst als langweiliger Vermittler zwischen DNA und Protein erachtet, erlebt sie nun eine Blütezeit und es reihen sich Forschungsarbeiten aneinander, die verschiedenste biologische Funktionen für RNA aufdecken und beschreiben.
Dies erklärt auch zu einem weiten Teil schon das Problem, dass wir heute mit dem Konzept “Gen” haben. Ist also nur noch Gen, was letztendlich Grundlage für ein Protein darstellt? Oder ist alles ein Gen, was abgelesen wird und ein Produkt codiert, welches dann eine Funktion im Organismus ausübt, möge dieses Genprodukt nun aus Protein oder RNA bestehen? Mit dieser Frage beschäftigte sich ein Konsortium aus führenden Wissenschaftlern aus diesem Feld zwei Tage lang (wobei laut Interviews viel gebrüllt und geschimpft wurde) um auf eine relativ unbestimmte Definition zu kommen:
“A locatable region of genomic sequence, corresponding to a unit of inheritance, which is associated with regulatory regions, transcribed regions and/or other functional sequence regions” [2]
Sollte man sich auf diese Definition nun also wirklich einigen, dann müsste die Anzahl der Gene im Menschen vielleicht wieder um Größenordnungen nach oben korrigiert werden und/oder die Grenzen zwischen den Genen verschwimmen ins Unermessliche. Es sieht – zumindest meiner Einschätzung nach – allerdings eher danach aus, als ob der Begriff des Gens als starre Einheit mehr und mehr an Bedeutung verliert; er scheint einfach nicht mehr zeitgemäß zu sein um unser Erbmaterial zu erfassen. Ob er aber wirklich im Lichte neuerer Forschung in der Bedeutungslosigkeit untergeht und ersatzlos verschwindet und/oder ob er vielleicht von anderen, ähnlich intendierten, Konzepten abgelöst wird, kann nur die Zukunft zeigen.
[1] Johannsen, W. (1909): Elemente der exakten Erblichkeitslehre: Deutsche wesentlich erweiterte Ausgabe in fünfundzwanzig Vorlesungen: G. Fischer. Available online at https://books.google.de/books?id=yoBUAAAAMAAJ
[2] Pearson, Helen (2006): Genetics: What is a gene? In Nature 441 (7092), pp. 398–401. DOI: 10.1038/441398a.