ArchivDeutsches Ärzteblatt46/2002Variabilität im menschlichen Genom: Bedeutung für die Krankheitsforschung

MEDIZIN

Variabilität im menschlichen Genom: Bedeutung für die Krankheitsforschung

Dtsch Arztebl 2002; 99(46): A-3091 / B-2615 / C-2442

Cichon, Sven

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...
LNSLNS Zusammenfassung
Das Genom des Menschen ist weitgehend sequenziert, und etwa 30 000 bis 40 000 Gene sind identifiziert. Dies ist ein wichtiger Schritt, um molekularbiologische Abläufe im menschlichen Körper besser zu verstehen. Für die Aufklärung der erblichen Ursachen von Krankheiten ist aber darüber hinaus noch ein weiterer Aspekt von großer Bedeutung: die Kenntnis der individuellen Unterschiede in der Erbinformation, der genetischen Variabilität. Sie stellt den Schlüssel dar, mit dem sich jene genetischen Unterschiede aufspüren lassen, die bestimmte physiologische Abläufe verändern und so zur Entstehung von Krankheiten beitragen. Die Arbeit gibt einen Überblick über die verschiedenen Formen genetischer Variabilität beim Menschen, ihre Häufigkeit und Verteilung. Sie soll damit zum Verständnis der Bedeutung genetischer Variabilität für die Krankheitsforschung beitragen.

Schlüsselwörter: genetische Variabilität, Humangenomprojekt, Gensequenzierung, Molekularbiologie, Genmutation

Summary
The Variability of the Human Genome and its Relevance for Medical Research
A working draft of the human genome has been completed and about 30 000 to 40 000 genes have been identified. This scientific progress has profound impact on the understanding of the biological mechanisms that govern the functions of the human organism. A new dimension to the human genome is added by exploring the variability present among individuals. The knowledge on genetic variability will be the key resource for understanding the genetic differences leading to altered physiological processes and, as a consequence, to development of disease. This manuscript surveys current knowledge on classes of variability,
relative frequencies and genome-wide distributions.

Key words: genetic variability, human genome project, gene sequencing, molecular biology, gene mutation

Das Humangenomprojekt (HGP) wurde im Jahre 1990 vom U.S. Department of Energy (DOE) und den National Institutes of Health (NIH) in Zusammenarbeit mit internationalen Forschungszentren initiiert. Ziel des ambitionierten Projektes war die Entschlüsselung des menschlichen Genoms. Unter Entschlüsselung wurde die Bestimmung der Abfolge aller 3,2 Milliarden DNA-Bausteine (DNA-Sequenz) des haploiden Genoms sowie die Identifizierung aller vorhandenen Gene verstanden.
Ursprünglich auf eine Laufzeit von 15 Jahren angelegt, sorgten enorme Fortschritte in der DNA-Sequenziertechnologie zu Beginn der 90er-Jahre, aber auch ein Wettrennen mit der Privatfirma Celera Genomics (Rockville, MD, USA), für eine enorme Beschleunigung des Projektes. Schließlich wurde bereits fünf Jahre früher als anfänglich geplant, im Juni 2000, unter großer Anteilnahme der Öffentlichkeit das Vorliegen einer nahezu vollständigen DNA-Referenzsequenz des Menschen verkündet. Diese Referenzsequenz umfasst etwa 90 Prozent der euchromatischen (das heißt Gen-reichen) Bereiche des menschlichen Genoms. Bis zum Jahr 2003 sollen noch vorhandene Lücken in der DNA-Sequenz geschlossen und Sequenzierfehler beseitigt werden.
Der Name Humangenomprojekt ist in gewisser Weise missverständlich, impliziert er doch die Existenz eines einzigen menschlichen Genoms. Tatsächlich weiß man heute aber, dass die DNA-Sequenz durch eine erhebliche individuelle Variabilität gekennzeichnet ist. Man kann sagen, dass jeder Mensch ein einzigartiges Genom trägt: Vergleicht man zwei beliebige menschliche Genome miteinander, so stellt man zwar eine 99,9-prozentige Übereinstimmung fest, die verbleibenden 0,1 Prozent jedoch repräsentieren etwa 3 000 000 Sequenzunterschiede. Ein Teil dieser Unterschiede muss für den genetischen Anteil der individuellen Variabilität verantwortlich sein, unter anderem in Bezug auf Aussehen, Persönlichkeit, Begabung und auch Krankheitsdispositionen. Der größere Teil bleibt jedoch sehr wahrscheinlich ohne phänotypische Konsequenz. Es leuchtet sofort ein, dass die Kenntnis von Sequenzvarianten, die für phänotypische Variabilität und Krankheitsdispositionen verantwortlich sind, von außerordentlichem Interesse für die biomedizinische Forschung sind. Weniger selbstverständlich ist die Tatsache, dass auch die anderen, phänotypisch nicht sichtbaren polymorphen Stellen im Genom eine enorme Bedeutung als so genannte genetische Marker haben: Sie stellen Orientierungspunkte in der unübersichtlichen Genomsequenz dar und sind sehr häufig ein wichtiges Werkzeug zur Aufklärung der Ursachen von Erkrankungen.
Die Kenntnis der genetischen Variabilität ist somit von existenzieller Wichtigkeit für die Humangenetik beziehungsweise medizinische Genetik. Einem weiteren Fach, der molekularen Anthropologie, ermöglicht sie einen Zugang zum Ursprung und zur Vergangenheit des Menschen. Dieser Forschungszweig versucht, über die Untersuchung von genetischen Polymorphismen Einblicke in die menschliche Evolution sowie historische Migrationsbewegungen zu erlangen.
Die Frage nach dem Ausmaß der natürlich vorkommenden genetischen Variabilität des Menschen rückte bald nach Beginn des HGP verstärkt in den Vordergrund. Waren bis dahin nur relativ wenige Polymorphismen bekannt (hauptsächlich Restriktionsfragmentlängen-Polymorphismen [RFLPs] und Minisatelliten), so wurden zu Beginn der 90er-Jahre systematisch Tausende neuer, sehr variabler Polymorphismen (so genannte Mikrosatelliten) in allen Bereichen des Genoms identifiziert, welche eine Orientierung innerhalb des Genoms als Voraussetzung zu seiner Sequenzierung erst ermöglichten.
In den letzten fünf Jahren ist nun ein enormes wissenschaftliches Interesse an einer neuen Klasse von Polymorphismen entstanden, den single nucleotide polymorphisms (SNPs, sprich: snips). Sie machen den weitaus größten Teil der Variabilität im menschlichen Genom aus, und mittlerweile sind bereits mehr als zwei Millionen dieser SNPs bekannt. Anders als die Mikrosatellitenmarker, die eine wichtige Voraussetzung für die Genomsequenzierung waren, ist die Identifizierung von SNPs in großer Zahl und in gleichmäßiger Verteilung erst durch die Kenntnis der Genomsequenz möglich geworden. Eine Reihe in jüngster Zeit veröffentlichter Artikel beschäftigt sich zunehmend damit, die Häufigkeit, Verteilungsmuster und Abhängigkeit der SNPs untereinander für bestimmte Genregionen systematisch aufzuklären und mögliche Unterschiede zwischen Populationen zu detektieren. Diese Arbeit soll einen Überblick über die unterschiedlichen Formen der für die biomedizinische Forschung relevanten genetischen Variabilität, ihre Eigenschaften, Häufigkeit und Verteilung im Genom geben.
Typen genetischer Variabilität beim Menschen
Bis Mitte der 70er-Jahre war die genetische Variabilität auf DNA-Ebene weitgehend unbekannt beziehungsweise technisch nicht nachweisbar. Für genetische Untersuchungen, die eine individuelle Unterscheidbarkeit von Genomabschnitten mittels natürlich vorkommender Polymorphismen (so genannte Marker) erfordern, stand eine sehr beschränkte Zahl von Markern in Form von Blutgruppensystemen, HLA-Typen und einer kleinen Zahl elektrophoretisch nachweisbarer Proteinpolymorphismen zur Verfügung. Diese insgesamt weniger als 100 Marker ließen allein Aussagen über den sehr beschränkten Teil des Genoms zu, auf dem die Gene liegen, welche für diese Proteine kodieren.
Mit Aufkommen der molekulargenetischen Forschung begann die Suche nach Markern direkt auf DNA-Ebene. Diese Marker sollten vor allem zwei Eigenschaften haben: Gleichmäßige Verteilung über das Genom, um Aussagen über den genetischen Einfluss aller chromosomalen Bereiche zu treffen, sowie möglichst hohe Heterozygotieraten und damit genetische Aussagekraft (Informativität). Letztere ist dann gegeben, wenn ein möglichst großer Anteil der untersuchten Personen unterschiedliche Markerallele trägt, also heterozygot für den betrachteten Marker ist (Grafik 1).
Für die genetische Forschung sind seitdem im Wesentlichen vier verschiedene Typen von DNA-Markern von Bedeutung: Mitte der 70er-Jahre wurde die erste Generation genetischer Marker beschrieben, die Restriktionsfragmentlängen-Polymorphismen (RFLPs). Mitte der 80er-Jahre kamen die Minisatelliten (auch VNTRs genannt, variable number of tandem repeats) hinzu, kurze Zeit später die Mikrosatelliten (STR, short tandem repeats). Seit Ende der 90er-Jahre werden in großem Maßstab single nucleotide polymorphisms (SNPs) verwendet (Grafik 2). Die vier Typen von Markern können grob in zwei Klassen eingeteilt werden, die unterschiedliche Eigenschaften haben.
- Minisatelliten und Mikrosatelliten liegen in der Regel in nichtkodierenden Sequenzen und werden als repetitive Sequenzen bezeichnet, sind also durch ein kurzes, sich mehrfach hintereinander wiederholendes Sequenzmotiv gekennzeichnet (Grafik 2). Daher findet man auch häufig die Bezeichnung simple Sequenzwiederholungen (SSR, simple sequence repeats).
- RFLPs und SNPs liegen sowohl in kodierenden als auch nichtkodierenden Bereichen und stellen Mutationen eines einzelnen Basenpaars, so genannte Einzelbasenaustausche, dar (Grafik 2).
Simple Sequenzwiederholungen
Mini- und Mikrosatelliten bilden einen Teil der Klasse der repetitiven DNA-Sequenzen. Die repetitiven Sequenzen machen mehr als 50 Prozent des Genoms aus und stellen sich wiederholende Sequenzmotive dar, deren Funktion bisher weitgehend unbekannt ist (11, 21). Ihnen gegenüber steht die Klasse der nichtrepetitiven (oder Einzelkopie-) DNA. Weil die Wiederholungseinheiten der Mini- und Mikrosatelliten hintereinander liegen, spricht man auch von tandemartig wiederholten DNA-Sequenzen (Grafik 2).
Minisatelliten liegen in euchromatischen Regionen und haben Grundmotive der Wiederholung von ungefähr 12 bis 500 bp Länge. Sie zeigen zusammen mit den nachfolgend besprochenen Mikrosatelliten die größte interindividuelle Variabilität aller DNA-Sequenzen. Für die meisten dieser Minisatelliten sind mehr als 70 bis 80 Prozent der Menschen einer Population heterozygot, tragen also auf ihren beiden homologen Chromosomen (das heißt väterlichem und mütterlichem Chromosom) zwei unterschiedliche Allele. Diese Marker haben vor allem zu Ende der 80er- und zu Beginn der 90er-Jahre eine große Bedeutung für die humangenetische Forschung und forensische Medizin gehabt. Nachteilig für systematische Untersuchungen des Genoms ist ihre ungleichmäßige Verteilung; die größte Dichte von Minisatelliten beobachtet man in den telomerischen Bereichen, also in den Enden der Chromosomen.
Auch die Mikrosatelliten liegen in euchromatischen Regionen, haben aber kürzere Grundmotive (1 bis 11 bp). Ihre interindividuelle Variabilität ist wie die der Minisatelliten sehr groß. Sie sind experimentell einfacher darstellbar als die Minisatelliten und bieten den Vorteil, gleichmäßig und in großer Zahl über das Genom verteilt zu sein. Sie machen etwa 0,5 Prozent des Gesamtgenoms aus.
In Grafik 3 sind die unterschiedlichen Wiederholungsmotive und ihre relative Häufigkeit im Genom dargestellt. Die positiven Eigenschaften der Mikrosatelliten haben dazu geführt, dass sie zu Beginn der 90er-Jahre zunehmend zu den genetischen Markern der Wahl (zum Beispiel für Kopplungsuntersuchungen) wurden. Als Marker werden vor allem Dinukleotid-Repeats, und hier insbesondere die CA-Wiederholungen (Grafik 2), welche mit einer Zahl von genomweit mehr als 80 000 die häufigste Form darstellen, verwendet. Ohne diese Marker wäre die Kartierung des menschlichen Genoms als eine Grundvoraussetzung zu dessen Sequenzierung vermutlich nicht möglich gewesen.
In der Humangenetik wurde eine sehr große Zahl von Krankheitsgenorten mithilfe dieser Marker in Familien mit den entsprechenden Erkrankungen lokalisiert. Trinukleotid-Repeats sind mit 50 000 bis 60 000 insgesamt seltener im Genom vertreten als Dinukleotid-Repeats, werden aber aufgrund ihrer guten Darstellbarkeit ebenfalls als genetische Marker eingesetzt. Phänotypisch bleiben individuell unterschiedlich lange Repeats in der Regel ohne Auswirkungen.
Eine kleine Zahl von Trinukleotid-Repeats sind in der Humanmedizin allerdings auch als Ursache bestimmter genetischer Krankheiten bekannt, wie zum Beispiel der Chorea Huntington, des fragilen X-Syndroms, der myotonen Dystrophie, der spinobulbären Muskelatrophie Typ Kennedy und verschiedener Typen der spinozerebellären Ataxien. Bei diesen Erkrankungen kommt es in den Keimzellen eines Elternteils zu einer Expansion einer Trinukleotid-Repeat-Sequenz, welche jeweils in einem spezifischen Gen gelegen ist. Durch die Expansion wird das durch das Gen kodierte Protein strukturell oder quantitativ pathologisch verändert und löst in dem aus der Keimzelle hervorgehenden Menschen die Krankheit aus.
Single nucleotide polymorphisms
Sowohl SNPs als auch RFLPs sind Einzelbasensubstitutionen. Man kann RFLPs als eine Untergruppe von SNPs bezeichnen, die innerhalb der Erkennungssequenz für bakterielle Restriktionsenzyme liegen oder durch ihre Anwesenheit neue Erkennungssequenzen generieren. Da dies lediglich durch die Methode der experimentellen Darstellbarkeit
definiert ist, aber keinen genuinen Unterschied hinsichtlich des Typs genetischer Variabilität bedeutet, wird im Folgenden für beide der Begriff SNP verwendet.
Wie man heute weiß, sind SNPs der mit Abstand häufigste Typ genetischer Variabilität beim Menschen; sie machen etwa 90 Prozent der interindividuellen genetischen Variabilität aus (6). Bis Anfang der 90er-Jahre war nur sehr wenig über ihre Häufigkeit, Verteilung und Eigenschaften bekannt, zudem wurde der enorme Wert dieses Wissens oft unterschätzt. Mittlerweile wird eine umfassende Kenntnis der Anzahl von SNPs, ihrer Verteilung in einzelnen genomischen Bereichen (Grafik 4) und in unterschiedlichen Bevölkerungen als der Schlüssel zum Verständnis von in der Bevölkerung häufigen Erkrankungen wie zum Beispiel Diabetes, Hypertonie, kardiovaskuläre und neuropsychiatrische Erkrankungen angesehen. Auch in die krankheitsunabhängige phänotypische Variabilität beim Menschen, die Interaktion von Genen und Umwelt sowie die historische Bevölkerungsentwicklung erhofft man sich durch die systematische Untersuchung von SNPs Einblicke. Verfolgt man nun die enorme Aktivität, mit der seit etwa fünf Jahren an der Identifizierung und Charakterisierung von SNPs gearbeitet wird, so ist es schwer nachzuvollziehen, dass Forscher noch zu Beginn des HGP öffentlich appellieren mussten, im Zuge der Euphorie um die bevorstehende Sequenzierung des Genoms den Aspekt der Identifizierung der genetischen Variabilität, insbesondere der SNPs, nicht zu vernachlässigen (1, 4).
Die Identifizierung von SNPs in großem, genomweitem Maßstab ist sehr kostenaufwendig und für akademische Forschungseinrichtungen allein mit öffentlichen Forschungsgeldern praktisch nicht durchführbar. Aufgrund der potenziellen Bedeutung von SNPs für die pharmazeutische Industrie floss in diese Arbeiten schließlich ein beträchtlicher Anteil privater Gelder. Im Jahre 1999 wurde das SNP-Konsortium (TSC, The SNP Consortium) gegründet, ein Zusammenschluss des britischen Wellcome Trust, zehn großer Pharmafirmen sowie der International SNP Map Working Group, bestehend aus drei US-amerikanischen und einem britischen akademischen Zentrum. Das TSC und das Humangenomprojekt zusammen haben bisher genomweit mehr als 2,1 Millionen SNPs identifiziert, die in einer öffentlich zugänglichen Datenbank (siehe Internetverweis) abgelegt sind. Die im Jahre 1998 gegründete Firma Celera Genomics identifiziert durch Sequenzvergleiche ihrer Sequenzierungsdaten mit den öffentlich zugänglichen Sequenzdaten aus dem Humangenomprojekt ebenfalls in großem Maßstab SNPs, die mit den TSC-SNPs allerdings zu einem Teil identisch sind (21). Die genauen Sequenzdaten dieser SNPs sind gegenwärtig nur gegen Lizenzgebühren an die Firma Celera Genomics zugänglich.
Häufigkeit, Verteilung und Charakteristika von SNPs
Die Zahl der bisher identifizierten SNPs ist beeindruckend groß. Wie steht ihre Zahl aber im Verhältnis zu der tatsächlich in der menschlichen Bevölkerung vorkommenden Zahl von SNPs? Bei einer Mutationsrate von etwa 2 3 10-8 pro Basenpaar und Generation (das heißt 1 Mutation pro 50 Millionen Basen) und einer Populationsgröße von derzeit etwa 6 Milliarden Menschen kann man davon ausgehen, dass jede Basenposition im Genom, an der eine Mutation mit dem Leben vereinbar ist, bereits in der letzten Generation mehrmals mutiert ist (14) – entsprechend häufiger in der Evolution des Menschen. Jede neu entstandene Mutation ist zunächst auf das Gründer-Individuum (bei dem die Mutation aufgetreten ist) beschränkt und breitet sich dann im Laufe der Generationen in der Bevölkerung allmählich aus, sofern kein negativer Selektionsdruck greift oder sie nicht zufällig verloren geht, weil das Gründer-Individuum keine Nachkommen hat oder die Mutation nicht weitervererbt. Erst ab einer minoren Allelfrequenz (Frequenz des weniger häufigen Allels) von etwa einem Prozent in der Bevölkerung werden SNPs für viele genetische Fragestellungen interessant. Anhand der durch die International SNP Map Working Group (20) veröffentlichten SNP-Daten schätzt man, dass es etwa 11 Millionen SNPs gibt, deren minores Allel eine Frequenz von wenigstens einem Prozent in der Weltbevölkerung hat (Tabelle 1). Diese SNPs kommen durchschnittlich wahrscheinlich alle 290 bp vor. Evolutionär ältere SNPs mit höheren minoren Allelfrequenzen sind erwartungsgemäß seltener: SNPs mit einer minoren Allelfrequenz von 40 Prozent treten mit einer geschätzten Häufigkeit von 1 auf 3 280 bp auf. Wie erläutert, kann man an jeder beliebigen Position des Genoms einen Basenaustausch erwarten, sofern man in der gesamten Weltbevölkerung danach suchen würde und sofern dieser Basenaustausch mit dem Leben vereinbar ist. Eine bessere Vorstellung von dem Ausmaß der tatsächlich für genetische Untersuchungen relevanten Variabilität erhält man, wenn man die „Nukleotid-Diversität“ angibt. Dieser Wert gibt die Frequenz von Basenaustauschen an, die man durchschnittlich beim Vergleich zweier beliebiger genomischer Regionen oder Chromosomen in der Bevölkerung beobachtet. Er ist ein normalisiertes (das heißt ein nach Stichprobengrößen korrigiertes) Maß für die genetische Variabilität, die auch Studien vergleichbar macht, welche die Variabilität einer bestimmten genomischen Region in unterschiedlich großen Stichprobenzahlen ermittelt haben.
Nukleotid-Diversität im Genom
Die Sequenzierungsdaten des Humangenomprojektes und des TSC geben einen guten Überblick über die genomweite Variabilität in der menschlichen Nukleotid-Sequenz. Aufgrund dieser Daten ergibt sich, dass man in zwei zufällig aus der Population ausgewählten Chromosomen eine durchschnittliche Nukleotid-Diversität von 7,51 heterozygoten Stellen in 10 000 bp, anders ausgedrückt 1 SNP pro 1 331 bp, erwarten kann (20). Die Nukleotid-Diversität der Autosomen (Chromosomen 1 bis 22) ist relativ ähnlich, eine deutlich geringere Nukleotid-Diversität weisen hingegen die Geschlechtschromosomen auf, deren Werte bei 1 SNP pro 2 132 bp für das X-Chromosom und 1 SNP pro 6 623 bp für das Y-Chromosom liegen. Dies ist wahrscheinlich das Resultat ihrer geringeren Anzahl im Vergleich zur Zahl der Autosomen, denn der Grad der Variabilität eines Chromosoms ist eng mit seiner Häufigkeit in der Bevölkerung korreliert. So kommen auf 100 Autosomen in der Population nur 75 X-Chromosomen und 25 Y-Chromosomen.
Die zumindest zwischen den Autosomen relativ ähnlichen Nukleotid-Diversitätswerte bedeuten jedoch nicht, dass an jeder beliebigen Stelle des Genoms ein gleiches Maß an Variabilität zu finden ist. Vielmehr scheint es, als ob erhebliche Unterschiede in der Variabilität einzelner chromosomaler Regionen bestehen (2, 3, 5, 9, 10, 13, 1518, 20, 2325). So konnte beispielhaft für Chromosom 6 gezeigt werden, dass sich die Nukleotid-Diversität zwischen verschiedenen Regionen sich bis zu 30fach unterscheidet. Die am wenigsten variablen Bereiche des Chromosoms zeigen Werte von etwa 1 SNP pro 10 000 bp, die variabelsten Bereiche hingegen Werte von etwa 1 SNP pro 333 bp. Dabei beobachtet man auch zwischen eng benachbarten chromosomalen Bereichen große Schwankungen (20).
Die zweifellos höchste Nukleotid-Diversität liegt im mitochondrialen Genom vor. Das mitochondriale Genom ist in den im Zytoplasma der Zelle befindlichen Mitochondrien lokalisiert und im Vergleich mit dem im Zellkern gelegenen (nukleären) Genom mit 16 569 bp wesentlich kleiner. Die ringförmig geschlossene mitochondriale DNA (mt-DNA) kodiert im Wesentlichen Untereinheiten der Atmungskette, die mit ihrer ATP-Produktion die Energieversorgung der Zelle gewährleisten. Aufgrund ineffizienterer DNA-Schutz- und -Reparaturmechnismen sowie der mutagenen Wirkung von Sauerstoff-Radikalen, die in der Atmungskette entstehen, ist die Mutationsrate wenigstens zehnfach höher als im Zellkern (22). Als Resultat ist eine Vielzahl von Erkrankungen beschrieben, die auf Mutationen in der mtDNA zurückgehen (8, 12). Charakteristisch ist die ausschließlich maternale Vererbung, da die Mitochondrien – und damit auch die mt-
DNA – nur über die mütterlichen Eizellen an die nächste Generation vererbt werden. Als Folge der hohen Mutationsrate häufen sich zudem in vielen Geweben während des Lebens somatische (und damit nichterbliche) Mutationen in der mtDNA an und führen zu einer allmählichen Verschlechterung der zellulären Energieproduktion. Dies hat insbesondere Auswirkungen auf die Funktion von Geweben mit hohem Energiebedarf, wie Skelettmuskel, ZNS, Herz, Ohr, Auge und Endokrinium (12) und wird als eine Ursache des Alterns angesehen. Daneben existiert eine große Zahl von neutralen, erblichen polymorphen Stellen in der mtDNA (22). Viele dieser Unterschiede sind aufgrund der kontinuierlich hohen Mutationsrate erst nach der Aufspaltung und geographischen Trennung verschiedener Populationen entstanden und lassen Aussagen über den ethnischen und geographischen Ursprung eines Individuums zu.
Diversität in kodierenden und nichtkodierenden Bereichen
Die Mechanismen, die zu Unterschieden in der Variabilität unterschiedlicher chromosomaler Regionen beitragen, sind noch sehr unzureichend untersucht. Ein besseres Verständnis liegt für die Muster von Variabilität vor, welche man im Bereich von Genen beobachtet. Nicht unerwartet zeigt sich eine geringere Nukleotid-Diversität in Protein kodierenden Bereichen (Exons) im Vergleich zu nichtkodierenden Bereichen (Introns). Diese Beobachtung ist konsistent mit der Erwartung, dass auf der Variabilität in kodierenden Bereichen ein größerer negativer Selektionsdruck lastet. In den kodierenden Bereichen selbst sind nicht alle Basen gleichmäßig betroffen: So ist seit langem bekannt, dass der durch Basentripletts (Codons) definierte genetische Code degeneriert ist. Dies bedeutet, dass jeweils mehrere Tripletts eine Aminosäure kodieren, da die Anzahl möglicher Triplett-Kombinationen viel größer ist (A, C, G und T bilden 43 = 64 mögliche Tripletts) als für die Kodierung der 20 Protein bildenden Aminosäuren nötig wäre. Die erste und zweite Base in einem Codon kodieren häufig sehr spezifisch für eine Aminosäure (nichtdegenerierte Positionen); Mutationen an diesen Positionen bewirken dann einen Aminosäureaustausch im resultierenden Protein. An der dritten Position im Codon für eine bestimmte Aminosäure sind hingegen oft alle vier Basen möglich (degenerierte Positionen). Mutationen an diesen Stellen verändern die Aminosäuresequenz dann nicht. Wie aus den Untersuchungen zur Variabilität in kodierenden Sequenzen hervorgeht, beobachtet man an den nichtdegenerierten Positionen eine signifikant verminderte Nukleotid-Diversität im Vergleich zu den degenerierten Positionen. Offenbar führen Mutationen an nichtdegenerierten Stellen häufig zu einem Selektionsnachteil, weil das resultierende Protein durch die Änderung der Aminosäuresequenz seine normale Funktion ganz oder zum Teil verliert. Somit werden solche Mutationen oft wieder aus der Population selektiert. Dafür spricht auch die Beobachtung, dass die meisten Varianten an nichtdegenerierten Positionen geringe Allelfrequenzen haben (19). Dies deutet darauf hin, dass sie ihre Frequenz in der Bevölkerung nicht erhöhen können, da dem ein negativer Selektionsdruck entgegensteht.
Die Häufigkeit vieler krankheitsverursachender Mutationen in Genen scheint sich im Laufe der Zeit in einer Bevölkerung auf einen bestimmten Wert einzupendeln. Dies liegt daran, dass im gleichen Maße, wie diese Mutationen durch einen negativen Selektionsdruck ausgelesen werden, Neumutationen hinzukommen. Ein weiterer Mechanismus, der trotz negativem Selektionsdruck gegen die Erkrankten für eine konstante Frequenz der krankheitsverursachenden Mutation in der Bevölkerung sorgen kann, ist besonders für viele rezessiv erbliche Krankheiten bekannt. Während die homozygot Betroffenen einen starken Selektionsnachteil haben, können äußerlich gesunde, heterozygote Anlageträger durchaus einen Selektionsvorteil haben (wie zum Beispiel für die Sichelzellanämie und die Thalassämien).
Der Großteil der SNPs in nichtkodierenden Bereichen wird mit großer Wahrscheinlichkeit phänotypisch ohne Auswirkungen bleiben und evolutionär neutral sein. Zumindest für einen Teil der SNPs in den kodierenden Bereichen wird dies anders sein. Ein wichtiger Gegenstand der Forschung in den nächsten Jahren wird es sein herauszufinden, welche Varianten in kodierenden Bereichen phänotypische Konsequenzen haben und inwiefern sich das im Zusammenspiel mit anderen Varianten und unter bestimmten Umweltbedingungen günstig oder ungünstig auf den Träger auswirkt. Dies wird vor allem für das Verständnis von in der Bevölkerung häufigen Erkrankungen von enormer Wichtigkeit sein, da die Identifizierung dieser Varianten den Schlüssel zum Verständnis der beteiligten molekularen Prozesse liefert. Letzteres wird wiederum neue Möglichkeiten für Therapie und Prävention eröffnen.
In diesem Artikel wurden die im menschlichen Genom vorkommenden Varianten betrachtet. Darauf aufbauend ergibt sich aber noch eine weitere Ebene genetischer Variabilität dadurch, dass räumlich auf den Chromosomen nahe beieinander liegende Varianten nicht
unabhängig voneinander weitervererbt werden. Dies hat spezifische Auswirkungen für die Krankheitsforschung. In der nächsten Ausgabe des Deutschen Ärzteblatts wird daher die erst kürzlich entdeckte Blockstruktur des Genoms erläutert (7).

Manuskript eingereicht: 13. 8. 2002, angenommen: 28. 8. 2002

zZitierweise dieses Beitrags:
Dtsch Arztebl 2002; 99: A 3091–3101 [Heft 46]

Die Zahlen in Klammern beziehen sich auf das Literaturverzeichnis, das über den Sonderdruck beim Verfasser und über das Internet (www.aerzteblatt.de) erhältlich ist.

Anschrift für die Verfasser:
Dr. rer. nat. Sven Cichon
Department of Medical Genetics
Universität Antwerpen
Universiteitsplein 1, 2610 Antwerpen, Belgien
E-Mail: svcichon@uia.ua.ac.be

Weitere Informationen im Internet:
www.ncbi.nlm.nih.gov/SNP/index.html
www.ensembl.org/


Glossar

Allel
Bestimmte Ausprägung einer variablen (polymorphen) DNA-Sequenz im Genom. Synonym zu Allel werden auch die Begriffe Variante oder Sequenzvariante gebraucht. Single nucleotide polymorphisms (SNPs) haben in der Bevölkerung in der Regel zwei Allele, Mini- und Mikrosatelliten können mehr als zehn Allele haben.

Genetischer Lokus
Position im Genom, an der eine bestimmte genetische Sequenz beziehungsweise eine bestimmte genetische Information lokalisiert ist. Ein Lokus kann beispielsweise eine einzelne Basenposition, ein Mikrosatellit, ein Gen oder eine zytogenetische Bande sein.

Polymorphismus
Ursprünglich definiert als genetischer Lokus, für den mehrere Allele existieren und die Allelfrequenz des selteneren Allels in der Bevölkerung mindestens ein Prozent beträgt. Diese Grenze sollte neutrale Varianten von Mutationen mit ungünstigen Auswirkungen abgrenzen, ist aber unscharf. In der medizinischen Genetik wird mit Polymorphismus auch häufig eine variable Stelle im Genom bezeichnet, die ohne phänotypische Auswirkungen bleibt.
In dem Artikel wird der Begriff Polymorphismus allgemein für Positionen in der DNA-Sequenz verwendet, von denen zwei oder mehr Allele in der Bevölkerung existieren, das heißt unabhängig von Allelfrequenz und phänotypischer Auswirkung. In diesem Kontext entspricht der Begriff Polymorphismus dem englischen Begriff sequence variation, der im Rahmen einer neuen Nomenklatur für die neutrale Beschreibung von Sequenzunterschieden vorgeschlagen wurde (den Dunnen und Antonarakis, Hum Genet 2001; 109: 121–124).

Genetischer Marker
Polymorphismus, dessen genaue chromosomale Position bekannt ist und dessen unterschiedliche Allele relativ häufig in der Population vorkommen.

Mutation
Erbliche Veränderung der DNA bei einem Individuum. Es besteht eine Sequenzabweichung gegenüber dem Wildtyp respektive der Referenzsequenz. Mutationstypen: Austausch einer einzelnen Base (Punktmutation), Verlust einer oder mehrerer Basen (Deletion), Einfügung einer oder mehrerer Basen (Insertion), Verdopplung eines Sequenzstücks (Duplikation), Umkehr der Basenabfolge eines Sequenzstücks (Inversion). Der Begriff Mutation kann für Sequenzänderungen unabhängig von ihrer phänotypischen Auswirkung gebraucht werden. In der medizinischen Genetik wird er aber meistens für Sequenzänderungen mit phänotypischen Konsequenzen (insbesondere krankheitsursächliche) verwendet.
1.
Bowock A, Cavalli-Sforza LL: The study of variation in the human genome. Genomics 1991; 11: 491–498. MEDLINE
2.
Cambien F, Poirier O, Nicaud V et al.: Sequence diversity in 36 candidate genes for cardiovascular disorders. Am J Hum Genet 1999; 65: 183–191. MEDLINE
3.
Cargill M, Altshuler D, Ireland J et al.: Characterization of single-nucleotide polymorphisms in coding regions of human genes. Nat Genet 1999; 22: 231–238. MEDLINE
4.
Cavalli-Sforza LL, Wilson AC, Cantor CR, Cook-Deegan RM, King MC: Call for a worldwide survey of human genetic diversity: a vanishing opportunity for the Human Genome Project. Genomics 1991; 11: 490–491. MEDLINE
5.
Clark AG, Weiss KM, Nickerson DA et al.: Haplotype structure and population genetic inferences from nucleotide sequence variation in human lipoprotein lipase. Am J Hum Genet 1998; 63: 595–612. MEDLINE
6.
Collins FS, Brooks LD, Chakravarti A: A DNA polymorphism discovery resource for research on human genetic variation. Genome Res 1998; 8: 1229–1231. MEDLINE
7.
Freudenberg J, Cichon S, Nöthen MM, Propping P: Blockstruktur des menschlichen Genoms. Ein Organisationsprinzip der genetischen Variabilität. Dtsch Arztebl 2002; 99: [Heft 47]. im Druck
8.
Gempel K, Bauer MF, Gerbitz K-D: Mitochondriale Erkrankungen. Dtsch Arztebl 1999; 96: A 3035–3042 [Heft 47]. VOLLTEXT
9.
Halushka MK, Fan J-B, Bentley K et al.: Patterns of single-nucleotide polymorphisms in candidate genes for blood-pressure homeostasis. Nat Genet 1999; 22: 239–247. MEDLINE
10.
Harding RM, Fullerton SM, Griffiths RC et al.: Archaic African and Asian lineages in the genetic ancestry of modern humans. Am J Hum Genet 1997; 60: 772–789. MEDLINE
11.
International Human Genome Sequencing Consortium: Initial sequencing and analysis of the human genome. Nature 2001; 409: 860–921. MEDLINE
12.
Jaksch-Angerer M, Hofmann S, Bauer MF et al.: Mitochondriale Erkrankungen. Dtsch Arztebl 1999; 96: A 2972–2981 [Heft 46]. VOLLTEXT
13.
Jaruzelska J, Zietkiewicz E, Batzer M et al.: Spatial and temporal distribution of the neutral polymorphisms in the last ZFX intron: analysis of the haplotype structure and genealogy. Genetics 1999; 152: 1091–1101. MEDLINE
14.
Kruglyak L, Nickerson DA: Variation is the spice of life. Nat Genet 2001; 27: 234–236. MEDLINE
15.
Nachman MW, Bauer VL, Crowell SL, Aquadro CF: DNA variability and recombination rates at X-linked loci in humans. Genetics 1998; 150: 1133–1141. MEDLINE
16.
Nakijama T, Jorde LB, Ishigami T et al.: Nucleotide diversity and haplotype structure of the human angiotensinogen gene in two populations. Am J Hum Genet 2002; 70: 108–123. MEDLINE
17.
Rana BK, Hewett-Emmett D, Jin L et al.: High polymorphism at the melanocortin 1 receptor locus. Genetics 1999; 151: 1547–1557. MEDLINE
18.
Rieder MJ, Taylor SL, Clark AG, Nickerson DA: Sequence variation in the human angiotensin converting enzyme. Nat Genet 1999; 22: 59–62. MEDLINE
19.
Sunyaev SR, Lathe III WC, Ramensky VE, Bork P: SNP frequencies in human genes: an excess of rare alleles and differing modes of selection. TIG 2000; 16: 335–337. MEDLINE
20.
The International SNP Map Working Group: A map of the human genome sequence variation containing 1.42 million single nucleotide polymorphisms. Nature 2001; 409: 928–933. MEDLINE
21.
Venter JC, Adams MD, Myers EW et al.: The sequence of the human genome. Science 2001; 291: 1304–1351. MEDLINE
22.
Wallace DC: Mitochondrial DNA sequence variation in human evolution and disease. Proc Natl Acad Sci USA 1994; 91: 8739–8746. MEDLINE
23.
Wang DG, Fan J-B, Siao C-J et al.: Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in the human genome. Science 1998; 280: 1077–1082. MEDLINE
24.
Yu N, Chen F-C, Ota S et al.: Larger genetic differences within Africans than between Africans and Eurasians. Genetics 2002; 161: 269–274. MEDLINE
25.
Zhao Z, Jin L, Fu Y-X et al.: Worldwide DNA sequence variation in a 10-kilobase noncoding region on human chromosome 22. Proc Natl Acad Sci USA 2000; 97: 11354–11358. MEDLINE
1. Bowock A, Cavalli-Sforza LL: The study of variation in the human genome. Genomics 1991; 11: 491–498. MEDLINE
2. Cambien F, Poirier O, Nicaud V et al.: Sequence diversity in 36 candidate genes for cardiovascular disorders. Am J Hum Genet 1999; 65: 183–191. MEDLINE
3. Cargill M, Altshuler D, Ireland J et al.: Characterization of single-nucleotide polymorphisms in coding regions of human genes. Nat Genet 1999; 22: 231–238. MEDLINE
4. Cavalli-Sforza LL, Wilson AC, Cantor CR, Cook-Deegan RM, King MC: Call for a worldwide survey of human genetic diversity: a vanishing opportunity for the Human Genome Project. Genomics 1991; 11: 490–491. MEDLINE
5. Clark AG, Weiss KM, Nickerson DA et al.: Haplotype structure and population genetic inferences from nucleotide sequence variation in human lipoprotein lipase. Am J Hum Genet 1998; 63: 595–612. MEDLINE
6. Collins FS, Brooks LD, Chakravarti A: A DNA polymorphism discovery resource for research on human genetic variation. Genome Res 1998; 8: 1229–1231. MEDLINE
7. Freudenberg J, Cichon S, Nöthen MM, Propping P: Blockstruktur des menschlichen Genoms. Ein Organisationsprinzip der genetischen Variabilität. Dtsch Arztebl 2002; 99: [Heft 47]. im Druck
8. Gempel K, Bauer MF, Gerbitz K-D: Mitochondriale Erkrankungen. Dtsch Arztebl 1999; 96: A 3035–3042 [Heft 47]. VOLLTEXT
9. Halushka MK, Fan J-B, Bentley K et al.: Patterns of single-nucleotide polymorphisms in candidate genes for blood-pressure homeostasis. Nat Genet 1999; 22: 239–247. MEDLINE
10. Harding RM, Fullerton SM, Griffiths RC et al.: Archaic African and Asian lineages in the genetic ancestry of modern humans. Am J Hum Genet 1997; 60: 772–789. MEDLINE
11. International Human Genome Sequencing Consortium: Initial sequencing and analysis of the human genome. Nature 2001; 409: 860–921. MEDLINE
12. Jaksch-Angerer M, Hofmann S, Bauer MF et al.: Mitochondriale Erkrankungen. Dtsch Arztebl 1999; 96: A 2972–2981 [Heft 46]. VOLLTEXT
13. Jaruzelska J, Zietkiewicz E, Batzer M et al.: Spatial and temporal distribution of the neutral polymorphisms in the last ZFX intron: analysis of the haplotype structure and genealogy. Genetics 1999; 152: 1091–1101. MEDLINE
14. Kruglyak L, Nickerson DA: Variation is the spice of life. Nat Genet 2001; 27: 234–236. MEDLINE
15. Nachman MW, Bauer VL, Crowell SL, Aquadro CF: DNA variability and recombination rates at X-linked loci in humans. Genetics 1998; 150: 1133–1141. MEDLINE
16. Nakijama T, Jorde LB, Ishigami T et al.: Nucleotide diversity and haplotype structure of the human angiotensinogen gene in two populations. Am J Hum Genet 2002; 70: 108–123. MEDLINE
17. Rana BK, Hewett-Emmett D, Jin L et al.: High polymorphism at the melanocortin 1 receptor locus. Genetics 1999; 151: 1547–1557. MEDLINE
18. Rieder MJ, Taylor SL, Clark AG, Nickerson DA: Sequence variation in the human angiotensin converting enzyme. Nat Genet 1999; 22: 59–62. MEDLINE
19. Sunyaev SR, Lathe III WC, Ramensky VE, Bork P: SNP frequencies in human genes: an excess of rare alleles and differing modes of selection. TIG 2000; 16: 335–337. MEDLINE
20. The International SNP Map Working Group: A map of the human genome sequence variation containing 1.42 million single nucleotide polymorphisms. Nature 2001; 409: 928–933. MEDLINE
21. Venter JC, Adams MD, Myers EW et al.: The sequence of the human genome. Science 2001; 291: 1304–1351. MEDLINE
22. Wallace DC: Mitochondrial DNA sequence variation in human evolution and disease. Proc Natl Acad Sci USA 1994; 91: 8739–8746. MEDLINE
23. Wang DG, Fan J-B, Siao C-J et al.: Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in the human genome. Science 1998; 280: 1077–1082. MEDLINE
24. Yu N, Chen F-C, Ota S et al.: Larger genetic differences within Africans than between Africans and Eurasians. Genetics 2002; 161: 269–274. MEDLINE
25. Zhao Z, Jin L, Fu Y-X et al.: Worldwide DNA sequence variation in a 10-kilobase noncoding region on human chromosome 22. Proc Natl Acad Sci USA 2000; 97: 11354–11358. MEDLINE

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Fachgebiet

Zum Artikel

Anzeige

Alle Leserbriefe zum Thema