-
GEBIET DER Erfindung
-
Die
vorliegende Anmeldung bezieht sich auf synthetische Gene und auf
Plasmide, die frei von CpG sind.
-
STAND DER TECHNIK
-
Die
Plasmide sind genetische Elemente, die im Wesentlichen bei den Bakterien
gefunden werden, die durch ein Desoxyribonukleinsäure-Molekül, das meist
ringförmig
ist, gebildet werden, dessen Replikation autonom und von der genomischen
DNA unabhängig
ist. Die natürlichen
Plasmide, die aus einer sehr großen Vielzahl unterschiedlicher
Bakterien isoliert wurden, sind fähig, mehrere Zellfunktionen
auszuüben.
Die erste, die für
alle Plasmide lebensnotwendig ist, ist die, für ihre Replikation verantwortlich
zu sein, die im Allgemeinen in Synchronie mit der Replikation der
genomischen DNA und der Zellteilung durchgeführt wird. Außer der
Region, die für
die Replikation des Plasmids notwendig ist, tragen alle natürlichen
Plasmide Gene, die für
Proteine codieren, deren Funktion sehr häufig aufgrund des Fehlens einer
spezifischen Untersuchung an diesen Genen unbekannt bleibt. Die
Zahl der Gene, die auf einem Plasmid vorliegen, bestimmt die Größe dieses
Plasmids, wobei die kleinsten natürlichen Plasmide nur zwei bis
drei Gene umfassen. Die Eigenschaften der Plasmide haben sehr früh die Forscher
angezogen, um daraus Vehikel für
Transport und Expression von Genen in den Prokaryoten- wie Eukaryoten-Zellen
zu machen. Die sehr raschen Fortschritte, die auf den Gebieten der
Molekularbiologie der Nukleinsäuren
und der Proteine in den letzen zwei Jahrzehnten beobachtet wurden,
sind zum Teil der Nutzung von rekombinierten Plasmiden zuzuschreiben,
die ausgehend von Fragmenten natürli cher
DNA plasmidischer Herkunft oder anderer zellulärer DNA konstruiert wurden
oder sogar chemisch synthetisiert wurden.
-
Die
vier Basen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T), die
die DesoxyriboNukleinsäure (DNA)
bilden, verteilen sich auf 16 Dinukleotid-Konfigurationen, das heißt CG, GC,
TA, AT, CC, GG, TT, AA, TG, CA, AG, CT, AC, GT, GA und TC. Die Analyse
der qualitativen Verteilung der Dinukleotide der DNA von Tausenden
von Plasmiden, deren Sequenzen bekannt sind, zeigt, dass die 16
Dinukleotide immer in allen natürlichen
Plasmiden oder Laborkonstrukten vorhanden sind. Jedoch zeigt die
Analyse der quantitativen Verteilung der Dinukleotide der Plasmide
starke Gefälle,
die nur zum Teil eine Funktion des Prozentgehalts jeder der vier
Basen der DNA sind. In der Tat kann der Vergleich der beobachteten
Häufigkeiten
für jedes
der Dinukleotide mit den Häufigkeiten,
die auf der Basis einer zufallsbedingten Assoziation zwischen zwei
Basen für
ein gegebenes Plasmid berechnet wurden, bedeutende Abweichungen
für mehrere
Dinukleotide im Sinne einer Überrepräsentation
oder im Gegenteil einer Unterrepräsentation beweisen (Campbell
A., Mrazek J. und Karlin S. (1999), Proc. Natl. Acad. Sci., USA,
96, 9184-9). Die konstatierten Abweichungen in der Verteilung bestimmter
Dinukleotide, aber immer derselben, bei natürlichen Plasmiden, die aus
Bakterien-Arten, die phylogen voneinander entfernt sind, isoliert
wurden, wurden durch Spezifitätsunterschiede
in den Mechanismen der Reparatur, Rekombination und Replikation,
die auf die zelluläre
DNA wirken, erklärt.
-
Der
Transfer von Genen in vitro in Zellen in Kultur und in vivo bei
verschiedenen Tieren sind Praktiken, die sich in starker Entwicklung
befinden, mit dem Ziel, einerseits die Zellfunktionen besser kennen
zu lernen, und andererseits diese Techniken auf Zelltherapien und
Gentherapien anzuwenden. Keiner der viralen Vektoren oder Plasmidvektoren
in der Vielzahl von Vektoren, die für den Transfer von Genen bei
Tieren verfügbar sind,
hat einen entscheidenden Vorteil gegenüber den anderen, denn jeder
weist Vorteile aber auch Nachteile auf. Es gibt jedoch eine Anwendung,
bei der die Plasmid-DNA nackt oder komplexiert mit verschiedenen Substanzen,
um den Transport der DNA zum Kern zu erleichtern, Gegenstand einer
intensiven Forschungsarbeit gemacht wurde, das heißt, die
der Impf-DNA. Das Prinzip der Impf-DNA bzw. Vakzin-DNA beruht auf
den Immunantworten, die bei Labortieren festgestellt wurden, welche
durch intramuskuläre
Injektion, intradermale Injektion oder Inhalation mit der Plasmid-DNA,
die für
ein antigenes Peptid codiert, behandelt worden waren. Es ist nun
gut etabliert, dass eine erste Folge der Einführung einer Plasmid-DNA aus
dem Bakterium E. coli in den Organismus eines Versuchstiers auf
intravenösem
oder muskulärem
Weg die schnelle Produktion verschiedener Cytokine durch Schutzzellen
des Immunsystems ist (Krieg A. M. und Kline J. N. (2000), Immunopharmacology,
48, 303-305). Diese Antwort ist äußerst spezifisch
für die
Bakterien-DNA, denn der DNA-Extrakt von Tierzellen ruft keine derartige
Induktion von Cytokinen unter denselben Bedingungen hervor. Die
zellulären Mechanismen,
die bei dieser Immunantwort impliziert sind, sind weit davon entfernt,
vollständig
bekannt zu sein. Wir wissen jedoch, dass die unterscheidende Erkennung
zwischen der Bakterien-DNA und der DNA tierischen Ursprungs auf
der Ebene von Strukturunterschieden erfolgt, die auf der Methylierung
bestimmter Cytosine. des Moleküls
basiert. In der Tat ist die DNA von Säugern natürlicherweise auf der Ebene
des Cytosins aller Dinukleotide CG (in der Folge CpG genannt) mit
der Ausnahme kurzer Zonen hoher Dichte an CpG, die als CpG-Inseln
bezeichnet werden, die in funktionellen Regionen auf der Ebene bestimmter
Promotoren vorliegen, methyliert. Die aus E. coli extrahierte DNA
weist diesen Methylierungstyp nicht auf, und zwar infolge des Fehlens
der enzymatischen Aktivität,
die fähig
ist, diese Modifikation durchzuführen,
bei diesem Bakterium. Es ist dennoch möglich, die CpGs der Plasmid-DNA,
die aus E. coli extrahiert wurde, im Reagensglas durch ein geeignetes
Enzym zu methylieren. Unter diesen Bedingungen verliert die in vitro-methylierte
DNA im Vergleich zu der nicht-methylierten Vergleichs-DNA einen
großen
Teil ihrer immunstimulierenden Aktivität. Der E. coli-Stamm K12, von dem
quasi die Gesamtheit der Mutanten-Stämme abstammt, welche für die Produktion von
Plasmid-DNA verwendet werden, enthält eine enzymatische Aktivität (DNA-Methylase
dem (Palmer B. R. und Marinus M. G. (1994), Gene, 143, 1-12)), die
zur Methylierung von Cytosin führt,
das sich im Nukleinsäure-Kontext
CC(A/T)GG befindet. Alle Plasmidvektoren zum Gentransfer umfassen
diese Sequenz in variabler Zahl und aufgrund dieser Tatsache enthält ihr DNA-Molekül methylierte
Cytosine, die sich nicht in der Säuger-DNA befinden. Diese Form
der Methylierung, die für
E. coli spezifisch ist, führt
so eine andere Differenz auf der Ebene der Methylierungen der Cytosine
zwischen der Bakterien-DNA
und der der Säuger
ein, die zu der immunstimulierenden Kraft der Plasmid-DNA beitragen könnte.
-
Die
Häufigkeit
der CpG der DNA von Primaten und Nagern liegt im Allgemeinen sehr
unter der, die auf der Basis der Häufigkeit der Cytosine und Guanine
erwartet wird. Der Mangel an CpG ist für ein gegebenes DNA-Fragment
von der biologischen Rolle dieses Fragments abhängig, wobei die Intergen-Regionen
nur ein Fünftel
der erwarteten Häufigkeit
umfassen, während
die Exons ein weniger ausgeprägtes
Defizit haben, und als anderes Extrem einige Promotoren eine CpG-Insel mit großer Größe umfassen,
die einen Prozentgehalt an CpG aufweist, der nahe dem erwarteten
ist. Die Analyse der Daten der Sequenzierung der cDNA und der humanen
Chromosomen zeigt dennoch große
Heterogenitäten
in der Häufigkeit
von CpG für
Promotorregionen und cDNA. Diese Beobachtung wird durch die cDNA
des humanen Gens, das für
Interleukin-2 codiert, veranschaulicht, welches nur ein einziges
CpG besitzt. Ebenso enthält
ein Teil des Promotors dieses Gens, der die TATA-Box umfasst, kein
CpG, dagegen umfasst der Teil stromaufwärts, der reich an Erkennungsstellen
für Transkriptionsfaktoren
ist, CpG. Die Regionen in 3' der
Gene, die durch die 3'-UTR
(nicht-translatierte Regionen) und die Polyadenylierungssequenzen
und das Transkriptionsende gebildet werden, sind eher arm am CpG.
Es ist nicht ungewöhnlich,
beim Menschen Regionen unmittelbar stromabwärts der Gene zu finden, die an
CpG verarmt sind. Jedoch haben die Resultate der humanen Sequenzierung,
die am Ende des Jahres 2000 verfügbar
waren, keine einzige Transkriptionseinheit beweisen können, die
durch Promotorregionen der Transkription, ein Gen mit oder ohne
Intron und die Polyadeylierungsregion gebildet wird, die völlig frei
von CpG ist. Die Situation der CpG bei E. coli ist eine völlig andere
als die der Tierzellen, denn die Häufigkeit der CpG in der genomischen
DNA dieses Bakteriums ist im leichten Überschuss bezüglich der
errechneten Häufigkeit. Das
gleiche gilt für
die CpGs der natürlichen
Plasmide, die aus E. coli-Wirtsstämmen isoliert wurden. Rekombinierte
bzw. rekombinante Plasmide, die aus genetischen Manipulationen resultieren,
die für
den Gentransfer eingesetzt werden, weisen Variationen in ihrer CpG-Zahl
auf, die von der Herkunft der in den Vektor insertierten Fragmenten
abhängen.
Eine Analyse der Sequenzen von mehreren zehn rekombinanten Plasmiden
(plasmides recombinés)
von E. coli, die in zufälliger
Art aus der GenBank genommen wurden, zeigt, dass die Plasmide, die
am ärmsten
an CpG sind, höchstens
ein Defizit von 50% der Zahl ihrer CpG haben. Versuche zur Reduktion
des Gehalts an CpG wurden für
das Gen lac durchgeführt,
führten
aber nicht zur Synthese von funktionellen Genen, die vollständig frei
von CpG sind (Henry et al., 1999, C. R. ACAD. SCI., Paris, Bd. 322,
Seiten 1061-1070; Skopek et al., 1996, Mutation Research, Bd. 349,
Seiten 163-172).
-
Die
vorliegende Erfindung liefert diesbezüglich Produkte und Verfahren,
um Plasmid-DNA bei E. coli zu synthetisieren, die vollständig frei
von CpG ist und bei denen die Cytosine, die sich in dem Kontext CC(A/T)GG
befinden, nicht methyliert sind. Nach Kenntnis der Anmelderin handelt
es sich dabei um die erste Beschreibung solcher Produkte, die eine
derartige Struktur haben, die ihre Funktion ganz konserviert hat.
-
DETAILLIERTE BESCHREIBUNG
DER ERFINDUNG
-
Die
vorliegende Erfindung stellt Mittel bereit, die es ermöglichen,
Plasmide zu produzieren, die bei einem Prokaryoten-Organismus, wie
Escherichia coli, funktionell sind und die dennoch vollständig frei
von CpG sind. Sie liefert insbesondere Mittel, die es ermöglichen,
Plasmide zu produzieren, die vollständig frei von CpG sind und
die außerdem
frei von einer Methylierung auf der Ebene des Cytosins im Nukletid-Kontext CC(A/T)GG
sind.
-
Die
vorliegende Erfindung bezieht sich somit auf Verfahren zur Herstellung
von solchen Plasmiden sowie auf konstitutive Elemente dieser Plasmide,
das heißt,
auf Gene, die frei von CpG sind, die in E. coli exprimiert werden
können,
Promotoren, die frei von CpG sind, die an die Expression der genannten
Gene angepasst sind, und Replikationsursprünge, die frei von CpG sind,
die an die bakterielle Transformation der genannten Plasmide angepasst
sind. Die vorliegende Anmeldung richtet sich auch auf die biotechnologischen
und medizinischen Anwendungen dieser Produkte. Jedes dieser Produkte
weist das besonders Charakteristikum auf, vollständig frei von CpG zu sein,
jedoch seine Funktionalität
bei einem Prokaryoten wie E. coli vollständig konserviert zu haben.
-
Die
vorliegende Erfindung stellt auch einen E. coli-Stamm bereit, der
speziell an die Produktion der Plasmide gemäß der Erfindung angepasst ist,
wobei dieser Stamm das besondere Merkmal aufweist, die stabile Replikation
dieser Plasmide und des Materials, das sie tragen, zu ermöglichen,
ohne ihre Funktion zu verändern
oder die Methylierung auf der Ebene der Stellen CC(A/T)GG zu induzieren
(Stamm, der ein inaktiviertes Gen dem umfasst).
-
Eines
der gemeinsamen Konzepte, das die verschiedenen Aspekte der vorliegenden
Erfindung verbindet, ist demnach es zu ermöglichen, Plasmide zu produzieren,
die vollständig
frei von CpG sind und die dennoch ihre funktionellen Eigenschaften
bei einem Prokaryoten wie E. coli ganz konserviert haben. Nach Kenntnis
der Anmelderin handelt es sich um die erste Beschreibung solcher
Mittel.
-
Die
vorliegende Erfindung bezieht sich somit auf ein Verfahren zur Herstellung
eines Plasmids, das Vektor wenigstens eines Gens ist, und das vollständig frei
von CpG ist, dadurch gekennzeichnet, dass man ein Plasmid konstruiert,
indem man durch enzymatische Ligation der DNA-Fragmente, die alle
frei von CpG sind, die einem Replikationsursprung und den Elementen,
die eine Transkriptionseinheit für
das wenigstens eine Gen bilden, entsprechen, zusammenfügt, und
dass man die ses Plasmid in einen Stamm von Escherichia coli, der
das Protein pi exprimiert, für
die Replikation des Plasmids transferiert.
-
Die
Plasmide, die aus Bakterien-Wildstämmen isoliert wurden, erfüllen im
Allgemeinen drei Funktionen im Zusammenhang mit der Replikation,
nämlich
Initiation der Replikation der DNA, Kontrolle der Replikation und
stabile Aufrechterhaltung des Plasmids im Verlauf der sukzessiven
Teilungen. Die Plasmide, die im Labor konstruiert wurden, weisen
nicht immer die Gesamtheit dieser Funktionen auf. Die Kopienzahl
der Plasmide ist zum Beispiel oft gegenüber dem Stammplasmid erhöht, was
darauf schließen
lässt,
dass die Elemente der Kontrolle der Replikation modifiziert wurden.
Das Plasmid R6K umfasst drei Replikationsursprünge alpha, gamma und beta,
die auf einem gleichen DNA-Fragment gebunden sind (Filutowicz M.
und Takowski S. A., (1998), Gene, 223, 195-204). Jeder der Ursprünge wird
durch das für
R6K spezifische Initiationsprotein pi aktiviert, das durch das Gen
R6K pir codiert wird. Die drei Ursprünge benötigen, um funktionell zu sein,
eine Sequenz mit 277 bp, die dem Fachmann unter dem Namen core (Herz
bzw. Kern) bekannt ist, die sich im Zentrum des Fragments befindet,
das die drei Ursprünge
trägt,
und auch ein einziges supplementäres
Fragment, das in cis positioniert ist, das heißt, das auf demselben DNA-Molekül vorliegt.
Wenn die Sequenzen der Ursprünge alpha
und beta deletiert werden, erlaubt der restliche Ursprung gamma
die autonome Duplikation des Plasmids unter der Bedingung, dass
das Gen pir in cis auf dem Plasmid oder in trans auf dem Chromosom
des Bakteriums vorliegt. Die Erfinder haben die Wahl getroffen,
sich insbesondere für
den kleinsten der drei Ursprünge zu
interessieren, das heißt,
für den
Ursprung gamma, der den Vorteil aufweist, alle Elemente zu enthalten,
die für
eine kontrollierte Replikation des Plasmids notwendig sind, das
heißt,
den Core und eine angrenzende aktivierende Sequenz. Der Core bzw.
Kern wird durch eine Fixierungssequenz des Proteins pi, die 7-mal
wiederholt wird, und eine an AT-reichen Sequenz gebildet. Die aktivierende
Region umfasst Fixierungsstellen von mehreren Zellproteinen des
Bakteriums, die für
eine stabile Aufrechterhaltung des Plasmids erforderlich sind. Die
Kopienzahl der Plasmide, die den einzelnen Ursprung gamma umfassen,
hängt vom
Protein pi ab, wobei mutante Formen von pi, die zu einer starken
Erhöhung
der Kopienzahl des Plasmids führen,
isoliert und charakterisiert wurden. Wie in den Beispielen unten
detaillierter beschrieben wird, gelang es den Erfindern, ausgehend
vom Replikationsursprung des Plasmids R6K-gamma Replikationsursprünge zu konstruieren,
die kein CpG mehr aufweisen, wobei ihre Funktionalität vollständig intakt
konserviert wurde. Es kann betont werden, dass die besondere Wahl
von R6K-gamma als Ausgangsmaterial, nämlich die Wahl eines Replikons
kleiner Größe, das
nur eine reduzierte Anzahl von CpG aufweist, eine besonders zweckdienliche
Wahl ist, denn wenn man von anderen Plasmiden wie denen der Reihe
pUC ausgeht, gelingt es nicht, Plasmide ohne CpG zu erhalten, die
funktionell bleiben: Alle Versuche, die von den Erfindern durchgeführt wurden,
um auf chemischem Wege die Minimalsequenz pUC wieder herzustellen,
indem die Cytosine der CpG durch ein Guanin oder Adenin ersetzt
wurden, führten
zu DNA-Fragmenten,
die jede funktionelle Replikationsaktivität verloren hatten. Die Plasmide,
die einen erfindungsgemäßen Replikationsursprung
ohne CpG umfassen, haben ihrerseits ihre Fähigkeit, in stabiler Art im
Innern einer Prokaryotenzelle, wie E. coli und E. coli K12 im Besonderen,
zu replizieren, konserviert in dem Maße, wie man ihnen das Protein
pi geliefert hat, das zur Aktivierung der Replikation notwendig
ist (wildes pir oder mutiertes pir wie pir116 als cis oder als trans).
Ein Replikationsursprung für
ein Plasmid gemäß der Erfindung
ist dadurch gekennzeichnet, dass seine Sequenz derjenigen des Replikationsursprungs
R6K-gamma entspricht, wobei jedes G der CpG der wiederholten Region
des Cores durch ein A, ein C oder ein T ersetzt wurde, oder jedes
C der CpG durch ein G, ein A oder ein T ersetzt wurde. Auf diese
Weise hat man verschiedene Replikationsursprünge ohne CpG erhalten, die
in überraschender
Weise immer noch fähig
waren, die Funktionen des Replikationsursprungs der Plasmide bei
E. coli sicherzustellen, und die darüber hinaus fähig waren,
diese Funktionen für
Gene und Transkriptionseinheiten sicherzustellen, die selbst frei von
CpG sind. Die unten angegebenen Beispiele liefern dafür einige
Illustrationen (zum Beispiel die Ursprünge R6K-gamma-M2A, R6K-gamma-M2C,
R6K-gamma-M2T in den Beispielen 7-10). Die vorliegende Erfindung bezieht
sich insbesondere auf jeden Replikationsursprung, dessen Se quenz
die Sequenz SEQ ID NO:12 oder die Sequenz SEQ ID NO:13 (12 und 14)
umfasst. Es wurde auch bewiesen, dass die Fixierungssequenz des
Proteins pi nicht 7-mal wiederholt sein kann, wie dies bei dem Standard-Ursprung
R6K-gamma mit CpG
beobachtet wird, sondern dass man die Zahl auf 5 oder 6 begrenzen
kann, ohne jedoch die Funktionen des Replikationsursprungs zu verändern. Die
vorliegende Anmeldung betrifft somit jeden Replikationsursprung gemäß der Erfindung,
wie er oben definiert wurde, der nur 5 oder 6 Wiederholungen der
Fixierungssequenz des Proteins pi umfasst.
-
Dank
dieser funktionellen Replikations-Ursprünge ohne CpG konnten die Erfinder
verschiedene Plasmide konstruieren, die in bemerkenswerter Art ihre
Funktionen als Transfektionsvektoren konserviert haben.
-
Die
Erzeugung von Plasmiden von E. coli, die frei von CpG sind, erfordert
obligatorisch, funktionelle Gene (exprimierbar bei einem Prokaryoten
wie E. coli) bereitzustellen, die kein CpG enthalten. So lässt die Selektion
der Bakterien, die durch eine rekombinante Plasmid-DNA transformiert
wurden, ein Gen einführen, dessen
Protein dem Bakterium einen dominanten Vorteil verleiht. Am häufigsten
wird der selektive Marker durch ein Gen für Resistenz gegenüber einem
auf das Bakterium E. coli aktiven Antibiotikum eingeführt. Die Analyse
der Sequenzen der Resistenz-Gene
in ihrer großen
Vielfalt, die bei E. coli verwendet werden, zeigt, dass alle ohne
Ausnahme CpG enthalten, oft sogar in sehr hoher Zahl für die Resistenz-Gene, die ihre Herkunft
bei den Streptomyces-Produzenten des Selektions-Antibiotikums finden.
Ebenso ist es notwendig, Reporter-Gene bereitzustellen, die ohne
CpG sind, jedoch funktionell bleiben.
-
So
zeigt eine Analyse von mehreren Hundert Chromosomen- und Plasmid-Genen
des Bakteriums E. coli, deren gut charakterisierte Sequenzen in
vielen Datenbanken verfügbar
sind, dass alle Gene ohne Ausnahme, die eine Größe von über 250 bp haben, durch diese
16 Dinukleotide gebildet werden.
-
Die
vorliegende Erfindung beweist, dass es trotz allem möglich ist,
Gene zu konstruieren, die bei E. coli funktionell sind, die frei
von CpG sind. Die Erfinder haben ein Verfahren zum Erhalt von Genen,
die frei von CpG sind, jedoch bei E. coli exprimierbar sind, entwickelt.
Dieses Verfahren basiert auf der Synthese einer PolyNukleotidkette,
in dem der Kettenbildung von Aminosäuren eines Protein, das bei
E. coli exprimiert werden kann, gefolgt wird, indem jeder Aminosäure ein
Nukleotidcodon zugeordnet wird, ausgewählt aus denen des genetischen
Codes, und indem der Degeneriertheit dieses Codes, der dieser Aminosäure entspricht,
Rechnung getragen wird, in dem aber von dieser Wahl ausgeschlossen
werden:
- i. alle Codons, die ein CpG in ihrer
Sequenz enthalten: betroffen sind die Codons ACG (Thr), CCG (pro), GCG
(Ala), TCG (Ser), CGA (Arg), CGC (Arg), CGG (Arg) und CGT (Arg),
und
- ii. die Codons, die durch ein C enden, wenn das Codon, das direkt
folgt, mit einem G beginnt. Beispiele für ein so erhaltenes Gen umfassen
das Gen NeoΔCpG
(SEQ ID NO:316; siehe Beispiel 11).
-
Nach
einer Ausführungsvariante
der Erfindung wird man so die genannte Wahl der Codons eliminieren,
deren Häufigkeiten
in den Proteinen humaner Herkunft schwach sind: betroffen sind die
Codons ATA (Ile), CTA (Leu), GTA (Val) und TTA (Leu). Die Gesamtheit
der möglichen
Codons entspricht somit nach dieser Variante der folgenden Gruppe:
GCA (Ala), GCC (Ala), GCT (Ala), AGA (Arg), AGG (Arg), AAC (Asn),
AAT (Asn), GAC (Asp), GAT (Asp), TGC (Cys), TGT (Cys), CAA (Gln),
CAG (Gln), GAA (Glu), GAG (Glu), GGA (Gly), GGC (Gly), GGG (Gly),
GGT (Gly), CAC (His), CAT (His), ATC (Ile), ATT (Ile), CTC (Leu),
CTG (Leu), CTT (Leu), TTG (Leu), AAA (Lys), MG (Lys), TTC (Phe),
TTT (Phe), CCA (Pro), CCC (Pro), CCT (Pro), TCA (Ser), TCC (Ser),
TCT (Ser), AGC (Ser), AGT (Ser), ACA (Thr), ACC (Thr), ACT (Thr),
TAC (Tyr), TAT (Tyr), GTC (Val), GTG (Val), GTT (Val), auf die selbstverständlich die
Regel ii. oben angewendet werden muss. Beispiele für ein Gen,
das gemäß dieser
Ausführungsvariante
erhalten wurde, umfassen insbesondere das Gen LacZ ΔCpG (Positionen
3 bis 3056 von SEQ ID NO:9; siehe Beispiel 5).
-
In
bevorzugter Weise wird die genannte Codon-Wahl auch so erfolgen,
dass Strukturen, die für
die Messenger-RNA nicht günstig
sind, wie das Vorliegen von Spleißsequenzen, direkten oder umgekehrten
Repetiersequenzen, Haarnadelstrukturen oder Polyadenylierungssignale,
vermieden werden. Die Anzahl und die Varietät der Größe der durch dieses Verfahren
synthetisierten Gene wird in den Beispielen unten veranschaulicht,
die zeigen, dass es so möglich
ist, die Synthese von Genen zu konzipieren, die vollständig frei
von CpG sind, die daher bei E. coli funktionell bleiben. Als Referenzprotein
kann man jedes Protein, das durch E. coli exprimiert werden kann,
zum Beispiel ein Protein, das durch ein Gen für Resistenz gegen ein Antibiotikum
codiert wird, wie zum Beispiel durch die Gene für Resistenz gegenüber Zeocin( R ) (Phleomycin),
gegen Hydromycin, gegen Blasticidin, gegen Puromycin, oder ein Protein,
das durch ein Reporter-Gen, wie zum Beispiel lacZ codiert wird,
nennen.
-
Die
vorliegende Erfindung betrifft ein derartiges Verfahren zur Herstellung
von Genen, die frei von CpG sind, die in E. coli exprimierbar sind,
sowie jedes Gens mit wenigstens 250 bp, das durch dieses Verfahren erhalten
werden kann. Die vorliegende Erfindung bezieht sich insbesondere
auf:
- – jedes
Gen, dessen Sequenz die Sequenz SEQ ID NO:1 von der Position 3 bis
zur Position 374 (1), die Sequenz SEQ ID NO:3
von der Position 3 bis zur Position 1025 (3), die
Sequenz SEQ ID NO:5 von der Position 3 bis zur Position 422 (5),
die Sequenz SEQ ID NO:7 von der Position 3 bis zur Position 599
(7) umfasst, sowie auf jede Verwendung dieser Gene
als Selektionsmarker, und
- – jedes
Gen, dessen Sequenz die Sequenz SEQ ID NO:9 von der Position 3 bis
zur Position 3056 (siehe 9) umfasst,
und jedes Gen, dessen Sequenz die Sequenz SEQ ID NO:316 (Positionen
3 bis 797 der in 18 dargestellten DNA-Sequenz
(codierend für
SEQ ID NO:317)) umfasst, sowie auf jede Verwendung eines derartigen
Gens als Reporter-Gen.
-
Die
Expression eines Plasmid-Gens benötigt auch eine Bereitstellung
bzw. Anordnung von Promotoren, die an die Zelle angepasst sind,
die das Plasmid beherbergt. Die vollständige Kenntnis des E. coli-Genoms seit
einigen Jahren hat die Untersuchung verschiedener nicht-codierender
Elemente, die bestimmte Funktionen aufweisen, erleichtert. Die Resultate
von Arbeiten, die auf der Natur der Promotoren von E. coli basieren, werden
derzeit auf der PromEC-Seite offenbart und öffentlich gemacht, welche im
Internet zugänglich
ist (http://bioinfo.md.huji.ac.il/marg/promec). Eine Analyse von
471 gut definierten Promotoren von der Base –75 bis +25 bezüglich des
Punkts +1 der Initiation der Transkription zeigt, dass nur 6 von
ihnen kein CpG besitzen. Die Addition jedes der 6 Promotoren, die
chemisch synthetisiert wurden und stromaufwärts des Gens lacZ, das für die β-Galactosidase
von E. coli codiert, platziert wurden, erwies sich als negativ für das Aufzeigen
der Aktivität
dieses Reporter-Gens. Das Fehlen einer starken Homologie mit den
Consensus-Sequenzen der "boites canoniques" –10 und –35 legt nahe, dass die Kraft
dieser Promotoren schwach ist und alternativ, dass diese durch Induktionsbedingungen
reguliert werden könnten,
die für
jeden von ihnen zu definieren ist. Eine Analyse der gut charakterisierten
Promotoren von E. coli hat gezeigt, dass nur eine Anzahl von zehn
kein CpG auf dem Niveau der spezifischen Boxen der Erkennung durch
RNA-Polymerase umfasst. Eine Literaturrecherche hat darüber hinaus
gezeigt, dass diese Promotoren alle eine durch diverse Stimuli induzierbare
Natur hatten, eine Situation, die für ein konstitutives Merkmal
der Expression manchmal gewollt ist, meist aber verzichtbar ist. Den
Erfindern ist es ihrerseits gelungen, durch zufällige Anordnung von PCR-Fragmenten,
die kurze Consensus-Sequenzen, die frei von CpG sind, die von mehreren
starken Promotoren abgeleitet sind, neue Promotoren zu entwickeln,
die an die Expression von Genen ohne CpG in E. coli angepasst sind,
und die den besonderen Vorteil aufweisen, sehr starke konstitutive
Promotoren zu sein und vollständig
frei von CpG zu sein. Beispiel 6 unten stellt die Konstruktion des
neuen Promotors EM2K durch diese Technik dar. Die vorliegende Erfindung
bezieht sich insbesondere auf jeden Promotor, dessen Sequenz die
Sequenz SEQ ID NO:11 umfasst (siehe 11).
-
Die
charakterisierten Transkriptions-Terminatoren bei E. coli werden
durch kurze Sequenzen gebildet, von denen viele kein CpG besitzen,
und die Erfinder konnten verifizieren, dass solche Terminatoren
ihre Funktion wirksam gewährleisten,
wenn sie in E. coli mit einem Promotor und einem Gen ohne CpG gemäß der Erfindung
assoziiert werden.
-
Die
vorliegende Anmeldung betrifft demnach jede Transkriptionseinheit,
die wenigstens ein Gen ohne CpG gemäß der Erfindung und wenigstens
einen Promotor ohne CpG gemäß der Erfindung
umfasst. Eine solche Transkriptionseinheit kann außerdem wenigstens
einen Terminator ohne CpG umfassen. Die Erfindung stellt somit zum
ersten Mal ein Nukleotidkonstrukt bereit, das vollständig frei
von CpG ist und das dennoch in E. coli exprimiert werden kann, und
zwar unter Gewährleistung
seiner normalen Funktionen.
-
Die
vorliegende Anmeldung betrifft somit jedes Plasmid, das einen Replikationsursprung
gemäß der Erfindung
umfasst. Solche Plasmide können
außerdem
ein Gen ohne CpG gemäß der Erfindung
und/oder einen Promotor ohne CpG gemäß der Erfindung und/oder einen
Transkriptions-Terminator ohne CpG oder eine Transkriptionseinheit
gemäß der Erfindung
umfassen. Die Plasmide gemäß der Erfindung
weisen somit den Vorteil auf, kein CpG in ihrer Struktur aufzuweisen,
während
sie dennoch immer fähig
sind, die Funktionen von Expressionsvektoren zu gewährleisten.
Beispiele für
solche Plasmide werden in den Beispielen unten angegeben. Die vorliegende
Anmeldung bezieht sich insbesondere auf jedes Plasmid von SEQ ID
NO:14 (15).
-
Im
Rahmen der vorliegenden Anmeldung liegt auch jede Zelle, die mit
wenigstens einem Element transformiert ist, ausgewählt aus
der Gruppe, bestehend aus Genen ohne CpG gemäß der Erfindung, Promotoren
ohne CpG gemäß der Erfindung,
Replikationsursprüngen
ohne CpG gemäß der Erfindung,
Plasmiden ohne CpG gemäß der Erfindung.
Eine solche Zelle gemäß der Erfindung
kann außerdem
ein Gen umfassen, das für
ein Protein pi, wie zum Beispiel Wild-pir oder mutiertes pir116,
codiert, umfassen. Vorteilhafterweise ist eine transformierte Zelle
gemäß der Erfindung
eine Zelle von E. coli.
-
Um
ein Plasmid gemäß der Erfindung
in einer ausreichenden Zahl von funktionellen Kopien zu replizieren,
hat der Fachmann zahlreiche Bakterien zur Verfügung, zum Beispiel wie E. coli
K12, die klassischerweise zu Zwecken der Plasmidreplikation verwendet
werden. Nun besitzt der ursprüngliche
Stamm K12 von E. coli eine Methylase der DNA, die eine Methylgruppierung
an alle Cytosine einführt,
die sich in Kontext CC(A/T)GG der genomischen und plasmidischen
DNA des Bakteriums befinden. Die Gesamtheit der verschiedenen Stämme der
Linie K12 besitzt diese Aktivität
aufgrund einer Methylase, die durch das Gen dcm codiert wird (Palmer
B. R. und Marinus M. G., (1994), Gene, 143, 1-12). In dem Maße wie die
Methylierung der Plasmid-DNA, die aus dcm+-Stämmen von
E. coli hergestellt wurde, eine Modifikation des DNA-Moleküls mit sich zieht,
die für
den Transfer von Genen in Eukaryotenzellen nicht gewünscht ist,
haben die Erfinder einen Stamm entwickelt, der gleichzeitig die
Funktion der Plasmide mit dem Ursprung R6K-gamma ohne CpG gemäß der Erfindung
und den Erhalt von Plasmid-DNA, die frei von Methylierung an den
dcm-Stellen ist, erlaubt. Dazu wurde von den Erfindern ein neues
Gen konstruiert, in dem das Gen dcm von der Position +3 nach dem
ATG bis zur Position –14
vor dem TGA in Gen dcm eines Stamms pir116 deletiert wurde (siehe
Beispiel 10 unten).
-
Das
Gen dcm befindet sich in einer Chromosomenregion, deren Sequenz
von der GenBank unter der Zugangsnummer D90835 (cloneKohara #344:43,5-43,9
min) erhalten werden kann.
-
Eine
Deletion in dem Gen (-) bringt den zusätzlichen Vorteil, dass jede
Reversion des Gens zur Wildform vermieden wird. Auf diese Weise
wurden mutante Stämme
dcm– von
den Erfindern produziert; sie weisen keinen negativen Phenotyp auf,
der das Wachstum der Bakterien verändern könnte oder die Qualität und Quantität der Plasmid-DNA
modifizieren könnte.
Es wurde insbesondere ein optimierter Stamm von E. coli durch gezielte
Inaktivierung des Gens dcm aus dem Elternstamm konstruiert, der
ein Protein pi exprimiert, das an einer Stelle mutiert ist, was
zur Erhöhung
der Kopienzahl der Plasmide ohne CpG führt. Dieser optimierte Stamm
erlaubt eine Produktion der Plasmid-DNA, die Gegenstand dieser Erfindung
ist, die frei von CpG ist, mit hoher Qualität und Abundanz, und die frei
von einer Methylierung an den Cytosinen der dcm-Stellen ist. Die
vorliegende Anmeldung betrifft somit jede Zelle, die ein Gen umfasst,
das für
das Protein pi codiert, das durch das deletierte Gen dcm gemäß der Erfindung
transformiert ist, und jedes Verfahren zur Replikation von Plasmiden,
das die Transformation einer solchen Zelle durch ein Plasmid und
die Kultur der transformierten Zelle unter Bedingungen, die an die
Replikation dieses Plasmids angepasst sind, umfasst.
-
Die
vorliegende Anmeldung betrifft somit ein Verfahren für die Herstellung
eines Plasmids, das vollständig
frei von CpG ist und ohne Methylierung auf der Ebene des Cytosins
im Nukleinsäure-Kontext CC(A/T)GG
ist, dadurch gekennzeichnet, dass man ein Plasmid gemäß der Erfindung
durch Replikation in einem Escherichia coli-Stamm produziert, der
das Protein pi produziert, der bezüglich des Methylierungssystems
dcm defizient ist.
-
Im
Rahmen der vorliegenden Anmeldung liegt auch jeder Kit zur Herstellung
von Plasmiden, der wenigstens eine Zelle gemäß der Erfindung umfasst. Diese
Kits sind insbesondere an die Replikation von Plasmiden gemäß der Erfindung
angepasst, um zu vermeiden, dass diese Plasmide, deren Struktur
frei von CpG ist, anderswo während
ihrer Replikation als CC(A/T)GG methyliert werden.
-
Die
Erfindung stellt somit einen vollständigen Komplex von Transformationsmitteln
bereit, die frei von CpG sind: Gene ohne CpG, Promotoren ohne CpG,
Transkriptionseinheiten ohne CpG, Replikationsursprünge für Plasmid
ohne CpG, Plasmide ohne CpG, Zellen, die spezielle an die Replikation
von Plasmiden ohne Methylierung von Cytosinen angepasst sind. Diese
neuen Mittel finden direkte Anwendungen für die genetische Transformation
von Zellen für
biotechnologische oder me dizinische Zwecke. Solche Produkte sind
in der Tat außergewöhnlich gut
an die Herstellung von Impfzusammensetzungen mit DNA, die für den Menschen
oder das Tier bestimmt sind, angepasst.
-
Die
Erfindung wird durch die folgenden Beispiele erläutert, in denen auf die Figuren
Bezug genommen wird:
-
1:
Sequenz des Gens Sh bleΔCpG
(ohne CpG),
-
2:
Liste der Oligonukleotide, die für
die Konstruktion bzw. die Anordnung des Gens Sh bleΔCpG verwendet
werden,
-
3:
Sequenz des Gens HphΔCpG,
-
4:
Liste der Oligonukleotide, die für
die Konstruktion des Gens HphΔCpG
verwendet wurden,
-
5:
Sequenz des Gens BsrΔCpG,
-
6:
Liste der Oligonukleotide, die für
die Konstruktion des Gens BsrΔCpG
verwendet wurden,
-
7:
Sequenz des Gens PacΔCpG,
-
8:
Liste der Oligonukleotide, die für
die Konstruktion des Gens PacΔCpG
verwendet wurden,
-
9:
Sequenz des Gens LacZΔCpG,
-
10A: Liste der Oligonukleotide, die für die Konstruktion
des ersten Drittels des Gens LacZΔCpG verwendet
wurden,
-
10B: Liste der Oligonukleotide, die für die Konstruktion
des zweiten Drittels des Gens LacZΔCpG verwendet wurden,
-
10C: Liste der Oligonukleotide, die für die Konstruktion
des dritten Drittels des Gens LacZΔCpG verwendet wurden,
-
11: Sequenz des Promotors EM7(1-), der degenerierten
Oligonukleotide (2-), die zur Konstruktion des Promotors EM2K, der
frei von CpG ist (3-), verwendet wurden,
-
12: Sequenz des Replikationsursprungs R6K-gamma
M2A,
-
13: Liste der Oligonukleotide, die für die Konstruktion
des Replikationsursprungs R6K-gamma M2A verwendet wurden,
-
14: Sequenz des Ursprungs R6K-gamma des Plasmids
pGTR6Kneoc9, begrenzt durch die Stellen PacI,
-
15: Sequenz des Plasmids pSh-LacZΔCpG,
-
16: Karte des Plasmids pShΔCpG,
-
17: Karte des Plasmids pSh-LacZΔCpG,
-
18: Sequenz des Gens NeoΔCpG (ohne CpG) [Position 3 bis
797 der DNA-Sequenz = SEQ ID NO:316; Proteinsequenz = SEQ ID NO:317],
-
19: Sequenz der Oligonukleotide SEQ ID NO:318
bis SEQ ID NO:X, die für
die Konstruktion des Gens NeoΔCpG
verwendet wurden.
-
BEISPIEL 1: Konstruktion des Gens Sh ble
der Resistenz gegen Zeocin, das frei von CpG ist
-
Das
Gen Sh bleΔCpG,
dessen Sequenz in 1 angegeben ist (Position 3
bis 377 von SEQ ID NO:1), wurde aus einer Anordnung von überlappenden
Oligonukleotiden (Größe 20-40
bp), deren Sequenzen in 2 angegeben sind, synthetisiert.
Das Verfahren der Konstruktion bzw. des Zusammenbaus bzw. der Anordnung
erfolgt in drei Stufen, wobei die erste in der Phosphorylierung
der Oligonukleotide des codierenden Strangs besteht, in der zweiten
Stufe wird die Gesamtheit der Oligonukleotide der zwei Stränge durch
Hybridisierung und Ligation assoziiert, und in der dritten Stufe
wird das Gen durch PCR amplifiziert. Dieses Verfahren wurde mit
Erfolg für
die Synthese aller synthetischen Gene verwendet, die in den Beispielen
1, 2, 3, 4, 5 genannt sind. Das Verfahren wird für das Gen Sh bleΔCpG detailliert
beschrieben:
Die 10 Oligonukleotide von OL26199 bis OL27099
(2), die dem codierenden Strang entsprechen, werden nach
dem folgenden Verfahren phosphoryliert: 1 μl jedes der Oligonukleotide,
die mit 250 μM
in Wasser aufgenommen wurden, wird in einem Mikroröhrchen,
das 15 μl
Wasser enthält,
gemischt, um eine Endlösung mit einer
Konzentration von 100 Picomol pro Mikroliter zu erhalten. Man mischt
dann 5 μl
dieser Lösung
mit 10 μl Puffer
der Polynukleotid-Kinase, 10-fach konzentriert, 0,4 μl einer 50
mM ATP-Lösung,
85 μl Wasser
und 1 μl des
Enzyms (mit 10 E/μl),
und das Ganze wird 4 Stunden bei 37°C (Lösung A) inkubiert.
-
Eine
Lösung
der Oligonukleotide des nicht-codierenden Strangs wird gebildet,
indem 1 μl
jedes Oligonukleotids (OL27199 bis OL28199; siehe 2)
und 1 μl
des Oligonukleotids OL26099 (2) gemischt
werden, wozu man 43 μl
Wasser gibt, um eine Endlösung
mit 54 Picomol pro μl
(Lösung
B) zu erhalten.
-
Der
Zusammenbau bzw. die Konstruktion des Gens wird durchgeführt, indem
zunächst
10 μl der
Lösung
A, 1 μl
der Lösung
B, 6 μl
einer KCl-Lösung
mit 100 mM, 3 μl
einer NP-40-Lösung
mit 0,5%, 4 μl
einer Lösung
von MgCl2 mit 50 mM, 3 μl
einer 10 mM ATP-Lösung
und 7,5 μl
Ligase Pfu (30 Einheiten) gemischt werden, dann wird das Gemisch
in einem programmierbaren Thermocycler erwärmt, und zwar 3 Minuten auf 95°C, dann 3
Minuten auf 80°C,
bevor es 3 Zyklen von einer Minute auf 95°C unterworfen wird, gefolgt
von einer Passage von 95°C
auf 70°C
in 1 Minute, dann einer Passage von 70°C auf 55°C in 1 Stunde und schließlich 2
Stunden auf 55°C.
Dann wird das Gemisch der zusammengefügten Oligonukleotide mit den
Primern OL26099 und OL27199 amplifiziert. Das Amplifikationsprodukt
wird an einer Promega-Säule
gereinigt, durch die Restriktions-Enzyme NcoI und NheI verdaut und
in das durch NcoI und NheI linearisierte Plasmid pMOD1LacZ(wt) kloniert.
Die Sequenzen der Plasmid-DNA von 2 Klonen, die gegen Zeocin resistent
sind, die nach der Transformation des E. coli-Stamms GT100 (verfügbar von
Invivogen) durch das Gemisch der Ligation zwischen dem Vektorfragment
und dem PCR-Fragment auftraten, wurden als entsprechend der gewünschten in 1 gezeigten
Sequenz bestimmt. Dieses synthetische Gen, das unter die Abhängigkeit
des Bakterien-Promotors EM7 (Vektor pMOD1Sh ΔCpG) gestellt ist, verleiht
eine Resistenz gegenüber
Zeocin, die identisch der ist, die durch denselben Vektor, der das
native Gen Sh ble enthält,
bei dem E. coli-Empfängerstamm GT100
bereitgestellt wird.
-
BEISPIEL 2: Konstruktion des Gens Hph
für Resistenz
gegen Hygromycin; das frei von CpG ist
-
Das
synthetische Gen Hph ΔCpG
(Sequenz SEQ ID NO:3, dargestellt in 3) wurde
nach den in Beispiel 1 beschriebenen Verfahren konstruiert. Die
zwei Stränge
wurden mit Hilfe von Oligonukleotiden mit 60 Basenpaaren plus zwei
Oligonukleotiden mit 30 Basenpaaren mit einer überlappenden Region mit 30
Basenpaaren konstruiert. Der Zusammenbau der verschiedenen Oligonukleotide,
die in 4 gezeigt sind, wurde durch
eine finale PCR mit dem Sense-Oligonukleotid TTCAGCTGAGGAGGCACATC
(SEQ ID NO:299) und dem reversen Oligonukleotid CTCAGGATCCGCTAGCTAAT
(SEQ ID NO:300) nach den im vorangehenden Beispiel genannten experimentellen
Bedingungen verwirklicht.
-
Das
amplifizierte und gereinigte Fragment (1068 bp) wurde dann durch
die Restriktions-Enzyme BspHI und NheI verdaut und in den Vektor
pMOD2 LacZ(wt) kloniert, in dem die NcoI-Stelle von pMOD1 durch die
Stelle von BspHI ersetzt wurde. Die Selektion der E. coli-Klone,
die diesen rekombinanten Vektor enthalten, wurde auf dem Medium
FastMediiaTM Hygro Agar (Cayla) durchgeführt. Die
Sequenz von SEQ ID NO:3 der 3 wurde
durch Sequenzierung an den zwei Strängen der Plasmid-DNA von zwei
Klonen, die gegenüber Mygromycin
resistent waren, bestätigt.
Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors
EM7 (Vektor pMOD2 Hph ΔCpG)
gestellt wurde, verleiht eine Resistenz gegen Hygromycin B, die
wenigstens gleich derjenigen ist, die durch denselben Vektor, der
das native Gen Hph enthält,
bei dem Empfängerstamm
E. coli GT100 bereitgestellt wird.
-
BEISPIEL 3: Konstruktion des Gens Bsr
für Resistenz
gegen Blasticidin, das frei von CpG ist
-
Das
Gen Bsr ΔCpG,
dessen Sequenz in 5 (SEQ ID NO:5) dargestellt
ist, wurde aus den als 6 angegebenen Oligonukleotiden nach dem in
Beispiel 1 beschriebenen Verfahren synthetisiert. Das Gemisch der zusammengebauten
Oligonukleotide wurde mit den Primern OL64 und OL76 (siehe 6)
amplifiziert. Das amplifizierte und gereinigte Fragment wurde dann
durch die Restriktions-Enzyme BspHI und NheI verdaut und in den
Vektor pMOD2 LacZ(wt) kloniert. Die Selektion der Klone von E. coli,
die diesen rekombinanten Vektor enthalten, wurde auf dem Medium
FastMediaTM Blasti Agar (Cayla) durchgeführt. Die
Sequenz SEQ ID NO:5 der 5 wurde durch Sequenzierung
der zwei Stränge
der Plasmid-DNA von zwei Klonen, die gegenüber Blasticidin resistent waren,
bestätigt.
Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors
EM7 (Vektor pMOD2 Bsr ΔCpG)
gestellt war, verleiht eine Resistenz gegen Blasticidin, die identisch mit
der ist, die durch denselben Vektor, der das native Gen Bsr enthält, mit
dem E. coli-Empfängerstamm GT100
geliefert wird.
-
BEISPIEL 4: Konstruktion des Gens Pac
für Resistenz
gegen Puromycin, das frei von CpG ist
-
Das
Fragment BspHI-NheI (Gen Pac ΔCpG;
SEQ ID NO:7), dessen Sequenz in 7 gezeigt
ist, wurde durch einen Zusammenbau der in 8 gezeigten
Oligonukleotide synthetisiert.
-
Das
Gemisch der zusammengebauten bzw. angeordneten Oligonukleotide wurde
mit dem Sense-Primer pur24 (AGGACCATCATGACTGAG; SEQ ID NO:301) und
dem Reverse-Primer pur25 (ATCATGTCGAGCTAGCTC; SEQ ID NO:302) amplifiziert.
Das gereinigte Fragment BspHI-NheI wurde in das Plasmid pMOD2 LacZ(wt)
zwischen die Stellen BspHI und NheI kloniert. Die Sequenzen der
Plasmid-DNA von 2 Klonen des Stamms GT100, die gegen Puromycin resistent
waren, die auf dem Medium FastMediaTM puro
Agar (Cayla) nach Transformation durch das Produkt der Ligation
zwischen dem Vektorfragment und dem PCR-Fragment auftraten, wurden
als entsprechend der gewünschten
in 7 dargestellten Sequenz gefunden. Das synthetische
Gen Pac ΔCpG,
das unter die Abhängigkeit
des Bakterien-Promotors EM7 gestellt war (Vektor pMOD2 Pac ΔCpG), verleiht
eine Resistenz gegen Puromycin, die etwas über der liegt, die durch denselben
Vektor, der das native Gen pac enthält, mit dem E. coli-Empfängerstamm
GT100 geliefert wird.
-
BEISPIEL 5: Konstruktion des Gens LacZ,
das frei von CpG ist, das für
die β-Galactosidase von
E. coli codiert
-
Das
synthetische Gen LacZ ΔCpG
(SEQ ID NO:9, dargestellt in 9) wurde
nach dem in den voranstehenden Beispielen beschriebenen Verfahren
konstruiert. Unter Berücksichtigung
der zu realisierenden Größe des Gens
(über 3000
bp) wurde die Konstruktion in drei verschiedenen Teilen durchgeführt, wobei
die Restriktionsstellen EcoRV und SacI an denselben Stellen wie
bei der nativen Sequenz des Gens lacZ konserviert wurden. Für jeden
Teil wurden die zwei Stränge
mit Hilfe von Oligonukleotiden mit 40 Basen plus zwei Oligonukleotiden
mit 20 Basen mit einer überlappenden
Region von 20 Basen synthetisiert.
-
Die
erste Region entspricht dem Fragment NcoI-EcoRV (Teil I), die zweite
Region entspricht dem Fragment EcoRV-SacI (Teil II) und die dritte
Region entspricht dem Fragment SacI-NheI. Der Zusammenbau der verschiedenen
Oligonukleotide, die in den 10A (Oligonukleotide,
die für
die Konstruktion des Teils I verwendet wurden), 10B (Oligonukleotide, die für die Konstruktion des Teils
II verwendet wurden), 10C (Oligonukleotide,
die für
die Konstruktion des Teils III verwendet wurden) dargestellt sind,
wurde durch PCR unter denselben experimentellen Bedingungen wie
die, die in den vorangehenden Beispielen angegeben sind, durchgeführt. Die
progressive Klonierung der drei Teile des synthetischen Gens wurde
in dem Vektor pMOD1 LacZ(wt) durchgeführt. Die Funktionalität jedes
klonierten Teils sowie die des vollständigen synthetischen Gens,
das auf dem Vektor pMOD1 LacZ vorlag, wurde durch Beweis der β-Galactosidase-Aktivität auf dem Medium
FastMediaTM Amp Xgal Agar (Cayla) für die rekombinanten
Klone, die in dem Stamm MC1061 ΔLac erhalten
worden waren, gezeigt. Das vollständige synthetische Gen LacZ ΔCpG, das
unter die Kontrolle des Promotors EM7 gestellt worden war, ergibt
30% weniger β-Galactosidase-Aktivität (luminometrische
Bestimmung von Protein-Extrakten der Kultur), als die Expression
des nativen Gens LacZ in derselben Plasmid-Umgebung.
-
BEISPIEL 6: Konstruktion eines starken
konstitutiven Promotors von E. coli, der frei von CpG ist
-
Der
Bakterien-Promotor EM7, der auf den Vektoren des Typs pMOD1 vorhanden
ist, ist ein synthetischer Promotor, der bei E. coli konstitutiv
und stark ist. Seine Sequenz, die 3 CpG enthält (SEQ ID NO:297 in 11), diente als Referenz, um einen Bakterien-Promotor
zu entwickeln, der frei von CpG ist. Wir haben nun "Linker-"Oligonukleotide hergestellt,
die an 4 Stellen (als W, D, W und H auf der Sequenz SEQ ID NO:298
in 11 bezeichnet) degeneriert sind und mit dem Restriktionsstellen
AseI und NcoI kompatibel sind. Diese verschiedenen Oligos wurden
hybridisiert und in den pMODI ShΔCpG
kloniert, und zwar zwischen die Restriktionsstellen AseI und NcoI
des Promotors EM7. Nach Selektion der rekombinanten Klone auf dem
Medium FastMediaTM Zeo Agar und Bestimmung
der Promotorsequenz des Klons, der gegenüber Zeocin am resistentesten war,
haben wir den Promotor EM2K (Sequenz SEQ ID NO:11 in 11) als Bakterien-Promotor, der frei von CpG ist,
erhalten.
-
BEISPIEL 7: Synthese der Ursprünge R6K-gamma,
die frei von CpG sind
-
Das
DNA-Fragment PacI, das den Ursprung R6K-gamma-M2A enthält (SEQ
ID NO:12 in 12) wurde durch PCR aus der
Konstruktion der in 13 angegebenen Oligonukleotide
synthetisiert. Die Konstruktion bzw. die Anordnung des Fragments
R6K-gamma-M2A wurde mit den Primern RK15 (GCAGGACTGAGGCTTAATTAAACCTTAAAAC
SEQ ID NO:303) und RK16 (AAGTCTCCAGG TTAATTAAGATCAGCAGTTC; SEQ ID
NO:304) amplifiziert und die Fragmente wurden nach Verdau durch
das Enzym PacI in ein Plasmid (pGTCMVneo), das das Gen für Resistenz
gegen Kanamycin und den Replikationsursprung pUC, begrenzt durch
2 PacI-Stellen, enthielt, kloniert. Zahlreiche Transformanten des
Stamms GT97 (der das Protein pi exprimiert) wurden analysiert und
es wurde festgestellt, dass Klone, ein Plasmid mit starker Kopienzahl
enthalten, das nach mehreren Subkulturen in Abwesenheit von Kanamycin
konserviert wird. Nach Sequenzierung wurde auch festgestellt, dass
das Fragment ori der Mehrheit dieser Plasmide eine reduziertere
Anzahl (5-6) an Repetiersequenzen anstelle der natürlicher
Weise 7 des Plasmids R6K besitzen können. Eine dieser neuen Sequenzen
des synthetischen Ursprungs R6K-gamma, der frei von CpG ist, ist
in SEQ ID NO.13 in 14 gezeigt.
-
Zwei
andere Versionen des Ursprungs R6K-gamma, in denen das G jedes CpG,
das in diesen Repetiersequenzen vorliegt (Element mit 22 bp, das
mehrmals in der Fixierungsregion des Proteins pi wiederholt wird),
durch ein C, um den Ursprung (R6K-gamma M2C) zu ergeben, oder durch
ein T, um den Ursprung R6K-gamma M2T) zu ergeben, ersetzt waren,
wurden in analoger Art synthetisiert. Die Funktionalität dieser neuen
Ursprünge
R6K-gamma, in denen das G der CpG der Repetiersequenzen durch ein
C oder durch ein T ersetzt war, angefügt an das Beispiel des Ursprungs
der 13, wo das G durch ein A ersetzt
ist, beweist, dass die CpGs dieser Repetiersequenzen keine Rolle
in der Funktionalität
des Ursprungs spielen.
-
BEISPIEL 8: Konstruktion von Plasmidvektoren,
die vollständig
frei von CpG sind, die ein Resistenz-Gen bei E. coli exprimieren
-
Zuerst
wurde eine Kassette PacI-PacI, die den Bakterien-Promotor EM2K,
das Gen für
Resistenz gegen Zeocin Sh ΔCpG,
gefolgt von einem Bakterien-Terminator ohne CpG enthält, realisiert.
Dazu wurden "Linker"-Oligonukleotide,
die die Sequenz des Terminators t1 der Intergenregion rpsO-pnp von
E. coli enthalten, hybridisiert und zwischen die Stellen NheI und
PacI des Vektors pMOD1 EM2K Sh ΔCpG
kloniert:
"Linker"-Oligonukleotide
rpsO-1(5'→3'):
CTAGCTGAGTTTCAGAAAAGGGGGCCTGAGTGGCCCCTTTTTTCAACTTAAT
SEQ
ID NO:305,
rpsO-2(5'→3'):
TAAGTTGAAAAAAGGGGCCACTCAGGCCCCCTTTTCTGAAACTCAG
SEQ
ID NO:306.
-
Der
erhaltene rekombinante Vektor (pMOD1 EM2K Sh ΔCpG Term) wurde durch Sequenzierung
auf der Ebene der Terminator-Sequenz, die natürlicherweise kein CpG enthält, verifiziert.
Die Kassette EM2K- Sh ΔCpG-Term,
die in diesem Vektor enthalten ist, wurde dann durch PCR mit Hilfe
der zwei folgenden Primer amplifiziert, um die zwei Seiten durch
die PacI-Stellen zu begrenzen:
PACI-UP (5'→3'):
ATCGTTAATTAAAACAGTAGTTGACAATTAAACATTGGC
SEQ ID NO:307
PACI-DOWN (5'→3'):
ATCGTTAATTAAGTTGAAAAAAGGGGCC
SEQ ID NO:308
-
Dieses
amplifizierte Fragment wurde dann gereinigt und durch PacI geschnitten,
dann mit dem Fragment PacI, das den Replikationsursprung R6K-gamma-ΔCpG, der
in Beispiel 7 beschrieben wurde, enthält, kombiniert. Nach Transformation
dieses Ligationsgemisches in den Stamm GT97 (der das Protein pi
exprimiert) und Selektion auf dem Medium FastMediaTM Zeo
zeigt die Analyse der erhaltenen rekombinanten Klone zwei mögliche Orientierungen
des Fragments PacI-PacI, das den Ursprung R6K-gamma-ΔCpG enthält. Die
in dem pSh ΔCpG
erhaltene Orientierung ist in 16 dargestellt.
-
BEISPIEL 9: Konstruktion bzw. Zusammenbau
eines Plasmidvektors, der vollständig
frei von CpG ist, der das Gen für
Resistenz gegen Zeocin und das Gen der β-Galactosidase in E. coli exprimiert
-
Der
in Beispiel 8 beschriebene Vektor pSh ΔCpG (16)
wurde verwendet, um das synthetische Gen LacZ, das frei von CpG
ist, zwischen die Stellen EcoRI und NheI zu insertieren. Dazu wurden
die "Linker"-Oligonukleotide,
die mit EcoRI und NcoI kompatibel sind, die eine Consensus-Sequenz
der Fixierungsstelle der Ribosomen von E. coli enthalten, hybridisiert
und mit dem Fragment LacZ ΔCpG
NcoI-NheI des pMOD1
LacZ ΔCpG
zwischen die Stellen EcoRI und NheI des Vektors pMOD1 EM2K ShΔCpG kloniert.
Verwendete "Linker"-Oligonukleotide:
rbs-1(5'→3'):
AATTTCTGAGGAGAAGCT SEQ ID NO:309
Rbs-2(5'→3'):
CATGAGCTTCTCCTCAG SEQ ID NO:310
-
Die
Transformation dieses Ligationsgemisches in den Stamm GT97 (der
das Protein pi exprimiert) und die Selektion auf dem Medium FastMediaTM Zeo XgaI erlaubte den Erhalt von rekombinanten
Klonen, die den Vektor pSh-LacZΔCpG
enthalten (15 und 17).
Dieser Vektor co-exprimiert unter der Abhängigkeit des Bakterien-Promotors
EM2K als künstliches
Operon-System die Gene ShΔCpG
und LacZΔCpG.
-
BEISPIEL 10: Herstellung eines E. coli-Stamms,
der das mutante Protein pi116 exprimiert und eine Deletion im Gen
dem trägt
-
Das
Gen pir, das für
das Protein pi codiert, das für
die Initiation der Replikation des Ursprungs R6K-gamma unverzichtbar
ist, sowie das mutierte Gen pir116, das zu einer Erhöhung der
Kopienzahl der Plasmide R6K-gamma führt, wurden in funktioneller
Form in verschiedene Stämme
von E. coli K12 durch unterschiedliche Gruppen eingeführt. Stämme dieses
Typs können
von E. coli Genetic Stock Center (http://cgsc.biology.yale.edu)
erhalten werden und sind auch im Handel von Firmen erhältlich,
die sich auf die Lieferung von biologischem Material für die Forschung
spezialisiert haben. Dies ist zum Beispiel der Fall für die Stämme pir1 (pir116)
und pir2 (Wild-pir), die von der Firma Invitrogen angeboten werden,
von der die Produkte in allen europäischen Ländern bezogen werden können. Der
Stamm GT97 der Linie K12, des Genotyps Δlac169 hsdR514 endA1 recA1 codBA
uidA (ΔMluI)::pir116
(verfügbar
von InvivoGen) wurde wegen seiner Widerstandsfähigkeit, der Konstanz der DNA-Präparationen
der Plasmide R6K-gamma und seiner erhöhten Kompetenzniveaus unter
mehreren Stämmen
K12pir unterschiedlichen Genotyps für einige Gene ausgewählt. Die Einführung einer
Deletion in das Gen dcm des Stamms GT97 wurde wie folgt durchgeführt:
Zwei
DNA-Regionen mit 1,8 kb und 1,5 kb, die das Initiations-Codon ATG
(Fragment A) und das Stopp-Codon TGA (Fragment B) des Gens dcm jeweils
begrenzen, wurden durch PCR amplifiziert. Das Fragment A wurde mit
dem Primer-Paar OLdcmAF (TTTTGCGGCCGCTTGCTGCGCCAGCAACTAATAACG, SEQ
ID NO:311) und OLdcmAR (CCTTGGATCCTGGTAAACACGCACTGTCCGCCAATCGATTC,
SEQ ID NO:312) amplifiziert, und das Fragment B wurde mit dem Primer-Paar
OLdcmBF (TTTTGGATCCTCAGCAAGAGGCACAACATG; SEQ ID NO:313) und OLdcmBR
(TTTTCTCGAGAAACGGCAGCTCTGATACTTGCTTC; SEQ ID NO:314) amplifiziert.
Die Restriktionsstellen für
die Enzyme NotI (GCGGCCGC) BamHI (GGATCC) und XhoI (CTCGAG) wurden
in die Primer eingeführt,
um das Fragment A und das Fragment B zu verbinden, indem ein genetisches
Element gebildet wurde, das durch die Stellen NotI und XHoI begrenzt
wird. Die Region des Gens dcm wird so wieder hergestellt, indem
eine Deletion erzeugt wird, die sich von der Position +3 nach dem
ATG bis zur Position –14
vor dem TGA erstreckt. Dieses genetische Element wurde in pKO3 (Link
A. J., Philips D. und Church G. M. (1997), J. Bacteriol. 179, 6228-37),
der Vektor, der für
den Allel-Ersatz bei Escherichia coli für eine thermoempfindliche Replikation
entwickelt wurde, zwischen die Stellen NotI und SalI kloniert, um
das Plasmid zu ergeben, das pKO3Δdcm
genannt wird. Dieses Plasmid wurde in den Stamm GT97 mit einem Plasmid,
das das Protein RecA exprimiert (pFL352), co-transformiert. Eine
Transformante, die die zwei Plasmide enthält, wurde bei einer nichtzulässigen Temperatur
(42°C) in
Gegenwart von Chloramphenicol kultiviert, um Klone zu selektionieren,
die durch homologe Rekombination das pKO3Δdcm in das Bakterium-Chromosom
integriert haben. Ein Sub-Klon, der gegenüber Chloramphenicol bei 42°C resistent
war, wurde dann bei 30°C
in einem Medium kultiviert, das eine starke Konzentration an Saccharose
(5%) enthielt, um eine Gegen-Selektion der Stämme durchzuführen, die
nach einem zweiten homologen Rekombinations-Ereignis die Chromosomenregion
des Gens dcm gegen das homologe in das Plasmid klonierte Fragment
ausgetauscht hatten. Die in dem erhaltenen Klon eingeführte Deletion
(GT106) wurde durch PCR verifiziert, und zwar mit dem Primer-Paar
OldcmAF und OldcmBR, wobei ein Fragment mit einer Größe unter
der, die mit dem Elternstamm und durch eine PCR mit dem Primer OldcmBR
und einem Primer, positioniert außerhalb der ausgetauschten
Region, erhalten wurde (OldcmCF TTTTGCGGCCGCGTTGCGGTATTACCCTTGTC;
SEQ ID NO:315).
-
Der
Genotyp dcm– des
Stamms GT106 wurde bestätigt,
indem in diesen und in GT106 ein Plasmid eingeführt wurde, das eine Restriktionsstelle
des Enzyms SexAI enthält,
das Gegenstand der Methylierung dcm ist. Das ausgehend von GT106
gereinigte Plasmid wird durch SexAI gespalten, während es gegenüber dem
Enzym resistent ist, wenn es aus GT97 gereinigt wird.
-
Dieser
letzte Stamm, der GT106 genannt wird, weist dieselben Wachstum-Charakteristika
wie der Elternstamm GT97 auf und wie erwartet wurde keine negative
Modifikation der Menge der DNA der Plasmide R6K-gamma beobachtet,
lediglich die Qualität
der DNA, bestimmt durch die Abwesenheit der Methylierung der Cytosine
der dcm-Stellen, wurde verbessert. Der Stamm GT106 wird von der
Firma Invivogen ab dem Tag der Einreichung dieser Patentanmeldung
verfügbar
sein.
-
BEISPIEL 11: Produktion des Gens Neo für Resistenz
gegen Neomycin, das frei von CpG ist
-
Das
Gen Neo ΔCpG,
dessen Sequenz in 18 dargestellt ist (Position
3 bis 797 der DNA-Sequenz, die in 18 dargestellt
ist = SEQ ID NO:316; Proteinsequenz = SEQ ID NO:317), wurde ausgehend
von einer Anordnung überlappender
Oligonukleotide (Größe 20-40
pb), deren Sequenzen in 19 angegeben
sind, synthetisiert. Das Verfahren des Zusammenbaus erfolgte in
drei Stufen, die erste besteht in der Phosphorylierung der Oligonukleotide
des codierenden Strangs, in einer zweiten Stufe wird die Gesamtheit
der Oligonukleotide durch Hybridisierung und Ligation zu zwei Strängen kombiniert,
und in der letzten Stufe wird das Gen durch PCR amplifiziert.
-
Die
20 Oligonukleotide von SEQ ID NO:319 bis SEQ ID NO:338 (19), die dem codierenden Strang entsprechen, werden
nach dem folgenden Verfahren phosphoryliert: 1 μl jedes der Oligonukleotide,
mit 250 μM
in Wasser aufgenommen, wird in einem Mikroröhrchen, das 50 μl Wasser
enthält,
gemischt, um eine Endlösung
mit einer Konzentration von 100 Picomol pro Mikroliter zu erhalten.
Dann mischt man 5 μl
dieser Lösung mit
10 μl Puffer
für PolyNukleotid-Kinase,
10-fach konzentriert,
0,4 μl einer
50 mM ATP-Lösung,
85 μl Wasser und
1 μl Enzym
(mit 10 U/μl),
und das Ganze wird 4 Stunden bei 37°C, dann 5 Minuten bei 95°C inkubiert
(Lösung A).
-
Eine
Lösung
der Oligonukleotide des nicht-codierenden Strangs wird hergestellt,
indem 1 μl
jedes Oligonukleotids (SEQ ID NO:339 bis SEQ ID NO:360; 19) und 1 μl
Oligonukleotid mit SEQ ID NO:318 (19)
gemischt wurden und man 106 μl
Wasser zusetzt, um eine Endlösung
mit 54 Picomol pro μl
zu erhalten
(Lösung
B).
-
Der
Zusammenbau bzw. die Konstruktion des Gens wird durchgeführt, indem
zunächst
10 μl der
Lösung
A, 1 μl
der Lösung
B, 6 μl
einer 100 mM KCl-Lösung,
3 μl einer
0,5%igen Lösung
des oberflächenaktiven Mittels
NP-40, 4 μl
einer 50 mM MgCl2-Lösung,
3 μl einer
10 mM ATP-Lösung
und 7,5 μl
Ligase Pfu (30 Einheiten) vermischt wurden, das Gemisch dann in
einem programmierbaren Thermocycler 3 Minuten auf 95°C, dann 3
Minuten auf 80°C
erwärmt
wurde, bevor es 3 Zyklen auf 1 Minute bei 95°C, gefolgt von einer Passage von
95°C auf
70°C in
1 Minute, dann einer Passage von 70°C auf 50°C in 1 Stunde, und schließlich 2
Stunden bei 55°C
unterworfen wurde. Dann wurde das Gemisch der angeordneten Oligonukleotide
mit den Primern NO1 und NO22 amplifiziert. Das Amplifikationsprodukt
wird an einer Promega-Säule
gereinigt, durch die Restriktions-Enzyme BspHI und NheI verdaut, und in
das durch BspHI und NheI linearisierte Plasmid pMOD2LacZ(wt) kloniert.
Die Sequenzen der Plasmid-DNA von 2 Klonen, die gegenüber Kanamycin
resistent waren, die nach Transformation des E. coli-Stamms GT100 (verfügbar von
Invivogen) durch das Gemisch der Ligation zwischen dem Vektorfragment
und dem PCR-Fragment auftragen, wurden als entsprechend in
18 präsentierten
Sequenz bestimmt. Dieses synthetische Gen, das unter die Abhängigkeit
des Bakterien-Promotors EM7 (Vektor pMOD2Neo ΔCpG) gestellt wurde, verleiht
eine Resistenz gegenüber
Kanamycin, die identisch der ist, die durch denselben Vektor, der
das native Gen neo enthält,
bei dem Empfängerstamm E.
coli GT100 verliehen wird. Das Fragment neo-BspHI-NheI des Plasmids
pMOD2Neo ΔCpG
wurde dann in das Plasmid pSh ΔCpG
der
16, linearisiert durcch NcoI-NheI,
eingeführt,
um nach Ligation und Transformation in E. coli das Plasmid pNeoΔCpG zu ergeben. SEQUENZPROTOKOLL