DE60221801T2

DE60221801T2 - Cpg-freie synthetische gene und bakterielle plasmide

Info

Publication number: DE60221801T2
Application number: DE60221801T
Authority: DE
Inventors: Daniel Drocourt; Jean-Paul Reynes; Gerard Tiraby
Original assignee: Cayla
Current assignee: Cayla
Priority date: 2001-03-09
Filing date: 2002-03-11
Publication date: 2008-05-08
Anticipated expiration: 2022-03-12
Also published as: AU2002253226B2; FR2821855A1; FR2821855B1; US20040219677A1; EP1366176B1; CA2440195A1; WO2002072846A9; CA2440195C; ATE370238T1; EP1366176A2; DE60221801T3; JP2004524031A; JP4264703B2; US7244609B2; WO2002072846A2; WO2002072846A3; DE60221801D1; EP1366176B2

Description

GEBIET DER Erfindung
Die vorliegende Anmeldung bezieht sich auf synthetische Gene und auf Plasmide, die frei von CpG sind.
STAND DER TECHNIK
Die Plasmide sind genetische Elemente, die im Wesentlichen bei den Bakterien gefunden werden, die durch ein Desoxyribonukleinsäure-Molekül, das meist ringförmig ist, gebildet werden, dessen Replikation autonom und von der genomischen DNA unabhängig ist. Die natürlichen Plasmide, die aus einer sehr großen Vielzahl unterschiedlicher Bakterien isoliert wurden, sind fähig, mehrere Zellfunktionen auszuüben. Die erste, die für alle Plasmide lebensnotwendig ist, ist die, für ihre Replikation verantwortlich zu sein, die im Allgemeinen in Synchronie mit der Replikation der genomischen DNA und der Zellteilung durchgeführt wird. Außer der Region, die für die Replikation des Plasmids notwendig ist, tragen alle natürlichen Plasmide Gene, die für Proteine codieren, deren Funktion sehr häufig aufgrund des Fehlens einer spezifischen Untersuchung an diesen Genen unbekannt bleibt. Die Zahl der Gene, die auf einem Plasmid vorliegen, bestimmt die Größe dieses Plasmids, wobei die kleinsten natürlichen Plasmide nur zwei bis drei Gene umfassen. Die Eigenschaften der Plasmide haben sehr früh die Forscher angezogen, um daraus Vehikel für Transport und Expression von Genen in den Prokaryoten- wie Eukaryoten-Zellen zu machen. Die sehr raschen Fortschritte, die auf den Gebieten der Molekularbiologie der Nukleinsäuren und der Proteine in den letzen zwei Jahrzehnten beobachtet wurden, sind zum Teil der Nutzung von rekombinierten Plasmiden zuzuschreiben, die ausgehend von Fragmenten natürli cher DNA plasmidischer Herkunft oder anderer zellulärer DNA konstruiert wurden oder sogar chemisch synthetisiert wurden.
Die vier Basen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T), die die DesoxyriboNukleinsäure (DNA) bilden, verteilen sich auf 16 Dinukleotid-Konfigurationen, das heißt CG, GC, TA, AT, CC, GG, TT, AA, TG, CA, AG, CT, AC, GT, GA und TC. Die Analyse der qualitativen Verteilung der Dinukleotide der DNA von Tausenden von Plasmiden, deren Sequenzen bekannt sind, zeigt, dass die 16 Dinukleotide immer in allen natürlichen Plasmiden oder Laborkonstrukten vorhanden sind. Jedoch zeigt die Analyse der quantitativen Verteilung der Dinukleotide der Plasmide starke Gefälle, die nur zum Teil eine Funktion des Prozentgehalts jeder der vier Basen der DNA sind. In der Tat kann der Vergleich der beobachteten Häufigkeiten für jedes der Dinukleotide mit den Häufigkeiten, die auf der Basis einer zufallsbedingten Assoziation zwischen zwei Basen für ein gegebenes Plasmid berechnet wurden, bedeutende Abweichungen für mehrere Dinukleotide im Sinne einer Überrepräsentation oder im Gegenteil einer Unterrepräsentation beweisen (Campbell A., Mrazek J. und Karlin S. (1999), Proc. Natl. Acad. Sci., USA, 96, 9184-9). Die konstatierten Abweichungen in der Verteilung bestimmter Dinukleotide, aber immer derselben, bei natürlichen Plasmiden, die aus Bakterien-Arten, die phylogen voneinander entfernt sind, isoliert wurden, wurden durch Spezifitätsunterschiede in den Mechanismen der Reparatur, Rekombination und Replikation, die auf die zelluläre DNA wirken, erklärt.
Der Transfer von Genen in vitro in Zellen in Kultur und in vivo bei verschiedenen Tieren sind Praktiken, die sich in starker Entwicklung befinden, mit dem Ziel, einerseits die Zellfunktionen besser kennen zu lernen, und andererseits diese Techniken auf Zelltherapien und Gentherapien anzuwenden. Keiner der viralen Vektoren oder Plasmidvektoren in der Vielzahl von Vektoren, die für den Transfer von Genen bei Tieren verfügbar sind, hat einen entscheidenden Vorteil gegenüber den anderen, denn jeder weist Vorteile aber auch Nachteile auf. Es gibt jedoch eine Anwendung, bei der die Plasmid-DNA nackt oder komplexiert mit verschiedenen Substanzen, um den Transport der DNA zum Kern zu erleichtern, Gegenstand einer intensiven Forschungsarbeit gemacht wurde, das heißt, die der Impf-DNA. Das Prinzip der Impf-DNA bzw. Vakzin-DNA beruht auf den Immunantworten, die bei Labortieren festgestellt wurden, welche durch intramuskuläre Injektion, intradermale Injektion oder Inhalation mit der Plasmid-DNA, die für ein antigenes Peptid codiert, behandelt worden waren. Es ist nun gut etabliert, dass eine erste Folge der Einführung einer Plasmid-DNA aus dem Bakterium E. coli in den Organismus eines Versuchstiers auf intravenösem oder muskulärem Weg die schnelle Produktion verschiedener Cytokine durch Schutzzellen des Immunsystems ist (Krieg A. M. und Kline J. N. (2000), Immunopharmacology, 48, 303-305). Diese Antwort ist äußerst spezifisch für die Bakterien-DNA, denn der DNA-Extrakt von Tierzellen ruft keine derartige Induktion von Cytokinen unter denselben Bedingungen hervor. Die zellulären Mechanismen, die bei dieser Immunantwort impliziert sind, sind weit davon entfernt, vollständig bekannt zu sein. Wir wissen jedoch, dass die unterscheidende Erkennung zwischen der Bakterien-DNA und der DNA tierischen Ursprungs auf der Ebene von Strukturunterschieden erfolgt, die auf der Methylierung bestimmter Cytosine. des Moleküls basiert. In der Tat ist die DNA von Säugern natürlicherweise auf der Ebene des Cytosins aller Dinukleotide CG (in der Folge CpG genannt) mit der Ausnahme kurzer Zonen hoher Dichte an CpG, die als CpG-Inseln bezeichnet werden, die in funktionellen Regionen auf der Ebene bestimmter Promotoren vorliegen, methyliert. Die aus E. coli extrahierte DNA weist diesen Methylierungstyp nicht auf, und zwar infolge des Fehlens der enzymatischen Aktivität, die fähig ist, diese Modifikation durchzuführen, bei diesem Bakterium. Es ist dennoch möglich, die CpGs der Plasmid-DNA, die aus E. coli extrahiert wurde, im Reagensglas durch ein geeignetes Enzym zu methylieren. Unter diesen Bedingungen verliert die in vitro-methylierte DNA im Vergleich zu der nicht-methylierten Vergleichs-DNA einen großen Teil ihrer immunstimulierenden Aktivität. Der E. coli-Stamm K12, von dem quasi die Gesamtheit der Mutanten-Stämme abstammt, welche für die Produktion von Plasmid-DNA verwendet werden, enthält eine enzymatische Aktivität (DNA-Methylase dem (Palmer B. R. und Marinus M. G. (1994), Gene, 143, 1-12)), die zur Methylierung von Cytosin führt, das sich im Nukleinsäure-Kontext CC(A/T)GG befindet. Alle Plasmidvektoren zum Gentransfer umfassen diese Sequenz in variabler Zahl und aufgrund dieser Tatsache enthält ihr DNA-Molekül methylierte Cytosine, die sich nicht in der Säuger-DNA befinden. Diese Form der Methylierung, die für E. coli spezifisch ist, führt so eine andere Differenz auf der Ebene der Methylierungen der Cytosine zwischen der Bakterien-DNA und der der Säuger ein, die zu der immunstimulierenden Kraft der Plasmid-DNA beitragen könnte.
Die Häufigkeit der CpG der DNA von Primaten und Nagern liegt im Allgemeinen sehr unter der, die auf der Basis der Häufigkeit der Cytosine und Guanine erwartet wird. Der Mangel an CpG ist für ein gegebenes DNA-Fragment von der biologischen Rolle dieses Fragments abhängig, wobei die Intergen-Regionen nur ein Fünftel der erwarteten Häufigkeit umfassen, während die Exons ein weniger ausgeprägtes Defizit haben, und als anderes Extrem einige Promotoren eine CpG-Insel mit großer Größe umfassen, die einen Prozentgehalt an CpG aufweist, der nahe dem erwarteten ist. Die Analyse der Daten der Sequenzierung der cDNA und der humanen Chromosomen zeigt dennoch große Heterogenitäten in der Häufigkeit von CpG für Promotorregionen und cDNA. Diese Beobachtung wird durch die cDNA des humanen Gens, das für Interleukin-2 codiert, veranschaulicht, welches nur ein einziges CpG besitzt. Ebenso enthält ein Teil des Promotors dieses Gens, der die TATA-Box umfasst, kein CpG, dagegen umfasst der Teil stromaufwärts, der reich an Erkennungsstellen für Transkriptionsfaktoren ist, CpG. Die Regionen in 3' der Gene, die durch die 3'-UTR (nicht-translatierte Regionen) und die Polyadenylierungssequenzen und das Transkriptionsende gebildet werden, sind eher arm am CpG. Es ist nicht ungewöhnlich, beim Menschen Regionen unmittelbar stromabwärts der Gene zu finden, die an CpG verarmt sind. Jedoch haben die Resultate der humanen Sequenzierung, die am Ende des Jahres 2000 verfügbar waren, keine einzige Transkriptionseinheit beweisen können, die durch Promotorregionen der Transkription, ein Gen mit oder ohne Intron und die Polyadeylierungsregion gebildet wird, die völlig frei von CpG ist. Die Situation der CpG bei E. coli ist eine völlig andere als die der Tierzellen, denn die Häufigkeit der CpG in der genomischen DNA dieses Bakteriums ist im leichten Überschuss bezüglich der errechneten Häufigkeit. Das gleiche gilt für die CpGs der natürlichen Plasmide, die aus E. coli-Wirtsstämmen isoliert wurden. Rekombinierte bzw. rekombinante Plasmide, die aus genetischen Manipulationen resultieren, die für den Gentransfer eingesetzt werden, weisen Variationen in ihrer CpG-Zahl auf, die von der Herkunft der in den Vektor insertierten Fragmenten abhängen. Eine Analyse der Sequenzen von mehreren zehn rekombinanten Plasmiden (plasmides recombinés) von E. coli, die in zufälliger Art aus der GenBank genommen wurden, zeigt, dass die Plasmide, die am ärmsten an CpG sind, höchstens ein Defizit von 50% der Zahl ihrer CpG haben. Versuche zur Reduktion des Gehalts an CpG wurden für das Gen lac durchgeführt, führten aber nicht zur Synthese von funktionellen Genen, die vollständig frei von CpG sind (Henry et al., 1999, C. R. ACAD. SCI., Paris, Bd. 322, Seiten 1061-1070; Skopek et al., 1996, Mutation Research, Bd. 349, Seiten 163-172).
Die vorliegende Erfindung liefert diesbezüglich Produkte und Verfahren, um Plasmid-DNA bei E. coli zu synthetisieren, die vollständig frei von CpG ist und bei denen die Cytosine, die sich in dem Kontext CC(A/T)GG befinden, nicht methyliert sind. Nach Kenntnis der Anmelderin handelt es sich dabei um die erste Beschreibung solcher Produkte, die eine derartige Struktur haben, die ihre Funktion ganz konserviert hat.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
Die vorliegende Erfindung stellt Mittel bereit, die es ermöglichen, Plasmide zu produzieren, die bei einem Prokaryoten-Organismus, wie Escherichia coli, funktionell sind und die dennoch vollständig frei von CpG sind. Sie liefert insbesondere Mittel, die es ermöglichen, Plasmide zu produzieren, die vollständig frei von CpG sind und die außerdem frei von einer Methylierung auf der Ebene des Cytosins im Nukletid-Kontext CC(A/T)GG sind.
Die vorliegende Erfindung bezieht sich somit auf Verfahren zur Herstellung von solchen Plasmiden sowie auf konstitutive Elemente dieser Plasmide, das heißt, auf Gene, die frei von CpG sind, die in E. coli exprimiert werden können, Promotoren, die frei von CpG sind, die an die Expression der genannten Gene angepasst sind, und Replikationsursprünge, die frei von CpG sind, die an die bakterielle Transformation der genannten Plasmide angepasst sind. Die vorliegende Anmeldung richtet sich auch auf die biotechnologischen und medizinischen Anwendungen dieser Produkte. Jedes dieser Produkte weist das besonders Charakteristikum auf, vollständig frei von CpG zu sein, jedoch seine Funktionalität bei einem Prokaryoten wie E. coli vollständig konserviert zu haben.
Die vorliegende Erfindung stellt auch einen E. coli-Stamm bereit, der speziell an die Produktion der Plasmide gemäß der Erfindung angepasst ist, wobei dieser Stamm das besondere Merkmal aufweist, die stabile Replikation dieser Plasmide und des Materials, das sie tragen, zu ermöglichen, ohne ihre Funktion zu verändern oder die Methylierung auf der Ebene der Stellen CC(A/T)GG zu induzieren (Stamm, der ein inaktiviertes Gen dem umfasst).
Eines der gemeinsamen Konzepte, das die verschiedenen Aspekte der vorliegenden Erfindung verbindet, ist demnach es zu ermöglichen, Plasmide zu produzieren, die vollständig frei von CpG sind und die dennoch ihre funktionellen Eigenschaften bei einem Prokaryoten wie E. coli ganz konserviert haben. Nach Kenntnis der Anmelderin handelt es sich um die erste Beschreibung solcher Mittel.
Die vorliegende Erfindung bezieht sich somit auf ein Verfahren zur Herstellung eines Plasmids, das Vektor wenigstens eines Gens ist, und das vollständig frei von CpG ist, dadurch gekennzeichnet, dass man ein Plasmid konstruiert, indem man durch enzymatische Ligation der DNA-Fragmente, die alle frei von CpG sind, die einem Replikationsursprung und den Elementen, die eine Transkriptionseinheit für das wenigstens eine Gen bilden, entsprechen, zusammenfügt, und dass man die ses Plasmid in einen Stamm von Escherichia coli, der das Protein pi exprimiert, für die Replikation des Plasmids transferiert.
Die Plasmide, die aus Bakterien-Wildstämmen isoliert wurden, erfüllen im Allgemeinen drei Funktionen im Zusammenhang mit der Replikation, nämlich Initiation der Replikation der DNA, Kontrolle der Replikation und stabile Aufrechterhaltung des Plasmids im Verlauf der sukzessiven Teilungen. Die Plasmide, die im Labor konstruiert wurden, weisen nicht immer die Gesamtheit dieser Funktionen auf. Die Kopienzahl der Plasmide ist zum Beispiel oft gegenüber dem Stammplasmid erhöht, was darauf schließen lässt, dass die Elemente der Kontrolle der Replikation modifiziert wurden. Das Plasmid R6K umfasst drei Replikationsursprünge alpha, gamma und beta, die auf einem gleichen DNA-Fragment gebunden sind (Filutowicz M. und Takowski S. A., (1998), Gene, 223, 195-204). Jeder der Ursprünge wird durch das für R6K spezifische Initiationsprotein pi aktiviert, das durch das Gen R6K pir codiert wird. Die drei Ursprünge benötigen, um funktionell zu sein, eine Sequenz mit 277 bp, die dem Fachmann unter dem Namen core (Herz bzw. Kern) bekannt ist, die sich im Zentrum des Fragments befindet, das die drei Ursprünge trägt, und auch ein einziges supplementäres Fragment, das in cis positioniert ist, das heißt, das auf demselben DNA-Molekül vorliegt. Wenn die Sequenzen der Ursprünge alpha und beta deletiert werden, erlaubt der restliche Ursprung gamma die autonome Duplikation des Plasmids unter der Bedingung, dass das Gen pir in cis auf dem Plasmid oder in trans auf dem Chromosom des Bakteriums vorliegt. Die Erfinder haben die Wahl getroffen, sich insbesondere für den kleinsten der drei Ursprünge zu interessieren, das heißt, für den Ursprung gamma, der den Vorteil aufweist, alle Elemente zu enthalten, die für eine kontrollierte Replikation des Plasmids notwendig sind, das heißt, den Core und eine angrenzende aktivierende Sequenz. Der Core bzw. Kern wird durch eine Fixierungssequenz des Proteins pi, die 7-mal wiederholt wird, und eine an AT-reichen Sequenz gebildet. Die aktivierende Region umfasst Fixierungsstellen von mehreren Zellproteinen des Bakteriums, die für eine stabile Aufrechterhaltung des Plasmids erforderlich sind. Die Kopienzahl der Plasmide, die den einzelnen Ursprung gamma umfassen, hängt vom Protein pi ab, wobei mutante Formen von pi, die zu einer starken Erhöhung der Kopienzahl des Plasmids führen, isoliert und charakterisiert wurden. Wie in den Beispielen unten detaillierter beschrieben wird, gelang es den Erfindern, ausgehend vom Replikationsursprung des Plasmids R6K-gamma Replikationsursprünge zu konstruieren, die kein CpG mehr aufweisen, wobei ihre Funktionalität vollständig intakt konserviert wurde. Es kann betont werden, dass die besondere Wahl von R6K-gamma als Ausgangsmaterial, nämlich die Wahl eines Replikons kleiner Größe, das nur eine reduzierte Anzahl von CpG aufweist, eine besonders zweckdienliche Wahl ist, denn wenn man von anderen Plasmiden wie denen der Reihe pUC ausgeht, gelingt es nicht, Plasmide ohne CpG zu erhalten, die funktionell bleiben: Alle Versuche, die von den Erfindern durchgeführt wurden, um auf chemischem Wege die Minimalsequenz pUC wieder herzustellen, indem die Cytosine der CpG durch ein Guanin oder Adenin ersetzt wurden, führten zu DNA-Fragmenten, die jede funktionelle Replikationsaktivität verloren hatten. Die Plasmide, die einen erfindungsgemäßen Replikationsursprung ohne CpG umfassen, haben ihrerseits ihre Fähigkeit, in stabiler Art im Innern einer Prokaryotenzelle, wie E. coli und E. coli K12 im Besonderen, zu replizieren, konserviert in dem Maße, wie man ihnen das Protein pi geliefert hat, das zur Aktivierung der Replikation notwendig ist (wildes pir oder mutiertes pir wie pir116 als cis oder als trans). Ein Replikationsursprung für ein Plasmid gemäß der Erfindung ist dadurch gekennzeichnet, dass seine Sequenz derjenigen des Replikationsursprungs R6K-gamma entspricht, wobei jedes G der CpG der wiederholten Region des Cores durch ein A, ein C oder ein T ersetzt wurde, oder jedes C der CpG durch ein G, ein A oder ein T ersetzt wurde. Auf diese Weise hat man verschiedene Replikationsursprünge ohne CpG erhalten, die in überraschender Weise immer noch fähig waren, die Funktionen des Replikationsursprungs der Plasmide bei E. coli sicherzustellen, und die darüber hinaus fähig waren, diese Funktionen für Gene und Transkriptionseinheiten sicherzustellen, die selbst frei von CpG sind. Die unten angegebenen Beispiele liefern dafür einige Illustrationen (zum Beispiel die Ursprünge R6K-gamma-M2A, R6K-gamma-M2C, R6K-gamma-M2T in den Beispielen 7-10). Die vorliegende Erfindung bezieht sich insbesondere auf jeden Replikationsursprung, dessen Se quenz die Sequenz SEQ ID NO:12 oder die Sequenz SEQ ID NO:13 (12 und 14) umfasst. Es wurde auch bewiesen, dass die Fixierungssequenz des Proteins pi nicht 7-mal wiederholt sein kann, wie dies bei dem Standard-Ursprung R6K-gamma mit CpG beobachtet wird, sondern dass man die Zahl auf 5 oder 6 begrenzen kann, ohne jedoch die Funktionen des Replikationsursprungs zu verändern. Die vorliegende Anmeldung betrifft somit jeden Replikationsursprung gemäß der Erfindung, wie er oben definiert wurde, der nur 5 oder 6 Wiederholungen der Fixierungssequenz des Proteins pi umfasst.
Dank dieser funktionellen Replikations-Ursprünge ohne CpG konnten die Erfinder verschiedene Plasmide konstruieren, die in bemerkenswerter Art ihre Funktionen als Transfektionsvektoren konserviert haben.
Die Erzeugung von Plasmiden von E. coli, die frei von CpG sind, erfordert obligatorisch, funktionelle Gene (exprimierbar bei einem Prokaryoten wie E. coli) bereitzustellen, die kein CpG enthalten. So lässt die Selektion der Bakterien, die durch eine rekombinante Plasmid-DNA transformiert wurden, ein Gen einführen, dessen Protein dem Bakterium einen dominanten Vorteil verleiht. Am häufigsten wird der selektive Marker durch ein Gen für Resistenz gegenüber einem auf das Bakterium E. coli aktiven Antibiotikum eingeführt. Die Analyse der Sequenzen der Resistenz-Gene in ihrer großen Vielfalt, die bei E. coli verwendet werden, zeigt, dass alle ohne Ausnahme CpG enthalten, oft sogar in sehr hoher Zahl für die Resistenz-Gene, die ihre Herkunft bei den Streptomyces-Produzenten des Selektions-Antibiotikums finden. Ebenso ist es notwendig, Reporter-Gene bereitzustellen, die ohne CpG sind, jedoch funktionell bleiben.
So zeigt eine Analyse von mehreren Hundert Chromosomen- und Plasmid-Genen des Bakteriums E. coli, deren gut charakterisierte Sequenzen in vielen Datenbanken verfügbar sind, dass alle Gene ohne Ausnahme, die eine Größe von über 250 bp haben, durch diese 16 Dinukleotide gebildet werden.
Die vorliegende Erfindung beweist, dass es trotz allem möglich ist, Gene zu konstruieren, die bei E. coli funktionell sind, die frei von CpG sind. Die Erfinder haben ein Verfahren zum Erhalt von Genen, die frei von CpG sind, jedoch bei E. coli exprimierbar sind, entwickelt. Dieses Verfahren basiert auf der Synthese einer PolyNukleotidkette, in dem der Kettenbildung von Aminosäuren eines Protein, das bei E. coli exprimiert werden kann, gefolgt wird, indem jeder Aminosäure ein Nukleotidcodon zugeordnet wird, ausgewählt aus denen des genetischen Codes, und indem der Degeneriertheit dieses Codes, der dieser Aminosäure entspricht, Rechnung getragen wird, in dem aber von dieser Wahl ausgeschlossen werden:

i. alle Codons, die ein CpG in ihrer Sequenz enthalten: betroffen sind die Codons ACG (Thr), CCG (pro), GCG (Ala), TCG (Ser), CGA (Arg), CGC (Arg), CGG (Arg) und CGT (Arg), und
ii. die Codons, die durch ein C enden, wenn das Codon, das direkt folgt, mit einem G beginnt. Beispiele für ein so erhaltenes Gen umfassen das Gen NeoΔCpG (SEQ ID NO:316; siehe Beispiel 11).

Nach einer Ausführungsvariante der Erfindung wird man so die genannte Wahl der Codons eliminieren, deren Häufigkeiten in den Proteinen humaner Herkunft schwach sind: betroffen sind die Codons ATA (Ile), CTA (Leu), GTA (Val) und TTA (Leu). Die Gesamtheit der möglichen Codons entspricht somit nach dieser Variante der folgenden Gruppe: GCA (Ala), GCC (Ala), GCT (Ala), AGA (Arg), AGG (Arg), AAC (Asn), AAT (Asn), GAC (Asp), GAT (Asp), TGC (Cys), TGT (Cys), CAA (Gln), CAG (Gln), GAA (Glu), GAG (Glu), GGA (Gly), GGC (Gly), GGG (Gly), GGT (Gly), CAC (His), CAT (His), ATC (Ile), ATT (Ile), CTC (Leu), CTG (Leu), CTT (Leu), TTG (Leu), AAA (Lys), MG (Lys), TTC (Phe), TTT (Phe), CCA (Pro), CCC (Pro), CCT (Pro), TCA (Ser), TCC (Ser), TCT (Ser), AGC (Ser), AGT (Ser), ACA (Thr), ACC (Thr), ACT (Thr), TAC (Tyr), TAT (Tyr), GTC (Val), GTG (Val), GTT (Val), auf die selbstverständlich die Regel ii. oben angewendet werden muss. Beispiele für ein Gen, das gemäß dieser Ausführungsvariante erhalten wurde, umfassen insbesondere das Gen LacZ ΔCpG (Positionen 3 bis 3056 von SEQ ID NO:9; siehe Beispiel 5).
In bevorzugter Weise wird die genannte Codon-Wahl auch so erfolgen, dass Strukturen, die für die Messenger-RNA nicht günstig sind, wie das Vorliegen von Spleißsequenzen, direkten oder umgekehrten Repetiersequenzen, Haarnadelstrukturen oder Polyadenylierungssignale, vermieden werden. Die Anzahl und die Varietät der Größe der durch dieses Verfahren synthetisierten Gene wird in den Beispielen unten veranschaulicht, die zeigen, dass es so möglich ist, die Synthese von Genen zu konzipieren, die vollständig frei von CpG sind, die daher bei E. coli funktionell bleiben. Als Referenzprotein kann man jedes Protein, das durch E. coli exprimiert werden kann, zum Beispiel ein Protein, das durch ein Gen für Resistenz gegen ein Antibiotikum codiert wird, wie zum Beispiel durch die Gene für Resistenz gegenüber Zeocin⁽ ^R ⁾ (Phleomycin), gegen Hydromycin, gegen Blasticidin, gegen Puromycin, oder ein Protein, das durch ein Reporter-Gen, wie zum Beispiel lacZ codiert wird, nennen.
Die vorliegende Erfindung betrifft ein derartiges Verfahren zur Herstellung von Genen, die frei von CpG sind, die in E. coli exprimierbar sind, sowie jedes Gens mit wenigstens 250 bp, das durch dieses Verfahren erhalten werden kann. Die vorliegende Erfindung bezieht sich insbesondere auf:

– jedes Gen, dessen Sequenz die Sequenz SEQ ID NO:1 von der Position 3 bis zur Position 374 (1), die Sequenz SEQ ID NO:3 von der Position 3 bis zur Position 1025 (3), die Sequenz SEQ ID NO:5 von der Position 3 bis zur Position 422 (5), die Sequenz SEQ ID NO:7 von der Position 3 bis zur Position 599 (7) umfasst, sowie auf jede Verwendung dieser Gene als Selektionsmarker, und
– jedes Gen, dessen Sequenz die Sequenz SEQ ID NO:9 von der Position 3 bis zur Position 3056 (siehe 9) umfasst, und jedes Gen, dessen Sequenz die Sequenz SEQ ID NO:316 (Positionen 3 bis 797 der in 18 dargestellten DNA-Sequenz (codierend für SEQ ID NO:317)) umfasst, sowie auf jede Verwendung eines derartigen Gens als Reporter-Gen.

Die Expression eines Plasmid-Gens benötigt auch eine Bereitstellung bzw. Anordnung von Promotoren, die an die Zelle angepasst sind, die das Plasmid beherbergt. Die vollständige Kenntnis des E. coli-Genoms seit einigen Jahren hat die Untersuchung verschiedener nicht-codierender Elemente, die bestimmte Funktionen aufweisen, erleichtert. Die Resultate von Arbeiten, die auf der Natur der Promotoren von E. coli basieren, werden derzeit auf der PromEC-Seite offenbart und öffentlich gemacht, welche im Internet zugänglich ist (http://bioinfo.md.huji.ac.il/marg/promec). Eine Analyse von 471 gut definierten Promotoren von der Base –75 bis +25 bezüglich des Punkts +1 der Initiation der Transkription zeigt, dass nur 6 von ihnen kein CpG besitzen. Die Addition jedes der 6 Promotoren, die chemisch synthetisiert wurden und stromaufwärts des Gens lacZ, das für die β-Galactosidase von E. coli codiert, platziert wurden, erwies sich als negativ für das Aufzeigen der Aktivität dieses Reporter-Gens. Das Fehlen einer starken Homologie mit den Consensus-Sequenzen der "boites canoniques" –10 und –35 legt nahe, dass die Kraft dieser Promotoren schwach ist und alternativ, dass diese durch Induktionsbedingungen reguliert werden könnten, die für jeden von ihnen zu definieren ist. Eine Analyse der gut charakterisierten Promotoren von E. coli hat gezeigt, dass nur eine Anzahl von zehn kein CpG auf dem Niveau der spezifischen Boxen der Erkennung durch RNA-Polymerase umfasst. Eine Literaturrecherche hat darüber hinaus gezeigt, dass diese Promotoren alle eine durch diverse Stimuli induzierbare Natur hatten, eine Situation, die für ein konstitutives Merkmal der Expression manchmal gewollt ist, meist aber verzichtbar ist. Den Erfindern ist es ihrerseits gelungen, durch zufällige Anordnung von PCR-Fragmenten, die kurze Consensus-Sequenzen, die frei von CpG sind, die von mehreren starken Promotoren abgeleitet sind, neue Promotoren zu entwickeln, die an die Expression von Genen ohne CpG in E. coli angepasst sind, und die den besonderen Vorteil aufweisen, sehr starke konstitutive Promotoren zu sein und vollständig frei von CpG zu sein. Beispiel 6 unten stellt die Konstruktion des neuen Promotors EM2K durch diese Technik dar. Die vorliegende Erfindung bezieht sich insbesondere auf jeden Promotor, dessen Sequenz die Sequenz SEQ ID NO:11 umfasst (siehe 11).
Die charakterisierten Transkriptions-Terminatoren bei E. coli werden durch kurze Sequenzen gebildet, von denen viele kein CpG besitzen, und die Erfinder konnten verifizieren, dass solche Terminatoren ihre Funktion wirksam gewährleisten, wenn sie in E. coli mit einem Promotor und einem Gen ohne CpG gemäß der Erfindung assoziiert werden.
Die vorliegende Anmeldung betrifft demnach jede Transkriptionseinheit, die wenigstens ein Gen ohne CpG gemäß der Erfindung und wenigstens einen Promotor ohne CpG gemäß der Erfindung umfasst. Eine solche Transkriptionseinheit kann außerdem wenigstens einen Terminator ohne CpG umfassen. Die Erfindung stellt somit zum ersten Mal ein Nukleotidkonstrukt bereit, das vollständig frei von CpG ist und das dennoch in E. coli exprimiert werden kann, und zwar unter Gewährleistung seiner normalen Funktionen.
Die vorliegende Anmeldung betrifft somit jedes Plasmid, das einen Replikationsursprung gemäß der Erfindung umfasst. Solche Plasmide können außerdem ein Gen ohne CpG gemäß der Erfindung und/oder einen Promotor ohne CpG gemäß der Erfindung und/oder einen Transkriptions-Terminator ohne CpG oder eine Transkriptionseinheit gemäß der Erfindung umfassen. Die Plasmide gemäß der Erfindung weisen somit den Vorteil auf, kein CpG in ihrer Struktur aufzuweisen, während sie dennoch immer fähig sind, die Funktionen von Expressionsvektoren zu gewährleisten. Beispiele für solche Plasmide werden in den Beispielen unten angegeben. Die vorliegende Anmeldung bezieht sich insbesondere auf jedes Plasmid von SEQ ID NO:14 (15).
Im Rahmen der vorliegenden Anmeldung liegt auch jede Zelle, die mit wenigstens einem Element transformiert ist, ausgewählt aus der Gruppe, bestehend aus Genen ohne CpG gemäß der Erfindung, Promotoren ohne CpG gemäß der Erfindung, Replikationsursprüngen ohne CpG gemäß der Erfindung, Plasmiden ohne CpG gemäß der Erfindung. Eine solche Zelle gemäß der Erfindung kann außerdem ein Gen umfassen, das für ein Protein pi, wie zum Beispiel Wild-pir oder mutiertes pir116, codiert, umfassen. Vorteilhafterweise ist eine transformierte Zelle gemäß der Erfindung eine Zelle von E. coli.
Um ein Plasmid gemäß der Erfindung in einer ausreichenden Zahl von funktionellen Kopien zu replizieren, hat der Fachmann zahlreiche Bakterien zur Verfügung, zum Beispiel wie E. coli K12, die klassischerweise zu Zwecken der Plasmidreplikation verwendet werden. Nun besitzt der ursprüngliche Stamm K12 von E. coli eine Methylase der DNA, die eine Methylgruppierung an alle Cytosine einführt, die sich in Kontext CC(A/T)GG der genomischen und plasmidischen DNA des Bakteriums befinden. Die Gesamtheit der verschiedenen Stämme der Linie K12 besitzt diese Aktivität aufgrund einer Methylase, die durch das Gen dcm codiert wird (Palmer B. R. und Marinus M. G., (1994), Gene, 143, 1-12). In dem Maße wie die Methylierung der Plasmid-DNA, die aus dcm⁺-Stämmen von E. coli hergestellt wurde, eine Modifikation des DNA-Moleküls mit sich zieht, die für den Transfer von Genen in Eukaryotenzellen nicht gewünscht ist, haben die Erfinder einen Stamm entwickelt, der gleichzeitig die Funktion der Plasmide mit dem Ursprung R6K-gamma ohne CpG gemäß der Erfindung und den Erhalt von Plasmid-DNA, die frei von Methylierung an den dcm-Stellen ist, erlaubt. Dazu wurde von den Erfindern ein neues Gen konstruiert, in dem das Gen dcm von der Position +3 nach dem ATG bis zur Position –14 vor dem TGA in Gen dcm eines Stamms pir116 deletiert wurde (siehe Beispiel 10 unten).
Das Gen dcm befindet sich in einer Chromosomenregion, deren Sequenz von der GenBank unter der Zugangsnummer D90835 (cloneKohara #344:43,5-43,9 min) erhalten werden kann.
Eine Deletion in dem Gen (-) bringt den zusätzlichen Vorteil, dass jede Reversion des Gens zur Wildform vermieden wird. Auf diese Weise wurden mutante Stämme dcm^– von den Erfindern produziert; sie weisen keinen negativen Phenotyp auf, der das Wachstum der Bakterien verändern könnte oder die Qualität und Quantität der Plasmid-DNA modifizieren könnte. Es wurde insbesondere ein optimierter Stamm von E. coli durch gezielte Inaktivierung des Gens dcm aus dem Elternstamm konstruiert, der ein Protein pi exprimiert, das an einer Stelle mutiert ist, was zur Erhöhung der Kopienzahl der Plasmide ohne CpG führt. Dieser optimierte Stamm erlaubt eine Produktion der Plasmid-DNA, die Gegenstand dieser Erfindung ist, die frei von CpG ist, mit hoher Qualität und Abundanz, und die frei von einer Methylierung an den Cytosinen der dcm-Stellen ist. Die vorliegende Anmeldung betrifft somit jede Zelle, die ein Gen umfasst, das für das Protein pi codiert, das durch das deletierte Gen dcm gemäß der Erfindung transformiert ist, und jedes Verfahren zur Replikation von Plasmiden, das die Transformation einer solchen Zelle durch ein Plasmid und die Kultur der transformierten Zelle unter Bedingungen, die an die Replikation dieses Plasmids angepasst sind, umfasst.
Die vorliegende Anmeldung betrifft somit ein Verfahren für die Herstellung eines Plasmids, das vollständig frei von CpG ist und ohne Methylierung auf der Ebene des Cytosins im Nukleinsäure-Kontext CC(A/T)GG ist, dadurch gekennzeichnet, dass man ein Plasmid gemäß der Erfindung durch Replikation in einem Escherichia coli-Stamm produziert, der das Protein pi produziert, der bezüglich des Methylierungssystems dcm defizient ist.
Im Rahmen der vorliegenden Anmeldung liegt auch jeder Kit zur Herstellung von Plasmiden, der wenigstens eine Zelle gemäß der Erfindung umfasst. Diese Kits sind insbesondere an die Replikation von Plasmiden gemäß der Erfindung angepasst, um zu vermeiden, dass diese Plasmide, deren Struktur frei von CpG ist, anderswo während ihrer Replikation als CC(A/T)GG methyliert werden.
Die Erfindung stellt somit einen vollständigen Komplex von Transformationsmitteln bereit, die frei von CpG sind: Gene ohne CpG, Promotoren ohne CpG, Transkriptionseinheiten ohne CpG, Replikationsursprünge für Plasmid ohne CpG, Plasmide ohne CpG, Zellen, die spezielle an die Replikation von Plasmiden ohne Methylierung von Cytosinen angepasst sind. Diese neuen Mittel finden direkte Anwendungen für die genetische Transformation von Zellen für biotechnologische oder me dizinische Zwecke. Solche Produkte sind in der Tat außergewöhnlich gut an die Herstellung von Impfzusammensetzungen mit DNA, die für den Menschen oder das Tier bestimmt sind, angepasst.
Die Erfindung wird durch die folgenden Beispiele erläutert, in denen auf die Figuren Bezug genommen wird:
1: Sequenz des Gens Sh bleΔCpG (ohne CpG),
2: Liste der Oligonukleotide, die für die Konstruktion bzw. die Anordnung des Gens Sh bleΔCpG verwendet werden,
3: Sequenz des Gens HphΔCpG,
4: Liste der Oligonukleotide, die für die Konstruktion des Gens HphΔCpG verwendet wurden,
5: Sequenz des Gens BsrΔCpG,
6: Liste der Oligonukleotide, die für die Konstruktion des Gens BsrΔCpG verwendet wurden,
7: Sequenz des Gens PacΔCpG,
8: Liste der Oligonukleotide, die für die Konstruktion des Gens PacΔCpG verwendet wurden,
9: Sequenz des Gens LacZΔCpG,
10A: Liste der Oligonukleotide, die für die Konstruktion des ersten Drittels des Gens LacZΔCpG verwendet wurden,
10B: Liste der Oligonukleotide, die für die Konstruktion des zweiten Drittels des Gens LacZΔCpG verwendet wurden,
10C: Liste der Oligonukleotide, die für die Konstruktion des dritten Drittels des Gens LacZΔCpG verwendet wurden,
11: Sequenz des Promotors EM7(1-), der degenerierten Oligonukleotide (2-), die zur Konstruktion des Promotors EM2K, der frei von CpG ist (3-), verwendet wurden,
12: Sequenz des Replikationsursprungs R6K-gamma M2A,
13: Liste der Oligonukleotide, die für die Konstruktion des Replikationsursprungs R6K-gamma M2A verwendet wurden,
14: Sequenz des Ursprungs R6K-gamma des Plasmids pGTR6Kneoc9, begrenzt durch die Stellen PacI,
15: Sequenz des Plasmids pSh-LacZΔCpG,
16: Karte des Plasmids pShΔCpG,
17: Karte des Plasmids pSh-LacZΔCpG,
18: Sequenz des Gens NeoΔCpG (ohne CpG) [Position 3 bis 797 der DNA-Sequenz = SEQ ID NO:316; Proteinsequenz = SEQ ID NO:317],
19: Sequenz der Oligonukleotide SEQ ID NO:318 bis SEQ ID NO:X, die für die Konstruktion des Gens NeoΔCpG verwendet wurden.
BEISPIEL 1: Konstruktion des Gens Sh ble der Resistenz gegen Zeocin, das frei von CpG ist
Das Gen Sh bleΔCpG, dessen Sequenz in 1 angegeben ist (Position 3 bis 377 von SEQ ID NO:1), wurde aus einer Anordnung von überlappenden Oligonukleotiden (Größe 20-40 bp), deren Sequenzen in 2 angegeben sind, synthetisiert. Das Verfahren der Konstruktion bzw. des Zusammenbaus bzw. der Anordnung erfolgt in drei Stufen, wobei die erste in der Phosphorylierung der Oligonukleotide des codierenden Strangs besteht, in der zweiten Stufe wird die Gesamtheit der Oligonukleotide der zwei Stränge durch Hybridisierung und Ligation assoziiert, und in der dritten Stufe wird das Gen durch PCR amplifiziert. Dieses Verfahren wurde mit Erfolg für die Synthese aller synthetischen Gene verwendet, die in den Beispielen 1, 2, 3, 4, 5 genannt sind. Das Verfahren wird für das Gen Sh bleΔCpG detailliert beschrieben:
Die 10 Oligonukleotide von OL26199 bis OL27099 (2), die dem codierenden Strang entsprechen, werden nach dem folgenden Verfahren phosphoryliert: 1 μl jedes der Oligonukleotide, die mit 250 μM in Wasser aufgenommen wurden, wird in einem Mikroröhrchen, das 15 μl Wasser enthält, gemischt, um eine Endlösung mit einer Konzentration von 100 Picomol pro Mikroliter zu erhalten. Man mischt dann 5 μl dieser Lösung mit 10 μl Puffer der Polynukleotid-Kinase, 10-fach konzentriert, 0,4 μl einer 50 mM ATP-Lösung, 85 μl Wasser und 1 μl des Enzyms (mit 10 E/μl), und das Ganze wird 4 Stunden bei 37°C (Lösung A) inkubiert.
Eine Lösung der Oligonukleotide des nicht-codierenden Strangs wird gebildet, indem 1 μl jedes Oligonukleotids (OL27199 bis OL28199; siehe 2) und 1 μl des Oligonukleotids OL26099 (2) gemischt werden, wozu man 43 μl Wasser gibt, um eine Endlösung mit 54 Picomol pro μl (Lösung B) zu erhalten.
Der Zusammenbau bzw. die Konstruktion des Gens wird durchgeführt, indem zunächst 10 μl der Lösung A, 1 μl der Lösung B, 6 μl einer KCl-Lösung mit 100 mM, 3 μl einer NP-40-Lösung mit 0,5%, 4 μl einer Lösung von MgCl2 mit 50 mM, 3 μl einer 10 mM ATP-Lösung und 7,5 μl Ligase Pfu (30 Einheiten) gemischt werden, dann wird das Gemisch in einem programmierbaren Thermocycler erwärmt, und zwar 3 Minuten auf 95°C, dann 3 Minuten auf 80°C, bevor es 3 Zyklen von einer Minute auf 95°C unterworfen wird, gefolgt von einer Passage von 95°C auf 70°C in 1 Minute, dann einer Passage von 70°C auf 55°C in 1 Stunde und schließlich 2 Stunden auf 55°C. Dann wird das Gemisch der zusammengefügten Oligonukleotide mit den Primern OL26099 und OL27199 amplifiziert. Das Amplifikationsprodukt wird an einer Promega-Säule gereinigt, durch die Restriktions-Enzyme NcoI und NheI verdaut und in das durch NcoI und NheI linearisierte Plasmid pMOD1LacZ(wt) kloniert. Die Sequenzen der Plasmid-DNA von 2 Klonen, die gegen Zeocin resistent sind, die nach der Transformation des E. coli-Stamms GT100 (verfügbar von Invivogen) durch das Gemisch der Ligation zwischen dem Vektorfragment und dem PCR-Fragment auftraten, wurden als entsprechend der gewünschten in 1 gezeigten Sequenz bestimmt. Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors EM7 (Vektor pMOD1Sh ΔCpG) gestellt ist, verleiht eine Resistenz gegenüber Zeocin, die identisch der ist, die durch denselben Vektor, der das native Gen Sh ble enthält, bei dem E. coli-Empfängerstamm GT100 bereitgestellt wird.
BEISPIEL 2: Konstruktion des Gens Hph für Resistenz gegen Hygromycin; das frei von CpG ist
Das synthetische Gen Hph ΔCpG (Sequenz SEQ ID NO:3, dargestellt in 3) wurde nach den in Beispiel 1 beschriebenen Verfahren konstruiert. Die zwei Stränge wurden mit Hilfe von Oligonukleotiden mit 60 Basenpaaren plus zwei Oligonukleotiden mit 30 Basenpaaren mit einer überlappenden Region mit 30 Basenpaaren konstruiert. Der Zusammenbau der verschiedenen Oligonukleotide, die in 4 gezeigt sind, wurde durch eine finale PCR mit dem Sense-Oligonukleotid TTCAGCTGAGGAGGCACATC (SEQ ID NO:299) und dem reversen Oligonukleotid CTCAGGATCCGCTAGCTAAT (SEQ ID NO:300) nach den im vorangehenden Beispiel genannten experimentellen Bedingungen verwirklicht.
Das amplifizierte und gereinigte Fragment (1068 bp) wurde dann durch die Restriktions-Enzyme BspHI und NheI verdaut und in den Vektor pMOD2 LacZ(wt) kloniert, in dem die NcoI-Stelle von pMOD1 durch die Stelle von BspHI ersetzt wurde. Die Selektion der E. coli-Klone, die diesen rekombinanten Vektor enthalten, wurde auf dem Medium FastMediia^TM Hygro Agar (Cayla) durchgeführt. Die Sequenz von SEQ ID NO:3 der 3 wurde durch Sequenzierung an den zwei Strängen der Plasmid-DNA von zwei Klonen, die gegenüber Mygromycin resistent waren, bestätigt. Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors EM7 (Vektor pMOD2 Hph ΔCpG) gestellt wurde, verleiht eine Resistenz gegen Hygromycin B, die wenigstens gleich derjenigen ist, die durch denselben Vektor, der das native Gen Hph enthält, bei dem Empfängerstamm E. coli GT100 bereitgestellt wird.
BEISPIEL 3: Konstruktion des Gens Bsr für Resistenz gegen Blasticidin, das frei von CpG ist
Das Gen Bsr ΔCpG, dessen Sequenz in 5 (SEQ ID NO:5) dargestellt ist, wurde aus den als 6 angegebenen Oligonukleotiden nach dem in Beispiel 1 beschriebenen Verfahren synthetisiert. Das Gemisch der zusammengebauten Oligonukleotide wurde mit den Primern OL64 und OL76 (siehe 6) amplifiziert. Das amplifizierte und gereinigte Fragment wurde dann durch die Restriktions-Enzyme BspHI und NheI verdaut und in den Vektor pMOD2 LacZ(wt) kloniert. Die Selektion der Klone von E. coli, die diesen rekombinanten Vektor enthalten, wurde auf dem Medium FastMedia^TM Blasti Agar (Cayla) durchgeführt. Die Sequenz SEQ ID NO:5 der 5 wurde durch Sequenzierung der zwei Stränge der Plasmid-DNA von zwei Klonen, die gegenüber Blasticidin resistent waren, bestätigt. Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors EM7 (Vektor pMOD2 Bsr ΔCpG) gestellt war, verleiht eine Resistenz gegen Blasticidin, die identisch mit der ist, die durch denselben Vektor, der das native Gen Bsr enthält, mit dem E. coli-Empfängerstamm GT100 geliefert wird.
BEISPIEL 4: Konstruktion des Gens Pac für Resistenz gegen Puromycin, das frei von CpG ist
Das Fragment BspHI-NheI (Gen Pac ΔCpG; SEQ ID NO:7), dessen Sequenz in 7 gezeigt ist, wurde durch einen Zusammenbau der in 8 gezeigten Oligonukleotide synthetisiert.
Das Gemisch der zusammengebauten bzw. angeordneten Oligonukleotide wurde mit dem Sense-Primer pur24 (AGGACCATCATGACTGAG; SEQ ID NO:301) und dem Reverse-Primer pur25 (ATCATGTCGAGCTAGCTC; SEQ ID NO:302) amplifiziert. Das gereinigte Fragment BspHI-NheI wurde in das Plasmid pMOD2 LacZ(wt) zwischen die Stellen BspHI und NheI kloniert. Die Sequenzen der Plasmid-DNA von 2 Klonen des Stamms GT100, die gegen Puromycin resistent waren, die auf dem Medium FastMedia^TM puro Agar (Cayla) nach Transformation durch das Produkt der Ligation zwischen dem Vektorfragment und dem PCR-Fragment auftraten, wurden als entsprechend der gewünschten in 7 dargestellten Sequenz gefunden. Das synthetische Gen Pac ΔCpG, das unter die Abhängigkeit des Bakterien-Promotors EM7 gestellt war (Vektor pMOD2 Pac ΔCpG), verleiht eine Resistenz gegen Puromycin, die etwas über der liegt, die durch denselben Vektor, der das native Gen pac enthält, mit dem E. coli-Empfängerstamm GT100 geliefert wird.
BEISPIEL 5: Konstruktion des Gens LacZ, das frei von CpG ist, das für die β-Galactosidase von E. coli codiert
Das synthetische Gen LacZ ΔCpG (SEQ ID NO:9, dargestellt in 9) wurde nach dem in den voranstehenden Beispielen beschriebenen Verfahren konstruiert. Unter Berücksichtigung der zu realisierenden Größe des Gens (über 3000 bp) wurde die Konstruktion in drei verschiedenen Teilen durchgeführt, wobei die Restriktionsstellen EcoRV und SacI an denselben Stellen wie bei der nativen Sequenz des Gens lacZ konserviert wurden. Für jeden Teil wurden die zwei Stränge mit Hilfe von Oligonukleotiden mit 40 Basen plus zwei Oligonukleotiden mit 20 Basen mit einer überlappenden Region von 20 Basen synthetisiert.
Die erste Region entspricht dem Fragment NcoI-EcoRV (Teil I), die zweite Region entspricht dem Fragment EcoRV-SacI (Teil II) und die dritte Region entspricht dem Fragment SacI-NheI. Der Zusammenbau der verschiedenen Oligonukleotide, die in den 10A (Oligonukleotide, die für die Konstruktion des Teils I verwendet wurden), 10B (Oligonukleotide, die für die Konstruktion des Teils II verwendet wurden), 10C (Oligonukleotide, die für die Konstruktion des Teils III verwendet wurden) dargestellt sind, wurde durch PCR unter denselben experimentellen Bedingungen wie die, die in den vorangehenden Beispielen angegeben sind, durchgeführt. Die progressive Klonierung der drei Teile des synthetischen Gens wurde in dem Vektor pMOD1 LacZ(wt) durchgeführt. Die Funktionalität jedes klonierten Teils sowie die des vollständigen synthetischen Gens, das auf dem Vektor pMOD1 LacZ vorlag, wurde durch Beweis der β-Galactosidase-Aktivität auf dem Medium FastMedia^TM Amp Xgal Agar (Cayla) für die rekombinanten Klone, die in dem Stamm MC1061 ΔLac erhalten worden waren, gezeigt. Das vollständige synthetische Gen LacZ ΔCpG, das unter die Kontrolle des Promotors EM7 gestellt worden war, ergibt 30% weniger β-Galactosidase-Aktivität (luminometrische Bestimmung von Protein-Extrakten der Kultur), als die Expression des nativen Gens LacZ in derselben Plasmid-Umgebung.
BEISPIEL 6: Konstruktion eines starken konstitutiven Promotors von E. coli, der frei von CpG ist
Der Bakterien-Promotor EM7, der auf den Vektoren des Typs pMOD1 vorhanden ist, ist ein synthetischer Promotor, der bei E. coli konstitutiv und stark ist. Seine Sequenz, die 3 CpG enthält (SEQ ID NO:297 in 11), diente als Referenz, um einen Bakterien-Promotor zu entwickeln, der frei von CpG ist. Wir haben nun "Linker-"Oligonukleotide hergestellt, die an 4 Stellen (als W, D, W und H auf der Sequenz SEQ ID NO:298 in 11 bezeichnet) degeneriert sind und mit dem Restriktionsstellen AseI und NcoI kompatibel sind. Diese verschiedenen Oligos wurden hybridisiert und in den pMODI ShΔCpG kloniert, und zwar zwischen die Restriktionsstellen AseI und NcoI des Promotors EM7. Nach Selektion der rekombinanten Klone auf dem Medium FastMedia^TM Zeo Agar und Bestimmung der Promotorsequenz des Klons, der gegenüber Zeocin am resistentesten war, haben wir den Promotor EM2K (Sequenz SEQ ID NO:11 in 11) als Bakterien-Promotor, der frei von CpG ist, erhalten.
BEISPIEL 7: Synthese der Ursprünge R6K-gamma, die frei von CpG sind
Das DNA-Fragment PacI, das den Ursprung R6K-gamma-M2A enthält (SEQ ID NO:12 in 12) wurde durch PCR aus der Konstruktion der in 13 angegebenen Oligonukleotide synthetisiert. Die Konstruktion bzw. die Anordnung des Fragments R6K-gamma-M2A wurde mit den Primern RK15 (GCAGGACTGAGGCTTAATTAAACCTTAAAAC SEQ ID NO:303) und RK16 (AAGTCTCCAGG TTAATTAAGATCAGCAGTTC; SEQ ID NO:304) amplifiziert und die Fragmente wurden nach Verdau durch das Enzym PacI in ein Plasmid (pGTCMVneo), das das Gen für Resistenz gegen Kanamycin und den Replikationsursprung pUC, begrenzt durch 2 PacI-Stellen, enthielt, kloniert. Zahlreiche Transformanten des Stamms GT97 (der das Protein pi exprimiert) wurden analysiert und es wurde festgestellt, dass Klone, ein Plasmid mit starker Kopienzahl enthalten, das nach mehreren Subkulturen in Abwesenheit von Kanamycin konserviert wird. Nach Sequenzierung wurde auch festgestellt, dass das Fragment ori der Mehrheit dieser Plasmide eine reduziertere Anzahl (5-6) an Repetiersequenzen anstelle der natürlicher Weise 7 des Plasmids R6K besitzen können. Eine dieser neuen Sequenzen des synthetischen Ursprungs R6K-gamma, der frei von CpG ist, ist in SEQ ID NO.13 in 14 gezeigt.
Zwei andere Versionen des Ursprungs R6K-gamma, in denen das G jedes CpG, das in diesen Repetiersequenzen vorliegt (Element mit 22 bp, das mehrmals in der Fixierungsregion des Proteins pi wiederholt wird), durch ein C, um den Ursprung (R6K-gamma M2C) zu ergeben, oder durch ein T, um den Ursprung R6K-gamma M2T) zu ergeben, ersetzt waren, wurden in analoger Art synthetisiert. Die Funktionalität dieser neuen Ursprünge R6K-gamma, in denen das G der CpG der Repetiersequenzen durch ein C oder durch ein T ersetzt war, angefügt an das Beispiel des Ursprungs der 13, wo das G durch ein A ersetzt ist, beweist, dass die CpGs dieser Repetiersequenzen keine Rolle in der Funktionalität des Ursprungs spielen.
BEISPIEL 8: Konstruktion von Plasmidvektoren, die vollständig frei von CpG sind, die ein Resistenz-Gen bei E. coli exprimieren
Zuerst wurde eine Kassette PacI-PacI, die den Bakterien-Promotor EM2K, das Gen für Resistenz gegen Zeocin Sh ΔCpG, gefolgt von einem Bakterien-Terminator ohne CpG enthält, realisiert. Dazu wurden "Linker"-Oligonukleotide, die die Sequenz des Terminators t1 der Intergenregion rpsO-pnp von E. coli enthalten, hybridisiert und zwischen die Stellen NheI und PacI des Vektors pMOD1 EM2K Sh ΔCpG kloniert:
"Linker"-Oligonukleotide
rpsO-1(5'→3'):
CTAGCTGAGTTTCAGAAAAGGGGGCCTGAGTGGCCCCTTTTTTCAACTTAAT
SEQ ID NO:305,
rpsO-2(5'→3'):
TAAGTTGAAAAAAGGGGCCACTCAGGCCCCCTTTTCTGAAACTCAG
SEQ ID NO:306.
Der erhaltene rekombinante Vektor (pMOD1 EM2K Sh ΔCpG Term) wurde durch Sequenzierung auf der Ebene der Terminator-Sequenz, die natürlicherweise kein CpG enthält, verifiziert. Die Kassette EM2K- Sh ΔCpG-Term, die in diesem Vektor enthalten ist, wurde dann durch PCR mit Hilfe der zwei folgenden Primer amplifiziert, um die zwei Seiten durch die PacI-Stellen zu begrenzen:
PACI-UP (5'→3'):
ATCGTTAATTAAAACAGTAGTTGACAATTAAACATTGGC SEQ ID NO:307
PACI-DOWN (5'→3'):
ATCGTTAATTAAGTTGAAAAAAGGGGCC SEQ ID NO:308
Dieses amplifizierte Fragment wurde dann gereinigt und durch PacI geschnitten, dann mit dem Fragment PacI, das den Replikationsursprung R6K-gamma-ΔCpG, der in Beispiel 7 beschrieben wurde, enthält, kombiniert. Nach Transformation dieses Ligationsgemisches in den Stamm GT97 (der das Protein pi exprimiert) und Selektion auf dem Medium FastMedia^TM Zeo zeigt die Analyse der erhaltenen rekombinanten Klone zwei mögliche Orientierungen des Fragments PacI-PacI, das den Ursprung R6K-gamma-ΔCpG enthält. Die in dem pSh ΔCpG erhaltene Orientierung ist in 16 dargestellt.
BEISPIEL 9: Konstruktion bzw. Zusammenbau eines Plasmidvektors, der vollständig frei von CpG ist, der das Gen für Resistenz gegen Zeocin und das Gen der β-Galactosidase in E. coli exprimiert
Der in Beispiel 8 beschriebene Vektor pSh ΔCpG (16) wurde verwendet, um das synthetische Gen LacZ, das frei von CpG ist, zwischen die Stellen EcoRI und NheI zu insertieren. Dazu wurden die "Linker"-Oligonukleotide, die mit EcoRI und NcoI kompatibel sind, die eine Consensus-Sequenz der Fixierungsstelle der Ribosomen von E. coli enthalten, hybridisiert und mit dem Fragment LacZ ΔCpG NcoI-NheI des pMOD1 LacZ ΔCpG zwischen die Stellen EcoRI und NheI des Vektors pMOD1 EM2K ShΔCpG kloniert.
Verwendete "Linker"-Oligonukleotide:
rbs-1(5'→3'):
AATTTCTGAGGAGAAGCT SEQ ID NO:309
Rbs-2(5'→3'):
CATGAGCTTCTCCTCAG SEQ ID NO:310
Die Transformation dieses Ligationsgemisches in den Stamm GT97 (der das Protein pi exprimiert) und die Selektion auf dem Medium FastMedia^TM Zeo XgaI erlaubte den Erhalt von rekombinanten Klonen, die den Vektor pSh-LacZΔCpG enthalten (15 und 17). Dieser Vektor co-exprimiert unter der Abhängigkeit des Bakterien-Promotors EM2K als künstliches Operon-System die Gene ShΔCpG und LacZΔCpG.
BEISPIEL 10: Herstellung eines E. coli-Stamms, der das mutante Protein pi116 exprimiert und eine Deletion im Gen dem trägt
Das Gen pir, das für das Protein pi codiert, das für die Initiation der Replikation des Ursprungs R6K-gamma unverzichtbar ist, sowie das mutierte Gen pir116, das zu einer Erhöhung der Kopienzahl der Plasmide R6K-gamma führt, wurden in funktioneller Form in verschiedene Stämme von E. coli K12 durch unterschiedliche Gruppen eingeführt. Stämme dieses Typs können von E. coli Genetic Stock Center (http://cgsc.biology.yale.edu) erhalten werden und sind auch im Handel von Firmen erhältlich, die sich auf die Lieferung von biologischem Material für die Forschung spezialisiert haben. Dies ist zum Beispiel der Fall für die Stämme pir1 (pir116) und pir2 (Wild-pir), die von der Firma Invitrogen angeboten werden, von der die Produkte in allen europäischen Ländern bezogen werden können. Der Stamm GT97 der Linie K12, des Genotyps Δlac169 hsdR514 endA1 recA1 codBA uidA (ΔMluI)::pir116 (verfügbar von InvivoGen) wurde wegen seiner Widerstandsfähigkeit, der Konstanz der DNA-Präparationen der Plasmide R6K-gamma und seiner erhöhten Kompetenzniveaus unter mehreren Stämmen K12pir unterschiedlichen Genotyps für einige Gene ausgewählt. Die Einführung einer Deletion in das Gen dcm des Stamms GT97 wurde wie folgt durchgeführt:
Zwei DNA-Regionen mit 1,8 kb und 1,5 kb, die das Initiations-Codon ATG (Fragment A) und das Stopp-Codon TGA (Fragment B) des Gens dcm jeweils begrenzen, wurden durch PCR amplifiziert. Das Fragment A wurde mit dem Primer-Paar OLdcmAF (TTTTGCGGCCGCTTGCTGCGCCAGCAACTAATAACG, SEQ ID NO:311) und OLdcmAR (CCTTGGATCCTGGTAAACACGCACTGTCCGCCAATCGATTC, SEQ ID NO:312) amplifiziert, und das Fragment B wurde mit dem Primer-Paar OLdcmBF (TTTTGGATCCTCAGCAAGAGGCACAACATG; SEQ ID NO:313) und OLdcmBR (TTTTCTCGAGAAACGGCAGCTCTGATACTTGCTTC; SEQ ID NO:314) amplifiziert. Die Restriktionsstellen für die Enzyme NotI (GCGGCCGC) BamHI (GGATCC) und XhoI (CTCGAG) wurden in die Primer eingeführt, um das Fragment A und das Fragment B zu verbinden, indem ein genetisches Element gebildet wurde, das durch die Stellen NotI und XHoI begrenzt wird. Die Region des Gens dcm wird so wieder hergestellt, indem eine Deletion erzeugt wird, die sich von der Position +3 nach dem ATG bis zur Position –14 vor dem TGA erstreckt. Dieses genetische Element wurde in pKO3 (Link A. J., Philips D. und Church G. M. (1997), J. Bacteriol. 179, 6228-37), der Vektor, der für den Allel-Ersatz bei Escherichia coli für eine thermoempfindliche Replikation entwickelt wurde, zwischen die Stellen NotI und SalI kloniert, um das Plasmid zu ergeben, das pKO3Δdcm genannt wird. Dieses Plasmid wurde in den Stamm GT97 mit einem Plasmid, das das Protein RecA exprimiert (pFL352), co-transformiert. Eine Transformante, die die zwei Plasmide enthält, wurde bei einer nichtzulässigen Temperatur (42°C) in Gegenwart von Chloramphenicol kultiviert, um Klone zu selektionieren, die durch homologe Rekombination das pKO3Δdcm in das Bakterium-Chromosom integriert haben. Ein Sub-Klon, der gegenüber Chloramphenicol bei 42°C resistent war, wurde dann bei 30°C in einem Medium kultiviert, das eine starke Konzentration an Saccharose (5%) enthielt, um eine Gegen-Selektion der Stämme durchzuführen, die nach einem zweiten homologen Rekombinations-Ereignis die Chromosomenregion des Gens dcm gegen das homologe in das Plasmid klonierte Fragment ausgetauscht hatten. Die in dem erhaltenen Klon eingeführte Deletion (GT106) wurde durch PCR verifiziert, und zwar mit dem Primer-Paar OldcmAF und OldcmBR, wobei ein Fragment mit einer Größe unter der, die mit dem Elternstamm und durch eine PCR mit dem Primer OldcmBR und einem Primer, positioniert außerhalb der ausgetauschten Region, erhalten wurde (OldcmCF TTTTGCGGCCGCGTTGCGGTATTACCCTTGTC; SEQ ID NO:315).
Der Genotyp dcm^– des Stamms GT106 wurde bestätigt, indem in diesen und in GT106 ein Plasmid eingeführt wurde, das eine Restriktionsstelle des Enzyms SexAI enthält, das Gegenstand der Methylierung dcm ist. Das ausgehend von GT106 gereinigte Plasmid wird durch SexAI gespalten, während es gegenüber dem Enzym resistent ist, wenn es aus GT97 gereinigt wird.
Dieser letzte Stamm, der GT106 genannt wird, weist dieselben Wachstum-Charakteristika wie der Elternstamm GT97 auf und wie erwartet wurde keine negative Modifikation der Menge der DNA der Plasmide R6K-gamma beobachtet, lediglich die Qualität der DNA, bestimmt durch die Abwesenheit der Methylierung der Cytosine der dcm-Stellen, wurde verbessert. Der Stamm GT106 wird von der Firma Invivogen ab dem Tag der Einreichung dieser Patentanmeldung verfügbar sein.
BEISPIEL 11: Produktion des Gens Neo für Resistenz gegen Neomycin, das frei von CpG ist
Das Gen Neo ΔCpG, dessen Sequenz in 18 dargestellt ist (Position 3 bis 797 der DNA-Sequenz, die in 18 dargestellt ist = SEQ ID NO:316; Proteinsequenz = SEQ ID NO:317), wurde ausgehend von einer Anordnung überlappender Oligonukleotide (Größe 20-40 pb), deren Sequenzen in 19 angegeben sind, synthetisiert. Das Verfahren des Zusammenbaus erfolgte in drei Stufen, die erste besteht in der Phosphorylierung der Oligonukleotide des codierenden Strangs, in einer zweiten Stufe wird die Gesamtheit der Oligonukleotide durch Hybridisierung und Ligation zu zwei Strängen kombiniert, und in der letzten Stufe wird das Gen durch PCR amplifiziert.
Die 20 Oligonukleotide von SEQ ID NO:319 bis SEQ ID NO:338 (19), die dem codierenden Strang entsprechen, werden nach dem folgenden Verfahren phosphoryliert: 1 μl jedes der Oligonukleotide, mit 250 μM in Wasser aufgenommen, wird in einem Mikroröhrchen, das 50 μl Wasser enthält, gemischt, um eine Endlösung mit einer Konzentration von 100 Picomol pro Mikroliter zu erhalten. Dann mischt man 5 μl dieser Lösung mit 10 μl Puffer für PolyNukleotid-Kinase, 10-fach konzentriert, 0,4 μl einer 50 mM ATP-Lösung, 85 μl Wasser und 1 μl Enzym (mit 10 U/μl), und das Ganze wird 4 Stunden bei 37°C, dann 5 Minuten bei 95°C inkubiert
(Lösung A).
Eine Lösung der Oligonukleotide des nicht-codierenden Strangs wird hergestellt, indem 1 μl jedes Oligonukleotids (SEQ ID NO:339 bis SEQ ID NO:360; 19) und 1 μl Oligonukleotid mit SEQ ID NO:318 (19) gemischt wurden und man 106 μl Wasser zusetzt, um eine Endlösung mit 54 Picomol pro μl zu erhalten
(Lösung B).
Der Zusammenbau bzw. die Konstruktion des Gens wird durchgeführt, indem zunächst 10 μl der Lösung A, 1 μl der Lösung B, 6 μl einer 100 mM KCl-Lösung, 3 μl einer 0,5%igen Lösung des oberflächenaktiven Mittels NP-40, 4 μl einer 50 mM MgCl2-Lösung, 3 μl einer 10 mM ATP-Lösung und 7,5 μl Ligase Pfu (30 Einheiten) vermischt wurden, das Gemisch dann in einem programmierbaren Thermocycler 3 Minuten auf 95°C, dann 3 Minuten auf 80°C erwärmt wurde, bevor es 3 Zyklen auf 1 Minute bei 95°C, gefolgt von einer Passage von 95°C auf 70°C in 1 Minute, dann einer Passage von 70°C auf 50°C in 1 Stunde, und schließlich 2 Stunden bei 55°C unterworfen wurde. Dann wurde das Gemisch der angeordneten Oligonukleotide mit den Primern NO1 und NO22 amplifiziert. Das Amplifikationsprodukt wird an einer Promega-Säule gereinigt, durch die Restriktions-Enzyme BspHI und NheI verdaut, und in das durch BspHI und NheI linearisierte Plasmid pMOD2LacZ(wt) kloniert. Die Sequenzen der Plasmid-DNA von 2 Klonen, die gegenüber Kanamycin resistent waren, die nach Transformation des E. coli-Stamms GT100 (verfügbar von Invivogen) durch das Gemisch der Ligation zwischen dem Vektorfragment und dem PCR-Fragment auftragen, wurden als entsprechend in 18 präsentierten Sequenz bestimmt. Dieses synthetische Gen, das unter die Abhängigkeit des Bakterien-Promotors EM7 (Vektor pMOD2Neo ΔCpG) gestellt wurde, verleiht eine Resistenz gegenüber Kanamycin, die identisch der ist, die durch denselben Vektor, der das native Gen neo enthält, bei dem Empfängerstamm E. coli GT100 verliehen wird. Das Fragment neo-BspHI-NheI des Plasmids pMOD2Neo ΔCpG wurde dann in das Plasmid pSh ΔCpG der 16, linearisiert durcch NcoI-NheI, eingeführt, um nach Ligation und Transformation in E. coli das Plasmid pNeoΔCpG zu ergeben. SEQUENZPROTOKOLL

Claims

Verfahren zur Herstellung eines Plasmids, das Vektor wenigstens eines Gens ist und das vollständig frei von CpG ist, dadurch gekennzeichnet, dass man ein Plasmid konstruiert, indem man durch enzymatische Ligation der DNA-Fragmente, die alle frei von CpG sind, die einem Replikationsursprung und den Elementen, die eine Transkriptionseinheit für das wenigstens eine Gen bilden, entsprechen, zusammenfügt und dass man dieses Plasmid in einen Stamm von Escherichia coli, der das Protein pi exprimiert, für die Replikation des Plasmids transferiert.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Replikationsursprung des Plasmids der Replikationsursprung R6K-gamma, der durch die Eliminierung der CpG modifiziert ist, ist.
Replikationsursprung für Plasmid, dadurch gekennzeichnet, dass seine Sequenz derjenigen des Replikationsursprungs R6K-gamma entspricht, in dem jedes G der CpG der wiederholten Region des Kerns durch ein A, ein C oder ein T ersetzt wurde, oder jedes C der CpG durch ein G, ein A oder ein T ersetzt wurde.
Replikationsursprung nach Anspruch 3, dadurch gekennzeichnet, dass seine Sequenz die Sequenz SEQ ID NO:12 oder die Sequeuenz SEQ ID NO:13 umfasst.
Replikationsursprung nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass die Sequenz zur Fixierung des Proteins pi fünfmal oder sechsmal wiederholt ist.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Transkriptionseinheit einen bakteriellen Promotor, der frei von CpG ist, umfasst.
Promotor, dadurch gekennzeichnet, dass seine Sequenz die SEQ ID NO:11 umfasst.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Transkriptionseinheit einen bakteriellen Transkriptionsterminator, der frei von CpG ist, umfasst.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Transkriptionseinheit ein Resistenzgen, das frei von CpG ist, umfasst.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Transkriptionseinheit ein Reportergen, das frei von CpG ist, umfasst.
Plasmid, das einen Replikationsursprung nach einem der Ansprüche 3 bis 5 umfasst.
Plasmid nach Anspruch 11, dadurch gekennzeichnet, dass es außerdem ein Gen umfasst, ausgewählt aus der Gruppe, bestehend aus: a) einem Gen aus wenigstens 250 bp, das durch ein Verfahren zur Herstellung eines Gens, das frei von GpG ist, obgleich es in E. coli exprimierbar ist, erhalten werden kann, dadurch gekennzeichnet, dass man eine Polynukleotidkette synthetisiert, indem man der Aminosäurekette eines Proteins folgt, das durch E. coli exprimiert werden kann, und indem man jeder Aminosäure einen Nukleotid-Codon zuordnet, ausgewählt unter denen, die entsprechend dem genetischen Code und unter Berücksichtigung der Degeneriertheit dieses Codes dieser Aminosäure entsprechen, indem man jedoch von dieser Wahl eliminiert: – die Codons ACG (Thr), CCG (Pro), GCG (Ala), TCG (Ser), CGA (Arg), CGC (Arg), CGG (Arg), CGT (Arg), die ein CpG umfassen, und – die Codons, die mit einem C enden, wenn das Codon, das direkt darauf folgt, mit einem G beginnt; b) einem Gen mit wenigstens 250 bp, das durch ein Verfahren zur Herstellung eines Gens, das frei von CpG ist, jedoch in E. coli exprimierbar ist, erhalten werden kann, dadurch gekennzeichnet, dass man eine Polynukleotidkette synthetisiert, indem man der Aminosäurekette eines Proteins, das durch E. coli exprimiert werden kann, folgt und indem man jeder Aminosäure ein Nukleotid-Codon zuordnet, ausgewählt unter denen, die nach dem genetischen Code und unter Berücksichtigung der Degeneriertheit dieses Codes dieser Aminosäure entsprechen, indem man jedoch von dieser Wahl eliminiert: – die Codons AGC (Thr), CCG (Pro), GCG (Ala), TCG (Ser), CGA (Arg), CGC (Arg), CGG (Arg), CGT (Arg), die ein CpG umfassen, und – die Codons, die mit einem C enden, wenn das Codon, das direkt darauf folgt, mit einem G beginnt, wobei das Verfahren dadurch gekennzeichnet, ist, dass man außerdem von der Wahl die Codons ATA (Ile), CTA (Leu), GTA (Val) und TTA (Leu) eliminiert; c) einem Gen, dessen Sequenz die Sequenz SEQ ID NO:1 von der Position 3 bis zu der Position 374, die Sequenz SEQ ID NO:3 von der Position 3 bis zu der Position 1025, die Sequenz SEQ ID NO:5 von der Position 3 bis zu der Position 422, die Sequenz SEQ ID NO:7 von der Position 7 bis zu der Position 599 umfasst; d) einem Gen, dessen Sequenz der Sequenz SEQ ID NO:9 von der Position 3 bis zu der Position 3056 entspricht; und e) einem Gen, dessen Sequenz der Sequenz SEQ ID NO:316 entspricht.
Plasmid nach Anspruch 11 oder 12, dadurch gekennzeichnet, dass es außerdem einen Promotor nach Anspruch 7 umfasst.
Plasmid nach einem der Ansprüche 11 bis 13, dadurch gekennzeichnet, dass es außerdem einen Transkriptionsterminator ohne CpG umfasst.
Plasmid nach einem der Ansprüche 11 bis 14, dadurch gekennzeichnet, dass es vollständig frei von CpG ist.
Plasmid der SEQ ID NO:14.
Verfahren für die Herstellung eines Plasmids, das vollständig frei von CpG ist und ohne Methylierung auf der Ebene des Cytosins im Nukleinsäure-Kontext CC(A/T)GG ist, dadurch gekennzeichnet, dass man ein Plasmid nach einem der Ansprüche 11 bis 16 durch Replikation in einem Escherichia coli-Stamm produziert, der das Protein pi, das bezüglich des Methylierungssystems dem defizient ist, exprimiert.
Escherichia coli-Zelle, transformiert durch wenigstens eines der Plasmide nach einem der Ansprüche 11 bis 16.
Transformierte Escherichia coli-Zelle nach Anspruch 18, dadurch gekennzeichnet, dass sie ein Gen exprimiert, das für ein Protein pi codiert.
Transformierte Escherichia coli-Zelle nach Anspruch 19, dadurch gekennzeichnet, dass sie außerdem ein inaktiviertes dcm-Gen umfasst.
Kit zur Herstellung von Plasmiden, wie sie in einem der Ansprüche 11 bis 16 definiert sind, dadurch gekennzeichnet, dass er wenigstens eine Zelle nach einem der Ansprüche 18 bis 20 umfasst.