CN1852975B

CN1852975B - 转基因的高色氨酸植物

Info

Publication number: CN1852975B
Application number: CN038156148A
Authority: CN
Inventors: 莉萨·M·韦弗; 蒂姆·N·奥尔马索夫; 加布里拉·瓦杜瓦; 梁继红; 玛格丽特·J·瓦拉戈纳; 蒂亚马冈德鲁·V·文卡蒂什; 西瓦林加纳·曼朱纳思
Original assignee: Monsanto Co
Current assignee: Monsanto Co
Priority date: 2002-05-03
Filing date: 2003-05-05
Publication date: 2012-09-05
Anticipated expiration: 2023-05-05
Also published as: EP1571896A2; AU2003253601A1; AU2003253601A8; US20030213010A1; WO2003092363A3; CA2482879C; US8158851B2; BR0309860A; CA2482879A1; EP1571896A4; CN1852975A; WO2003092363A2; US20110195175A1

Abstract

本发明提供通过在植物细胞中导入和表达编码邻氨基苯甲酸合酶的分离DNA片段来改变植物的色氨酸含量的方法。也提供用编码邻氨基苯甲酸合酶的分离DNA片段转化的转基因植物，以及来源于这些植物的人或动物的食物、种子和后代。

Description

转基因的高色氨酸植物

本申请要求于2002年5月3日提交的，美国临时申请系列号为60/377,727的权利。

许多重要的农作物，包括大豆和玉米的种子不包含营养完全的充足数量的几种氨基酸。这些氨基酸包括但不限于：色氨酸、异亮氨酸、缬氨酸、精氨酸、赖氨酸、甲硫氨酸和苏氨酸。因此，这些氨基酸的生物合成途径，和/或进入那些途径的代谢产物的生物合成途径，是用于增加这些植物的氨基酸含量的潜在的操作目标。

邻氨基苯甲酸合酶(AS，EC4.1.3.27)催化植物、真菌和细菌中从芳香氨基酸途径到生物合成色氨酸分出支路的第一反应。

邻氨基苯甲酸合酶(例如玉米邻氨基苯甲酸合酶)的最普遍形式是由2个亚基，α或TrpE亚基和β或TrpG亚基组成的异四聚体酶。2个α-亚基和2 个β-亚基装配形成异四聚体的邻氨基苯甲酸合酶。也已经发现″单体″形式的AS包括具有TrpE和TrpG亚基活性的单个多肽链(例如苜蓿中华根瘤菌(Rhizobium meliloti))。当单体的邻氨基苯甲酸合酶只包括一类多肽时，单体邻氨基苯甲酸合酶的酶促活性形式一般是由2个这种单体多肽的同型二聚体组成的。异四聚体和单体的邻氨基苯甲酸合酶都在利用谷氨酰胺和分支酸的反应中催化形成邻氨基苯甲酸。在α-亚基(在此指″α-结构域″)上发现的结构域结合分支酸并除去烯醇丙酮酸侧链，而在β-亚基(在此指″β-结构域″)上发现的结构域将氨基从谷氨酰胺传递到羧酸和烯醇丙酮酸部分间的分支酸苯基环上的位置。

合成色氨酸的下一个反应是将磷酸核糖焦磷酸的磷酸核糖基部分传递到邻氨基苯甲酸上。吲哚环在2个步骤形成，包括将核糖基团异构转化为核酮糖，然后是环化反应以产生吲哚磷酸甘油。该途径中的最后反应由可能包含1个或2个亚基的单个酶催化。该反应实现吲哚甘油醛-3-磷酸的切割和吲哚基团与丝氨酸的缩合(Umbarger，Ann.Rev.Biochem.，47：555(1978))。

在较高等的植物和微生物中流入色氨酸途径的代谢产物显然受到色氨酸的邻氨基苯甲酸合酶反馈抑制的调节。色氨酸可阻断需要活化β-结构域和产生相对于α-结构域活性部位的氨通道途径的构像重排。这种色氨酸的反馈抑制被认为降低了经邻氨基苯甲酸合酶的色氨酸的生产。参见Li J.和Last，R.L.，拟南芥(Arabidopsis thaliana)trp5突变株具有抗反馈的邻氨基苯甲酸合酶和升高的可溶解色氨酸The Arabidopsis thaliana trp5 mutant has afeedback-resistant anthranilate synthase and elevated soluble tryptophan(植物生理学Plant Physiol.，110：51-59(1996))。

已经鉴定几个氨基酸残基涉及来自鼠伤寒沙门氏菌(Salmonellatyphimurium)的邻氨基苯甲酸合酶复合物的反馈调节。这种信息提供了氨基末端调节位点的证据(生物化学杂志J.Biol.Chem.，266：8328-8335(1991))。Niyogi等人已经使用分子的方法进一步表征来自某些植物的邻氨基苯甲酸合酶。参见，Niyogi和Fink，植物细胞Plant Cell，4：721(1992)和Niyogi等人，植物细胞Plant Cell，5：1011(1993)。他们发现拟南芥邻氨基苯甲酸合酶的α-亚基是由2个紧密相关的、分别调节的非等位基因编码的。这些α-亚基基因中的一个，ASA1，是由创伤和细菌性病原体浸润诱导的，暗示其涉及防御反应，而另一个α-亚基基因，ASA2是以组成性的基础水平表达的。两种预测的蛋白质共用与细菌和真菌的邻氨基苯甲酸合酶蛋白质同源的区域，并且在已经被证明描述涉及细菌中色氨酸反馈抑制的位置包含保守的氨基酸残基(Caligiuri等人，生物化学杂志J.Biol.Chem.，266：8328(1991))。

色氨酸的氨基酸类似物和色氨酸生物合成途径中的中间体的类似物(例如5-甲基色氨酸、4-甲基色氨酸、5-氟基色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚基乙酸、3-甲基邻氨基苯甲酸)已经显示抑制原核和真核生物的生长。可对植物细胞培养物进行抗这些氨基酸类似物的筛选。例如，已经选择抗5-甲基色氨酸(5-MT)、色氨酸的氨基酸类似物的生长抑制所培养的烟草、胡萝卜、马铃薯、谷物和毛曼陀罗(Datura innoxia)细胞系，其生长抑制是由于表达改变的邻氨基苯甲酸合酶。

Ranch等人，植物生理学Plant Physiol.71：136(1983)在双子叶植物杂草，毛曼陀罗的细胞培养物中选择5-MT抗性，并且报道抗性的细胞培养物包含增加的色氨酸水平(比野生型水平高出8-30倍)并具有对色氨酸反馈抑制灵敏度较小的邻氨基苯甲酸合酶。再生的植物也是对5-MT有抗性的，包含改变的邻氨基苯甲酸合酶，并且在叶片中具有比对照植物的叶片更大的游离色氨酸浓度(4-44倍)。与在烟草(N.tabacum)中的研究相比，改变的酶不在从抗性细胞系再生的植物中表达，这些结果表明氨基酸过量产生的表型可在细胞水平选择并且在从毛曼陀罗中所选择的细胞再生的完整植株中表达。

Hibberd等人(美国专利号4,581,847)描述了5-MT抗性的玉米细胞系包含比野生型的邻氨基苯甲酸合酶对反馈抑制较少敏感的邻氨基苯甲酸合酶。一种5-MT抗性细胞系比非转化的细胞系积聚大于几乎二十倍水平的游离色氨酸。

P.C.Anderson等人(美国专利号6,118,047)公开了利用来自C28玉米的邻氨基苯甲酸合酶的色氨酸不敏感的α-结构域在转基因中制备显示种子中游离色氨酸水平升高的转基因玉米植株(玉米(Zea mays))。

虽然有可能在某些细胞培养物和植物中选择5-MT抗性，这些特性不一定与完整植株中过量生产的游离色氨酸相关。另外，再生自5-MT抗性系的植物经常不表达酶的改变形式。也不能预测该特性将在一段时间内稳定并且将会作为可遗传的性状延续下去。还已经从高等植物的细胞培养物的粗提物中部分地纯化邻氨基苯甲酸合酶(Hankins等人，植物生理学Plant Physiol.， 57：101(1976)；Widholm，Biochim.Biophys.Acta，320：217(1973))。然而，发现它是很不稳定的。因此，必须提供具有可增加植物色氨酸含量的邻氨基苯甲酸合酶源的植物。

发明概述

本发明提供编码可用于产生转基因植物的邻氨基苯甲酸合酶(AS)的核酸。当这种邻氨基苯甲酸合酶在转基因植物中表达时，可在植物细胞内获得升高水平的色氨酸。在一个实施方案中，本发明涉及编码单体邻氨基苯甲酸合酶的DNA分子，其中这种单体的邻氨基苯甲酸合酶是天然的或是邻氨基苯甲酸合酶的α-和β-结构域的遗传工程嵌合融合体。来自几个种属(例如，一些细菌及其他微生物)的邻氨基苯甲酸合酶基因，天然地产生组成单个多肽链的单体邻氨基苯甲酸合酶。然而，大多种属具有由在分开亚基上发现的2个α和2个β结构域组成的异四聚体邻氨基苯甲酸合酶。本发明也预期形成包括连接任何β-结构域的任何邻氨基苯甲酸合酶α-结构域的嵌合邻氨基苯甲酸合酶的融合蛋白质。

通常，天然存在的单体邻氨基苯甲酸合酶与多数植物的邻氨基苯甲酸合酶序列的同一性是相当低的。然而，根据本发明，尽管与植物内源的邻氨基苯甲酸合酶的序列同一性很低，当在植物中表达时，这种单体邻氨基苯甲酸合酶可提供高水平的色氨酸。因此，本发明提供可具有差异(divergent)的序列而且能够在植物宿主中有效提供高水平的色氨酸的单体邻氨基苯甲酸合酶。例如，包含单体根瘤农杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸合酶的转基因的大豆植株可在种子中产生达到大约10,000-大约12,000ppm的色氨酸，而平均的trp水平范围达到大约7,000-大约8,000ppm。相反，非转基因的大豆植株通常在种子中只具有达到大约100-大约200ppm的色氨酸。

因此，本发明提供编码单体邻氨基苯甲酸合酶的分离的DNA序列，其中单体的邻氨基苯甲酸合酶具有邻氨基苯甲酸α-结构域和邻氨基苯甲酸β-结构域，并且其中单体的邻氨基苯甲酸合酶是在植物中表达的。这种表达可提高植物中L-色氨酸的水平。

单体的邻氨基苯甲酸合酶可以是天然单体的。可从中分离天然单体邻氨基苯甲酸合酶核酸的生物体的实例，包括但不限于例如根瘤农杆菌、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、Mesorhizobium loti(例如，Genbank 登记号GI 13472468)、马尔他布鲁氏菌(Brucella melitensis)(例如，Genbank登记号GI 17982357)、念珠藻属(Nostoc sp.)PCC7120(例如，Genbank登记号GI 17227910或GI 17230725)、巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号GI1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI152445)的生物体。在一些实施方案中，分离的DNA编码具有例如，SEQ ID NO：4的氨基酸序列或SEQ ID NOs：1或75中任何一个核苷酸序列的根瘤农杆菌邻氨基苯甲酸合酶。

可选地，单体的邻氨基苯甲酸合酶可以是任何适用的邻氨基苯甲酸合酶的α和β结构域的融合体。这种α和β结构域可来源于玉米、芸香(Rutagraveolens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌(Serratia marcescens)、大肠杆菌(Escherichia coli)、根瘤农杆菌、拟南芥、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、百脉根根瘤菌(Mesorhizobiun loti)(例如，Genbank登记号GI 13472468)、马尔他布鲁氏菌(例如，Genbank登记号GI 17982357)、念珠藻属PCC7120(例如，Genbank登记号GI17227910或GI 17230725)、巴西固氮螺菌(例如，Genbank登记号GI 1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI 152445)、大豆、稻、棉花、小麦、烟草或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。例如，编码α或β结构域的核酸可利用任何SEQ ID NOs：1-70，75-113和116-137中的序列信息获得。

在另一个实施方案中，本发明提供编码来自玉米(Zea mays)的邻氨基苯甲酸合酶的α结构域，包括SEQ ID NOs：5或66的分离DNA。这种分离的DNA可具有核苷酸序列SEQ ID NOs：2，67或68。可将分离的DNA可操作地连接启动子，并且当在植物中表达时可在植物中提供升高水平的L-色氨酸。

在另一实施方案中，本发明提供编码邻氨基苯甲酸合酶的分离的DNA分子，其中DNA分子编码基本上与由SEQ ID NOs：66，108-111，133和137所例证说明的邻氨基苯甲酸合酶蛋白质同源的蛋白质。编码邻氨基苯甲酸合酶的分离DNA包括基本上与由SEQ ID NOs：67，68，104-107和134-136所例证说明的DNA分子同源的DNA分子。

在另一个实施方案中，本发明提供包括表达盒的DNA构建体，其中该可操作连接的表达盒包括(i)异源启动子；(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子，其中单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α- 结构域和邻氨基苯甲酸合酶β-结构域的单个多肽，以及(iii)转录终止子。单体的邻氨基苯甲酸合酶蛋白质可包括与由SEQ ID NOs：4，7，43，57，77-82和130-132所例证说明的蛋白质基本上同源的蛋白质。DNA分子可包括与由SEQ ID NOs：1，75，76，83和121-129所例证说明的DNA分子基本上同源的DNA分子。

在进一步的实施方案中，本发明提供包括第一表达盒的DNA构建体，其中第一表达盒可操作的连接，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子和(iii)转录终止子。

上述的DNA构建体可进一步包括第二表达盒，包括可操作的连接(i)异源启动子；(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子和(iii)转录终止子。DNA构建体可包括与由SEQ ID NOs：5，6，8，44，45，66，99，100，101，102，103，108，109，110，111，117，118，133或137所例证说明的蛋白质基本上同源的α-结构域或β-结构域蛋白质。编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子可包括与由SEQ ID NOs：2，3，67，94，95，96，97，98，104，105，106，112，116，119，120，134，135或136所例证说明的DNA分子基本上同源的DNA分子。具体的实例包括其中α-结构域邻氨基苯甲酸合酶蛋白质是SEQ ID NO：66和β-结构域蛋白质是SEQ ID NO：118的DNA构建体。

分离的DNA也可编码突变的邻氨基苯甲酸合酶或突变的邻氨基苯甲酸合酶结构域。这种突变的邻氨基苯甲酸合酶或其结构域可具有一种或多种突变。本领域的技术人员已知，突变可以是沉默的，可产生具有与野生型类似的酶活性的变异基因产物，或可产生具有改变的酶活性的衍生基因产物。本发明包括所有这类的突变。

可在体外或体内从野生型邻氨基苯甲酸合酶核酸产生突变的分离DNA，并且可编码例如，一种或多种氨基酸的取代、缺失或插入。产生具有增加活性的、更大稳定性的或对色氨酸或色氨酸类似物的反馈抑制较少灵敏性的突变邻氨基苯甲酸合酶的突变的分离DNAs是合乎需要的。在一个实施方案中，邻氨基苯甲酸合酶或其结构域抗内源L-色氨酸或色氨酸类似物的抑制。例如，邻氨基苯甲酸合酶可在色氨酸-结合袋或减少邻氨基苯甲酸合酶灵敏性的其它地方，或其对于色氨酸抑制的结构域具有一种或多种突变。预期用于突变的氨基酸残基是例如在大约48，51，52，293，和298位置的残基。例如，突变可以是：

a)在大约48位用Phe替换Val；

b)在大约48位用Tyr替换Val；

c)在大约51位用Phe替换Ser；

d)在大约51位用Cys替换Ser；

e)在大约52位用Phe替换Asn；

f)在大约293位用Ala替换Pro；

g)在大约293位用Gly替换Pro；或

h)在大约298位用Trp替换Phe；

其中突变的位置由所选择的邻氨基苯甲酸合酶的氨基酸序列与根瘤农杆菌邻氨基苯甲酸合酶氨基酸序列的序列对比决定。具有这种突变的邻氨基苯甲酸合酶的实例包括具有SEQ ID NOs：58-65，69，70和84-94的邻氨基苯甲酸合酶。

分离的DNA可编码其他元件和功能。本领域的技术人员所预期的任何元件或功能都可包括在内。例如，分离的DNA也可包括在植物细胞中有功能的启动子，其可操作地连接到编码邻氨基苯甲酸合酶的DNA上。分离的DNA可进一步编码质体运输肽。分离的DNA也可编码选择性的标记或报道基因。这种选择性的标记可赋予所述植物细胞除草剂抗性、高蛋白含量、高含油量、高赖氨酸含量、高异亮氨酸含量、高生育酚含量等。DNA序列也可包括编码一种或多种来源于苏云金杆菌(Bacillus thuringiensis)的杀虫剂蛋白质的序列。

本发明进一步提供包括本发明的分离DNA的载体。这种载体可用于在原核和真核细胞中表达邻氨基苯甲酸合酶多肽，用于转化植物细胞并产生转基因植物。

本发明也提供包括本发明的分离DNA的转基因植物。这些分离DNAs在转基因植物中的表达可导致转基因植物，例如植物的种子或其他部分中的L-色氨酸，优选游离的L-色氨酸水平的升高。该水平增至高于不同于转基因大豆植物的，缺乏该DNA的，例如相应的未转化细胞或具有相同遗传背景的未转化植株的植物细胞中L-色氨酸的水平。DNA优选是可遗传的，其优选通过可繁殖植物的完全正常的生殖周期传递给其后代以及进一步传给下一代。

可具有这种分离的DNA的转基因植物包括双子叶植物(双子叶)，例如大豆或Canola。可选地，转基因植物可以是单子叶植物(单子叶)，例如玉米、稻、小麦、大麦或高粱。

本发明也提供包含任何本发明的分离DNAs、邻氨基苯甲酸合酶多肽、转基因或载体的任何转基因植物的种子。

本发明进一步提供包含具有本发明的分离DNA或DNA构建体的植物的至少一部分的动物饲料或人的食品。可被归入动物饲料或人食品的植物的部分包括例如，种子、叶片、茎、根、块茎或果实。所需要的植物部分具有由本发明的分离DNA编码的邻氨基苯甲酸合酶表达所提供的增加的色氨酸水平。

本发明进一步提供通过将本发明的分离DNA导入植物的可再生细胞用于改变、优选增加植物(双子叶植物或单子叶植物)中色氨酸含量的方法。优选地，DNA序列可操作地连接至少一种在植物细胞中可操作的启动子。鉴定或选择转化的细胞，然后再生以产生包括可表达功能性的邻氨基苯甲酸合酶多肽的植物。在一些实施方案中，编码邻氨基苯甲酸合酶或其结构域的DNA是突变的DNA。导入的DNA优选是可遗传的并且该植物优选是可繁殖的植物。例如，导入的DNA优选可通过完全的性周期传递给子代植株，并且可赋予子代的后代高色氨酸的表型。

编码邻氨基苯甲酸合酶的DNAs，优选整合到也可包括编码运输肽、例如质体运输肽的DNA序列和选择性标记或报道基因的，可操作地连接一种或多种在靶植物细胞中有功能的启动子的载体或″转化基因″中。启动子可以是例如，可诱导的启动子、组织特异的启动子、强启动子或弱启动子。其他的转录本或翻译调控元件，例如增强子或终止子，也可功能性地连接编码邻氨基苯甲酸合酶的DNA片段。

悬浮培养物中的细胞或胚胎、完整的组织或器官可通过多种转化技术转化，例如通过微粒子轰击、电穿孔和根瘤农杆菌介导的转化，及其他本领域适用的方法。

因此，转化植物的细胞，包括天然的邻氨基苯甲酸合酶基因和转化基因或其他编码外源邻氨基苯甲酸合酶的DNA片段。植物细胞中外源邻氨基苯甲酸合酶的表达可导致色氨酸及其次级代谢产物的水平增加。在一些实施方案中，这种表达赋予对一定数量的内源L-色氨酸类似物的耐受性，例如比具有野生型或色氨酸敏感的邻氨基苯甲酸合酶的植物细胞存在至少大约10％多的邻氨基苯甲酸合酶活性。

本发明也提供用于改变植物中色氨酸含量的方法，包括：(a)将包括可操作地连接到在植物细胞中有功能的启动子上、编码邻氨基苯甲酸合酶结构域和质体运输肽的分离DNA的转化基因导入植物的可再生细胞；以及(b)从所述的转化植物细胞再生转化植株，其中植物的细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于同样遗传背景的未转化植物中的色氨酸含量，该合酶表达的数量有效增加了所述植物中的色氨酸含量。结构域可以是邻氨基苯甲酸合酶α-结构域。邻氨基苯甲酸合酶结构域可具有一种或多种突变，例如，减少结构域对色氨酸抑制的灵敏性的突变。这种突变可以是例如在色氨酸结合袋(pocket)中。这种结构域可以是，例如，来自根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻(Euglena gracilis)、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、大豆、稻、棉花或玉米的邻氨基苯甲酸合酶结构域。芸香具有它自己的叶绿体转运序列，其可与邻氨基苯甲酸合酶转基因一起使用。因此，当利用芸香DNA时，本领域的技术人员不必增加质体转运序列。

本发明也提供包括编码单体邻氨基苯甲酸合酶或其结构域的DNA的，新的分离和纯化的DNA分子。当在植物内表达时，这种邻氨基苯甲酸合酶DNA可提供高水平的色氨酸。在一些实施方案中，邻氨基苯甲酸合酶基本上抗游离的L-色氨酸或其类似物的抑制。本发明包括的新的DNA序列的实例包括但不限于，从根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌；大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌(Rhodopseudomonas palustris)、深红红螺菌(Rhodospirillum rubrum)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(Sorghum bicolor)、硫磺矿硫化叶菌、Thermobifida fusca或玉米(Zea mays王蜀黍)或其他邻氨基苯甲酸合酶分离的DNA分子。

这些DNA序列包括具有在单个多肽链上连接至少另一个邻氨基苯甲酸合酶结构域的邻氨基苯甲酸合酶α-结构域的，合成的或天然存在的单体形式的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶可以例如，是邻氨基苯甲酸合酶α或β结构域的融合体。这种邻氨基苯甲酸合酶α或β结构域可来源于根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、深红红螺菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(sorghum bicolor)、硫磺矿硫化叶菌、Thermobifidafusca、高粱属(sorghum)、大豆、稻、棉花、小麦、烟草或玉米(王蜀黍)，或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因。这种邻氨基苯甲酸合酶及其结构域在此也由分离自根瘤农杆菌，(SEQ ID NOs：175或84-94)、玉米，(SEQ ID NOs：2，67，68，96，116或136)、芸香(SEQ ID NO：3)、鱼腥藻M22983、拟南芥(SEQ ID NO：45)、巴西固氮螺菌(SEQ ID NO：122)、马尔他布鲁氏菌(SEQ ID NO：123)、百脉根根瘤菌(SEQ ID NO：121)、念珠藻属PCC7120(SEQ ID NOs：124或125)、苜蓿中华根瘤菌、血色红假单胞菌(SEQID NO：126)、硫磺矿硫化叶菌、稻(SEQ ID NOs：94，95，119或120)、小麦(SEQID NO：97)、烟草(SEQ ID NO：98)、陆地棉(Gossypium hirsutum)(SEQ ID NOs：104或105)、大豆(Glycine max)(SEQ ID NOs：106，107，112或113)、大豆慢生根瘤菌(SEQ ID NO：127)、深红红螺菌(SEQ ID NO：128)、Thermobifidafusca(SEQ ID NO：129)或高粱(SEQ ID NOs：134或135)的邻氨基苯甲酸合酶的核酸例证说明。这些核苷酸序列从根瘤农杆菌(SEQ ID NOs：4，58-65，69或70)；玉米(SEQ ID NOs：5，66，101，118或137)和芸香(SEQ ID NO：6)，鱼腥藻M22983、巴西固氮螺菌(SEQ ID NO：78)、马尔他布鲁氏菌(SEQ ID NO：79)、百脉根根瘤菌(SEQ ID NO：77)、念珠藻属PCC7120(SEQ ID NOs：80或81)、苜蓿中华根瘤菌(SEQ ID NOs：7或43)、血色红假单胞菌(SEQ ID NOs：57或82)、硫磺矿硫化叶菌(SEQ ID NOs：8或44)、稻(SEQ ID NOs：99，100或117)、小麦(SEQ ID NO：102)、烟草(SEQ ID NO：103)、陆地棉(SEQ ID NOs：108或109)、大豆(SEQ ID NOs：110或111)、大豆慢生根瘤菌(SEQ ID NO：130)、深红红螺菌(SEQ ID NO：131)、Thermobifida fusca(SEQ ID NO：132)或高粱(SEQ IDNO：133)编码邻氨基苯甲酸合酶或其α-结构域或β结构域。

本发明也提供包括编码具有酶活性的根瘤农杆菌邻氨基苯甲酸合酶或其结构域的DNA序列的分离DNA分子。这种DNA分子可编码具有SEQ IDNOs：4，58-65，69或70的邻氨基苯甲酸合酶，具有邻氨基苯甲酸合酶活性的结构域或其变体。DNA分子也可具有包括SEQ ID NOs：1，75或84-93，或其结构域或变体的序列。在此所提供的任何DNA的编码区也可被优化，用于在所选择的生物体，例如所选择的植物或微生物中表达。具有用于所选择植物的优化密码子的DNA分子的实例是具有SEQ ID NO：75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。

本发明也提供包括编码玉米邻氨基苯甲酸合酶结构域的DNA序列的分离和纯化的DNA分子。这种DNA分子可编码具有SEQ ID NOs：5或66的邻氨基苯甲酸合酶结构域，或具有邻氨基苯甲酸合酶活性的其变体或衍生物。DNA分子也可具有包括SEQIDNOs：2，67，或68的序列，或其结构域或变体。

本发明进一步提供与包括SEQ ID NOs：1，75或84-94中的任何一个的互补DNA分子在严谨条件下杂交的，至少8个核苷酸的分离的DNA分子。这种DNA分子可以是探针或引物、例如具有SEQ ID NOs：9-42，47-56或138-143中任何一个的核酸。可选地，DNA可包括所选择的邻氨基苯甲酸合酶或其结构域的全部编码区。这种DNA也可包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体运输肽的DNA序列。本发明进一步涉及用于在植物和/或微生物中转化和表达这类DNA分子的载体。

与在此所明确描述的DNA序列和氨基酸序列显示50％、优选60％、更优选70％、更优选80％、最优选90％，例如95％-99％的序列同一性的，功能性的邻氨基苯甲酸合酶DNA序列和功能性的邻氨基苯甲酸合酶多肽也在本发明的范畴内。例如85％同一性，指当2个序列对比进行最大匹配时，85％的氨基酸是相同的。在最大化匹配中容许缺口(gap)(在任何一个待匹配的2个序列中)；5个或较少的间隙(gap)长度是优选的，而2个或更少是更优选的。

可选地和优选地，如在此所使用的术语，如果当利用具有突变数据矩阵以及6分或更大的缺口罚分的ALIGN程序时，它们具有大于5的序列对比积分(alignmentscore)(在标准偏差单位中)，则这2种多肽序列是同源的。参见Dayhoff，M.O.，″蛋白质序列和结构的图谱Atlas of Protein Sequence andStructure″，1972，第5卷，国家生物医学研究基金会，pp.101-110，以及该卷的增刊2，pp.1-10。更优选地当利用ALIGN程序进行优化序列对比时，如果它们的氨基酸大于或等于50％相同，则2个序列或其部分是同源的。本发明进一步提供用于产生具有高种子水平的色氨酸的转基因植物的载体，包括编码单体邻氨基苯甲酸合酶的分离DNA序列，其中包含连接有邻氨基苯甲酸合酶β-结构域和质体运输肽，并可操作地连接在植物细胞中有功能的启动子的邻氨基苯甲酸合酶α-结构域。这种单体的邻氨基苯甲酸合酶可例如是，根瘤农杆菌，苜蓿中华根瘤菌、百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌，深红红螺菌或Thermobifida fusca的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶也可来源于根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌、百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆慢生根瘤菌，深红红螺菌，Thermobifida fusca，高粱，大豆，稻，棉花，小麦，烟草，玉米或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因的邻氨基苯甲酸合酶α-和β-结构域的融合体。

提供增加水平的色氨酸的，分离和纯化的邻氨基苯甲酸合酶DNA的转化可在分子水平评估，例如，Southern或Northern印迹分析，基于PCR的方法学，邻氨基苯甲酸合酶的生物化学或免疫学检测，或通过表型分析，即，转化后代的细胞是否可在存在抑制未转化植物细胞生长的大量色氨酸的氨基酸类似物时生长。

本发明也提供在原核或真核宿主细胞，例如酵母、昆虫细胞或细菌中生产邻氨基苯甲酸合酶的方法，其可以是培养物，优选是商业规模的。该方法包括将包含编码邻氨基苯甲酸合酶或其结构域，例如单体邻氨基苯甲酸合酶，至少包括α和β邻氨基苯甲酸合酶的结构域，或其功能性变体的DNA片段的转化基因导入宿主细胞，并在宿主细胞中表达邻氨基苯甲酸合酶，以产生功能性的邻氨基苯甲酸合酶或其结构域的步骤。转化基因通常包括转录本和翻译调控元件，例如在真核或原核起源的宿主细胞中有功能的启动子。优选地，转基因被导入已知可用于生产重组蛋白质的，例如大肠杆菌的原核细胞，或例如酵母或昆虫细胞的真核细胞。培养转化细胞可导致增加色氨酸及其衍生物的生产，可从细胞或培养基中回收该产物。色氨酸的累积也可导致在微生物和植物中增加次级代谢产物的生产，例如包含吲哚的代谢产物，例如植物中的单个的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷(glucosinolates)。

对色氨酸不敏感的邻氨基苯甲酸合酶具有增加多种分支酸衍生代谢产物的潜能，包括来自由于色氨酸通过分支酸变位酶刺激苯基丙氨酸所合成的苯基丙氨酸。参见Siehl，D.来自植物氨基酸的分支酸的色氨酸、酪氨酸和苯丙氨酸的生物合成：生物化学和生物工艺学，(The biosynthesis of tryptophan， tyrosine and phenylalanine from chorismate in Plant Amino Acids：Biochemistryand Biotechnology)，ed.BK Singh，第171-204页。当反馈不敏感的邻氨基苯甲酸合酶存在时，可能增加的其他分支酸衍生的代谢产物包括，苯丙酮(phenylpropanoid)、类黄酮和异类黄酮，以及来源于邻氨基苯甲酸的代谢产物，例如吲哚、吲哚生物碱和吲哚异硫氰酸盐。许多化合物是重要的植物激素、植物防御化合物、各种健康状况的化学保护剂(chemopreventive agents)、和/或药物学活性的化合物。这些化合物的合成可能由于邻氨基苯甲酸合酶的表达而增加，其范围取决于表达邻氨基苯甲酸合酶的生物体。本发明涉及在多种原核和真核细胞或生物体，包括植物细胞、微生物、真菌、酵母、细菌、昆虫细胞和哺乳动物细胞中的色氨酸及其他有用化合物的合成。

因此，本发明提供用于生产色氨酸的方法，包括：在足够表达由该分离DNA编码的单体邻氨基苯甲酸合酶的条件下，培养包括分离的DNA的原核或真核的宿主细胞，其中单体的邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α结构域和邻氨基苯甲酸合酶β结构域，并且其中足够表达单体的邻氨基苯甲酸合酶的条件包括，宿主细胞足以利用单体的邻氨基苯甲酸合酶合成色氨酸的养分和前体。

可在多种宿主细胞和/或生物体中表达产生的有用化合物的实例包括，吲哚乙酸及其他生长素；对心血管健康重要的、存在于大豆中的异类黄酮化合物；在玉米中对食草昆虫的天敌起信号作用的挥发性的吲哚化合物；抗癌剂，例如在十字花科植物家族中发现的吲哚芥子油苷(吲哚-3-甲醇)；以及吲哚生物碱，例如由某些种属的真菌生产的麦角化合物。(Bames等人，Adv Exp MedBiol.，401：87(1996)；Frey等人，Proc Natl Acad.Sci.，97：14801(2000)；Muller等人，生物化学Biol.Chem.，381：679(2000)；Mantegani等人，Farmaco，54：288(1999)；Zeligs，医药食品杂志J Med Food，1：67(1998)；Mash等人，AnnNY Acad Sci.，844：274(1998)；Melanson等人，Proc Natl Acad.Sci.，94：13345(1997)；Broadbent等人，Curr Med Chem.，5：469(1998))。

本发明也提供在中度以及优选高严谨条件下，与编码邻氨基苯甲酸合酶的DNA分子的互补序列杂交的、至少7个核苷酸碱基的分离和纯化的DNA分子。这种分离和纯化的DNA分子包括编码邻氨基苯甲酸合酶或其结构域或突变体的新的DNA片段。突变的DNA可编码基本上抗游离L-色氨酸或色氨酸的氨基酸类似物抑制的邻氨基苯甲酸合酶。这种邻氨基苯甲酸合酶DNA分子可与例如，根瘤农杆菌、血色红假单胞菌或芸香的邻氨基苯甲酸合酶，或其α-结构域，包括其功能性的突变体杂交。当这些DNA分子编码功能性的邻氨基苯甲酸合酶或邻氨基苯甲酸合酶结构域时，它们定义为编码邻氨基苯甲酸合酶、邻氨基苯甲酸合酶结构域或其突变体的主要DNA分子的″变体″。较短的DNA分子或寡聚核苷酸可用作PCR扩增靶DNA序列的引物，或作为合成全长基因的中间产物。

也提供杂交探针，包括至少7个核苷酸碱基的新的分离和纯化的DNA片段，其被可检测地标记或结合可检测的标记物，该DNA片段在中度或优选高严谨条件下，与包括编码邻氨基苯甲酸合酶，例如编码单体的邻氨基苯甲酸合酶或其结构域，例如α-结构域，包括基本上抗色氨酸的氨基酸类似物抑制的、其功能性突变体的DNA片段的DNA分子的非编码链杂交。中度和严谨杂交条件是本领域已知的，参见，例如Sambrook等人，分子克隆：实验指南Molecular Cloning：A Laboratory Manual，第2版(1989)；也参见，Sambrook和Russell，分子克隆：实验室指南，第3版(2001年1月15日)的第0.47-9.51节。例如，严谨条件是(1)使用低离子强度和高温进行洗涤，例如，50℃，0.015M NaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，或(2)在杂交期间使用例如甲酰胺的变性剂，例如，在42℃，50％甲酰胺和0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/含750mM NaCl，75mM柠檬酸钠的50mM pH6.5的磷酸钠缓冲液。另一个使用的实例是，在42℃，50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声处理的鲑鱼精DNA(50μg/ml)，0.1％十二烷基磺酸钠SDS)，和10％葡聚糖硫酸酯，并在42℃，0.2×SSC和0.1％SDS中洗涤。

附图简述

图1是质粒pMON61600的限制性图谱。

图2表明根瘤农杆菌邻氨基苯甲酸合酶DNA序列(上面的序列)(SEQ IDNO：4)的翻译序列和苜蓿中华根瘤菌的邻氨基苯甲酸合酶DNA序列(下面的序列)(SEQ ID NO：7)的翻译序列。

图3是质粒pMON34692的限制性图谱。

图4是质粒pMON34697的限制性图谱。

图5是质粒pMON34705的限制性图谱。

图6A-B表明比较根瘤农杆菌α-结构域序列(SEQ ID NO：4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO：8)的邻氨基苯甲酸合酶氨基酸序列的序列对比。

图7A-B表明用于突变SEQ ID NO：1的34个引物的序列(SEQ ID NOs：9-42)。突变密码子是加下划线的，而变化的碱基是小写字体的。

图8表明质粒pMON13773的限制性图谱。

图9表明质粒pMON58044的限制性图谱。

图10表明质粒pMON53084的限制性图谱。

图11表明质粒pMON58045的限制性图谱。

图12表明质粒pMON58046的限制性图谱。

图13表明质粒pMON38207的限制性图谱。

图14表明质粒pMON58030的限制性图谱。

图15表明质粒pMON58006的限制性图谱。

图16表明质粒pMON58041的限制性图谱。

图17表明质粒pMON58028的限制性图谱。

图18表明质粒pMON58042的限制性图谱。

图19表明质粒pMON58029的限制性图谱。

图20表明质粒pMON58043的限制性图谱。

图21A-D表明具有SEQ ID NOs：4和43(分别来源于根瘤农杆菌和苜蓿中华根瘤菌)的单体″TrpEG″邻氨基苯甲酸合酶，与来自硫磺矿硫化叶菌(SEQID NO：44)和拟南芥(SEQ ID NO：45)的异四聚体邻氨基苯甲酸合酶的TrpE(α)和TrpG(β)结构域的多重序列对比。接头区域是加下划线的。

图22是质粒pMON52214的限制性图谱。

图23是质粒pMON53901的限制性图谱。

图24是质粒pMON39324的限制性图谱。

图25是质粒pMON39322的限制性图谱。

图26是质粒pMON39325的限制性图谱。

图27是表明用pMON39325转化的大豆种子中游离的色氨酸水平的图表。存在5个来自各事件的观察结果。NT表示非转基因的大豆种子。

图28是质粒pMON25997的限制性图谱。

图29是质粒pMON62000的限制性图谱。

图30表明大肠杆菌EMG2(K-12wt F+)的截短的trpE基因序列(SEQ IDNO：46)。该trpE核酸的最初30bp和最后的150bp通过EcoRI限制酶切位点连接。该trpG基因的开始部分紧随trpE的终止密码子。

图31图解表明大肠杆菌trpE基因中框内缺失的构建体。

图32A-C表明分离自根瘤农杆菌的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO：1)和氨基酸(SEQ ID NO：4)序列。

图33A-C表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO：2)序列。图33D表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的氨基酸(SEQ ID NO：5)序列。

图34是质粒pMON58120的限制性图谱。

图35A-E提供来自根瘤农杆菌(AgrTu_15889565)(SEQ ID NO：4)、苜蓿中华根瘤菌(RhiMe_136328)(SEQ ID NO：7)、百脉根根瘤菌(MesLo_13472468)(SEQ ID NO：77)、巴西固氮螺菌(AzoBr-1717765)(SEQ IDNO：78)、马尔他布鲁氏菌(BruMe_17986732)(SEQ ID NO：79)、念珠藻属(Nostoc_17227910)(SEQ ID NO：80)、念珠藻属(Nostoc_17230725)(SEQ IDNO：81)和血色红假单胞菌(RhoPa_TrpEG)(SEQ ID NO：82)的邻氨基苯甲酸合酶氨基酸序列的序列比较。

图36A-B提供用于根瘤农杆菌邻氨基苯甲酸合酶的优化核苷酸序列(SEQ ID NO：75)。

图37A-C提供野生型(上面的链)和优化的(下面的链)根瘤农杆菌邻氨基苯甲酸合酶核苷酸序列(SEQ ID NOs：1和75)的序列对比。这2个序列由中间的链证明是94％相同的。

图38是质粒pMON66877的限制性图谱。

图39是质粒pMON66878的限制性图谱。

图40是质粒pMON66879的限制性图谱。

图41是质粒pMON66595的限制性图谱。

图42是质粒pMON66599的限制性图谱。

图43是质粒pMON66598的限制性图谱。

图44是质粒pMON66596的限制性图谱。

图45是质粒pMON79951的限制性图谱。

图46是质粒pMON79955的限制性图谱。

图47是质粒pMON79956的限制性图谱。

图48是质粒pMON36524的限制性图谱。

图49是质粒pMON30167的限制性图谱。

发明详述

本发明提供分离的DNAs，载体，宿主细胞和含有编码能够在植物中表达高水平的色氨酸的邻氨基苯甲酸合酶的分离核酸的转基因植物。在一个实施方案中，分离的核酸编码单体邻氨基苯甲酸合酶(AS)。在另一个实施方案中，分离的核酸编码邻氨基苯甲酸合酶，或其结构域，其基本上抗游离的L-色氨酸或色氨酸的氨基酸类似物的抑制。邻氨基苯甲酸合酶或其结构域的表达，可以提高色氨酸例如种子中游离色氨酸的水平，而超过在缺乏这种表达的植物中的水平。

提供生产含有增强的邻氨基苯甲酸合酶活性的相关核酸的转基因植物的方法，和生产培养细胞，植物组织，植物，植物部分和产生高水平色氨酸的种子。这种转基因植物将产生高水平色氨酸的能力优先地性传递给其后代。也描述了产生编码突变邻氨基苯甲酸合酶的分离DNAs，和细胞培养物的筛选技术以挑选出过量表达色氨酸和/或对色氨酸类似物有抗性作用的新表型。例如，产生能够生产高水平色氨酸的大豆品系，制备和表征含有至少一种本发明的分离核酸的转基因大豆细胞，然后在植物中再生。其中一些分离的DNAs对色氨酸类似物的生长抑制有抗性作用。本发明也提供用于在双子叶植物，例如其他的豆类，以及例如谷粒的单子叶植物中产生升高的游离色氨酸水平的方法。

定义

如在此所用的，转化植物、植物组织、植物部分或植物细胞中的色氨酸的“改变”水平是相应于未转化的植物、植物组织、植物部分或植物细胞增强或减少的水平。

正如在此所用的“α-结构域”是结合分支酸和消除烯醇丙酮酸侧链的酶或酶复合物的一部分。TrpE基因编码这种α-结构域。在一些情况中，α-结构域是只具有结合分支酸和消除分支酸的烯醇丙酮酸侧链功能的单个多肽。在其他情况中，α-结构域是除了结合分支酸和消除分支酸的烯醇丙酮酸侧链外，还可执行其他酶功能的较大多肽的一部分。

术语“β-结构域”是指将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环的位置的酶或酶复合物的一部分。TrpG基因编码这种β-结构域。在一些情况中，β-结构域是只具有将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支环位置的功能的单个多肽。在其他情况中，β-结构域是除了将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环位置外，还可执行其他酶功能的较大多肽的一部分。

正如在此所用的，“色氨酸的氨基酸类似物”是指结构上与色氨酸相关的氨基酸，并且可以与野生型邻氨基苯甲酸合酶的色氨酸结合位点结合。这些类似物包括但不限于，6-甲基苯甲酸甲酯、5-甲基色氨酸、4-甲基色氨酸、5-氟色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚丙烯酸、3-甲基邻氨基苯甲酸等。

术语“基本上由...组成”与涉及出现的DNA分子、序列或片段一起使用，是指编码邻氨基苯甲酸合酶的DNA分子、序列或片段的主要部分。除非另有注明，DNA分子、序列或片段只编码邻氨基苯甲酸合酶。

在此使用的术语“互补”指能与参照的核苷酸序列的全部、或部分杂交的核酸链的序列。例如，核苷酸序列“TATAC”具有与参照序列5′-TATAC-3′100％的相同性，但也与参照序列5′-GTATA-3′100％互补。

正如在此所用的，“外源的”邻氨基苯甲酸合酶是由导入到宿主细胞中的分离DNA编码的邻氨基苯甲酸合酶，优选地与天然的未转化状态的细胞中的任何DNA序列都不相同。“内源的”或“天然的”邻氨基苯甲酸合酶是天然存在于宿主细胞或生物体内的邻氨基苯甲酸合酶。

正如在此所用的，植物细胞、植物组织、植物一部分或植物中游离L-色氨酸“增强的”或“升高的”水平与未转化的植物细胞、植物组织、植物部分或植物，即未由存在外源的邻氨基苯甲酸合酶核酸或其结构域而改变基因组的植物中的水平相比大约是2-200倍，优选为5-150倍，更优选为10-100倍。例如，在转化的植物种子中游离色氨酸的水平与未转化的植物种子(“起始材料”)相比较。

编码邻氨基苯甲酸合酶的DNA分子和编码运输肽的DNA分子或标记/报道基因是从天然来源中“分离的”，不再存在于其通常存在的细胞中。这样分离的DNA分子至少是部分制备或在体外操作的，例如，从其通常发现的细胞中分离，纯化和扩增。这样分离的DNA分子也可以是“重组的”，将其与外源DNA分子或片段结合。例如，重组的DNA可以是将分离的DNA可操作地连接外源启动子，或连接对宿主细胞来说是内源的启动子。

在此与邻氨基苯甲酸合酶相关使用的术语“单体”指两个或更多个邻氨基苯甲酸合酶结构域结合形成单个多肽链的功能形式。单体邻氨基苯甲酸合酶可在体内组装成二聚体形式。单体邻氨基苯甲酸合酶核酸和多肽可分离自各种生物体，例如根瘤农杆菌，鱼腥藻M22983，巴西固氮螺菌，马尔他布鲁氏菌，薄肌眼虫藻，百脉根根瘤菌，念珠藻属PCC7120或苜蓿中华根瘤菌。可选地，可将选自任何方便的单体或多聚体邻氨基苯甲酸合酶基因的结构域结合，构建单体邻氨基苯甲酸合酶的核酸和多肽。这种生物体包括，例如，根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。编码所选择区域的核酸可以重组连接。例如，编码α-结构域的C端的核酸可通过形成磷酸二酯键与编码β-结构域的N端的核酸连接。或者，这种多肽的单个结构域可化学连接。例如α-结构域C端通过形成肽键与β-结构域的N端相连，或者相反。

正如在此所用的，“天然的”基因指在体外没有改变，也就是说在体外没有突变的“野生型”基因。

术语“质体”值得是植物细胞器类型，包括造粉体，叶绿体，色质体，油质体，eoplast，黄化质体，白色体和前质体。这些细胞器可自我复制，含有通常称为“叶绿体基因组”的，根据植物的种类大小为大约120-大约217kb的环状DNA分子，其通常含有反向的重复区域。

正如在此所用的，“多肽”指除了分别具有氨基和羧基，而不用肽键连接的N端和C端外，通过肽键连接的所有氨基酸的连续链。多肽可以是任何长度的，并且可进行例如糖基化或磷酸化的翻译后修饰，。

正如在此所用的，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物，是在L-色氨酸类似物存在时与相应的野生型的邻氨基苯甲酸合酶相比，至少含有约10％多的邻氨基苯甲酸合酶活性的植物细胞，植物组织或植物。通常，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物可在一定数量的色氨酸的氨基酸类似物下生长，而该数量通常可抑制未转化的植物细胞，植物组织或植物的生长，这可通过本领域已知的方法确定。例如，用编码基本上抗或耐受色氨酸的氨基酸类似物的抑制的邻氨基苯甲酸合酶的DNA分子转化的，同型纯合回交转变的近交植物生长在一定数量的色氨酸的氨基酸类似物下，而该数量的类似物抑制相应的，即基本上等基因的轮回的近交植物的生长。

正如在此所用的，当耐受/抗性的和野生型的邻氨基苯甲酸合酶处于等量的色氨酸或色氨酸的氨基酸类似物时，“对色氨酸或色氨酸的氨基酸类似物的抑制有抗性或耐受的”邻氨基苯甲酸合酶保持比相应的野生型或天然易感的邻氨基苯甲酸合酶的活性高出大约10％多。优选地，抗性或耐受性的邻氨基苯甲酸合酶比相应于野生型的或天然易感型的邻氨基苯甲酸合酶，保持大于20％多的活性。

在此使用的涉及邻氨基苯甲酸合酶的术语“其结构域”包括全长邻氨基苯甲酸合酶的结构或功能性片段。结构区域包括邻氨基苯甲酸合酶内已鉴定的结构。结构区域的一个实例包括α螺旋，β折叠，活性位点，底物或抑制剂结合位点等。功能区域包括具有确定功能的邻氨基苯甲酸合酶的片段，例如色氨酸结合袋，活性位点或底物或抑制剂结合位点。邻氨基苯甲酸合酶的功能性结构域包括可催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸合酶部分。例如，α-结构域是由TrpE编码的区域，可将NH₃传递到分支酸上而形成氨基苯甲酸。β-结构域是由TrpG编码的区域，可除去谷氨酸的氨基而形成氨。因此，功能结构域包括邻氨基苯甲酸合酶的酶活性片段和结构域。也包括邻氨基苯甲酸合酶的突变结构域。用于制备突变结构域的野生型邻氨基苯甲酸合酶的核酸包括，例如，编码根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米的结构域的任何核酸，或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因，其可在编码区包含至少一个氨基酸的取代。突变或相连的、以形成具有增强的色氨酸生物合成活性，更好的稳定性，降低对色氨酸或其类似物的敏感性等的单体邻氨基苯甲酸合酶的结构域，是特别感兴趣的。

术语“5′UTR”指DNA上游未翻译的区域，或基因编码区的5′未翻译的区域。

术语“3′UTR”指DNA下游未翻译的区域，或基因编码区的3′未翻译的区域。

术语“基本上同源”指两个序列在序列上至少90％相同，其通过(Version10；Genetics Computer Group，Inc.，University of Wiconsin BiotechnologyCenter，Madison，WI)中所描述的BestFit程序，使用默认的参数进行测定。

序列相同性的百分数优选使用″Best Fit″或″Gap″序列分析软件包的程序(Version 10；Genetics Computer Group，Inc.，University of WisconsinBiotechnology Center，Madison，WI)测定。″Gap″使用Needleman和Wunsch(1970)算法，以发现两个序列的序列对比中最大的匹配数和最小的缺口(gap)。

″Best Fit″在两个序列间对相似性最好的片段进行优化的序列对比，并且利用Smith和Waterman(Smith and Waterman，1981；Smith等人，1983)的同源性算法插入缺口(gap)以最大化匹配的数目。优选使用默认参数的″Best Fit″程序测定同一性的百分数。在此使用的术语“可操作地连接”指启动子与编码区是以通过启动子来控制和调节编码区翻译的方式连接。可操作地连接启动子和编码区的方法是本领域已知的。

通用概念

本发明涉及用于获得产生升高水平的游离L-色氨酸的植物的新的核酸和方法。过量生产是由于导入和表达编码邻氨基苯甲酸合酶或其结构域的核酸。这种邻氨基苯甲酸合酶核酸包括邻氨基苯甲酸合酶的野生型或突变的α-结构域，或单体形式。邻氨基苯甲酸合酶的单体形式在单个多肽链上含有至少两个邻氨基苯甲酸合酶区域，例如，α-结构域连接β-结构域。

天然植物的邻氨基苯甲酸合酶通常对L-色氨酸和其类似物的抑制反馈敏感。这种抑制构成调控色氨酸合成途径的关键机制。因此，邻氨基苯甲酸合酶或其结构域是高度活性的、更加有效的或较少程度地受到色氨酸或其类似物的抑制，从而可能产生升高水平的色氨酸。根据本发明，根瘤农杆菌邻氨基苯甲酸合酶对于产生高水平的色氨酸特别有用。

为了在植物或所选择的宿主细胞中产生高水平色氨酸，分离所选择的邻氨基苯甲酸合酶核酸，并可在体外操作，以包括在植物细胞或其他细胞类型中基因表达所需的调控信号。因为报道植物中的色氨酸合成途径在质体中进行，可将外源邻氨基苯甲酸合酶的核酸导入质体中或通过加上编码质体运输肽的氨基末端的核酸片段进行修饰。这种质体运输肽可直接引导邻氨基苯甲酸合酶基因产物进入质体。在一些情况中邻氨基苯甲酸合酶已经含有质体运输序列，这样就没有必要增加片段了。

为了改变色氨酸的生物合成，编码邻氨基苯甲酸合酶活性的核酸必须导入植物细胞或其他宿主细胞，然后直接或间接地验证这些转化细胞。可使用完整的邻氨基苯甲酸合酶或其有用的部分或结构域。邻氨基苯甲酸合酶稳定地整合在植物细胞基因组上。控制邻氨基苯甲酸合酶表达的转录信号必须在植物细胞或其他宿主细胞内被识别并发挥作用。也就是说邻氨基苯甲酸合酶必须转录成信使RNA(mRNA)，而mRNA必须在植物细胞核中稳定、完整地运输到细胞质中翻译。邻氨基苯甲酸合酶mRNA必须含有可被植物细胞核糖体识别和合适翻译的合适的翻译信号。多肽基因产物必须基本上逃脱细胞质内蛋白水解的攻击，而被转运到正确的细胞内部分(例如，质体)，并且能够呈现赋予酶活性的三维构像。邻氨基苯甲酸合酶必须进一步能够在色氨酸和其衍生物的生物合成中发挥作用；也就是说，必须定位在催化生物合成中旁侧步骤的天然植物酶的附近(大概在质体中)，以获得所需要的底物并传递合适的产物。

即使满足所有的条件，色氨酸的成功过量产生也不是一个可以预料的事情。一些转基因的表达可能受到附近染色体元件的负影响，如果通过突变减少反馈抑制而获得高水平的色氨酸，存在其他的控制机制来补偿邻氨基苯甲酸合酶步骤减少的调控。可能有提高所蓄积氨基酸降解率的机制。色氨酸和相关氨基酸的过量表达的水平也不能对植物有毒性。最后，导入性状必须是稳定的和可以遗传的，以提供商业上的发展和使用。

编码邻氨基苯甲酸合酶的DNA的分离和鉴定

可通过标准的方法鉴定和分离编码邻氨基苯甲酸合酶的核酸，例如，如Sambrook等在“分子克隆：实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆：实验指南”，第三版(2001.1.15)中所描述的。例如，编码邻氨基苯甲酸合酶或其结构域的DNA序列可以通过筛选来源于特定细胞种类、细胞系、初级细胞或组织的核酸所产生的DNA或cDNA文库而鉴定。用于鉴定和分离邻氨基苯甲酸合酶的文库的实例包括，但不限于，来源于根瘤农杆菌菌株A348，玉米自交系B73(Stratagene，La Jolla，加利福尼亚，Cat. #937005，Clontech，Palo Alto，加利福尼亚，Cat.#FL1032a，#FL1032b，和FL1032n)的cDNA文库，来源于玉米自交系Mo17(Stratagene，Cat.#946102)的基因组文库，来源于玉米自交系B73(Clontech，Cat.#FL1032d)的基因组文库，来源于鱼腥藻M22983(例如，Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(GI17982357)，大肠杆菌，薄肌眼虫藻(Euglena gracilis)，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)，或其他种类的基因组DNA。而且，可采用分离自任何这些种类的基因组DNA，mRNA或cDNA，通过核酸扩增方法分离邻氨基苯甲酸合酶核酸。

筛选编码邻氨基苯甲酸合酶的全长或其部分序列的DNA片段可通过筛选与来源于从其他生物体的邻氨基苯甲酸合酶基因探针杂交的基因组或cDNA文库的噬菌斑，或筛选与特异性识别邻氨基苯甲酸合酶的抗体结合的cDNA表达文库的噬菌斑而实现。将与来自其他生物体的邻氨基苯甲酸合酶探针杂交的DNA片段和/或携带邻氨基苯甲酸合酶抗体免疫活性的DNA片段的噬菌斑亚克隆到载体中，并进行测序和/或作为探针用于鉴定编码所需要的邻氨基苯甲酸合酶基因的全长或部分的其他cDNA或基因组序列。用于筛选玉米或植物文库的优选cDNA探针可从质粒克隆pDPG600或pDPG602获得。

cDNA文库可例如，通过随机寡引物或寡dT引物引发制备。含有DNA片段的噬菌斑可以用特异于邻氨基苯甲酸合酶的探针或抗体筛选。将编码邻氨基苯甲酸合酶基因部分的DNA片段亚克隆，并测序，以及用作鉴定基因组邻氨基苯甲酸合酶基因的探针。编码细菌或植物邻氨基苯甲酸合酶的DNA片段可通过确定与其他已知的邻氨基苯甲酸合酶基因的同源性而验证，或通过与邻氨基苯甲酸合酶特异的信使RNA杂交而验证。一旦获得编码邻氨基苯甲酸合酶的5′，中间和3′端部分的cDNA片段，则可将其作为探针，从基因组文库中鉴定和克隆完整的邻氨基苯甲酸合酶基因的基因组拷贝。

对部分基因组拷贝或邻氨基苯甲酸合酶基因的拷贝测序，并通过标准方法鉴定基因的5′端，包括通过与其他邻氨基苯甲酸合酶基因的DNA序列同源或RNA酶保护分析，例如，Sambrook等在“分子克隆：实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆：实验指南”，第三版(2001.1.15)中所描述的。靶基因的3′和5′端可通过利用已知的AS编码区计算机搜索基因组序列数据库来定位。一旦鉴定基因的5′端，邻氨基苯甲酸合酶基因的完整拷贝可通过标准方法获得，包括克隆或利用与基因DNA序列的5′末端互补的寡核苷引物的聚合酶链式反应(PCR)。分离的邻氨基苯甲酸合酶基因的全长拷贝的存在可通过杂交，部分序列分析或通过表达玉米邻氨基苯甲酸合酶来验证。

本发明例证性分离的DNAs包括具有下面核苷酸SEQ ID NO的DNAs：

SEQ ID NO：1根瘤农杆菌(野生型)

SEQ ID NO：2玉米(野生型，α2)

SEQ ID NO：3芸香

SEQ ID NO：46大肠杆菌EMG2(K-12 wt F+)的截短的TrpE基因

SEQ ID NO：67玉米(C28突变)

SEQ ID NO：68玉米(C28+终止子)

SEQ ID NO：71叶绿体靶肽(g)

SEQ ID NO：73叶绿体靶肽(a)

SEQ ID NO：75根瘤农杆菌(优化的)

SEQ ID NO：76血色红假单胞菌

SEQ ID NO：83血色红假单胞菌(RhoPa_TrpEG)

SEQ ID NO：84根瘤农杆菌V48F突变体

SEQ ID NO：85根瘤农杆菌V48Y突变体

SEQ ID NO：86根瘤农杆菌S51F突变体

SEQ ID NO：87根瘤农杆菌S51C突变体

SEQ ID NO：88根瘤农杆菌N52F突变体

SEQ ID NO：89根瘤农杆菌P293A突变体

SEQ ID NO：90根瘤农杆菌P293G突变体

SEQ ID NO：91根瘤农杆菌F298W突变体

SEQ ID NO：92根瘤农杆菌S50K突变体

SEQ ID NO：93根瘤农杆菌F298A突变体

SEQ ID NO：94稻

SEQ ID NO：95稻的同功酶

SEQ ID NO：96玉米(Anderson的美国专利No.6,118,047)

SEQ ID NO：97小麦

SEQ ID NO：98烟草

SEQ ID NO：104陆地棉(Gossypium hirsutum)(α)

SEQ ID NO：105陆地棉(β)

SEQ ID NO：106大豆(Glycine max)(α)

SEQ ID NO：107大豆(β)

SEQ ID NO：112具有5′和3′UTRs的大豆(α)

SEQ ID NO：113具有5′和3′UTRs的大豆(β)

SEQ ID NO：116玉米(β)

SEQ ID NO：119稻(Oryza sativa)(β1)

SEQ ID NO：120稻(β2)

SEQ ID NO：121百脉根根瘤菌

SEQ ID NO：122巴西固氮螺菌

SEQ ID NO：123马尔他布鲁氏菌

SEQ ID NO：124念珠藻属

SEQ ID NO：125念珠藻属

SEQ ID NO：126血色红假单胞菌

SEQ ID NO：127大豆慢生根瘤菌

SEQ ID NO：128深红红螺菌

SEQ ID NO：129 Thermobifida fusca

SEQ ID NO：134高粱(Sorghum bicolor)(β1)

SEQ ID NO：135高粱(β2)

SEQ ID NO：136玉米(α1)

某些引物也可以用于实现本发明，例如具有SEQ ID NOs：9-42，47-56，或138-143的引物。

本发明也包括编码具有例如下述任何氨基酸序列的邻氨基苯甲酸合酶的任何分离核酸。

SEQ ID NO：4根瘤农杆菌(野生型)

SEQ ID NO：5玉米(野生型)

SEQ ID NO：6芸香

SEQ ID NO：7苜蓿中华根瘤菌

SEQ ID NO：8硫磺矿硫化叶菌

SEQ ID NO：43苜蓿中华根瘤菌

SEQ ID NO：44硫磺矿硫化叶菌

SEQ ID NO：45拟南芥

SEQ ID NO：57血色红假单胞菌

SEQ ID NO：58根瘤农杆菌V48F突变体

SEQ ID NO：59根瘤农杆菌V48Y突变体

SEQ ID NO：60根瘤农杆菌S51F突变体

SEQ ID NO：61根瘤农杆菌S51C突变体

SEQ ID NO：62根瘤农杆菌N52F突变体

SEQ ID NO：63根瘤农杆菌P293A突变体

SEQ ID NO：64根瘤农杆菌P293G突变体

SEQ ID NO：65根瘤农杆菌F298W突变体

SEQ ID NO：66玉米C28突变体

SEQ ID NO：69根瘤农杆菌S50K突变体

SEQ ID NO：70根瘤农杆菌F298A突变体

SEQ ID NO：74叶绿体靶肽(a)

SEQ ID NO：72叶绿体靶肽(g)

SEQ ID NO：77百脉根根瘤菌(MesLo_13472468)

SEQ ID NO：78巴西固氮螺菌(AzoBr_1717765)

SEQ ID NO：79马尔他布鲁氏菌(BruMe_17986732)

SEQ ID NO：80念珠藻属(Nostoc_17227910)

SEQ ID NO：81念珠藻属(Nostoc_17230725)

SEQ ID NO：82血色红假单胞菌RhoPa_TrpEG

SEQ ID NO：99稻

SEQ ID NO：100稻的同功酶

SEQ ID NO：101玉米(Anderson的美国专利No.6,118,047)

SEQ ID NO：102小麦

SEQ ID NO：103烟草

SEQ ID NO：108陆地棉(α)

SEQ ID NO：109陆地棉(β)

SEQ ID NO：110大豆(α)

SEQ ID NO：111大豆(β)

SEQ ID NO：114玉米(ASα2)叶绿体靶肽

SEQ ID NO：115玉米(ASα1)叶绿体靶肽

SEQ ID NO：117稻(β)

SEQ ID NO：118玉米(β)

SEQ ID NO：130大豆慢生根瘤菌

SEQ ID NO：131深红红螺菌

SEQ ID NO：132 Thermobifida fusca

SEQ ID NO：133高粱(β)

SEQ ID NO：137玉米(ASα1)

任何这些核酸和多肽以及其任何突变体，变异体或衍生物都可用于实现本发明。

单体的邻氨基苯甲酸合酶

根据本发明，来源于植物和非植物类的单体邻氨基苯甲酸合酶在植物中都有可以提供高水平色氨酸的功能。出乎意料的是非植物类来源的单体邻氨基苯甲酸合酶在植物中有很好的作用效果，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。例如，成功使用来源于如细菌，原生生物和微生物一样多样的物种的单体邻氨基苯甲酸合酶。特别是来源于下述细菌类的单体邻氨基苯甲酸合酶：根瘤农杆菌，苜蓿中华根瘤菌，百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌(Bradyrhizobium janonicum)，深红红螺菌，和Thermobidfida fusca，在植物中都有提供高水平色氨酸的功能，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。

包含例如野生型单体根瘤农杆菌邻氨基苯甲酸合酶的转基因植物可以在种子中产生高达约10,000-约12,000ppm的色氨酸，平均的trp水平为约7,000-约8,000ppm。非转基因大豆植物的种子中通常只能达到约100-约200ppm的色氨酸。比较含有添加突变的玉米α-结构域的转基因植物产生较低水平的色氨酸(例如，平均达到约3000-约4000ppm)。

单体酶相对于多聚酶具有一些优点。例如，虽然本发明并不仅限于特定的机制，单体酶可以提供更好的稳定性，协同表达等。当在体内合成异源的四聚体邻氨基苯甲酸合酶的结构域或亚基时，这些结构域/亚基必须在酶具有活性之前就适当地组装成异源四聚体形式。通过转基因方法在植物中增加单个的邻氨基苯甲酸合酶结构域不能提供过量产生的异源四聚体酶，因为没有足够的内源非转基因结构域来从实质上增强功能四聚体的水平。因此，编码单体邻氨基苯甲酸合酶的核酸、载体和酶可有利地用于过量产生邻氨基苯甲酸合酶的所有酶功能。

根据本发明，当在植物细胞、植物组织或种子中表达时，可融合或连接来源于天然产生异源四聚体邻氨基苯甲酸合酶的种属的邻氨基苯甲酸合酶结构域，以提供能产生高水平色氨酸的单体邻氨基苯甲酸合酶。例如，单体邻氨基苯甲酸合酶可通过融合或连接邻氨基苯甲酸合酶的α和β-结构域，以使得α-β融合体与天然单体的邻氨基苯甲酸合酶的序列排列比对而制备。单体和四聚体邻氨基苯甲酸合酶的序列排列的实例如图21和35所示。采用这种序列排列，可以调整邻氨基苯甲酸合酶结构域的间隔和定位或修饰，以从异源四聚体区域产生任选地与天然邻氨基苯甲酸合酶的排列比对的单体邻氨基苯甲酸合酶结构。这种融合蛋白可用于升高植物组织中的色氨酸水平。

异源四聚体邻氨基苯甲酸合酶，例如硫磺矿硫化叶菌邻氨基苯甲酸合酶(例如，Genbank登录号GI 1004323)，与其他植物或微生物的异源四聚体邻氨基苯甲酸合酶的同源性大约为30％-87％。单体邻氨基苯甲酸合酶，例如根瘤农杆菌邻氨基苯甲酸合酶与其他单体酶，例如苜蓿中华根瘤菌(Genbank登录号GI 15966140)和巴西固氮螺菌(Genbank登录号1717765)的同源性分别为大约83％和约52％。Bae等人，苜蓿中华根瘤菌邻氨基苯甲酸合酶基因：克隆，测序和在大肠杆菌中表达，细菌学杂志J.Bacteriol.，171：3471-3478(1989)；De Troch等人，分离和纯化巴西固氮螺菌trpE(G)基因，编码邻氨基苯甲酸合酶.Curr.Microbiol.，34：27-32(1997)。

然而，全序列与天然单体和天然四聚体邻氨基苯甲酸合酶的同源性可以小于30％。因此，不是计算机产生的排列而是视觉排列，以优化排列单体和四聚体的邻氨基苯甲酸合酶。邻氨基苯甲酸合酶内的界标(landmark)结构和序列有助于序列排列。例如，基序″LLES″是形成邻氨基苯甲酸合酶的色氨酸结合袋的β-夹层的β-折叠的一部分。这种界标序列可用于更加确信地排列差异的邻氨基苯甲酸合酶序列，特别是用于确定涉及色氨酸结合的关键残基。

为了实现邻氨基苯甲酸合酶结构域的融合或连接，所选择的TrpE或α-结构域的C末端与TrpG结构域或β-结构域的N末端连接。在一些方案中，可在结构域间使用接头肽，以提供合适的间隔和/或灵活性。通过单体和四聚体邻氨基苯甲酸合酶的序列对比来鉴定合适的接头序列。

例如通过杂交，PCR扩增或如Anderson等人在美国专利No.6,118,047中所描述的，克隆所选择的β-结构域。质体传递肽序列可通过标准方法与邻氨基苯甲酸合酶编码区连接。例如可以使用拟南芥小亚基(SSU)的叶绿体靶肽(CTP，SEQ ID NOs：71-74)。也参见Stark等人，科学Science，258：287(1992)。然后可将融合的基因插入在此所描述的用于转化植物的合适载体中。

邻氨基苯甲酸合酶的突变体

本发明所包括的突变的邻氨基苯甲酸合酶，可具有任何类型的突变，包括例如，氨基酸取代、缺失、和/或重排。这种突变体可以是邻氨基苯甲酸合酶核酸和在此所特异性鉴定的多肽的衍生物或变异体。突变的邻氨基苯甲酸合酶也可从任何可得到的种类中获得，包括没有在此明确鉴定的种类。突变体、衍生物和变异体可具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137序列中任何一个的氨基酸位点至少约30％的同一性，并且具有邻氨基苯甲酸合酶活性。在优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约50％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约60％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约70％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约80％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约90％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约95％的同一性，并且具有邻氨基苯甲酸合酶活性。

在一个实施方案中，邻氨基苯甲酸合酶突变体、变异体和衍生物可通过将SEQ ID NOs：1-3，9-42，46，47-56，67-68，75-76，83-98，104-107，112，113，116，119-129，134-136，和138-143，或其片段或引物中任何一个，在中等的或优选高严谨条件下与所选择的核酸源杂交来鉴定。杂交的中等或严谨条件在本领域是已知的，参见，例如Sambrook等人，分子克隆：实验指南，第二版(1989)的第0.47-9.51节；也参见Sambrook和Russell，“分子克隆：实验指南，第三版(2001.1.15)。例如，严谨条件是：(1)采用低离子强度和高温洗涤，例如0.015M NaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，于50℃，或(2)杂交过程中使用例如甲酰胺的变性试剂，例如，50％甲酰胺，0.1％小牛血清/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液pH 6.5和750mM NaCl，75mM柠檬酸钠，于42℃。另外一个实例是采用50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声的鲑精DNA(50μg/ml)，0.1％十二烷基硫酸钠(SDS)，和10％葡聚糖硫酸酯于42℃，和在42℃下用0.2×SSC和0.1％SDS洗涤。

本发明进一步提供杂交探针和包含至少7个核苷酸碱基的新分离和纯化的DNA片段的引物，其可被可检测地标记或结合可检测的标记。这种杂交探针或引物可在中等或高严谨条件下与编码邻氨基苯甲酸合酶的DNA分子的任何一条链杂交。这种杂交探针和引物的实例包括SEQ ID NOs：9-42，47-56，和138-143中的任何一个。

邻氨基苯甲酸合酶可以是任何邻氨基苯甲酸合酶，或其突变体或结构域，例如α-结构域。邻氨基苯甲酸合酶可以是单体邻氨基苯甲酸合酶。功能性的突变体是优先的，特别是那些能够在植物中产生高水平色氨酸的突变体，例如，对色氨酸的氨基酸类似物的抑制有基本抗性的突变体。

产生编码突变的邻氨基苯甲酸合酶的核酸可产生自任何方便的种类，例如，编码根瘤农杆菌，鱼腥藻M22983(例如Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(例如，Genbank登录号GI 17982357)，大肠杆菌，薄肌眼虫藻，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI 95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆慢生根瘤菌，深红红螺菌，Thermobifidafusca，Sorghum bicolor，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)的任何结构域，或编码邻氨基苯甲酸合酶亚基或区域的任何基因的核酸。

所需要的突变包括升高邻氨基苯甲酸合酶的活性，减少对色氨酸或其类似物的反馈抑制的敏感性，和/或在植物中产生升高量的色氨酸。这种突变在其显示的活性的水平或类型上具有功能性改变，并且有时被称为在此所提供的邻氨基苯甲酸合酶核酸和多肽的“衍生物”。

然而，本发明也包括邻氨基苯甲酸合酶变异体和带“沉默”突变的邻氨基苯甲酸合酶。正如在此所用的，沉默突变是一种改变邻氨基苯甲酸合酶核苷酸序列但并不改变邻氨基苯甲酸合酶编码的氨基酸序列的突变。突变核酸编码变异体邻氨基苯甲酸合酶，与相应的野生型邻氨基苯甲酸合酶相比，变异体具有一个或更多个氨基酸的改变但并没有从基本上改变它的活性。本发明指所有这种衍生物、变异体和带有沉默突变的邻氨基苯甲酸合酶核酸。

可通过几种方法获得编码对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变的邻氨基苯甲酸合酶的DNA。该方法包括但不限于：

1.培养物中的自发变异和直接的突变筛选；

2.任何细胞种类或组织，种子或植物的组织培养物中的直接或间接的突变方法；

3.通过下述方法突变所克隆的邻氨基苯甲酸合酶基因，例如通过化学突变；特异性点或定点诱变(Sambrook等人，在前引用的)，转位子介导的突变(Berg等人，生物技术Biotechnology，1：417(1983))，和缺失突变(Mitra等人，Molec.Gen.Genetic.，215：294(1989))；

4.在关键残基中设计合理的突变；以及

5.DNA移码以将感兴趣的突变整合到多种邻氨基苯甲酸合酶核酸中。

例如，可使用能够得到的邻氨基苯甲酸合酶蛋白的蛋白结构信息合理地设计可能具有增强的活性，或减少对色氨酸或色氨酸类似物敏感性的邻氨基苯甲酸合酶突变。这种蛋白结构信息是可以得到的，例如，从硫磺矿硫化叶菌(solfulobus solfataricus)邻氨基苯甲酸合酶(Knochel等人，Proc.Natl.Acad.Sci.(U.S.A.)，96：9479-9484(1999))。合理设计的突变可以通过对所选择的邻氨基苯甲酸合酶氨基酸与已知结构的，如硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现。参见附图6、21和35。通过结合结构信息和序列同源性的知识来预测邻氨基苯甲酸合酶蛋白的色氨酸结合和催化区域。例如，确定色氨酸结合袋的残基可作为突变的候选物来改变酶对色氨酸反馈抑制的抗性。使用这种结构信息，在涉及色氨酸结合的位点或区域，合理设计几种根瘤农杆菌邻氨基苯甲酸合酶的突变体。

使用这种序列和结构分析，与单体根瘤农杆菌邻氨基苯甲酸合酶在大约25-60或200-225或290-300或370-375位类似的区域，可在单体根瘤农杆菌邻氨基苯甲酸合酶中，作为产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变而鉴定出来。更具体地，与单体根瘤农杆菌邻氨基苯甲酸合酶中的P29，E30，S31，I32，S42，V43，V48，S50，S51，N52，N204，P205，M209，F210，G221，N292，P293，F298，和A373类似的氨基酸是产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变残基。本发明包括在这些位点的任何氨基酸的取代或插入。可选地，任何这些位点的氨基酸也可被缺失。

定点诱变可用于在各种位点产生氨基酸取代、缺失和插入。在根瘤农杆菌邻氨基苯甲酸合酶编码区内的具体突变实例包括下列：

在大约48位用Phe替换Val(见例如，SEQ ID NO：58)；

在大约48位用Tyr替换Val(见例如，SEQ ID NO：59)；

在大约51位用Phe替换Ser(见例如，SEQ ID NO：60)；

在大约51位用Cys替换Ser(见例如，SEQ ID NO：61)；

在大约52位用Phe替换Asn(见例如，SEQ ID NO：62)；

在大约293位用Ala替换Pro(见例如，SEQ ID NO：63)；

在大约293位用Gly替换Pro(见例如，SEQ ID NO：64)；或

在大约298位用Trp替换Phe(见例如，SEQ ID NO：65)。

通过对比待突变的邻氨基苯甲酸合酶的氨基酸序列和根瘤农杆菌邻氨基苯甲酸合酶的氨基酸序列，可在任何邻氨基苯甲酸合酶的类似位置产生相似的突变。可用于序列对比的根瘤农杆菌邻氨基苯甲酸合酶的一个实例是SEQ ID NO：4。

可通过经典的突变和遗传筛选鉴定有用的突变体。通过将酶暴露在游离的L-色氨酸或色氨酸的氨基酸类似物下，测定基因编码的酶的活性来检测功能性变化，或通过限制性酶切图谱或DNA序列分析检测DNA分子中的变化。

例如，编码基本上耐受5-甲基色氨酸(5-MT)的邻氨基苯甲酸合酶的基因可以从5-甲基色氨酸耐受细胞系中分离。见美国专利No.4,581,847，其所公开的内容在此引入作为参考。简而言之，使部分分化的植物细胞培养物生长，并暴露于连续低水平的5-甲基色氨酸进行继代培养。然后在几次继代培养的期间逐步增加5-甲基色氨酸的浓度。在通常有毒性的5-甲基色氨酸水平存在下生长的细胞或组织，在5-甲基色氨酸存在下重复地传代培养和表征。所培养细胞的耐受5-甲基色氨酸性特性的稳定性可通过使所选择的细胞系在不含5-甲基色氨酸时生长不同的时间段，然后将组织暴露于5-甲基色氨酸后分析其生长来评估。由于邻氨基苯甲酸合酶改变而具有耐受性优点的细胞系可通过在通常有毒性的，即生长抑制剂水平的5-甲基色氨酸下鉴定具有酶活性的细胞系而选择出来。

从5-MT-或6-甲基邻氨基苯甲酸(6-MA)-抗性的细胞系中克隆的邻氨基苯甲酸合酶基因可以用标准方法评估对5-MT，6-MA，或色氨酸的其他氨基酸类似物的耐受性，如美国专利No.4,581,847所描述的，其所公开的内容在此引入作为参考。

对5-甲基色氨酸抑制的敏感性降低的邻氨基苯甲酸合酶的细胞系可以用于分离5-甲基色氨酸-抗性的邻氨基苯甲酸合酶。可从耐受5-甲基色氨酸的细胞系产生DNA文库，并且编码邻氨基苯甲酸合酶基因的全长或部分DNA片段可通过与编码邻氨基苯甲酸合酶基因的cDNA探针杂交而鉴定。改变基因的完整拷贝可通过克隆和连接或利用合适引物的PCT获得。编码邻氨基苯甲酸合酶的改变基因的分离可在转化的植物细胞中通过测定表达的邻氨基苯甲酸合酶在通常有毒性的5-甲基色氨酸水平下是否保留酶活性而验证。见Anderson等人，美国专利号6,118,047。

可优化在此提供的任何DNA分子的编码区，用于在所选择的生物体中例如，所选择的植物或其他宿主细胞类型中表达。对于所选择的植物具有优化的密码子使用的DNA分子的实例是具有SEQ ID NO：75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。该优化的根瘤农杆菌邻氨基苯甲酸合酶DNA(SEQ ID NO：75)与SEQ ID NO：1有94％的同一性。

转基因和载体

一旦获得和扩增编码邻氨基苯甲酸合酶或其结构域的核酸，就可以可操作地与启动子，任选地与其他元件结合形成转基因。

大多数基因具有已知作为启动子并调控基因表达的DNA序列的区域。在真核和原核细胞中，通常在编码序列上游的DNA序列侧翼找到启动子区域。启动子序列提供对下游基因序列转录的调控，一般包括约50-约2,000个核苷酸碱基对。启动子序列也包含调控序列，例如可影响基因表达水平的增强子序列。一些分离的启动子序列可提供外源基因的基因表达，即不同于天然或同源基因的基因表达。已知启动子序列可以是强的或弱的或可诱导的。强启动子可以提供高水平的基因表达，而弱启动子提供低水平的基因表达。可诱导的启动子是对于外源所加的试剂或对于环境或发育的刺激可打开或关闭基因表达的启动子。启动子可以提供组织特异性或发育的调控。对于异源基因是强启动子的分离启动子是有利的，因为它提供足够水平的基因表达以便容易检测和筛选出转化细胞，在需要时提供高水平的基因表达。

可提供本发明的转基因中的启动子用于从编码邻氨基苯甲酸合酶的DNA序列表达邻氨基苯甲酸合酶。优选地，编码序列的表达导致植物组织，例如植物种子中色氨酸水平的增强。在另一个实施方案中，编码序列的表达导致对色氨酸的氨基酸类似物的反馈抑制或生长抑制的耐受性增强或导致细胞中色氨酸总量的增加。也可诱导启动子以使得基因表达可以在加入外源试剂时开放或关闭。例如，如Ptac启动子的细菌启动子可根据加入到转化的细菌细胞中的异硫丙基半乳糖苷的水平被诱导而改变基因表达的水平。也可优选结合具有提供在植物中组织特异性表达或发育地调控基因表达的启动子的基因。用于实现本发明的许多启动子对本领域技术人员来说是可获得的。

优选的启动子一般包括但不限于，在细菌、细菌噬菌体、质体或植物细胞中起作用的启动子。有用的启动子包括CaMV 35S启动子(Odell等人，自然Nature，313：810(1985))，CaMV 19S(Lawton等人，Plant Mol.Biol.，9：31F(1987))，nos(Ebert等人，Proc.Nat.Acad.Sci.(U.S.A.)，84：5745(1987))， Adh(Walker等人，Proc.Nat.Acad.Sci.(U.S.A.)，84：6624(1987))，蔗糖合酶(Yang等人，Proc.Nat.Acad.Sci.(U.S.A.)，87：4144(1990))，α-微管蛋白，napin，肌动蛋白(Wang等人，Mol.Cell.Biol.，12：3399(1992))，cab(Sullivan等人，Mol.Gen.Genet.，215：431(1989))，PEPCase启动子(Hudspeth等人，Plant Mol.Biol.，12：579(1989))，7S-α′-大豆伴球蛋白启动子(Beachy等人，EMBO J，4：3047(1985))或与R基因复合物相关的启动子(Chandler等人，The Plant Cell，1：1175(1989))。其他有用的启动子包括噬菌体SP6，T3，和T7启动子。

也可使用质体启动子。大多数的质体基因含有可用于多亚基质体编码的RNA聚合酶(PEP)以及单亚基核编码的RNA聚合酶的启动子。核编码的聚合酶(NEP)启动子的共有序列和几种天然质体基因的特异性启动子序列的列表可在Hajdukiewicz等人，EMBO J.，16：4041-4048，(1997)中找到，在此将其全部引入作为参考。

可使用的质体启动子的实例包括玉米质体RRN(ZMRRN)启动子。ZMRRN启动子在拟南芥质体RNA聚合酶存在时可驱使基因表达。可用于本发明的相似启动子有甘氨酸最大质体RRN(SOYRRN)和烟草(Nicotianatabacum)质体RRN(NTRRN)启动子。所有这三种启动子都可被拟南芥(Arabidopsis)质体RNA聚合酶识别。RRN启动子的普遍特征在Hajdukiewicz等人和美国专利6,218,145中有描述。

而且，来源于特定启动子的转录增强子或复制增强子也可用于增强表达。这种增强子的实例包括但不限于，来源于CaMV 35S启动子和章鱼氨酸(octopine)合酶基因(Last等人，美国专利5,290,924)的元件。例如，根据本发明可构建包括ocs增强子元件的载体。这个元件首次是从农杆菌属(Ellis等人，EMBO J.，6：3203(1987))的章鱼氨酸合酶(ocs)基因中确定的16bp回文(palindromic)增强子，并且存在至少10个其他的启动子(Bouchez等人，EMBOJ.，8：4197(1989))。当在单子叶植物转化中使用时，建议使用增强子元件，例如ocs元件和特别是多拷贝的元件，将有助于增强邻近启动子的转录水平。组织特异性启动子，包括但不限于，根细胞启动子(Conkling等人，PlantPhysiol.，93：1203(1990))，并且也包括特别有用的组织特异性增强子(Fromm等人，The Plant Cell，1：977(1989))，以及例如ABA-和膨压诱导的启动子等的可诱导的启动子。

转录起始位点和编码序列起始之间的DNA序列，即未翻译的前导序列可影响基因表达，也希望采用特定的前导序列。可采用本领域技术人员可获得的任何前导序列。优选的前导序列直接优化所连接基因的表达水平，例如，通过增强或维持mRNA的稳定性和/或防止不合适的翻译起始(Joshi，Nucl.Acid Res.，15：6643(1987))。本领域技术人员谨慎考虑选择这种序列。也可以考虑使用来源于在双子叶植物，特别是大豆中高表达基因的序列。

在一些情况下，不必要极端高表达邻氨基苯甲酸合酶或其结构域。例如，使用本发明的方法可产生这种高水平的邻氨基苯甲酸合酶，可产生的底物而不是酶可能限制色氨酸产生的水平。在这种时候，本领域的技术人员可采用更加适度或调控水平的表达。这样技术人员可容易地调节和调控表达的水平，例如，通过使用弱启动子或发育调控或组织特异性的启动子。

编码感兴趣的邻氨基苯甲酸合酶的核酸也包括质体运输肽(例如SEQ IDNOs：72，74，114，或115)，有助于运输邻氨基苯甲酸合酶多肽进入质体，例如，进入叶绿体。通常编码所选择的质体运输肽(例如，SEQ ID NOs：71或73)的核酸在框内与编码邻氨基苯甲酸合酶的序列连接。然而，质体运输肽也可位于邻氨基苯甲酸合酶的N末端或C末端。

构建体也包括感兴趣的核酸(例如编码邻氨基苯甲酸合酶的DNA)和作为转录终止信号和允许所得mRNA的多聚腺苷酸化的核酸序列。这种转录终止信号位于感兴趣的编码区的3′或下游。优选的转录终止信号包括来源于根瘤农杆菌胭脂氨酸合酶基因的转录终止信号(Bevan等人，Nucl.Acid Res.，11：369(1983))，来源于根瘤农杆菌章鱼氨酸(octopine)合酶的终止子，和马铃薯和番茄中编码蛋白酶抑制剂I和II的3′末端基因，尽管也可以使用其他本领域技术人员已知的转录终止信号。根据需要进一步包括调控元件，例如Adh内含子1(Callis等人，Genes Develop.，1：1183(1987))，蔗糖合酶内含子(Vasil等人，Plant Physiol.，91：5175(1989))或TMVω元件(Gallie等人，ThePlant Cell，1：301(1989))。可以根据An，Methods in Enzymology，153：292(1987)描述的方法获得这些3′非翻译的调控序列，或已经存在可从商业上，例如Clontech，(Palo Alto，加利福尼亚)获得的质体上。3′非翻译的调控序列可按标准方法可操作地与邻氨基苯甲酸合酶基因的3末端相连。本发明也可以使用其他本领域技术人员已知的调控元件。

DNA构建体可包含第一表达盒，包括，可操作地连接，异源启动子，编码邻氨基苯甲酸合酶α-结构域蛋白的DNA分子和转录终止子。这种DNA 构建体可进一步包含可操作连接的第二表达盒，其包括异源启动子，编码邻氨基苯甲酸合酶β-结构域蛋白的DNA分子和转录终止子。

在本发明中也使用可选择的标记基因或报道基因。这种基因可赋予表达标记基因的细胞明显的表型，这样可以在没有标记的细胞中区分出转化细胞。可选择的标记基因赋予一个可通过化学方法，即通过使用选择性试剂(例如，杀虫剂，抗生素等)进行“选择”的性状。报道基因或可筛选的基因赋予可通过观察或检测确定的性状，即通过“筛选”(例如，R-基因座性状)。当然，本领域已知许多合适标记基因的实例，都可用于实现本发明。

本发明中涉及使用的可选择标记包括但不限于，编码新霉素抗性的neo基因(Potrykus等人，Mol Gen.Genet.，199：183(1985))，可用卡那霉素，G418等选择；编码bialaphos抗性的bar基因；编码改变的DPSP合酶蛋白的基因(Hinchee等人，Biotech.，6：915(1988))可赋予草甘膦抗性；腈水解酶基因，例如来源于臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn，可赋予bromoxynil抗性(Stalker等人，Science，242：419(1988))；突变的乙酰乳酸合酶基因(ALS)可赋予咪唑啉酮、磺酰尿或其他ALS-抑制化学试剂(EP 154 204(1985))的抗性；氨甲喋呤抗性DHFR基因(Thillet等人，J.Biol.Chem.，263：12500(1988))；茅草枯(dalapon)脱卤素酶基因可赋予对杀虫剂茅草枯的抗性；或突变的邻氨基苯甲酸合酶基因可赋予对5-甲基色氨酸的抗性。使用突变的EPSP合酶基因时，通过整合合适的质体运输肽(CTP)可实现额外的益处。

能够在选择转化体的系统中使用的可选择标记基因的说明性的实施方案是编码phosphinothricin乙酰基转移酶的基因，例如来源于吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来源于绿色产色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利5,550,318，其在此引入作为参考)。Phosphinothricin乙酰基转移酶(PAT)使杀虫剂bialaphos，phosphinothricin(PPT)中的活性成分失活。PPT抑制谷氨酰胺合酶，(Murakami等人，Mol.Gen.Genet.，205：42(1986)；Twell等人，Plant Physiol.，91：1270(1989))导致氨的迅速积累和细胞死亡。

可使用的选择性标记包括但不限于，β-葡醛糖酸糖苷酶或uidA基因(GUS)，已知其编码各种发色底物的酶；R-基因座基因，其编码的产物调控植物组织中花色素苷色素(红色)的产量(Dellaporta等人，染色体结构和功能，第263-282页(1988))；β-内酰胺酶基因(Sutcliffe，Proc.Nat.Acad.Sci.(U.S.A.)， 75：3737(1978))，已知其编码各种发色底物的酶(例如，PADAC，生色的头孢菌素)；xylE基因(Zukowsky等人，Proc.Nat.Acad.Sci.(U.S.A.)，80：1101(1983))编码儿茶酚双加氧酶可转换生色的儿茶酚；α-淀粉酶基因(Ikuta等人，Biotech.，8：241(1990))；酪氨酸酶基因(Katz等人，J.Gen.Microbiol.，129：2703(1983))，其编码的酶可以氧化酪氨酸为DOPA和多巴醌，其依次可浓缩形成易检测的化合物黑色素；β-半乳糖苷酶基因，已知其编码各种发色底物的酶；萤光素酶(lux)基因(Ow等人，Science，234：856(1986))，其可用生物发光检测；或甚至是水母发光蛋白质基因(Prasher等人，Biochem.Biophys.Res.Comm.，126：1259(1985))，它可用于钙敏感的生物发光检测，或绿色荧光蛋白基因(Niedz等人，Plant Cell Reports，14：403(1995))。转化细胞中lux基因的存在可使用例如X射线胶片，闪烁计数，荧光分光光度测定法，低光视频照相机，光子计数照相机，或多维发光仪(multiwell luminometry)检测。预想也可发展这个系统以用于生物发光的群体筛选，例如在组织培养平板上，或甚至在整个植株中筛选。

另外，也可构建转基因，用于提供将基因产物导向植物细胞内的胞内部分或指导蛋白进入胞外环境。这通常通过连接编码运输或信号肽的DNA序列和编码特定基因的序列而实现。所得的运输或信号肽将分别把蛋白运输到特定的细胞内或细胞外的目的地，并且可在翻译后除去。运输或信号肽有助于运输蛋白通过细胞内的膜，例如，液泡、小泡、质体和线粒体膜，而信号肽指导蛋白通过胞外膜。通过协助蛋白进入细胞内或细胞外的区室，这些序列增强了基因产物的积累。

这种用法的特定实例是关于指导邻氨基苯甲酸合酶进入，例如质体而非细胞质的特定的细胞器。使用拟南芥SSU 1A运输肽赋予蛋白特异性导向质体作为例证性说明。可选地，转基因也可包括编码质体运输肽的DNA序列或编码rbcS(RuBISCO)运输肽的DNA序列，其可操作地连接启动子和编码邻氨基苯甲酸合酶的DNA序列。(关于质体导向肽的综述，见Heijne等人，Eur.J.Biochem.，180：535(1989)；Keegstra等人，Ann.Rev.Plant Physiol.PlantMol.Biol.，40：471(1989))。如果转基因被导入植物细胞，转基因也可包含植物转录终止和多聚腺苷酸化信号和翻译信号，以及连接植物邻氨基苯甲酸合酶基因的3′末端的翻译信号。

可以使用外源质体运输肽，其不在天然的植物邻氨基苯甲酸合酶基因内被编码。质体运输肽一般长度为40-70个氨基酸，功能是翻译后指导蛋白进入质体。运输肽在进入质体产生成熟蛋白的过程中或之后切除。编码植物邻氨基苯甲酸合酶的基因的完整拷贝含有质体运输肽。那种情况下，就没必要将外源获得的质体运输肽序列结合到转基因中。

可以从各种植物核基因中获得外源运输肽编码序列，只要基因的产物表达为含有氨基端运输肽的前蛋白并运输到质体中。已知的植物基因产物的实例包括这种运输肽序列，包括但不限于，核酮糖二磷酸羧化酶的小亚基，叶绿素a/b结合蛋白，由核基因编码的质体核糖体蛋白，某些热休克蛋白，氨基酸生物合酶，例如乙酰乳酸合酶，3-烯醇丙酮磷酸莽草盐(3-enolpyruvylphosphos hikimate)合酶，二氢吡啶二羧酸合酶，邻氨基苯甲酸合酶等的氨基酸。在一些情况中，质体运输肽蛋白可能在感兴趣的邻氨基苯甲酸合酶基因中编码，其中就不必要添加这种质体运输序列。可选地，编码运输肽的DNA片段可从例如上面所列出的运输肽的已知序列整个地或部分地化学合成，。

不管编码运输肽的DNA片段的来源，它必须包括例如ATG密码子的翻译起始密码子，和表达在宿主植物的质体中可识别的和发挥合适作用的氨基酸序列。也必须关注运输肽和邻氨基苯甲酸合酶之间连接的氨基酸序列，其可切除产生成熟的酶。已经鉴别了一些保守的氨基酸序列，并可作为指导路线。运输肽编码序列和邻氨基苯甲酸合酶编码序列的精确融合可能需要处理一个或两个DNA序列以引入，例如方便的限制性酶切位点。这可通过定点突变，化学合成的寡核苷接头的插入等方法实现。

编码质体运输肽的核酸的精确融合是不必要的，只要编码质体运输肽的序列在编码邻氨基苯甲酸合酶的序列框内。例如，经常可以包括附加的肽或氨基酸而对感兴趣的蛋白的表达或定位无反作用。

一旦获得质体运输肽序列，可适宜地与启动子和邻氨基苯甲酸合酶编码区根据标准方法在转基因中连接。可构建在植物细胞中起作用和在下游具有多克隆位点的质粒或从商业来源获得。采用限制性酶将质体运输肽序列插入启动子的下游。邻氨基苯甲酸合酶的编码区可在翻译后融合或立即插入质体运输肽序列的3′末端的下游和框架内。因此，质体运输肽优先与邻氨基苯甲酸合酶的氨基端连接。一旦形成，将转基因亚克隆到其他的质粒或载体中。

除了核植物转化以外，本发明也提供植物质体基因组的转化。因此，将基因产物导向植物细胞内的胞内区室，可通过指导基因进入胞内部分获得。质体基因组的直接转化比核转化更好。例如，直接的质体转化邻氨基苯甲酸合酶相对于核转化消除了对质体靶肽和翻译后的运输以及前体蛋白的处理过程的需要。在P.Maliga，Current Opinion in Plant Biology，5：164-172(2002)，P.B.Heifetz，Biochimie，82：655-666(2000)，R.Bock.，J.Mol.Biol.，312：425-438(2001)，和H.Daniell等人，Trends in Plant Science，7：84-91(2002)中描述了植物的质体转化，在此作为参考。

构建了含有邻氨基苯甲酸合酶基因的转基因后，将盒导入植物细胞中。根据植物细胞的类型，基因表达的水平和基因编码酶的活性，将编码邻氨基苯甲酸合酶的DNA导入植物细胞可导致色氨酸的过量产生，赋予对色氨酸的氨基酸类似物，例如5-甲基色氨酸或6-甲基邻氨基苯甲酸的耐受性，和/或另外改变植物细胞中的色氨酸含量。

宿主细胞的转化

将包含邻氨基苯甲酸合酶基因的转基因亚克隆到已知的表达载体中，检测和/或定量AS的表达。这种筛选方法对于鉴定提供邻氨基苯甲酸合酶基因的表达的转基因，和邻氨基苯甲酸合酶在转化植物细胞的质体中的表达是有用的。

质粒载体包括附加的DNA序列，其提供简便的筛选，扩增和在原核和真核细胞中转化转基因，例如，pUC-衍生载体，pSK-衍生载体，pGEM-衍生载体，pSP-衍生载体，或pBS-衍生载体。附加的DNA序列包括提供载体自我复制的复制原点，可选择的标记基因，优选编码抗生素或杀虫剂抗性，提供多位点以便在转基因中插入DNA序列或编码的基因的独特的多克隆位点，以及增强原核和真核细胞转化的序列。

可用于植物和原核细胞中表达的另外的载体是二元的Ti质粒(如在Schilperoort等人，美国专利4,940,838中所公开的)，以载体pGA582例证说明。二元的Ti质粒已经被在前引用的An鉴定。二元的Ti质粒可在原核细菌，例如大肠杆菌和农杆菌中复制。农杆菌质粒载体可用于传递转基因进入植物细胞中。二元的Ti载体优选包括提供有效的植物细胞转化的胭脂氨酸TDNA的左右边界，可选择标记基因，T边界区独特的多克隆位点，colE1复制原点和野生型宿主区域的复制子。携带本发明的转基因的二元Ti载体可用于原核和真核细胞的转化，但优选用于转化植物细胞。参见例如，Glassman 等人，美国专利5,258,300。

通过适用的方法将表达载体导入原核或真核细胞。对于单子叶和双子叶植物特别有效的转化方法，包括但不限于，微粒轰击未成熟胚胎(美国专利5,990,390)或II型胚胎发生的愈伤组织细胞，如W.J.Gordon-Kamm等人(Plant Cell，2：603(1990))，M.E.Fromm等人(Bio/Technology，8：833(1990))和D.A.Walters等人(Plant Molecular Biology，18：189(1992))所描述的，或电穿孔I型胚胎发生的愈伤组织，如D′Halluin等人(The Plant Cell，4：1495(1992))，或Krzyzek(美国专利5,384,253)所描述的。通过与DNA包被的钨须漩涡转化植物细胞(Coffee等人，美国专利5,302,523)和使用含有DNA的脂质体转化细胞。

所选择的邻氨基苯甲酸合酶构建体转化细胞后，宿主细胞可用于由转基因的邻氨基苯甲酸合酶结合宿主酶促机制产生有用产物的生产。培养转化细胞导致升高的色氨酸产量和其他有用的化合物，其可以从细胞或培养基中获得。在各种宿主细胞和/或生物体中表达产生的有用化合物的实例，包括色氨酸，吲哚乙酸和其他植物激素，在大豆中发现的对心血管健康很重要的异类黄酮化合物，玉米中作为食草昆虫天敌的信号的挥发性吲哚，抗癌剂，例如十字花科(cruciferae)植物家族中的吲哚芥子油苷(glucosinolate)(吲哚-3-甲醇)，和吲哚生物碱，例如某些真菌产生的麦角化合物。(Bames等人，Adv ExpMed Biol，401：87(1996)；Frey等人，Proc Natl Acad.Sci.，97：14801(2000)；Muller等人，Biol.Chem.，381：679(2000)；Mantegani等人，Farmaco，54：288(1999)；Zeligs，J Med Food，1：67(1998)；Mash等人，Ann NY Acad Sci.，844：274(1998)；Melanson等人，Proc Natl Acad.Sci.，94：13345(1997)；Broadbent等人，Curr Med Chem.，5：469(1998))。

色氨酸的积累导致微生物和植物中次级代谢产物增加，例如，含有例如植物中简单的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷的代谢产物的吲哚。

对色氨酸不敏感的邻氨基苯甲酸合酶有可能由于色氨酸经分支酸变位酶刺激合成苯基丙氨酸，而增加各种分支酸衍生的代谢物，包括那些衍生自苯基丙氨酸的代谢物。参见Siehl，D.来自分支酸的色氨酸、酪氨酸和苯基丙氨酸的生物合成，″植物氨基酸：生物化学和生物技术″，BK Singh编辑，第171-204页。当存在反馈不敏感的邻氨基苯甲酸合酶时，其他分支酸衍生的代谢物可能增加，包括苯丙醇，类黄酮和异类黄酮，以及衍生自邻氨基苯甲酸的代谢物，例如吲哚，吲哚生物碱和吲哚芥子油苷。这些化合物中的许多种是重要的植物激素，植物防御化合物，各种健康状态的化学防护试剂，和/或药物活性的化合物。

由于邻氨基苯甲酸合酶的表达而增强合成的这些化合物的范围依赖于表达邻氨基苯甲酸合酶的生物体。本领域的技术人员可轻易地评估哪种和/或测定生物体和宿主细胞可用于产生所需要的化合物。本发明也包括在各种生物体，包括植物，微生物，真菌，酵母，细菌，昆虫细胞和哺乳动物细胞中合成色氨酸和其他有用的化合物。

筛选色氨酸过量产生的细胞系的策略

利用组织培养技术对所需要的色氨酸类似物抗性，色氨酸过量产生的变异体的有效筛选，需要仔细的确定筛选的条件。优化这些条件以容许在培养物中生长和积累色氨酸类似物抗性的、色氨酸过量产生的细胞，同时抑制大量细胞群的生长。由于个体细胞在种群中的存活力高度依赖于邻近细胞的存活力，这使得情况变得复杂。

通过化合物与组织相互作用的特征确定细胞培养物暴露于色氨酸类似物下的状况。要考虑例如毒性的程度和抑制的速率这类因素。培养物中细胞化合物的积累，培养基和细胞中化合物的持续和稳定，都需要同吸收和传递给所需要的细胞部分的程度一起考虑。可选地，测定加入色氨酸是否逆转化合物的作用也很重要。

要仔细评价类似物对于培养物的存活力和形态学的影响。特别重要的是选择对培养的植物再生能力没有影响的暴露于类似物的条件。对类似物暴露条件的选择也受到类似物是否杀死细胞或只是抑制细胞分化的影响。

筛选方案的选择依赖于上面提到的考虑因素。下面简要描述的方案可用于筛选过程。例如，为了选择对色氨酸类似物的生长抑制有抗性的细胞，将在培养物的悬浮液中很好分化的细胞在短时间内暴露在高水平的色氨酸类似物下。回收和蓄积存活的细胞，并随后再暴露更长时间。可选地，有组织的部分分化的细胞培养物伴随连续的暴露在最初低水平的色氨酸类似物下生长和传代培养。经过几次传代培养间隔后浓度逐渐增加。在筛选过程中使用这些方案时，本发明并不仅限于这些过程。

植物修饰的基因

如上所描述的，在本发明的转基因，载体和植物中，作为可选择的标记基因和报道基因的基因可操作地与编码邻氨基苯甲酸合酶或其结构域的DNA序列连接。另外，可以将其他农艺学的性状加到本发明的转基因，载体和植物中。这些性状包括但不限于，昆虫抗性或耐受性；疾病抗性或耐受性(病毒，细菌，真菌，线虫类)；胁迫抗性或耐受性，例证说明的有抗或耐受干旱，热，冷，冰冻，过量潮湿，盐胁迫，氧化胁迫，增加的产量，食物含量和组成，物理表现，雄性不育，干燥，群从能力(standability)，繁殖力，淀粉特性，油的数量和质量等。可整合一个或多个赋予本发明的植物这些性状的基因。

昆虫抗性或耐受性

苏云金芽孢杆菌(Bacillus thuringiensis或″Bt″)包括近20种已知亚类的细菌，其产生的内毒素多肽被多种昆虫摄入时是有毒的。内毒素蛋白(Bt蛋白)和相应的基因(Bt基因)的生物学和分子生物学在H.R.Whitely等人，Ann.Rev.Microbiol.，40：549(1986)和H.Hofte等人，Microbiol.Rev.，53：242(1989)中有评述。已经克隆和测序了各种Bt蛋白的编码基因。Bt多肽的片段对于各种鳞翅目(Lepidoptera)害虫的毒性是本质上的，并占大约Bt多肽分子首要(first)的50％。因此，截短的Bt基因编码的截短的Bt多肽在多数时候保留了对多种鳞翅目昆虫的毒性。例如HD73和HD1 Bt多肽显示对美国植物中的重要鳞翅类害虫幼虫的毒性，例如欧洲玉米螟(borer)，切根虫(cut worms)和螟蛉(earworms)。M.Geiser等人，Gene，48：109(1986)和M.J.Adang等人，Gene，36：289(1985)各自克隆和测序了编码HD73和HD1 Bt多肽的编码基因，其可从采用标准方法收集的培养物(例如，Bacillus Genetic Stock Center，Columbus，OH or USDA Bt stock collection Peoria，IL)中获得的HD73和HD1菌株中克隆。例如在美国专利6,329,574；6,303,364；6,320,100和6,331,655中描述了Bt基因和多肽。

编码新的、以前未表征的Bt毒素的DNA可从宿主芽孢杆菌(Bacillus)生物体中采用以前克隆Bt基因的步骤克隆得到，也可以产生Bt毒素的新的合成形式。

用于本发明的Bt基因包括5′DNA序列，其含有在植物中允许下游的Bt序列转录和翻译起始的DNA序列。Bt基因也包含3′DNA序列，它包括来源于可在感兴趣植物中表达的基因的3′非编码区的序列。Bt基因也包括编码苏云金芽孢杆菌产生的毒性Bt多肽或其毒性部分或具有的基本氨基序列的同源物的DNA序列。Bt编码序列可包括：(i)编码与Bt内毒素基本上同源的杀虫剂蛋白的DNA序列，它对感兴趣植物的有害昆虫有活性，例如HD73或HD1 Bt序列；(ii)编码Bt内毒素多肽的杀虫剂活性的片段的序列，例如杀虫剂活性的HD73或HD1多肽的从羧基和/或氨基端截短的形式；和/或(iii)在框内与编码提供附加优点的多肽融合的截短的Bt序列，所附加的优点例如：(a)可选择的基因，例如，赋予抗生素或杀虫剂抗性的基因，(b)其产物易检测和分析的报道基因，例如，荧光蛋白或β-葡萄糖苷酶；(c)编码具有一些附加用途的多肽序列的DNA序列，该附加用途是稳定Bt蛋白不被降解或增强Bt蛋白对昆虫的有效性，例如蛋白酶抑制剂；和(d)协助指导Bt蛋白进入植物细胞特定的部分内或外的序列，例如信号序列。

为了在植物中获得Bt蛋白的优化合成，也可以适当调节Bt基因的DNA序列，使基因在感兴趣的植物中更加有效的表达。由于Bt基因的密码子使用与感兴趣植物中表达的基因所使用的不同，可以通过使用在植物中，例如经常在感兴趣的植物中使用的(见E.Murray等人，Nucl Acids Res.，17：477(1989))更加有效表达的密码子来取代这些密码子而增加Bt基因在植物细胞中的表达。这种密码子取代需要取代碱基但不改变最终Bt多肽的序列。Bt多肽序列可与细菌基因或其片段相同。含有比原始细菌的基因更加优选的密码子的完整的Bt编码序列或其部分，可通过采用标准的化学合成方法合成，并且采用标准方法导入或组装Bt基因，例如定点突变或DNA聚合和连接等。

蛋白酶抑制剂可提供昆虫抗性。例如，使用来源于马铃薯或番茄的蛋白酶抑制剂II基因，pinII是非常有用的。组合使用pinII基因和Bt毒素基因也是有好处的。编码昆虫消化系统抑制剂的其他基因，或编码酶或有助于抑制剂产生的辅助因子的基因也很有用。这包括例如来源于小麦和大麦的水稻半胱氨酸蛋白酶(oryzacystatin)抑制剂和淀粉酶抑制剂。

编码凝集素的基因可赋予附加的或备选的杀虫剂特性。(Murdock等，Phytochemistry，2985(1990)；Czapla和Lang，J.Econ.Entomol.，83：2480(1990)。也包括有用的外源凝集素基因，例如，大麦和小麦的胚凝集素(WGA)以及稻的外源凝集素(Gatehouse等人，J Sci Food Agric.，35：373(1984))。

当被导入有害昆虫时，控制针对昆虫的大的或小的活性多肽，例如溶解酶的肽，肽激素和毒素和毒液的产量的基因都是很有用的。例如，保幼激素酯酶的表达直接导向特异性的有害昆虫，也可导致杀虫剂活性，或可导致变态的停止(Hammock等人，Nature，344：458(1990))。

表达编码影响昆虫外皮(cutide)完整性的基因的转基因植物也是有用的。这些基因包括编码几丁质酶，蛋白酶，脂肪酶和产生三国霉素的基因。编码影响昆虫蜕皮活性的基因，如影响蜕皮素UDP-葡萄糖基转移酶产量的基因也是有用的。

编码促进减少植物对有害昆虫的营养品质的化合物的生产的酶的基因也是有用的。通过改变固醇成分可例如赋予植物杀虫剂活性。本发明进一步的实施方案涉及具有增强的脂肪氧化酶活性的转基因植物。

本发明也提供用于改变次级代谢物的方法和化合物。一个实例涉及改变植物产生DIMBOA，预期其可赋予对欧洲玉米螟，根虫和几种其他有害昆虫的抗性。参见例如，美国专利6,331,880。DIMBOA来源于吲哚相关的化合物。本发明提供的方法用于增强植物细胞和组织内类似色氨酸的吲哚相关地化合物含量。因此，根据本发明在此提供的方法也可增加DIMBOA的水平，因而增强对昆虫的抗性。

导入调控玉米可凝性球蛋白(maysin)产生的基因和涉及高粱中蜀黍苷产生的基因，都可分别用于促进对有害幼虫(earworm)和根虫的抗性。

也可使用编码具有潜在的杀虫剂活性的蛋白的更多基因。这种基因包括，例如，可用作根虫抑制剂的豇豆胰蛋白酶抑制剂(CpTI；Hilder等人，Nature，330：160(1987))；证实可用于玉米根虫抑制剂(deterrent)的编码除虫菌素的基因(除虫菌素和阿巴美丁(Abamectin)，Campbell，W.C.，编辑.，1989；Ikeda等人，J Bacteriol，169：5615 1987)；核糖体灭活蛋白基因；和调控植物结构的基因。转基因植物包括抗昆虫抗体基因和编码可将植物外用为非毒性杀虫剂(前杀虫剂)转化为植物内杀虫剂的酶的基因。

环境或胁迫抗性或耐受性

可通过基因的表达影响植物对各种环境胁迫的耐受能力的提高。例如，对霜冻温度的增强抗性可通过导入“抗冻”蛋白，例如美洲拟鲽(WinterFlounder)(Cutler等人，J Plant Physiol.，135：351(1989))或合成其基因衍生物而赋予。改善质体中甘油-3-磷酸乙酰基转移酶的表达可赋予增强的耐寒性(Wolter等人，The EMBO J.，11：4685(1992))。超氧化物歧化酶的表达可赋予对氧化胁迫的抗性(Gupta等人，Proc.Natl.Acad.Sci(U.S.A.)，90：1629(1993))，谷胱甘肽还原酶可改善对氧化胁迫的抗性(Bowler等人，Ann Rev.Plant Physiol.，43：83(1992))。

预期影响植物的含水量，总的水压，渗透压和膨压的基因的表达增强植物对干旱的耐受性，并因此将是有用的。建议使用例如，编码用于渗透压活性溶质的生物合成的基因的表达可赋予抗干旱的保护。这类基因中有编码甘露醇脱氢酶(Lee和Saier，J.Bacteriol.，258，10761(1982))和海藻糖-6-磷酸合酶(Kaasen等人，J.Bacteriology，174：889(1992))的基因。

类似地，其他代谢产物也可保护酶的功能或膜的完整性(Loomis等人，J.Expt.Zoology，252：9(1989))，因此编码用于这些化合物的生物合成的基因可赋予以类似或补充甘露醇的方式的干旱抗性。天然产生的其他代谢物的实例是渗透压活性的，和/或在干旱和/或脱水过程中提供一些直接保护作用的，包括果糖，赤藓糖醇，山梨醇，卫矛醇，葡糖基甘油，蔗糖，水苏糖，棉子糖，脯氨酸，甘氨酸，甜菜碱，ononitol和松醇。参见例如，美国专利6,281,411。

根据结构的相似性可分为三种后期胚胎发生蛋白(见Dure等人，PlantMolecular Biology，12：475(1989))。所有三种LEA组的结构基因的表达可赋予干旱耐受性。水胁迫过程中诱导的其他类型的蛋白可能是有用的，包括硫醇蛋白酶，醛缩酶和跨膜运输蛋白，在干旱胁迫中其可赋予各种保护性和/或修复功能。参见例如，PCT/CA99/00219(Na+/H+交换多肽基因)。影响脂质生物合成的基因也可用于赋予干旱抗性。

涉及特异的形态学性状，容许从干燥的土壤中增强水的提取的基因表达也是有用的。在胁迫过程中增强复制适应性的基因表达也是有用的。建议在胁迫过程中最小化核发育不全的基因表达将提高所收获的谷物的数量，因此是有价值的。

即使当土壤中的水不受限制时，通过导入和表达基因可使植物更有效地利用水从而增加总的产量。通过导入基因提高植物最大化利用水的能力，可克服涉及水的可获得性的所有胁迫范围，也可实现产量性能的稳定性或产量的连续性。

疾病抗性或耐受性

可通过表达基因产生对病毒的抗性。例如，表达针对基本的病毒功能的反义基因或表达编码病毒外壳蛋白的基因可赋予对病毒的抗性。

通过导入基因赋予对细菌和真菌导致的疾病的抗性。例如，编码称作“肽抗生素”的基因，编码病原相关(PR)蛋白，毒素抗性和影响宿主病原体相互作用，例如形态学特征的蛋白的基因都是有用的。

真菌毒素的减少/消除

由植物相关的真菌产生的真菌毒素，包括黄曲霉毒素和烟曲霉毒素(fumonisin)，是使得谷粒无用的一个重要因素。抑制这些真菌的生长可减少毒素物质的合成，从而减少由于真菌毒素污染造成的谷粒损失。可在植物中导入基因抑制真菌毒素的合成而不妨碍真菌的生长。此外，为了获得减少真菌毒素污染的谷粒，表达编码使得真菌毒素无毒性的酶的新基因也是有用的。

植物组合物或品质

可以改变植物组合物，例如，通过各种方式改善氨基酸的平衡，包括增加天然蛋白的表达，降低不良组合物的表达，改变天然蛋白的组成，或导入编码完整的具有优越组成的新蛋白的基因。参见例如，美国专利6,160,208(种子储存蛋白表达的改变)。导入基因改变植物中油的含量是有价值的。参见例如，美国专利6,069,289和6,268,550(ACCase基因)。导入的基因可例如通过增加分枝的程度，通过延迟代谢导致母牛中增加对淀粉的利用，从而增强植物中淀粉含量的营养价值，。

植物农艺学的性状

决定植物在何处生长的两个因素是生长季节过程中的平均日温度和霜冻间的时间长短。表达涉及调控植物发育的基因也许是有用的，例如，已经在谷物(com)中鉴定的非舌叶(liguleless)和粗糙鞘基因。

导入玉米的基因将增强站立性和其他植物的生长特性。赋予更强壮的茎，改善的根系或防止或减少抽穗的额外损耗的基因表达对于农民来说都是有价值的。

营养利用

利用可获得营养的能力是植物生长的一个限制因素。通过导入基因可改变营养的吸收，耐受pH的极限，植物中的流动，储存库，和代谢活动的有效性。这些修饰使得植物更加有效利用可获得的营养。例如，通常存在于植物中并涉及营养利用的酶的活性的增强可增强营养的有用性。这种酶的一个实例是植酸酶。

雄性不育

雄性不育在生产杂交中有用，雄性不育可通过表达基因产生。可通过转化导入TURF-13而从疾病敏感性中分离出雄性不育。参见Levings，Science，250：942-947，(1990)。对于育种的目的，有必要恢复雄性不育，可导入编码恢复雄性不育的基因。

抗性细胞系的筛选和表征

当细胞或组织恢复到在通常的色氨酸类似物水平抑制存在下观察到生长良好就可以进行筛选。这些细胞“系”在色氨酸类似物存在下传代培养几次以去除非抗性细胞，然后进行表征。通过比较在各种浓度的色氨酸类似物存在下这些细胞系和未筛选细胞或组织的生长可确定所获得的抗性量。将所筛选的细胞系在没有色氨酸类似物存在下，简单培养不同的时间阶段，然后分析将组织再暴露在色氨酸类似物下的生长就可以评估培养细胞抗性的稳定性。也可以使用体外化学研究评估抗性细胞系来证实改变类似物的作用位点可形成对色氨酸类似物抑制的较少的敏感性。

在转化细胞中可测定和定量邻氨基苯甲酸合酶的瞬时表达。基因表达可通过RT-PCR分析，使用克隆的邻氨基苯甲酸合酶特异性抗体的Western印迹或通过检测在色氨酸或色氨酸的氨基酸类似物存在下酶的活性而定量。测定克隆的邻氨基苯甲酸合酶的组织和亚细胞定位可通过使用克隆的邻氨基苯甲酸合酶特异性抗体的免疫化学染色法或亚细胞的分级以及随后的生物化学和/或免疫学分析。也可以评估克隆的邻氨基苯甲酸合酶对试剂的敏感性。提供邻氨基苯甲酸合酶的表达或邻氨基苯甲酸合酶对色氨酸的氨基酸类似物或游离的L-色氨酸的抑制的耐受性的转基因可用于转化单子叶和/或双子叶植物组织细胞并产生转化的植物和种子。转化细胞可通过检测选择性标记基因或报道基因的存在，例如，通过检测选择性的除草剂抗性标记而筛选。邻氨基苯甲酸合酶基因在转基因的胚胎发生愈伤组织中的瞬时表达可使用对邻氨基苯甲酸合酶特异性的抗体或通过RT-PCR分析来检测。

植物再生和种子的生产

转化的胚胎发生愈伤组织，分生组织，胚，叶盘等都可用于产生显示转化的邻氨基苯甲酸合酶基因稳定遗传的转基因植物。显示对色氨酸的氨基酸类似物的令人满意水平耐受性的植物细胞系可通过本领域已知的方法实行植物再生方案以获得成熟植物和表达耐受性性状的种子(例如，参见美国专利5,990,390和5,489,520；和Laursen等人，Plant Mol.Biol.，24：51(1994))。植物再生方案可使体细胞胚发育并随后生长成根和苗。为了确定耐受性性状在植物分化器官中，而不仅只是在未分化的细胞培养物中表达，可分析再生植物相对于再生的非转化植物的植物各个部分的色氨酸存在水平。转基因植物和种子可从采用标准的方法显示出色氨酸含量或对色氨酸类似物的抗性变化的细胞和组织中产生。尤其优选色氨酸含量增强的叶片和种子。在抑制量的色氨酸或其类似物的存在下，酶特定活性的变化可通过检测转化细胞中的酶活性来测定，如Widholm，Biochimica et Biophysica Acta，279：48(1972)中所描述的。通过如Jones等人，Ahalyst，106：968(1981)所描述的标准方法检查总色氨酸含量的变化。

从已知表达性状的细胞系获得成熟的植物。如果可能的话，使再生植物自花授粉。另外，将来源于再生植物的花粉与具有农艺学上重要的自交系的种子所生长的植物进行杂交。在一些情况中，使用来源于自交系的花粉给再生植物授粉。通过评价第一代和后代的性状分离来遗传表征该性状。如果该性状是商业上有用的，组织培养物中所选择的植物性状的遗传可能性和表达是特别重要的。

如果各种不同杂交组合都可以得到的话，色氨酸过量产生的大豆，谷类和其他植物的商业价值是巨大的。农民一般根据成熟度，站立性或其他农艺学性状的差异种植多种杂交品种。另外，由于成熟度，疾病，和昆虫抗性的性状的差异，适应一部分地区的杂种并不适于其他部分。因此，有必要培育色氨酸过量产生的大量的亲本自交系以产生许多杂交组合。

通过杂交原始过量产生的品系与正常的原种品系以及将杂交后代与正常的亲本回交来进行转换过程(回交)。这种杂交的后代将进行分离以至于携带基因的植物负责过量生产，而另外一些则没有。携带这种基因的植物再次与正常的亲本杂交，导致在后代中再次分离出过量产生和正常产量的性状。不停重复直到原始正常的亲本转变成过量产生的品系，也具有在正常亲本中原始就有的其他重要的特性。对于每种原种品系都实现分离的回交方案，则可将其转换成色氨酸过量生产的品系。

回交后，新的过量产生的品系和合适品系的组合是具有很好的商业价值的杂种，评价其过量生产和其他一系列重要的农艺学性状。生产过量产生的品系和杂种，其是原始正常品系和杂种的纯种类型。这需要在一系列环境条件中评估哪些品系或杂种通常将用于大规模地生长。对于高水平色氨酸大豆的产生，需要杂种种子的两个亲本是纯合的高色氨酸的特征。增加表现令人满意的杂种的亲本品系并采用标准的杂种种子生产试验用于杂种的制备。

预计在此产生的转基因植物有益于各种商业和研究目的。可产生转基因植物用于传统的农艺学以具有对从植物中收获的谷粒的消费者有利的性状(例如，在人食物或动物饲料中增加营养含量)。在这种用途中，植物通常是为了人或动物食物中的谷物的用途而生长。然而，植物的其他部分，例如茎，外壳，营养性部分等都是有用的，包括用作动物饲料，发酵饲料，生物催化的一部分或观赏性的用途。

转基因植物也可用于商业上的蛋白或其他分子的生产，其中从植物部分，种子等中提取或纯化感兴趣的分子。也可体外培养、生长植物的细胞或组织，或发酵制备这种分子。

转基因植物也可用于商业上的育种项目，或杂交或培育相关农作物种类的植株。可以传递重组DNA编码的改进，例如，通过原生质体融合从大豆细胞传递到其他种类的细胞。

在一个实施方案中，含有玉米邻氨基苯甲酸α-结构域的转基因分离自对5-MT耐受的玉米品系，与35S CaMV启动子连接并且采用微粒轰击的方法导入5-MT敏感的单子叶或双子叶组织中。筛选出转化的胚胎或分生组织用于产生转基因植物。评估转化的愈伤组织和转基因的植物对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。

下面的实施例进一步阐述了本发明，但并不是为了限制本发明。

实施例1：来自根瘤农杆菌的邻氨基苯甲酸合酶的分离和大肠杆菌表达

该实施例描述了来自根瘤农杆菌的邻氨基苯甲酸合酶的分离及其在大肠杆菌中的表达。

根瘤农杆菌AS的克隆

使用来自苜蓿中华根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸合酶编码区的核苷酸和氨基酸序列(GenBank登录号：P15395)检索根瘤农杆菌C58基因组序列数据库(Goodner等人，科学Science，294：2323-2328(2001))。该检索由利用blosum62矩阵的tblastn组成(Altschul等人，核酸研究Nucleic Acid Res.，25：3389-3402(1997))。

在根瘤农杆菌C58基因组序列数据库中鉴定的AS同系物，通过利用来自根瘤农杆菌菌株C58(ATCCNo.33970)的基因组DNA作为模板的PCR克隆。初级的PCR反应利用下列引物进行：

5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO：47)；和

5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO：48)。

基因扩增参数如下：(a)95℃变性30秒，(b)50℃退火30秒，以及(c)根据制造商的指导，利用扩展高保真PCR(Roche Biochemicals)在72℃延伸2分钟。

附加一轮的PCR扩增产生大约2.3Kb长度的产物，该反应利用上述的扩增模板和下列成套引物：

5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO：49)；和

5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO：50)。

将纯化的PCR产物连接到pGEM-Teasy(Promega Biotech)中从而得到质粒pMON61600(图1)。pMON61600利用标准的测序方法测序。正确序列的确认是通过与苜蓿中华根瘤菌邻氨基苯甲酸合酶的序列(图2)比较而获得的。来自分离克隆的翻译的氨基酸序列(SEQ ID NO：4)与苜蓿中华根瘤菌酶(SEQID NO：7)(图2)享有88％的同一性。缩写″AgroAS″或根瘤农杆菌AS有时在此用于指根瘤农杆菌的邻氨基苯甲酸合酶。

根瘤农杆菌AS的大肠杆菌表达

构建下列载体以便于将根瘤农杆菌AS基因亚克隆到合适的表达载体中。

利用pMON61600作为模板和下列引物产生2215碱基对的PCR片段：

5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′

(SEQ ID NO：51)；和

5′-AAAAGAATTCTTATCACGCGGCCTTGGTCTTCGCC-3′

(SEQ ID NO：52)。

质粒pMON61600用限制性内切酶NcoI和RsrII消化。另外，将409bp的片段(通过用NcoI和RsrII消化2215碱基对的PCR产物产生)随后连接到消化的pMON61600质粒中，从而替换NcoI/RsrII片段，并在具有根瘤农杆菌AS翻译起始密码子(ATG)的框内得到NcoI位点，以产生质粒pMON34692(图3)。

碱基T7大肠杆菌表达质粒，pMON34697(图4)，是通过用SphI和BamHI限制性消化pET30a(Novogen公司)而产生的。纯化所得到的4,969bp片段并用来自pET11d(Novogen公司)的338bp的SphI和BamHI片段亚克隆。

质粒pMON34705(图5)通过用NcoI和SacI限制性消化pMON34697而产生。然后纯化所得到的5,263bp片段并连接来自包含根瘤农杆菌AS的pMON34692的2,256bp的NcoI和SacI片段。

根据制造商的指导说明(Novogen公司)，将质粒pMON34705转化入大肠杆菌BL21(DE3)(F-ompT HsdS_b(r_B ^-m_B ^-)gal dcm(DE3))。DE3是包含受控制于异丙基-1-硫代-D-半乳糖苷(IPTG)诱导的lacUV5的T7 RNA聚合酶的染色体拷贝的λDE3的宿主溶菌原。

在已经于37℃培养过夜(10小时)的卡那霉素平板上筛选转化细胞。将单克隆转入2ml的LB(Luria液体培养基；每升10g胰蛋白胨，5g酵母提取物，10gNaCl，和1g葡萄糖(任选的))或2×-YT液体培养基(每升16g胰蛋白胨，10g酵母提取物，5gNaCl)，然后放入37℃的培养箱中在225rpm摇动3小时。移出细胞并在培养物中加入4μL的100mM IPTG，再放回37℃培养箱补充培养2-3小时。移出1mL等分的细胞，并在超声缓冲液(50mM磷酸钾(pH7.3)，10％甘油，10mM 2-巯基乙醇和10mM MgCl₂)中超声处理。所得到的裂解细胞提取物是用于如下所述的标准AS分析的原材料。结果证实以质粒pMON34705为基础的表达体系能够生产可溶解的和酶促活性的根瘤农杆菌AS蛋白质，其数量是总的可溶解的提取蛋白质的大约50％。

实施例2：通过用野生型的农杆菌邻氨基苯甲酸合酶转化植物获得高Trp种子水平。

表达载体pMON58120

载体pMON58120(图34)编码264碱基对的拟南芥小亚基(SSU)叶绿体靶肽(CTP，SEQ ID NO：71)和2187碱基对的野生型农杆菌(Agrobacterium)邻氨基苯甲酸合酶(AgroAS)开放阅读框(SEQ ID NO：1)间的融合体。参见，Stark等人，(1992)科学Science，258：287。开放阅读框的表达是由大豆7Sα初级(7Sα′)启动子驱动的。

当在细胞质核糖体上翻译时，融合体(不成熟的蛋白质)进入到叶绿体中，其中除去了叶绿体靶序列。在CTP1中存在2个切割位点。第一个位点是CDS起始(C/M)上游的30个碱基对，而另一个是起始的甲硫氨酸(C/M)。第二切割位点看来不进行有效地加工。预测该切割产生通过酶活性数据和trp效能数据所显示的具有AS活性的大约70Kd的成熟蛋白质。

AS基因用赋予草甘膦抗性的合成CP4基因转化，然而CP4基因是从AS基因单独加工出来的。CP4基因的表达由FMV启动子驱动，该启动子是来自玄参(Figwort)花叶病毒的35S启动子。草甘膦抗性提供了转化植物的筛选。

AS蛋白质的Western分析

分析pMON58120的35个转化事件中AgroAS蛋白质的存在。AgroAS蛋白质用兔抗纯化的His标记的AgroAS激发的多克隆抗体检测。使用His-标记的全长Agro-AS多肽作为抗原，由CoCalico Biological公司在兔中产生多克隆抗体群。将重组His标记的Agro-AS DNA置入pMON34701(pet-30a-agroAS)表达载体。His-AgroAS融合蛋白质在大肠杆菌BL21(DE3)中表达，并通过Ni-NTA树脂系统(Qiagen方法)纯化。对于western分析，使用1∶5,000稀释的兔抗-AgroAS初级抗体。其次使用1∶5,000稀释的山羊抗-兔碱性磷酸酶-共轭的抗体。在携带7Sα′-Agro AS基因的转基因品系中，western印迹分析一致显示存在特异地与抗-AgroAS抗体交叉反应的单个条带。没有在非转基因的对照品系中检测到该条带。

大豆和拟南芥种子的游离氨基酸分析

氨基酸提取：将大约50mg碾碎的大豆种子(5mg拟南芥)材料置于各自的离心管中。将1毫升的5％三氯乙酸加入各个样品(对于拟南芥为100μl)。涡旋样品，并在室温下搁置搅动15分钟。然后在14000rpm微离心15分钟。除去一些上清液，放入HPLC管并密封。样品在4℃保存有待排列分析。

氨基酸分析：用于氨基酸分析的试剂包括硼酸盐缓冲液(水中0.4N，pH10.2)中的OPA试剂(含邻苯二醛和3-巯基丙酸的硼酸盐缓冲液Hewlett-Packard，PN 5061-3335))。利用如2000年3月17日的Agilent技术出版物，″利用Zorbax Eclipse-AAA柱和Agilent 1100系列HPLC的氨基酸分析″所描述的Agilent 1100系列HPLC系统进行分析。最初，用10μl硼酸盐缓冲液中的2.5μl OPA试剂诱导(derivatized)0.5μl的样品。其次，将该诱导衍生物用1.2ml/min的流速注射到Eclipse XDB-C185μm，4.6×150mm柱上。利用在340nm激发，在450nm发射的荧光测量氨基酸浓度。用HPLC缓冲液A和B的梯度根据表A进行洗提，其中HPLC缓冲液A是40mM Na₂HPO₄，pH＝7.8，而HPLC缓冲液B是9∶9∶2::甲醇∶乙腈∶水。

表A：氨基酸洗提

时间

0

20

21

26

27

[0410]

％缓冲液B

5

65

100

从干的化学药品，利用感兴趣的所有氨基酸制备氨基酸标准。脯氨酸分析需要使用9-芴甲基-氯甲酸酯(FMOC)的附加衍生步骤。氨基酸标准有时也以0-100μg/ml的浓度范围购买。样品以μg/g的种子粉末报告。

野生型农杆菌邻氨基苯甲酸合酶在拟南芥中的表达

将载体pMON58120通过次级荧光的真空渗入转化拟南芥植株，并且容许植株产生转基因的种子。收集种子并以存在可选择的标记物(草甘膦抗性)进行筛选。草甘膦抗性植物生长成熟并且从各个植物收集种子，其中该植株指明为转化事件，并且分析色氨酸含量(表B)。如表B所示，也在成熟种子中通过Western印迹分析，分析所选择转化事件中表达农杆菌邻氨基苯甲酸合酶蛋白质的存在。

表B：转化体的分析

转化事件	Trp(ppm)	蛋白质的存在
			7317	2547	+
7315	2960	+
			7319	3628	+
7313	3979	+

野生型农杆菌邻氨基苯甲酸合酶在大豆(Glycine Max)中的表达

分析35个大豆转化事件中，33个具有增加的种子trp水平，例如，从上述的500ppm达到12,000ppm。在非转基因的大豆种子中，trp水平小于200ppm。包含高数量trp的所有种子通过western印迹证明邻氨基苯甲酸合酶蛋白质的表达。表C显示包含高trp水平以及通过western印迹分析邻氨基苯甲酸合酶蛋白质，同时也为邻氨基苯甲酸合酶阳性的19个大豆事件的数据。

表C：具有pMON58120的19个大豆转基因事件中AgroAS蛋白质的存在和色氨酸水平之间的相关性

谱系	最大Trp(ppm)	平均Trp(ppm)	蛋白质存在？
				A3244(ctr)	306	96	否
GM_A20380：.	6444	2246.4	是
				GM_A20532：.	6055	2556.6	是
GM_A22043：.	10422	2557.2	是
				GM_A20598：.	8861	2859.9	是
GM_A20744：.	7121	3373.3	是
				GM_A20381：.	6392	3572.9	是
GM_A20536：.	9951	3581.5	是
				GM_A20510：.	8916	3592.7	是
GM_A20459：.	8043	3900.4	是
				GM_A20337：.	7674	4088.6	是
GM_A20533：.	9666	4183.2	是
				GM_A20577：.	6276	4434.1	是
GM_A20339：.	9028	4687.8	是
				GM_A20386：.	8487	5285.3	是
GM_A20457：.	11007	5888.9	是
				GM_A20379：.	7672	6416.1	是
GM_A20537：.	9163	6695.8	是
				GM_A20534：.	12676	7618.2	是
GM_A20576：.	10814	7870.1	是

Agro AS的酶测定

在携带pMON58120构建体的11个转化事件中测量邻氨基苯甲酸合酶的特异活性。利用基于HPLC的终点分析根据C.Paulsen(J.Chromatogr.，547：155-160(1991))所描述的方法分析个别的大豆未成熟种子。简要地，从碾磨缓冲液(100mM Tris pH7.5，10％甘油，1mM EDTA，1mM DTT)中的单个种子产生脱盐提取物并用反应缓冲液(100mM tris pH7.5，1mM分支酸，20mM 谷氨酰胺和10mM MgCl₂)培育30分钟。在存在或缺少25mM trp时测量AgroAS活性。反应用磷酸终止并且通过HPLC利用设置在340nm/激发和410nm/发射的荧光检测器定量所形成的邻氨基苯甲酸的数值。

不成熟的分离的转基因种子中AS的特异活性与非转基因对照相比，增加1.5倍到70倍，达到高达6,000pmoles/mg/min。如表D的最后一列所示，转基因植物中的邻氨基苯甲酸合酶活性是抗色氨酸抑制的(参见表D)。

表D：转基因事件20576中的Agro AS酶活性

事件	种子号	特异活性 (pmoles/mg/min)	特异活性 (pmoles/mg/min)(+25微摩尔Trp)
				对照	3244-1	95.4	42.4
对照	3244-2	85.5	40.6
				20576	20576-1	6060.2	4407.1
20576	20576-2	3783.8	1709.4
				20576	20576-3	2768.3	2431.7
20576	20576-4	4244.08	2125.2

实施例3：用包含玉米邻氨基苯甲酸合酶α-亚基基因的载体转化大豆

玉米邻氨基苯甲酸合酶α-亚基的编码序列通过用XbaI组合部分的NcoI消化而从pMON52214(图22)分离(参见Anderson等人，美国专利号6,118,047)。所得到的表示邻氨基苯甲酸合酶α编码区的1952bp的DNA片段用凝胶纯化，并制备成平末端。质粒pMON53901(图23)用BglII和EcoRI消化，以产生6.8Kb的片段。分离后，使6.8Kb片段的末端钝化并脱磷酸化。然后将包含ASα基因的1952Kb的片段连接平末端的6.8Kbp的MON53901片段以产生pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR表达载体(图24)。

该pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR盒，随后用BamHI消化获得包含7S启动子和玉米ASα编码序列的2.84Kb的DNA片段。质粒pMON39322(图25)用BamHI消化获得5.88kb的DNA片段。然后将这2个片段连接在一起以产生pMON39325(图26)，亚克隆成为pMON39322的包含7S启动子-玉米ASα-NOS3′UTR盒的转化载体。

利用类似的方法，从USP启动子的下游克隆玉米邻氨基苯甲酸合酶α-亚基的编码序列，以产生pMON58130表达载体，从Arc5启动子的下游克隆产生pMON69662表达载体，从Lea9启动子下游克隆产生pMON69650表达载体，以及从Per1启动子的下游克隆产生pMON69651表达载体。这些表达载体的列表如表E所示。

表E：C28-玉米邻氨基苯甲酸合酶的构建体

种子世代	表达盒	载体名称
			R4	7Sa′-玉米ASα	PMON39325
R2	Napin-玉米ASα	PMON58023
			R1	USP-玉米ASα	PMON58130
R1	Arc5-玉米ASα	PMON69662
			R1	Lea9-玉米ASα	PMON69650
R1	Per1-玉米ASα	PMON69651

这些载体用于植物转化和繁殖实验。如在此所描述的，大豆植株用包含玉米AS的载体利用微粒子轰击技术转化。对于每种类型的载体分别建立几个转基因的大豆品系，并且通过表E中所标明的世代数目来繁殖。

例如，建立3个携带pMON39325的7Sα′-玉米AS转化基因的纯合系。这3个系在2个不同的场所随机分组设计生长。产生成熟的种子并且分析游离氨基酸的含量。包括对照以建立基线的trp水平，即3个相应阴性的等值线和非转基因的对照。

表F提供pMON39325转化体和对照系的R4种子中ppm的色氨酸，显示非转基因大豆平均包含大约100-200μg色氨酸种子粉末，而pMON39325转化体基本上包含更多的Trp。也参见，图27。

表F：用C28玉米突变体(pMON39325)转化的大豆植株种子中的色氨酸水平

阳性等值线号	阳性等值线的平均 trp(ppm)	标准偏差	相应的阴性等值线的平均trp(ppm)	标准偏差
					39325-1	3467	377	226	55
39325-2	2623	307	164	20
					39325-3	3715	152	184	64
39325-4	2833	165	202	146
					39325-5	3315	161	173	34
39325-6	2394	318	144	22
					非转基因的对照-7			191	24
非转基因的对照-8			118	23

用在5个不同启动子的控制下表达C28玉米邻氨基苯甲酸合酶的5个其他构建体转化大豆(表E)，并获得转基因植株。各个构建体都产生高trp的结果。由Per1-C28玉米邻氨基苯甲酸合酶产生的实施例说明的结果显示在表G和H中。

表G：3个具有Per1-C28玉米AS(pMON69651)的转基因事件中C28玉米AS蛋白质表达与增加的Trp水平相关

谱系	平均Trp(ppm)	蛋白质存在？
			对照	96	否
22689	2375	是
			22787	1707	是
22631	1116	是

表H说明用pMON69651表达载体转化大豆植株，R1种子中C28玉米AS的酶活性。

表H：pMON69651转化体的R1种子中C28玉米AS的特异活性

事件	种子号	特异活性 (pmoles/mg/min)	种子特异活性 (pmoles/mg/min)(+25微摩尔色氨酸)
				对照		51.6	2.6
22689	22689-1	130.9	64.7
					22689-2	115.3
	22689-3	148.5	61.1
					22689-4	149.5
	22689-5	133.8	60.3

这些结果表明当大豆植物组织用C28玉米AS基因转化时，色氨酸有显著的增加。

表G中显示的高色氨酸水平与AS蛋白质的存在和转基因酶的增加的特异活性(比非转基因对照中高2.5倍)有关(表H)。如表H所示-以及根据C28玉米AS酶的生物化学特性所预测的-转基因事件的特异活性是色氨酸-抗性的。

实施例4：根瘤农杆菌邻氨基苯甲酸合酶色氨酸反馈不敏感的突变体的合理设计

该实施例描述包含对色氨酸或色氨酸类似物的反馈抑制具有各种灵敏度或不敏感的突变的根瘤农杆菌邻氨基苯甲酸合酶的载体。

根瘤农杆菌突变的邻氨基苯甲酸合酶基因的产生

利用硫磺矿硫化叶菌(Solfulobus solfataricus)的邻氨基苯甲酸合酶蛋白质结构信息作为指导(Knochel等人，Proc.Natl.Acad.Sci.(美国)，96：9479-9484(1999))，利用蛋白质信息学确信指定几个涉及色氨酸结合的残基，合理设计几个根瘤农杆菌邻氨基苯甲酸合酶突变体。这通过将根瘤农杆菌邻氨基苯甲酸合酶基因与硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现(图6)。根瘤农杆菌假定的色氨酸结合和催化域是通过结合对序列同源性的结构信息的认识而指定的。确定结合袋中的残基是可用于改变以提供对色氨酸反馈抑制的抗性的潜在候选物。

根据硫磺矿硫化叶菌邻氨基苯甲酸合酶的结构分析，表明氨基酸E30， S31，I32，S42，V43，N204，P205，M209，F210，G221和A373涉及色氨酸结合。根据成对地序列对比，硫磺矿硫化叶菌的N204，P205和F210在单体的根瘤农杆菌邻氨基苯甲酸合酶中分别为残基N292，P293和F298，也是保守的。

然而，由于多重插入和缺失，硫磺矿硫化叶菌和根瘤农杆菌酶的N-末端区是高度离散的。因此，必须在根瘤农杆菌邻氨基苯甲酸合酶涉及色氨酸调控的N-末端区域人工指定残基(图6)。结构分析表明基序″LLES″在色氨酸结合袋中形成β折叠(β-sheet)。该结构在异四聚体酶中看来似乎是高度保守的。然后将已知的单体酶利用″LLES″基序作为界标人工序列对比于硫磺矿硫化叶菌序列(图21)。根据蛋白质信息学分析，根瘤农杆菌AS中的氨基酸残基V48，S50，S51和N52也可能涉及色氨酸结合。

随着在根瘤农杆菌单体的酶中指定假定的色氨酸结合残基，合理化几个独特策略以用于减少该酶对色氨酸抑制的敏感性。这些置换包括例如，扩大色氨酸-结合袋(F298A)，窄化结合袋(V48F，V48Y，S51F，S51C，N52F，F298W)，增加结合袋的极性(S50K)，或通过改变蛋白质主链的构象扭曲结合袋的形状(P293A，P29G)。

根瘤农杆菌AS的定点诱变

使用定点诱变产生10个单一氨基酸置换的6个位点。利用QuikChange^TM 定点诱变试剂盒(Stratagene)将突变导入pMON34705中的根瘤农杆菌AS。用于定点诱变的引物是SEQ ID NOs：9-42(图7；F＝正向，R＝反向)。每个引物序列特异地用于在序列中的特异位点改变核酸，并因此改变编码的密码子，用于编码新的氨基酸。例如，S51C指明在根瘤农杆菌AS肽序列51位的氨基酸，从丝氨酸变化为半胱氨酸。

诱变后再确认全部基因的序列并且表达变体以及如下列用于野生型酶所描述的，从大肠杆菌纯化。将所得到的包括突变的根瘤农杆菌AS的质粒利用如实施例1所描述的T7表达系统，合适地克隆到用于过量生产蛋白质的质粒中。

根瘤农杆菌AS蛋白质的表达和纯化

如实施例中所描述的，在大肠杆菌中表达根瘤农杆菌AS野生型和突变的酶。所有的根瘤农杆菌AS酶，包括野生型和其突变体的纯化，在4℃进行。将细胞(大约1g湿重)悬浮在20ml的纯化缓冲液(50mM磷酸钾，pH7.3，10mMMgCl₂，10mM 2-巯基乙醇，10％甘油)中，并且通过超声处理(Branson Sonifier Cell Disruptor，W185)裂解。匀浆物在20,000×g离心15分钟后收集上清液。上清液进行硫酸铵分级分离(30-65％饱和)。在20,000×g离心15分钟后收集沉淀物，并溶于3ml的纯化缓冲液，然后整个地加载到用相同的缓冲液预平衡的Econo-Pac 10DG脱盐柱上。通过进一步分析检测包含酶的级分并加以收集。将收集的酶(4.3mls)加载到用相同的缓冲液平衡的10ml DEAESephacel(Pharmacia Biotech)柱(1.5×7.5cm)上。该柱用30ml的纯化缓冲液洗涤并且用相同缓冲液中的30ml的50mM NaCl洗提酶。收集包含高AS活性的级分并且通过65％的硫酸铵饱和液沉淀，以及如上所述分离和脱盐。收集包含酶的级分并贮藏在-80℃。

邻氨基苯甲酸合酶的酶测定和动力学分析

根瘤农杆菌AS的标准分析于25℃，在包含100mM磷酸钾，pH7.0，10mMMgCl₂，1mM二硫苏糖醇，200μM分支酸和10mM L-谷氨酰胺的分析缓冲液中进行。通过将30μl的酶加入反应混合物并混合而开始反应。邻氨基苯甲酸的形成直接通过320nm处3分钟的吸光率增加而监测。根据吸光率对反应时间变化的斜率，以每秒增加的单位吸光率计算反应的初速度。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇和10mM L-谷氨酰胺，并且分支酸浓度在2.5-100μM分支酸之间变化的分析缓冲液中确定分支酸的Km(Km^Cho)。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇和200μM分支酸，并且L-谷氨酰胺浓度在0.1-2mM L-谷氨酰胺之间变化的分析缓冲液中确定谷氨酰胺的Km(Km^Gln)。在总体积为1ml，包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇，10mM L-谷氨酰胺，200μM分支酸，并且L-色氨酸的浓度在0.1-10mM色氨酸之间变化的分析缓冲液中确定色氨酸的IC₅₀(IC₅₀ ^Trp)。在使数据适合非线性回归程序(GraFit)后计算AS的动力学参数和IC₅₀。

几个突变体证明对色氨酸抑制的敏感性降低，同时与野生型酶相比仍然保持酶活性(表I)。这些结果表明可例如通过在邻氨基苯甲酸合酶的色氨酸结合袋中突变氨基酸和通过优化证明为反馈不敏感的突变来减少对色氨酸抑制的灵敏性的程度。

表I：邻氨基苯甲酸合酶活性以及色氨酸对根瘤农杆菌AS突变体的作用

实施例5：随机诱变根瘤农杆菌AS以产生色氨酸反馈不敏感的突变体

除在实施例4中所描述的合理设计方法外，其他产生邻氨基苯甲酸合酶的反馈不敏感突变体的策略包括但不限于随机诱变。根瘤农杆菌AS的随机诱变，可例如通过化学诱变(分离的DNA或完整的生物体)、易错PCR和DNA移码实现。该实施例描述化学诱变及其后的遗传选择的使用。遗传选择方法也对选择来源于其他诱变方法的所需要的突变体有用。

包含根瘤农杆菌AS的大肠杆菌表达质粒的产生

通过利用包含正向引物5′末端上的Nco1位点和反向引物3′末端上的XbaI位点的引物，PCR扩增来自根瘤农杆菌AS克隆pMON61600(在实施例1中所描述的(SEQ ID NO：1)的开放阅读框：

5′-CATCCCATGGATGGTAACGATCATTCAGGAT-3′

(SEQ ID NO：55)；和

5′-GATGTCTAGAGACACTATAGAATACTCAAGC-3′

(SEQ ID NO：56)。

将所得到的PCR产物连接到pMON25997(图28)中，pMON25997用BspH1和Xba1消化除去bktB开放阅读框(Slater等人，细菌学杂志J.Bact.， 180：1979-1987(1998))而得到质粒pMON62000(图29)。pMON62000是用于诱变和互补色氨酸营养缺陷型(EMG2ΔtrpE)的基础质粒。

大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的产生

大肠杆菌菌株Ec-8(EMG2ΔtrpE)利用自杀载体pKO3构建，以从大肠杆菌菌株EMG2(K-12 wt F+)(大肠杆菌遗传原种中心)的染色体的trpE基因缺失1,383个碱基对。PCR扩增大肠杆菌基因组DNA的2个扩增子。第一个扩增子大约1.5kb，并在3′末端包含trpE ORF的前30bp。该扩增子在5′末端包含BamHI位点，并且在3’末端包含EcoR1位点。第二个扩增子大约1kb，并且在5’末端包含trpE ORF的最后150bp。该扩增子在5’末端包含EcoR1位点，并且在3’末端包含Sal1位点。2个扩增子用适当的酶消化，并且在EcoR1位点连接在一起以产生trpE的框内缺失。图30显示所得到的截短基因的序列(SEQ IDNO：46)。将trpE缺失扩增子在BamH1和Sall位点连接到pKO3中。如A.J.Link等人，J.Bacteriol.，179：6228(1997)所描述的进行基因断裂。

大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE与pMON62000的互补

用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且接种在M9基本培养基上以确定缺失是否通过加入pMON62000而互补。对照质粒(减去根瘤农杆菌AS插入)和对照菌株Ec-8也接种在M9基本培养基和具有40μg/ml色氨酸的M9基本培养基上。观察到在没有色氨酸的M9上生长用pMON62000转化的菌株Ec-8，而对照都没有观察到有生长，表明菌株Ec-8中trpE缺失通过pMON62000互补。

pMON62000的羟胺诱变和突变体的遗传选择

为了产生邻氨基苯甲酸合酶的突变体，pMON62000用化学诱变剂羟胺突变。将下列成分在eppendorf管中化合：20μg pMON62000质粒DNA和40μl2.5M羟胺，pH6.0。用0.1M NaH₂PO₄，pH6.0+5mM EDTA，pH6.0使体积变为200μl。该试管在70℃孵育。1.5小时后，将100μl的反应混合物在浮于大约500ml H₂O上的硝酸纤维素滤膜上透析。15分钟后，利用Qiagen PCR纯化试剂盒浓缩DNA。3小时后，将剩余的100μl反应混合物移出并以同样的方式纯化。

然后大肠杆菌菌株Ec-8用已经用羟胺诱变处理1.5或3小时的100ngpMON62000通过电穿孔转化。对于各个时间点进行2种转化方法。容许转化细胞在SOC介质(20g/L细菌用胰化胨(Bacto-Tryptone)，5g/L细菌用酵母提取物，10ml/L 1M NaCl，2.5ml/L 1M KCl，18g葡萄糖)中恢复4或6小时。

制备2个245mm正方形的生物检测平板，包含M9基本培养基，加2％琼脂和50μg/ml 5-甲基-DL-色氨酸(5-MT)。将一等分的900μl 1.5小时诱变处理的转化混合物接种到1个50μg/ml 5-MT的平板上。将剩余的100μl接种到M9对照平板上。对于包含3.0小时诱变处理的质粒的转化混合物进行相同的步骤。

然后平板在37℃孵育大约2.5天。从5-MT平板分离抗性克隆并接种到LB-卡那霉素(50μg/ml)平板上以验证质粒的存在。所有选择的集落都在这些平板上生长。将来自每一抗性克隆的个别克隆分成两份以分离质粒。进行限制性消化和PCR并且证实所有的克隆都包含所需的根瘤农杆菌AS插入。

然后将挽救质粒转化回菌株Ec-8。通过划线接种到新的LB-卡那霉素平板上纯化来自每个转化子的一个克隆。为了证实对5-MT的抗性，将个别纯化的克隆接种到包含M9加50μg/ml 5-MT和2％琼脂的平板上，然后在37℃生长3天。大部分克隆证实有抗性。为了确定抗性突变体是否在5-MT的更高浓度保持抗性，将它们接种到M9加300μg/ml 5-MT和2％琼脂上。大多数克隆证明在此高浓度也有抗性。

分离来自所有抗性克隆的质粒并对两条链都测序。这个实验的一些突变体在表J中进行图解。

表J：5-MT抗性克隆中根瘤农杆菌trpEG序列的变化。

数据库克隆#	原始克隆#	确定的序列变异体	K_m ^cho (μM)	IC₅₀ ^trp (μM)
					Wt			8.0	5.0
Ec-12	1	G4A Val2Ile
					Ec-18	8	C35T Thr12Ile	15	2.5
Ec-19	9	C2068T Pro690Ser	5.0	3.4
					Ec-20	11	G1066A Glu356Lys和C1779T Ile593Ile

如表J中的数据所表明的，几个突变体对突变酶的Km^cho和IC₅₀ ^trp的作用很小，表明这些突变可能不是抗色氨酸反馈抑制的来源。例如，在核苷酸 35位的C到T的突变，它将氨基酸12位的苏氨酸残基变化为异亮氨酸(Thr12Ile)，而在Km^cho和IC₅₀ ^trp值中产生微小的变化。类似地，核苷酸2068位的C到T的变化，将脯氨酸变化为丝氨酸，也在Km^cho和IC₅₀ ^trp值中产生微小的变化。这些突变可能因此，也许是产生具有如同野生型酶特性的变体基因产物的″沉默的″突变。

实施例6：高色氨酸转基因的大豆植物。

该实施例说明由用来自根瘤农杆菌的邻氨基苯甲酸合酶的色氨酸反馈不敏感突变体转化产生的，具有升高的色氨酸水平的转基因大豆植物的制备。

载体构建

质粒pMON34711，具有来自根瘤农杆菌的，包含在实施例4中所描述的F298W突变的邻氨基苯甲酸合酶克隆，将其用限制性内切酶NotI消化。使所得到片段的末端钝化，然后用NcoI消化。然后质粒pMON13773(图8)用限制性内切酶EcoRI消化，使末端钝化，然后用NcoI消化。将所得到片段连接质粒pMON58044，该质粒包含在7S启动子和NOS3′UTR控制下的AS基因(图9)。

然后用限制性内切酶BglII和NcoI切割质粒pMON58044，并连接通过用BglII和NcoI消化pMON53084(图10)所产生的片段。所得到的片段命名为pMON58045(图11)并且包含用于拟南芥SSU1A运输肽的序列。

最后，通过连接由用限制性内切酶NotI消化pMON58045(图11)和pMON38207(图13)所产生的片段构建质粒pMON58046(图12)。这产生了用于大豆转化的pMON58046载体(图12)。

经微粒子轰击的大豆转化

对于粒子轰击转化法，将市场上可买到的大豆种子(即，Asgrow A3244，A4922)发芽大约18-24小时过夜，并切下分生组织外植体。移去初生叶暴露分生组织并将外植体置于目标培养基中，同时分生组织垂直于粒子递送的方向。

将如上所述的pMON58046转化载体用CaCl₂和亚精胺沉淀到显微的金粒子上，并且随后再悬浮在乙醇中。将悬浮液包涂到Mylar片层上，然后放置到放电装置上。将颗粒以大约60％的电容经放电加速进入植物组织。

轰击后，将外植体置于选择性培养基(WPM+0.075mM草甘膦)(WPM＝木本植物(woody plant)培养基(McCown和Lloyd，Proc.International PlantPropagation Soc.，30：421，(1981)minus BAP))中5-7周，以供选择和生长转基因苗用。轰击大约5-7周后收获表型阳性的苗，并且放入选择性的根培养基中(BPM+0.025mM草甘膦)(参见，下列用于BRM的配方)2-3周。将产根苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2周。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记物的表达。在标准温室条件下保持植株直到收获R1种子。

用于豆生根培养基的配方(BRM)提供如下。

化合物	4L的数量
		MS盐^***	8.6g
肌醇(细胞培养级)	0.40g
		SBRM维生素原液^**	8.0ml
L-半胱氨酸(10mg/ml)	40.0ml
		蔗糖(超纯的)	120g
调节pH到5.8
		Washed琼脂	32g
高压灭菌后加入：
		SBRM/TSG激素原液^*	20.0毫升

^*SBRM/TSG激素原液(每1L的BRM)：3.0ml IAA(0.033mg/ml)，2.0ml无菌蒸馏水。原液在4℃避光储存。

^**SBRM维生素原液(每1L的原液)：甘氨酸(1.0g)，烟酸(0.25g)，吡哆醇HCl(0.25g)，硫胺HCl(0.25g)。

^***3×MInorMS盐(每1L原液)：H₂BO₃(1.86g)，MnSO₄(5.07g)，ZnSO₄-H₂O(2.58g)，KI(0.249g)，7.5ul NaMoO-2H₂O(1.0mg/ml)，7.5ulCoSO₄-5H₂0(1.0mg/ml)，7.5ulCoCl₂-6H₂O(1.0mg/ml)。

每次加入并溶解1个成分，用无菌蒸馏水使体积达到1升，并且该溶液保存在箔覆盖的瓶子中，在冰箱中保存不超过1个月。

利用根瘤农杆菌转化大豆

对于农杆菌转化法，将市场上可买到的大豆种子(Asgrow A3244，A4922)发芽过夜(大约10-12小时)，并且切下分生组织外植体。可移去或不移去初生叶暴露分生组织并且将外植体置于创伤导管中。

使包含感兴趣质粒的农杆菌菌株ABI生长到对数期。通过离心收获细胞并且再悬浮在含有诱导物的接种培养基中。从种子开始萌芽和利用超声处理创伤以来不迟于14小时，混合大豆外植体和诱导的农杆菌培养物。

创伤后，在农杆菌中培养外植体大约1个小时。该接种步骤后，通过移液管移出农杆菌并且将外植体置于共培养2-4天。此时，将它们转入选择性培养基(WPM+0.075mM草甘膦+抗生素以控制农杆菌过度生长)5-7周以容许选择并生长转基因的苗。

轰击后大约5-7周后，收获表型阳性的苗并置于选择性的根培养基中(BRM+0.025mM草甘膦)2-3周。将产生根的苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2星期。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记草甘膦抗性的表达。在标准温室条件下保持植株直到收获R1种子。

R1种子的氨基酸含量的分析

生产成熟的R1种子并且利用如Agilent Technologies Technical BulletinREV14所描述的荧光检测分析游离氨基酸的含量。从每个事件选择5个种子用于单个种子分析。表达AgroAS F298W，AgroAS S51F，AgroAS V48F，AgroAS V48Y或AgroAS S51C的突变体蛋白质的大豆种子产生高数量的色氨酸。最高水平的色氨酸对萌芽具有负影响。结果显示在表K，L和M中。

表K：用pMON58046转化的种子中蛋白质的表达

谱系	平均Trp(ppm)	蛋白质存在？
			对照	96	否
22817	9922	是
			22891	12955	是
23026	7968	是

[0509] 表L：AS蛋白质表达与pMON58123转化相关

谱系	平均Trp(ppm)	蛋白质存在？
			对照	96	否
23562	88	否
			23590	8795	是
23911	388	否

表M：携带下列AgroAS等位基因中的一个的大豆中，平均和最大的色氨酸水平：V48F(pMON66877)、V48Y(pMON66878)和S51C(pMON66879)。

PMON号	说明	事件号	平均trp(ppm)	最大trp(ppm)
					66877	7Sα-V48F AgroAS	26640	12,283	28,342
66877	7Sα-V48F AgroAS	26641	5,588	14,579
					66877	7Sα-V48F AgroAS	26642	11,833	18,712
66878	7Sα-V48Y AgroAS	26872	6,015	11,902
					66878	7Sα-V48Y AgroAS	26875	12,361	17,181
66878	7Sα-V48Y AgroAS	27010	13,962	19,323
					66879	7Sα-S48C AgroAS	27105	12,614	31,827
66879	7Sα-S48C AgroAS	27300	16,711	34,263
					66879	7Sα-S48C AgroAS	27568	10,135	20,237

用AgroAS转化的R1种子中的AS酶活性

生产成熟的R1种子并且分析邻氨基苯甲酸合酶活性。在携带AgroASF298W(SEQ ID NOs：65或91)或AgroAS S51F(SEQ ID NOs：60或86)突变体等位基因的R1大豆种子中确定邻氨基苯甲酸合酶的酶活性。观察到非常高水平的色氨酸-抗性邻氨基苯甲酸合酶活性，与由这些种子所产生的高数量的色氨酸一致。结果显示在表N和O中。

表N：用pMON58046转化的R1种子中AS的特异活性

事件	种子号	特异活性 (pmoles/mg/min)	种子特异活性 (pmoles/mg/min)(+25微摩尔Trp)
				对照		77.6
23076	23076-1	100.5	1.04
					23076-2	4512.8
	23076-3	9737.4	9290.4
					23076-4	136.12
	23076-5	8992.5	9749.9

表O：用pMON58123转化的R1种子中AS的特异活性

事件	种子号	特异活性 (pmoles/mg/min)	种子特异活性 (pmoles/mg/min)(+25微摩尔Trp)
				对照		83.7	32.7
23590	23590-1	891	692.3
					23590-2	466.2	186.5
	23590-3	71.7	38.3
					23590-4	320.5	316.2

实施例7：包括芸香邻氨基苯甲酸合酶α-亚基的转化载体的制备

来自芸香(Ruta graveolens)的邻氨基苯甲酸合酶α基因(Genbank登记号GI960291)提供另一个对本发明有用的邻氨基苯甲酸合酶结构域(Bohlmann，J等人，Plant Phys.，111：507-514(1996))。存在于芸香基因组中的邻氨基苯甲酸合酶的一个同工酶显示对L-色氨酸的反馈抑制的敏感度较低。该等位基因也可用于本发明以提高转基因植物中游离的L-色氨酸的水平。载体pMON58030(图14)包含对色氨酸抑制较少敏感的芸香邻氨基苯甲酸合酶α-亚基。从pMON58030 PCR扩增芸香的邻氨基苯甲酸合酶α基因，以提供在芸香邻氨基苯甲酸合酶α基因片段的5′末端的BamHI位点和在3末端的BglII位点，其中利用包含这2个限制性内切酶位点的引物：

5′-CAAAAGCTGGATCCCCACC-3′(SEQ ID NO：53)；和

5′-CCTATCCGAGATCTCTCAACTCC-3′(SEQ ID NO：54)。

纯化PCR片段，用分别的限制性内切酶消化以形成pMON58041，其中包含芸香ASα至napin启动子的转录融合体。产生农杆菌介导的植物转化质粒，pMON58043，包括napin启动子，芸香AS，NOS终止子，草甘膦抗性(CP4)可选择的标记和适合于所述盒的固有染色体整合的边界。使用所得到的植物转化载体利用如实施例2，3和6中所描述的标准的植物转化技术转化植物。

实施例8：转化多个多肽邻氨基苯甲酸合酶成为单体的单个多肽邻氨基苯甲酸合酶

需要通过融合所选择的多亚基酶产生单体的邻氨基苯甲酸合酶，例如为了优化催化的效率，为了稳定酶，为了获得例如包括TrpE和TrpG活性的亚基，以及2个亚基间有效传递的协同表达。在有些情况下，可能对使用植物或微生物来源的TrpE或α-亚基有用，其中该植物或微生物通过标准诱变方法或通过如前文的实施例，例如实施例4中所描述的合理设计而不受有关反馈抑制的调控。在其他情况下，使用植物或微生物来源的野生型TrpE或α-亚基。

所选择的TrpE或α-亚基的C-末端连接TrpG亚基或β-亚基的N-末端，优选使用肽接头连接。可合理设计接头以提供合适的间隔和使两个亚基适当定位排列的灵活性。可选地接头可通过单体的和异四聚体的邻氨基苯甲酸合酶的序列对比确定。单体的和异四聚体的邻氨基苯甲酸合酶所形成的序列对比的实例显示在图21和35中。也可设想可能必须产生包括异源亚基的单体邻氨基苯甲酸合酶以便优化效益。例如，α-亚基可从例如大肠杆菌的细菌来源获得，并与例如拟南芥的植物来源的β-亚基融合。

可将产生的新蛋白质导入植物，例如如实施例2，3或6中所描述的。本发明不限于所显示和描述的精确细节，因为应该理解可在保持在权利要求所定义的本发明的精神和范围内的同时，产生许多变化和改进。

实施例9：来自基因组序列数据库的邻氨基苯甲酸合酶的鉴定。

对本发明有用的单体邻氨基苯甲酸合酶以及α和β结构域可经生物信息分析，通过利用BLAST(www.ncbi.nlm.nih.gov/blast/)搜索例如genbank和/或swisprot数据库鉴定。鉴定单体邻氨基苯甲酸合酶的有用的查询序列包括，例如邻氨基苯甲酸合酶的结构域，例如硫磺矿硫化叶菌的α-结构域(GI1004323)或β-结构域(GI 1004324)，或单体的邻氨基苯甲酸合酶，例如根瘤农杆菌AS(GI 15889565)。推定的单体邻氨基苯甲酸合酶将具有与询问序列50％和100％之间的同源性，并且应最低限度地包含700个氨基酸。如果使用AS-α-结构域查询基因组数据库，除鉴定推定的邻氨基苯甲酸合酶基因外，它也可能鉴定涉及PABA合成，例如4-氨基-4-脱氧分支酸(ADC)合酶的基因。单体的ADC合酶基因可根据观察ADC合酶的酰胺转移酶结构域(β-结构域)存在于蛋白质的N-末端，而AS的酰胺转移酶结构域(β-结构域)存在于C-末端，从而将推定的单体AS基因轻易地鉴定出来。对本发明有用的单体邻氨基苯甲酸合酶通过生物信息分析鉴定，包括但不限于，例如苜蓿中华根瘤菌(Rhizobiummeliloti)(GI 95177)，百脉根根瘤菌(Mesorhizo biumloti)(GI 13472468)，马尔他布鲁氏菌(Brwella melitensis)(GI 17982357)，念珠藻属(NostoaSP.)PCC7120(GI 17227910，GI 17230725)，巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156)，血色红假单胞菌(Rhodopseudomonas palustris)，鱼腥藻(Anabaena)M22983(GI 152445)。图21是本发明中所使用的2个单体邻氨基苯甲酸合酶(根瘤农杆菌和苜蓿中华根瘤菌)与2个异四聚体邻氨基苯甲酸合酶(硫磺矿硫化叶菌和拟南芥)的序列对比的实例。图35是几个单体的邻氨基苯甲酸合酶与血色红假单胞菌异四聚体邻氨基苯甲酸合酶的序列对比的实例。

实施例10：优化密码子的使用

该实施例说明通过优化密码子的使用改进植物种子中邻氨基苯甲酸合酶基因表达的方法。

检验野生型根瘤农杆菌的邻氨基苯甲酸合酶(AS)基因的核苷酸序列(SEQ ID NO：1)中存在的不表达密码子。为了鉴定低表达的密码子，从谷物和大豆中寻找高度表达的种子蛋白质的序列以获得相对的密码子频率。相对的密码子使用频率显示在表P中，表示为预期值的形式。预期值形式可例证说明如下：假定存在4个编码给定氨基酸的密码子，并且假定它们同样使用，然后预期每个密码子占氨基酸25％(0.25)的频率。然而，由于冗余，将0.25规范化到1.0，以对每个密码子相比较于编码该氨基酸的密码子产生相对的积分。对于这个分析，如果该密码子比另一个对于给定的氨基酸选择更占优势，则它受到大于1.0的计数。相应地，如果密码子是较少占优势的，它受到小于1.0的计数。对于这个研究，如果其相对的密码子使用频率低于0.5，则认为该特定的密码子未被充分表示。

利用表P所产生的结果，在谷物和大豆中，野生型农杆菌AS序列的紧密检查显示认为125个密码子未被充分表示(低于0.5的阈值)(表Q)。这些未被充分表示的密码子被如上所定义的更占优势的密码子替代。改变的核苷酸序列显示在图36中。利用生物信息工具，装配所得到的序列并且通过翻译以及与相应的野生型AS序列的核苷酸和蛋白质的序列对比分析完整性。虽然未改变蛋白质序列，但优化序列的核苷酸序列与野生型的农杆菌AS序列(图37)具有94％的同一性。分别利用Lasergene EditSeq(DNASTAR公司，Madison，WI)和Grail2(国立橡树岭实验室，OakRidge，TN)分析优化的核苷酸序列中隐藏的多聚腺苷酸化信号(AATAAA，AATAAT)和隐藏的内含子的缺乏。没有发现隐藏的信号。

改变的核苷酸序列利用本领域中公知的技术或由例如EgeaBiosciencesces公司(SanDiego，加利福尼亚)的商业供应者合成。将所得到的核苷酸克隆到适当的表达载体中，并且利用本说明书的上述实施例中所详细记载的方法，测试在谷物，大豆和拟南芥中的效能。

表P：玉米和大豆种子-表达基因¹中相对的密码子使用频率。

密码子氨基酸玉米种子大豆种子密码子氨基酸玉米种子大豆种子

TTT F 0.4211 0.7348 ATC I 1.7143 1.0563

TTC F 1.5789 1.2652 ATA I 0.3673 0.6654

TTA L 0.4557 0.3875 ATG M 1.0000 1.0000

TTG L 0.9494 1.2060 ACT T 0.6153 1.0008

TCT S 0.9624 1.4851 ACC T 1.2213 2.1020

TCC S 1.3707 1.1249 ACA T 0.8372 0.7146

TCA S 0.9107 1.0044 ACG T 1.3262 0.1826

TCG S 0.7851 0.3266 AAT N 0.2885 0.5409

TAT Y 0.2455 0.6861 AAC N 1.7115 1.4591

TAC Y 1.7545 1.3139 AAA K 0.5333 0.9030

TGT C 0.2788 0.7572 AAG K 1.4667 1.0970

TGC C 1.7222 1.2428 AGT S 0.2679 0.9714

TGG W 1.0000 1.0000 AGC S 1.7032 1.0876

CTT L 0.7975 1.6298 AGA R 0.3913 1.9459

CTC L 1.0610 1.6301 AGG R 2.9185 1.3087

CTA L 0.8544 0.5905 GTT V 0.5714 1.2381

CTG L 1.8820 0.5562 GTC V 1.0119 0.6864

CCT P 0.6500 1.5822 GTA V 0.3810 0.3472

CCC P 0.8520 0.7694 GTG V 2.0357 1.7284

CCA P 1.2240 1.5838 GCT A 0.9876 1.3583

CCG P 1.2740 0.0645 GCC A 1.1618 1.1283

CAT H 0.8438 0.6066 GCA A 0.8011 1.2898

CAC H 1.1563 1.3934 GCG A 1.0495 0.2235

CAA Q 0.8639 1.2162 GAT D 0.8500 0.9523

CAG Q 1.1361 0.7838 GAC D 1.1500 1.0477

CGT R 0.2582 0.5903 GAA E 0.6818 1.0463

CGC R 1.0082 1.1159 GAG E 1.3182 0.9537

CGA R 0.1957 0.6700 GGT G 1.1268 1.1431

CGG R 1.2283 0.3692 GGC G 1.8758 0.6577

ATT I 0.9184 1.2783 GGA G 0.3085 1.2759

ATC I 1.7143 1.0563 GGG G 0.6889 0.9233

¹相对的密码子频率以预期值的形式表示。这指如果存在4个编码给定氨基酸的密码子，并且它们是同样使用的，预期每个密码子占25％(0.25)。由于冗余，将0.25规格化为1，以对于每个密码子相比较于所有编码该氨基酸的密码子产生相对的积分。如果密码子比另一个对于给定的氨基酸选择更占优势，则它将得到＞1的计数。而如果它比另一个对于该氨基酸较少优选，它将得到＜1的计数。

表Q：未被充分表示的AgroAS密码子和用于改善种子表达²的改进

密密码氨修饰作物中密密码氨修饰作物中密密码氨修饰作物中

码子基的密未充分码子基的密未充分码子基的密未充分

子 (wt) 酸码子表示² 子 (wt) 酸码子表示子 (wt) 酸码子表示

2 GTA V GTG 谷物， 177 TCG S TCC 大豆 481 GCG A GCC 大豆

大豆

3 ACG T ACC 大豆 179 GCG A GCC 大豆 485 AAT N AAC 谷物，

大豆

9 GGA G GGT 谷物 180 CGT R CGC 谷物 489 CCG P CCA 大豆

10 GCG A GCC 大豆 181 CCG P CCA 大豆 504 ATA I ATC 谷物

15 ACG T ACC 大豆 185 CGT R CGC 谷物 508 CGT R CGC 谷物

16 AAA K AAG 谷物 190 TTT F TTC 谷物 520 CGT R CGC 谷物

21 GTC V GTG 大豆 201 TAT Y TAC 谷物 543 ACG T ACC 大豆

23 CGA R CGC 谷物 209 CGT R CGC 谷物 545 GCG A GCC 大豆

26 CGG R CGC 大豆 218 ACG T ACC 大豆 546 AAT N AAC 谷物，

大豆

30 TAT Y TAC 谷物 219 ACG T ACC 大豆 547 TAT Y TAC 谷物

36 AAT N AAC 谷物，238 CCG P CCA 大豆 551 ACG T ACC 大豆

大豆

46 GGC G GGT 大豆 244 CGT R CGC 谷物 553 GCG A GCC 大豆

47 GCG A GCC 大豆 248 TAT Y TAC 谷物 554 ACG T ACC 大豆

48 GTT V GTG 谷物 276 CGT R CGC 谷物 556 TCG S TCC 大豆

49 TTT F TTC 谷物 280 AAT N AAC 谷物，559 AGA R AGG 谷物

大豆

50 TCG S TCC 大豆 281 CCG P CCA 大豆 561 CCG P CCA 大豆

53 TAT Y TAC 谷物 282 TCG S TCC 大豆 572 CCG P CCA 大豆

55 TAT Y TAC 谷物 283 GCG A GCC 大豆 578 TCG S TCC 大豆

56 CCG P CCA 大豆 290 GCG A GCC 大豆 580 GGA G GGT 谷物

58 CGT R CGC 谷物 293 CCG P CCA 大豆 584 CCG P CCA 大豆

64 ACG T ACC 大豆 294 TCG S TCC 大豆 585 ACG T ACC 大豆

69 CCG P CCA 大豆 296 TAT Y TAC 谷物 592 ACG T ACC 大豆

70 CCG P CCA 大豆 301 AAT N AAC 谷物，602 CCG P CCA 大豆

大豆

75 TGT C TGC 谷物 307 TAT Y TAC 谷物 617 TAT Y TAC 谷物

76 TTT F TTC 谷物 312 TCG S TCC 大豆 633 TCG S TCC 大豆

85 TAT Y TAC 谷物 313 CCG P CCA 大豆 652 ACG T ACC 大豆

86 AAT N AAC 谷物，322 CGT R CGC 谷物 655 CGT R CGC 谷物

大豆

97 ACG T ACC 大豆 328 CCG P CCA 大豆 658 TCG S TCC 大豆

102 GCG A GCC 大豆 329 ATA I ATC 谷物 667 CCG P CCA 大豆

112 TCG S TCC 大豆 339 CCG P CCA 大豆 668 CGT R CGC 谷物

115 CGG R CGC 大豆 352 TCG S TCC 大豆 680 ACG T ACC 大豆

123 CCG P CCA 大豆 363 TCG S TCC 大豆 690 CCG P CCA 大豆

125 CGT R CGC 谷物 376 CCG P CCA 大豆 698 CCG P CCA 大豆

133 TCG S TCC 大豆 378 TCG S TCC 大豆 700 TCG S TCC 大豆

136 CCG P CCA 大豆 390 TAT Y TAC 谷物 703 ACG T ACC 大豆

137 ACG T ACC 大豆 411 TTT F TTC 谷物 705 GGA G GGT 谷物

143 AGA R AGG 谷物 442 CCG P CCA 大豆 708 GCG A GCC 大豆

150 TAT Y TAC 谷物 446 TAT Y TAC 谷物 711 CGG R CGC 大豆

151 TCG S TCC 大豆 449 GCG A GCC 大豆 715 AAT N AAC 谷物，

大豆

153 GCG A GCC 大豆 460 AAT N AAC 谷物，724 GCG A GCC 大豆

大豆

155 TCG S TCC 大豆 464 ACG T ACC 大豆 729 GCG A GCC 大豆

172 GCG A GCC 大豆 469 CGG R CGC 大豆

²标题为″作物中未充分表示″栏表明作物(玉米或大豆)中特定的密码子是未被充分表示的。

实施例11：包括单体的苜蓿中华根瘤菌邻氨基苯甲酸合酶的转化载体的制备。

苜蓿中华根瘤菌的基因克隆

使用获得自ATCC的苜蓿中华根瘤菌1021的穿刺培养物，接种到YM培养基(每1L含10g甘露醇，0.5g K₂HPO₄，0.2g MgSO₄-7H₂O，1.0g酵母提取物，0.2g NaCl，88mg FeCl₃-6H₂O，15g琼脂)平板上。该平板在30℃生长2天。使用单个克隆接种到1升的YM培养基中。该培养物在30℃生长过夜。在5,000×g旋转10分钟沉下细胞颗粒并且在-20℃冷冻。使用Qiagen Genomic-tip DNA试剂盒(Qiagen公司，Valencia，加利福尼亚)根据1999年8月的Qiagen基因组DNA手册(第42页)提取基因组DNA。

使用PCR反应扩增基因。所使用的引物是Rhizo F2：

ATGGCAGCGGTAATTCTGGAAG(SEQ ID NO：138)和Rhizo R8：

TCAGGCTGCCTTGGTCTTC(SEQ ID NO：139)。

将所得到的PCR片段克隆到pGEM(Promega公司，Madison，WI.)载体中。

最后，利用PCR扩增pGEM中的PCR产物，使用下列引物：

Rhizo NcoI ACTGACTCCATGGCAGCGGTAATTCTGGAA

(SEQ ID NO：140)和Rhizo SpeI：

CTGACTAGTTCAGGCTGCTT(SEQ ID NO：141)，

并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen公司，Grand Island，N.Y)。

载体构建

用SpeI消化在TOPO 2.1载体中包含根瘤菌基因的载体，并且进行klenow反应以使该位点钝化。PCR纯化DNA(Qiagen PCR纯化试剂盒和MinElute手册，2001)，然后用NcoI消化。将该片段克隆到pET30a的EcoRV和NcoI位点，从而产生pMON66595(图41)。

通过几个步骤产生拟南芥转化载体，最初用NcoI/EcoRI消化pMON13773(图8)以产生骨架片段。用NcoI和EcoRI消化pMON66595并除去根瘤菌AS基因的较大的部分(大约2000碱基对)。然后将两段连接在一起。用EcoRI消化阳性克隆并用小牛肠磷酸酶(CIP)处理。通过用EcoRI消化pMON66595除去根瘤菌基因的第二个片段，并且保持大约200碱基对的片段。将2个片段连接在一起，并且对所合成的克隆测序以检查根瘤菌小片段的正确方向。

用BglII和NcoI消化具有正确的序列和方向的上述一个克隆。然后用BglII和NcoI消化pMON58046(图12)，并且除去CTP2运输肽片段。将这些片段连接在一起以完成该盒。

连接片段用NotI消化以移出该盒。然后在CIP处理的NotI位点将它们连接成为pMON36524(图48)。消化这些克隆以发现以与NPTII基因产生pMON66599(图42)相同的方向插入的盒。

然后将载体pMON66599转化农杆菌并用于转化拟南芥。该实验中的对照构建体是pMON66598(图43)，其与pMON66599所描述的盒插入方式相同，只是包含农杆菌AS野生型基因。

互补分析

用BamHI和NcoI切下来自pMON66595的根瘤菌AS基因，并克隆到 pSE280载体(Invitrogen)的相应位点，产生pMON66596(图44)。然后将pMON66596转化突变的大肠杆菌菌株，EMG2 ΔtrpE(产生自EMG菌株WTK12，F+，获得自ATCC)显示同数的基因互补于trp-菌株的基因组。

活性分析

将pMON66596转化BL-21细胞并用IPTG诱导表达蛋白质。通过HPLC分析粗细胞提取物，并发现具有活性和大约10μM trp的IC₅₀(Poulson，色谱法杂志Journal of Chromatography，547：155-160(1991))。

蛋白质表达和纯化

通过用IPTG诱导His-标记的蛋白质表达。利用QIAexpressionist 2002手册和镍树脂(Ni-NTA Spin手册，2000)中所列出的天然条件完成蛋白质纯化。兔血清显示识别纯化的蛋白质。

如在实施例2，3和6中，用包含根瘤菌邻氨基苯甲酸合酶基因的载体转化植物，并且在种子中显示升高的色氨酸水平。

实施例12：用包含玉米邻氨基苯甲酸合酶α-亚基基因和玉米邻氨基苯甲酸合酶β-亚基基因的载体转化谷物。

为了产生包含玉米邻氨基苯甲酸合酶α-亚基的编码序列的穿梭载体，用EcoRI和SacII消化pMON65150。凝胶纯化所得到的6195碱基对的片段，然后脱磷酸化。质粒pMON66604用EcoRI和SacII消化，以产生凝胶纯化的1077碱基对的片段。然后将1077碱基对的片段连接包含玉米ASα编码序列的粘末端的6195碱基对片段，以产生pMON67149，玉米L3(油质蛋白)启动子-玉米hsp70内含子-玉米ASα-Tr73′UTR表达载体。随后用XhoI消化这个载体，产生包含玉米油质蛋白启动子、玉米热休克蛋白70内含子、玉米邻氨基苯甲酸α-亚基编码序列和Tr7 3’UTR的4364碱基对的DNA片段。

用XhoI消化质粒pMON30167，产生8.89Kb的DNA片段。然后将这个片段连接4964碱基对的片段以产生pMON79951(图45)，转化载体包含L3启动子-zmhsp70内含子-玉米ASα-Tr73′UTR。

通过PCR从Monsanto所有的cDNA文库分离玉米邻氨基苯甲酸合酶β-亚基的编码序列，其中利用下列引物：

5′引物5″TGCTGACCATGGCCTGCTCCCACATCGTCG3′

(SEQ ID NO：142)，其包含NcoI限制酶切位点(以粗体显示)，和

3′引物5′CAGTGAATTCCTACGAACGCTGCTTCTCCAGTTC3′

(SEQ ID NO：143)，其包含EcoRI限制酶切位点(以粗体显示)。

所使用的PCR参数是，2°/秒到95°；95°5分钟；2°/秒到95；95°30秒；2°/秒到55°；55°45秒；2°/秒到72°；72°55秒；循环25次，在第三步开始；2°/秒到72°；72°10分钟；2°/秒到4°保持。(所有的温度显示为℃，除非另作说明)。PCR混合物包含：1μl从pMON79952小量制备(Qiagen方法)的DNA，1.5μl的各种引物(10μM原液)5μl含氯化镁的Roche 10×PCR缓冲液，2μl 10mM dNTP混合物，1μL高保真(Hi-Fi)Taq混合物(Roche扩展高保真PCR系统#1732650)和水，总体积为50μl。所得到的PCR产物连接到pGEM-T载体(Promega pGEM-T载体系统I#A3600)中。对上述片段测序显示其丢失限制性酶切位点。利用pGEM克隆作为模板再进行PCR，并且将产物克隆到TOPO 2.1PCR载体中(Invitrogen TOPO TA克隆试剂盒pCR2.1-TOPO载体#45-0641)。该克隆通过测序证实。所得到的包含玉米ASβ的载体称为pMON66592。然后用NcoI和EcoRI消化该载体，以产生850碱基对(bp)的片段。分离后，钝化850bp片段的末端并脱去磷酸。用BamHI和SmaI消化质粒pMON79953，以产生5353bp的片段。分离后，钝化5353bp片段的末端。然后将包含ASβ基因的850bp片段连接到平末端的5353bppMON79953片段中以产生pMON79954，玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr73′UTR载体。

随后用XhoI消化载体pMON79954以产生包含玉米油质蛋白启动子，玉米hsp70内含子，玉米ASβ编码序列和Tr7 3′UTR的2907碱基对的DNA片段。质粒pMON30167(图49)用XhoI消化以产生8.89Kb的片段。将2个片段连接在一起以产生pMON79955(图46)，转化载体包含L3启动子-zmhsp70内含子-玉米ASβ-Tr73′UTR。

为了产生玉米ASα和ASβ叠加(stacking)载体，用HindIII消化pMON79955以产生16.57Kb的片段。产生钝化的片段并且脱去磷酸。质粒pMON67149用XhoI消化，以产生4364碱基对的DNA片段，随后变为平末端。将2个片段连接在一起以产生pMON79956(图47)，最后的转化载体包含玉米L3启动子-zmhsp70内含子-玉米ASα-Tr7 3′UTR，与玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR叠加。

利用根瘤农杆菌转化玉米

玉米植株(自交系LH198/Hill)在标准实验下生长在温室中。当胚为 1.5-2.0mm长度，通常在授粉后10-15天收获植物的穗。通过喷雾或渗入80％的乙醇对穗进行表面杀菌。

利用本领域技术人员公知的方法从个体的种仁分离不成熟的胚胎。转化前，将不成熟的胚胎在包含16.9mg/L AgNO₃(指定为培养基2112V)的培养基211(N6盐，2％蔗糖，1mg/l 2，4-二氯苯氧乙酸(2，4-D)，0.5mg/L烟酸，1.0mg/L硫胺HCl，0.91g/L L-天冬酰胺，100mg/L：肌醇，0.5g/L MES，100mg/L酪蛋白水解物，1.6g/L MgCl₂，0.69g/L L-脯氨酸，2g/L GELGRO tm，pH5.8)上培养3-6天。

农杆菌介导的转化玉米细胞及其他单子叶植物的方法是已知的(美国专利号5,591,616和5,981,840；以及EP0 672 752)。使用农杆菌菌株ABI和根瘤农杆菌二元载体系统进行转化。

在与玉米胚胎细胞共培养前，农杆菌细胞生长在28℃，包含大约50μg/ml卡那霉素和100μg/ml壮观霉素的LB(DIFCO)液体培养基中，以选择保持改变的Ti质粒和二元载体。在接种玉米细胞前，农杆菌细胞在室温下，在包括用于保持质粒的适当抗生素和200μM乙酰丁香酮的AB培养基(Chilton等人，Proc.Nat.Acad.Sci.(美国)，71：3672-3676(1974))中生长过夜。在马上接种前，农杆菌细胞通过离心沉淀，在包含200μM乙酰丁香酮的1/2 MSVI培养基(2.2g/L GIBCO MS(Murashige和Skoog，Physiol.Plant 15：473-497(1962)基本(basal)盐，2mg/L甘氨酸，0.5g/L烟酸，0.5g/L L-吡哆醇-HCl，0.1mg/L硫胺，115g/L L-脯氨酸，10g/L D-葡萄糖和10g/L蔗糖，pH5.4)中洗涤。

切下不成熟的玉米胚，浸于1/2 MSPL培养基的农杆菌悬浮液中并且在室温下与农杆菌培养大约5分钟。

农杆菌感染和共培养后，将胚转入类型II的延迟培养基中5-7天并且在27℃黑暗培养。延迟培养基由包含2.0mg/L 2，4-D(GIBCO)，100mg/L-酪蛋白氨基酸，12mM脯氨酸，500mg/L羧苄青霉素和20μM硫代硫酸银的MS基础盐组成。所有的培养基化学试剂是组织培养级的。一旦从不成熟的胚胎观察到类型II的愈伤组织开始的标志，正如Selman等人，在玉米手册The MaizeHandbook，Freeling和Walbot编辑，Springer Verlag，第672页(1994)中所定义的，从胚胎除去胚芽鞘。然后将胚胎转入包含2.0mg/L 2，4-D，12mM脯氨酸，20μM硫代硫酸银，500mg/L羧苄青霉素和0.5mM草甘膦(Monsanto公司，St.Louis，Mo.)的MS培养基并且在27℃黑暗培养2周。

如上所述将胚形成的愈伤组织转入MS培养基，但是培养基另外包含1.0mM草甘膦。然后培养物在黑暗中于27℃培养2周。然后将仍然具有愈伤组织的胚转入包含3.0mM草甘膦的MS培养基另外培养2周。

通过将愈伤组织转入包含0.1mg/L 2，4-D和0.1μM脱落酸(ABA)的MS培养基2周，然后转入包含6％蔗糖而无2，4-D的MS培养基再培养2周实现植物再生。培育在黑暗中于27℃进行以容许体细胞胚成熟并在再生过程中转化。

将准备发芽的体细胞胚转入无激素的MS培养基，并且在光照下培养直到产生附着根的苗。大约2-3周后，产生小植株。

然后将小植株转入温室并且在标准温室条件下生长。

R1种子氨基酸含量的分析

对于各个载体建立几个转基因谷物的品系并通过世代的数目繁殖。这些品系是生长的，并且自花受粉以产生纯合系。在各个世代，利用在未成熟种子上进行western印迹分析确定转化基因的表达，产生成熟的R1种子并利用如Agilent Technologies Technical Bulletin REV14所描述的荧光检测分析游离氨基酸的含量。表达ASα蛋白质的玉米种子相对于基线水平(相当于阴性等值线和非转基因对照)产生升高数量的色氨酸。谷物的基线游离色氨酸水平的范围是从大约5-大约25ppm。

所有的出版物和专利在此引入作为参考，并且逐一地引入作为参考。本发明不限于所显示和描述的精确细节，因为应该理解在保持在由权利要求所定义的本发明的精神和范围之内的同时可产生许多变化和改进。

Claims

1.编码邻氨基苯甲酸合酶α-结构域蛋白质的分离的DNA分子，其中该DNA分子编码其序列如SEQ ID NO：66所示的蛋白质。

2.权利要求1的分离的DNA分子，其中该DNA分子是其序列如SEQ IDNO：67或68所示的DNA分子。

3.包括第一表达盒的DNA构建体，其中所述第一表达盒包括可操作连接的(i)异源启动子；(ii)编码其序列如SEQ ID NO：66所示的邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子；和(iii)转录终止子。

4.权利要求3的DNA构建体，进一步包括第二表达盒，所述第二表达盒包括可操作连接的(i)异源启动子；(ii)编码玉米邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子；和iii)转录终止子。

5.权利要求4的DNA构建体，其中编码邻氨基苯甲酸合酶α-结构域的DNA分子是其序列如SEQ ID NO：67所示的DNA分子。

6.权利要求4的DNA构建体，其中α-结构域蛋白质是其序列如SEQ IDNO：66所示的蛋白质，而β-结构域蛋白质是其序列如SEQ ID NO：118所示的蛋白质。

7.权利要求6的DNA构建体，其中β-结构域蛋白质是由其序列如SEQ IDNO：116所示的DNA分子编码的。

8.用于改变植物中色氨酸含量的方法，包括：

a.将包括权利要求1的编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及

b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于不包括转基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。

9.权利要求8的方法，其中邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α-结构域和玉米邻氨基苯甲酸合酶β-结构域的融合体。

10.权利要求9的方法，其中α-结构域是其序列如SEQ ID NO：66所示的蛋白质。

11.用于制备动物饲料或人食品的方法，包括：

a.将包括权利要求1的编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA分子被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及

b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA分子编码的邻氨基苯甲酸合酶，相对于不包括转基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。

12.权利要求11的方法，其中邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α-结构域和玉米邻氨基苯甲酸合酶β-结构域的融合体。

13.通过权利要求11的方法所制备的动物饲料或人食品。

14.包括权利要求4的DNA构建体的动物饲料或人食品。

15.通过权利要求11的方法所制备的转基因植物细胞。

16.包括权利要求4的DNA构建体的转基因植物细胞。