CN101849014B - 嵌合pufa聚酮合酶系统及其用途 - Google Patents

嵌合pufa聚酮合酶系统及其用途 Download PDF

Info

Publication number
CN101849014B
CN101849014B CN200880024785.9A CN200880024785A CN101849014B CN 101849014 B CN101849014 B CN 101849014B CN 200880024785 A CN200880024785 A CN 200880024785A CN 101849014 B CN101849014 B CN 101849014B
Authority
CN
China
Prior art keywords
seq
fatty acid
polyunsaturated fatty
territory
polyketide synthase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200880024785.9A
Other languages
English (en)
Other versions
CN101849014A (zh
Inventor
克雷格·A·韦弗
罗斯·泽克尔
丹尼尔·H·多尔蒂
詹姆斯·G·梅茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101849014A publication Critical patent/CN101849014A/zh
Application granted granted Critical
Publication of CN101849014B publication Critical patent/CN101849014B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • C12P7/6434Docosahexenoic acids [DHA]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/04Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • A61P15/06Antiabortive agents; Labour repressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • A61P19/10Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/08Antiepileptics; Anticonvulsants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/24Antidepressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • C12P7/625Polyesters of hydroxy carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6472Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone

Abstract

本文公开了嵌合多不饱和脂肪酸(PUFA)聚酮合酶(PKS)蛋白和嵌合PUFA PKS系统,包括裂殖壶菌属(Schizochytrium)和破囊壶菌属(Thraustochytrium)来源的嵌合PUFA PKS蛋白和系统。还公开了编码这些嵌合PUFA PKS蛋白和系统的核酸和蛋白、经过遗传修饰的包含这些嵌合PUFA PKS蛋白和系统的生物体和制造和使用这类嵌合PUFA PKS蛋白和系统的方法。

Description

嵌合PUFA聚酮合酶系统及其用途
相关申请
本文通过援引并入下列所有专利申请的全部内容。美国专利申请No.11/689,438,其于2007年3月21日递交;美国专利申请No.10/965,017,其于2004年10月13日递交,现为美国专利No.7,217,856;美国专利申请流水号10/810,352,其于2004年3月26日递交,现为美国专利No.7,211,418;美国临时申请流水号60/457,979,其于2003年3月26日递交;美国专利申请流水号10/124,800,其于2002年4月16日递交;美国临时申请流水号60/284,066,其于2001年4月16日递交;美国临时申请流水号60/298,796,其于2001年6月15日递交;美国临时申请流水号60/323,269,其于2001年9月18日递交;美国申请流水号09/231,899,其于1999年1月14日递交,现为美国专利No.6,566,583;美国申请No.11/668,333,其于2007年1月29日递交;美国专利申请流水号11/452,096,其于2006年6月12日递交;美国临时申请No.60/784,616,其于2006年3月21日递交;美国临时申请No.60/689,167,其于2005年6月10日递交;美国专利申请No.11/452,138,其于2006年6月12日递交;美国临时申请No.60/784,616,其于2006年3月21日递交;美国临时申请No.60/689,167,其于2005年6月10日递交;美国申请流水号09/090,793,其于1998年6月4日递交,现为美国专利No.6,140,486。
发明领域
本发明涉及嵌合多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统,具体地,涉及来自裂殖壶菌属(Schizochytrium)和破囊壶菌属(Thraustochytrium)的嵌合PUFA PKS系统。更具体地,本发明涉及编码这些PUFA PKS系统的核酸,这些PUFA PKS系统,包含这些PUFA PKS系统的遗传修饰生物体,和制造和使用这些本文公开的PUFA PKS系统的方法。
发明背景
本领域公知聚酮合酶(PKS)系统是与脂肪酸合酶(FAS)系统相关的酶复合物,但它们经常被高度修饰而产生通常显示与脂肪酸几乎没有相似性的特化产物。然而现在已有证据显示,PKS样系统(PKS-like systems),在本文也可互换地称作用于产生PUFA的PKS系统、PUFA合酶系统或PUFA PKS系统,存在于能够从乙酰CoA和丙二酰CoA合成多不饱和脂肪酸(PUFA)的海洋细菌和某些真核生物中。在美国专利No.6,140,486中详细描述了希瓦氏菌属(Shewanella)和另一种海洋细菌海产弧菌(Vibrio marinus)中PUFA合成的PKS途径。在美国专利6,566,583中详细描述了真核破囊壶菌(Thraustochyrid)-裂殖壶菌属(Schizochytrium)中PUFA合成的PKS途径。在2002年12月19日公开的美国专利申请公开No.20020194641和2007年4月19日公开的美国专利申请公开20070089199中,详细描述了真核生物例如破囊壶菌科(Thraustochytriales)成员中PUFA合成的PUFA PKS途径,包括裂殖壶菌属(Schizochytrium)中PUFA PKS系统的附加描述和破囊壶菌属(Thraustochytrium)中PUFA PKS系统的鉴定,包括有关这些系统的使用的细节。2004年11月25日公布的美国专利申请公开No.20040235127公开了破囊壶菌属中PUFA PKS系统的详细结构描述,以及关于使用这类系统产生二十碳五烯酸(C20:5,ω-3)(EPA)和其他PUFA的更多细节。2005年3月12日公布的美国专利申请公开No.20050100995公开了Shewanella olleyana和日本希瓦氏菌(Shewanella japonica)中PUFA PKS系统的结构和功能描述,以及这些系统的用途。这些申请还公开了具有PUFA PKS途径组成基因的生物体,包括微生物和植物,的遗传修饰,并公开了通过这些生物体产生PUFA。而且,PCT专利公开No.WO 05/097982描述了Ulkenia中的PUFAPKS系统,美国专利申请公开No.20050014231描述了来自金黄破囊壶菌(Thraustochytrium aureum)的PUFA PKS基因和蛋白。本文通过援引并入上述每一个申请的全部内容。
研究人员已尝试利用聚酮合酶(PKS)系统。文献中传统上将聚酮合酶系统归为三种基本类型之一,这三种类型通常是指:I型[模块性(modular)或重复性(iterative)],II型和III型。为清楚起见,需要指出,I型模块性PKS系统以前被直接称为“模块性”PKS系统,而I型重复性PKS系统先前也被直接称作“I型”PKS系统。II型系统的特征是多个可以分离的(separable)蛋白质,其中各个蛋白质执行独特的酶反应。这些酶协同工作来产生终产物,并且在生产终产物的过程中,该系统的每一个单独的酶通常有数次参与。这类系统的工作方式与在植物和细菌中发现的脂肪酸合酶(FAS)系统类似。I型重复性PKS系统与II型系统相似之处在于酶以重复的方式被使用来产生最终产物。I型重复性与II型的不同之处在于,酶活性作为较大的蛋白质的域存在,而不是与可分离的蛋白相伴随。该系统与在动物和真菌体内发现的I型FAS系统类似。
与II型系统相反,在I型模块性PKS系统中,每个酶域在终产物的产生过程中只被使用一次。这些域存在于非常大的蛋白质中,在PKS蛋白质中每个反应的产物被传递给另一个域。此外,在上述PKS系统中,如果终产物中包含碳-碳双键,则碳-碳双键通常是反式构型。
更近些时候发现了III型系统,它属于缩合酶(condensing enzymes)的植物查耳酮合酶家族。III型PKS与I型和II型PKS系统迥然不同,在重复缩合反应中利用游离CoA底物,通常产生杂环终产物。
多不饱和脂肪酸(PUFA)被认为可用于营养、药物、工业和其他用途。目前由天然资源和化学合成提供的PUFA不能满足商业需要。PUFA的一个主要来源是海洋鱼类;然而鱼类资源正不断减少,因此可能不是一个可持续的来源。此外,重金属和有毒有机分子的污染也是一个影响海洋鱼类来源的油类的严重问题。来源于含油种子作物的植物油价格相对低廉,并且没有与鱼油相关的污染问题。然而,在产业上开发的植物油中,PUFA通常仅限于亚油酸(在Δ9和12位有两个双键的18碳-18:2Δ9,12)和亚麻酸(18:3Δ9,12,15)。在PUFA合成的传统途径(即“标准”途径或“经典”途径)中,中等链长的饱和脂肪酸(脂肪酸合酶(FAS)系统的产物)经过一系列延长和去饱和反应被修饰。延长反应的底物是脂肪酰-CoA(待延长的脂肪酸链)和丙二酸单酰-CoA(在每个延长反应中添加的2个碳的来源)。延长酶反应的产物是在直链中具有两个额外碳的脂肪酰-CoA。去饱和酶通过氧依赖性的反应除去2个氢从而在现有的脂肪酸链内产生顺式双键。去饱和酶的底物是酰基-CoA(在某些动物体内)或被酯化到磷脂(例如卵磷脂)甘油骨架上的脂肪酸。
因此,因为从亚油酸和亚麻酸合成脂肪酸需要多种单独的去饱和酶和延长酶以产生更不饱和的和更长链的PUFA,所以为了对植物宿主细胞进行工程化以表达PUFA,例如EPA和二十二碳六烯酸(DHA),就需要表达数种单独的酶来实现合成。此外,可能需要进行进一步的工程化工作来产生可用量的这类PUFA。因此,从自然产生这些脂肪酸的物种(例如来自PUFAPKS系统)获得参与PUFA生物合成的遗传材料,并将该分离的材料在能够被操作以产生产业量的PUFA的异源系统中单独或组合地进行表达,是令人感兴趣的。
人们已经进行了努力,试图通过修饰内源产生的脂肪酸而在含油种子作物中产生PUFA。通过对这些具有各种单独的脂肪酸延长酶和去饱和酶基因的植物进行遗传修饰,已经产生了含有可测量水平的PUFA(例如EPA)并且含有显著水平的混合短链和不饱和度较低的PUFA的叶子或种子(Qi等,Nature Biotech.22:739(2004);PCT Publication No.WO 04/071467;Abbadi等,Plant Cell 16:1(2004));Napier and Sayanova,Proceedings of the NutritionSociety(2005),64:387-393;Robert等,Functional Plant Biology(2005)32:473-479;或美国专利申请公开2004/0172682)。
提高微生物和植物的PUFA产量是一个非常令人向往的产业目标。因此,本领域中仍然需要提供方法来有效地和高效地产生,特别是在产业上有用的生物体例如微生物和含油植物中有效和高效地产生大量富含期望PUFA的脂类(例如三酰基甘油(TAG)和磷脂(PL))。
发明内容
本发明的一个实施方案涉及一种嵌合PUFA PKS系统,其中来自第一PUFA PKS系统的FabA样β-羟酰-ACP脱水酶(DH)域被替换为来自另一不同的第二PUFA PKS系统的DH域,从而产生嵌合的PUFA PKS系统,其与所述第一PUFA PKS系统相比,产生不同的ω-3PUFA对ω-6PUFA比例。在一个方面中,包含来自所述第一PUFA PKS系统的DH域的蛋白质被替换为包含来自所述第二PUFA PKS系统的DH域的同源蛋白质。在一个方面中,来自所述第一或第二PUFA PKS系统的DH域对应于来自裂殖壶菌属或破囊壶菌属的DH2域。在一个方面中,第一PUFA PKS系统是裂殖壶菌属PUFA PKS系统,并且其中第二PUFA PKS系统是破囊壶菌属PUFAPKS系统。在一个方面中,第一PUFA PKS系统是裂殖壶菌属PUFA PKS系统,并且其中来自裂殖壶菌属PUFA PKS系统的OrfC被来自不同破囊壶菌(thraustochytrid)的OrfC替换。
在本实施方案的一个方面中,第一PUFA PKS系统是裂殖壶菌属PUFAPKS系统,并且其中来自裂殖壶菌属PUFA PKS系统的OrfC被替换为来自破囊壶菌23B的OrfC。在一个方面中,此类来自破囊壶菌23B的OrfC由针对裂殖壶菌属密码子用法优化过的核酸序列编码。示例核酸序列包括SEQ ID NO:70。在另外一个方面中,来自裂殖壶菌属PUFA PKS系统的OrfA被替换为来自破囊壶菌23B的OrfA。在一个方面中,此类来自破囊壶菌23B的OrfA是由针对裂殖壶菌属密码子用法优化过的核酸序列编码的。示例核酸序列包括SEQ ID NO:71。在另外一个方面中,来自裂殖壶菌属PUFA PKS系统的OrfB被替换为破囊壶菌23B的OrfB。在一个方面中,此类来自破囊壶菌23B的OrfB由针对裂殖壶菌属密码子用法优化过的核酸序列编码。示例核酸序列包括SEQ ID NO:72。本领域的技术人员根据本文的公开容易想到Orf A、B和C的其它组合。
在本实施方案的另一个方面中,第一PUFA PKS系统是裂殖壶菌属PUFA PKS系统,并且其中来自裂殖壶菌属PUFA PKS系统的OrfC的DH2域被替换为来自破囊壶菌23B的DH2域。在一个方面中,包含来自破囊壶菌23B的DH2域的示例性核酸序列包括SEQ ID NO:73。在一个方面中,所述来自破囊壶菌23B的DH2由针对裂殖壶菌属密码子用法优化过的核酸序列编码。此类包含来自破囊壶菌23B的DH2域的核酸序列的实例有包含SEQ ID NO:75的序列。
在本实施方案的另外一个方面中,该嵌合PUFA PKS系统包括这样的蛋白质,所述蛋白质的氨基酸序列与SEQ ID NO:74至少95%同一。在一个方面中,该嵌合PUFA PKS系统包括包含SEQ ID NO:74的氨基酸序列的蛋白质。在一个方面中,该嵌合PUFA PKS系统包括SEQ ID NO:2、SEQ IDNO:4和SEQ ID NO:74。在另一个方面中,该嵌合PUFA PKS系统包括SEQIDNO:39、SEQ ID NO:4和SEQ ID NO:62。在另一个方面中,该嵌合PUFAPKS系统包括SEQ ID NO:39、SEQ ID NO:4和SEQ ID NO:74。在另一个方面中,该嵌合PUFA PKS系统由如下核酸分子编码,所述核酸分子包括SEQID NO:1、SEQ ID NO:3和SEQ ID NO:70。在另外一个方面中,该嵌合PUFAPKS系统由如下核酸分子编码,所述核酸分子包括SEQ ID NO:1、SEQ IDNO:3和SEQ ID NO:73。在另一个方面中,该嵌合PUFA PKS系统由如下核酸分子编码,所述核酸分子包括SEQ ID NO:1、SEQ ID NO:3和SEQ IDNO:75。在另一个方面中,该嵌合PUFA PKS系统由如下核酸分子编码,所述核酸分子包括SEQ ID NO:71,SEQ ID NO:3和SEQ ID NO:70。
本发明的另一个实施方案涉及改变由第一PUFA PKS系统产生的多不饱和脂肪酸(PUFA)的ω-3对ω-6比例的方法,包括在生物体中表达任何上述的嵌合PUFA PKS系统。在一个方面中,该嵌合PUFA PKS系统由微生物表达。在一个方面中,该微生物是裂殖壶菌属。在另一个方面中,该微生物是酵母。在一个方面中,该嵌合PUFA PKS系统由植物表达。
本发明的再一个实施方案涉及遗传修饰的微生物或植物或植物部分,其包括任何上述的PUFA PKS系统。
本发明的另一个实施方案涉及增加第一PUFA PKS系统的PUFA产生和改变由第一PUFA PKS系统产生的多不饱和脂肪酸(PUFA)的ω-3对ω-6比例的方法。该方法包括在生物体中表达嵌合PUFA PKS系统,该系统中来自第一PUFA PKS系统的FabA-样β-羟酰-ACP脱水酶(DH)域被替换为来自另一不同的第二PUFA PKS系统的DH域,从而产生嵌合PUFA PKS系统,其与所述第一PUFA PKS系统相比产生不同的ω-3PUFA对ω-6PUFA比例。来自所述第二PUFA PKS系统的DH域是针对该第一PUFA PKS系统所来源的生物体的密码子用法优化过的。
本发明的另一个实施方案涉及编码与SEQ ID NO:74至少95%同一的嵌合OrfC蛋白的分离核酸分子。在一个方面中,该分离的核酸分子包含与SEQID NO:73至少95%同一的核酸序列。在一个方面中,该核酸分子是针对表达该核酸分子的生物体的密码子用法优化过的。例如,该核酸分子可以是针对该嵌合蛋白一部分所来源的生物体的密码子用法进行过优化的。在一个实施方案中,该核酸序列与SEQ ID NO:75至少95%同一。
本发明的另一个实施方案涉及包含任何上述核酸分子的重组核酸分子。
本发明的另外一个实施方案涉及经任何上述核酸分子转染的重组宿主细胞。在一个方面中,该细胞是微生物。在一个方面中,该微生物是裂殖壶菌属。在一个方面中,该微生物是细菌。在一个方面中,该微生物是酵母。在一个方面中,该细胞是植物细胞。
本发明的另一个实施方案涉及包含任何上述重组宿主细胞的遗传修饰植物或其部分。
本发明的另一个实施方案涉及一种嵌合PUFA PKS系统,其包括a)至少一个烯酰-ACP还原酶(ER)域;b)至少四个ACP域;c)至少两个β-酮酯酰-ACP合酶(KS)域;d)至少一个酰基转移酶(AT)域;e)至少一个β-酮酯酰-ACP还原酶(KR)域;f)至少两个FabA样β-羟酰-ACP脱水酶(DH)域;g)至少一个链长因子(CLF)域;和h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)域。至少一个DH域来自第一PUFA PKS系统,并且其中域(a)-(h)中其余的域来自另一不同的第二PUFA PKS系统。
本发明的另一个实施方案涉及提高表达PUFA PKS系统的生物体的PUFA产生的方法。该方法包括针对该生物体或相关生物体的最优密码子用法对编码PUFA PKS系统中至少一种蛋白质的核酸分子加以修饰。在一个方面中,该生物体表达异源重组PUFA PKS系统。在一个方面中,该生物体是裂殖壶菌属,并且编码该内源PUFA PKS系统中至少一种蛋白质的核酸分子是针对裂殖壶菌属密码子用法优化过的。
附图简述
图1是裂殖壶菌属PUFA PKS系统的域结构图示。
图2A是显示含有编码来自破囊壶菌23B的OrfC的核酸序列的质粒(pThOrfC synPS)的构建过程的第1步以及由该过程产生的中间质粒的示意图。上述核酸序列是针对裂殖壶菌属密码子优化过的合成序列。
图2B是显示含有编码来自破囊壶菌23B的OrfC的核酸序列的质粒(pThOrfC synPS)的构建过程的第2步以及由该过程产生的中间质粒的示意图。上述核酸序列是针对裂殖壶菌属密码子优化过的合成序列。
图3A是显示编码包含来自破囊壶菌23B的天然DH2域的裂殖壶菌属OrfC的质粒(pDS49)的构建过程的步骤1-6以及由该过程产生的中间质粒的示意图。
图3B是显示编码包含来自破囊壶菌23B的天然DH2域的裂殖壶菌属OrfC的质粒(pDS49)的构建过程的步骤7以及由该过程产生的中间质粒的示意图。
图3C是显示编码包含来自破囊壶菌23B的天然DH2域的裂殖壶菌属OrfC的质粒(pDS49)的构建过程的步骤8-9以及由该过程产生的中间质粒的示意图。
图4A是显示质粒DD21的构建以及由该过程产生的中间质粒的示意图。该质粒DD21的构建是编码包含来自破囊壶菌23B并经过裂殖壶菌属密码子优化的合成DH2域的裂殖壶菌属OrfC的质粒(pDD24)的构建过程的第一步。
图4B是显示质粒DD22的构建以及由该过程产生的中间质粒的示意图。该质粒DD22的构建是编码包含来自破囊壶菌23B并经过裂殖壶菌属密码子优化的合成DH2域的裂殖壶菌属OrfC的质粒(pDD24)的构建过程的第二步。
图4C是显示质粒DD24的构建以及由该过程产生的中间质粒的示意图。该质粒DD24的构建是编码包含来自破囊壶菌23B并经过裂殖壶菌属密码子优化的合成DH2域的裂殖壶菌属OrfC的质粒(pDD24)的构建过程的最后一步。
图5是对照酵母和表达裂殖壶菌属OrfsA,OrfsB,OrfC和Het I的酵母的FAME谱。
图6是图5中酵母的FAME谱(profile),经放大以图示目标PUFA的产生。
发明详细说明
本发明一般地涉及多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统,也称作PUFA合酶系统,包括来自破囊壶菌(thraustochytrids)(例如裂殖壶菌属和破囊壶菌属)、拟网黏菌类(labyrinthulids)、海洋细菌和其它含PUFA PKS的生物体的PUFA PKS系统,和嵌合PUFA PKS蛋白及其产生的系统。本发明涉及包含这类PUFA PKS系统的遗传修饰生物体,并涉及制造这些系统和使用这些系统产生目的产物,包括生物活性分子,的方法。在一个优选实施方案中,本发明涉及一种在经过遗传修饰从而表达本发明的PUFA PKS系统的微生物或含油种子植物(oil-seed plants)或植物部分中产生PUFA的方法。由该微生物或植物产生的油含有至少一种由所述PUFA PKS系统产生的PUFA,并且在植物的场合,基本上不含混合的较短链和较低饱和度PUFA(它们是通过FAS系统产物的修饰而产生的脂肪酸产物)。本发明特别地包括用于修饰PKS系统产生的PUFA量以及PUFA的比例——在本发明的一个方面中,修饰ω-3PUFA对ω-6PUFA的比例或一种PUFA对另一种PUFA的比例(例如DHA对EPA的比例)——的方法,这些方法可应用于创建和使用任何PUFA PKS构建体和/或遗传修饰的生物体,如本文例示和详细说明的。
首先,本发明人在此描述了PUFA PKS系统的一种结构域,它是对PUFA PKS系统所产生的PUFA的比例(当多于一种PUFA被产生时)进行修饰的必要而充分的条件;本发明人还在此提供了新的嵌合构建体、新的嵌合PUFA PKS系统、新的生物体和利用此发现来产生修饰量的PUFA的新方法。其次,本发明人在此描述了用于在异源宿主(或在内源宿主)中优化PUFA PKS表达以增加该生物体的PUFA生产的方法、修饰、以及多种嵌合PUFA PKS系统和构建体。本发明包括了单独或联合利用这两项发现来提高和指导生物体的PUFA生产的详细说明。
更具体地,关于本发明的某些实施方案,本发明人和同事的先前工作(见美国专利申请公开No.20050100995)显示,破囊壶菌23B(Thraustochytrium23B)orfC编码区(本文用SEQ ID NO:62表示)能够在功能上替换基因组orfC座位上的裂殖壶菌属orfC编码区。这一点是通过下述过程确定的。首先,精确地删除裂殖壶菌属orfC编码区代之以一个抗生素抗性盒(表示为ΔorfC::ZEO),从而获得生长专性需要DHA并且对ZeocinTM耐受的菌株(表示为B32-Z1)。然后构建质粒,其中破囊壶菌23B orfC编码区被精确地克隆到裂殖壶菌属orfC上游非编码区和下游非编码区之间。用该破囊壶菌23BorfC构建体转化所述裂殖壶菌属ΔorfC::ZEO菌株,以补足所述删除并产生自养型(不需要DHA)且Zeocin敏感的转化体。发现这些转化体来源于orfC座位的双交叉(cross-over)重组事件,该重组事件使破囊壶菌23B orfC编码区精确地替换来自裂殖壶菌属的orfC编码区,即基因替换。对这些转化体的脂肪酸含量分析显示,DHA/DPA比例从大约2.3(在野生型裂殖壶菌属ATCC20888中)提高到了大约8.3(接近破囊壶菌23B的比例)。该结果表明,orfC基因(在裂殖壶菌属和破囊壶菌属中其含有三个域DH1,DH2和ER)在PUFA产物的n-3/n-6(ω-3/ω-6)比例的决定中发挥主要作用。然而,含破囊壶菌23B orfC菌株的总PUFA产量,尽管相当可观,是低于野生型裂殖壶菌属宿主的产量的(大约60%)。
通过对这两个orfC编码区进行检查,本发明人认为破囊壶菌23B基因在裂殖壶菌属中的表达很低是由于裂殖壶菌属和破囊壶菌属之间的密码子用法模式明显不同造成的。本发明人现在已发现,使用具有针对裂殖壶菌属模式优化过的密码子用法的“合成”破囊壶菌23B orfC编码区(即合成产生的编码区)提高了DHA产量,同时利用非合成破囊壶菌23B orfC时所见的n-3/n-6比例增加仍然得以保持(见实施例1和4)。
本发明人先前还描述了裂殖壶菌属和破囊壶菌属的OrfC蛋白内存在可识别的域:脱水酶1(DH1)、脱水酶2(DH2)和烯酰还原酶(ER)(例如见美国专利申请公开No.20020194641,上文;美国专利申请公开No.20040235127,上文),并教导了OrfC中的一个或多个域被认为参与控制由PUFA PKS系统产生的脂肪酸的类型和/或比例。这里,本发明人在裂殖壶菌属、大肠杆菌(E.coli)和酵母系统中证明,PUFA PKS系统对ω-3对ω-6(n-3/n-6)脂肪酸比例的大部分或全部影响是由DH2域单独负责的。具体地说,本发明人首先进行实验,使用各种破囊壶菌23B OrfC域来替换裂殖壶菌属OrfC中相应的域(数据未显示)。本发明人发现,用来自破囊壶菌属的OrfC-ER域替换裂殖壶菌属OrfC-ER域,DHA/DPA比例与野生型裂殖壶菌属相比没有显著改变(历史地,大约2.3)。然而,用来自破囊壶菌属的相应域替换裂殖壶菌属的全部两个DH域,DHA/DPA比例则与野生型破囊壶菌23B相比显著提高(历史地,大约8.3-10),而且,仅用来自破囊壶菌23B的DH2域替换裂殖壶菌属DH2域也足以有效地实现相同的结果。实施例2、3、4、5和6提供了多种显示PUFA PKS系统中DH2域对ω-3对ω-6(n-3/n-6)脂肪酸比例的影响的实验结果。
本发明人还描述了使用多种PUFA PKS系统提高宿主生物体的PUFA生产,并出乎意料地发现某些嵌合PUFA PKS的组合(例如由特定的来自裂殖壶菌属和破囊壶菌属的Orf组合构成的嵌合PUFA PKS系统)与天然生物体或其他嵌合PUFA PKS系统相比具有显著更高的PUFA生产(在一个实例中是DHA生产)。例如,本发明人显示,包含来自破囊壶菌23B的OrfA和OrfC,以及来自裂殖壶菌属的OrfB的嵌合PUFA PKS系统,当在裂殖壶菌属宿主生物体内表达时,与天然裂殖壶菌属或来自于这两种生物体的其它嵌合PUFA PKS系统相比可产生显著更多的脂肪酸,特别是显著更多的DHA(实施例8)。因此,本发明提供了充分的指引来生产数种不同PUFA PKS系统,这些系统与某些野生型(非嵌合)PUFA合酶相比,PUFA生产增加,且n-3/n-6比例改善。
如本文所使用的,PUFA PKS系统(也可以称作PUFA合酶系统、PUFA合酶或用于产生PUFA的PKS样系统)一般具有如下的识别特征:(1)它产生PUFA,特别是长链PUFA,作为该系统的天然产物;和(2)包括数个组装成复合体的多功能蛋白,该复合体进行脂肪酸链的重复性加工,又进行非重复性加工,包括选定的循环中的顺反异构化和烯酰还原反应。此外,PUFA合酶中的ACP域需要通过辅助因子(例如4-磷酸泛酰巯基乙胺)的结合而激活。该辅助因子的结合是由磷酸泛酰巯基乙胺基转移酶(PPT酶)执行的。如果宿主生物体的内源PPT酶不能激活PUFA合酶ACP域,那么就必须提供能够执行该功能的PPT酶。本发明人鉴定了一种念珠蓝细菌(Nostocsp.)的Het I酶是用于激活PUFA合酶ACP域的合适PPT酶的实例。所称PUFA PKS系统或PUFA合酶是指生物体中以复合体形式产生PUFA的所有基因及其编码产物的总称。因此,PUFA PKS系统具体地指天然产物是PUFA的PKS系统。
更具体地,本文所称的PUFA PKS系统产生多不饱和脂肪酸(PUFA),特别是长链PUFA,作为产物。例如,内源(天然)地含有PUFA PKS系统的生物体使用该系统制造PUFA。根据本发明,PUFA是这样的脂肪酸,其碳链长度至少为16个碳,更优选至少18个碳,更优选至少20个碳,更优选22个或更多个碳,具有至少3个或更多个双键,优选地有4个或更多个双键,更优选地有5个或更多个双键,甚至更加优选有6个或更多个双键,其中所有的双键均是顺式构型。本文中称长链多不饱和脂肪酸(LCPUFA)更具体地是指18个或更长碳链长度的脂肪酸,优选地20个或更长碳链,含有3个或更多个双键。ω-6系列的LCPUFA包括:γ-亚麻酸(C18:3)、二-高γ-亚麻酸(C20:3n-6)、花生四烯酸(C20:4n-6)、肾上腺酸(也称二十二碳四烯酸或DTA)(C22:4n-6)和二十二碳五烯酸(C22:5n-6)。ω-3系列的LCPUFA包括:α-亚麻酸(C18:3)、二十碳三烯酸(C20:3n-3)、二十碳四烯酸(C20:4n-3)、二十碳五烯酸(C20:5n-3)、二十二碳五烯酸(C22:5n-3)和二十二碳六烯酸(C22:6n-3)。LCPUFA还包括具有多于22个碳和4个或更多个双键的脂肪酸,包括但不限于C28:8(n-3)。
第二,根据本发明的PUFA PKS系统包括数个多功能蛋白(也可以包括单功能蛋白,特别是对于来自海洋细菌的PUFA PKS系统而言),它们组装成复合体,该复合体同时指导脂肪酸链的重复性加工和非重复性加工,包括所选的循环内的顺反异构化和烯酰基还原反应。这些蛋白质在本文还可以称作核心PUFA PKS酶复合体或核心PUFA PKS系统。这些蛋白质中包含的各个域和基序的一般功能是本领域已知的,就来自海洋细菌和真核生物体的各种PUFA PKS系统有详细描述(见例如美国专利6,140,486;美国专利No.6,566,583;Metz等,Science 293:290-293(2001);美国专利申请公开No.20020194641;美国专利申请公开No.20040235127;美国专利申请公开No.20050100995和PCT公开No.WO 2006/135866)。域可以作为单个蛋白存在(即该域和蛋白是同义的),或者作为单个蛋白的两个或多个域的其中之一,如上面提到的。
在一种海洋细菌内的PUFA PKS系统被发现(见美国专利No.6,140,486)之前,并不知道PKS系统具有这种重复性和选择性酶促反应的组合,人们也不认为它们能够产生顺式构型的碳-碳双键。然而,本发明描述的PUFAPKS系统能够产生顺式双键,并且能够改变循环中的反应顺序。
本发明人提出利用PUFA PKS系统的这些特点来产生多种不能被先前描述的(I型重复型或模块型、II型或III型)PKS系统产生的生物活性分子。这些生物活性分子包括,但不限于,多不饱和脂肪酸(PUFA)、抗生素或其它生物活性化合物,它们中的许多在下文中将有讨论。例如,使用本文描述的PUFA PKS基因结构的知识,可以使用多种方法中的任一种改变PUFAPKS基因,或者将这些基因中的一部分与其他的合成系统(包括其他的PKS系统)组合,从而产生新的产物。这类系统的兼具进行重复性和选择性反应的内在能力使得该系统可以产生对其它类型PKS系统应用类似方法时不会见到的产物。
优选地,本发明的PUFA PKS系统至少包括如下的生物活性域,它们通常包含在三种或多种蛋白上:(a)至少一个烯酰基-ACP还原酶(ER)域;(b)多个酰基载体蛋白(ACP)域(例如至少1-4个,优选地至少5个ACP域,在一些实施方案中有最多达6、7、8、9、10或超过10个ACP域);(c)至少两个β-酮酯酰-ACP合酶(KS)域;(d)至少一个酰基转移酶(AT)域;(e)至少一个β-酮酯酰-ACP还原酶(KR)域;(f)至少两个FabA样β-羟酰-ACP脱水酶(DH)域;(g)至少一个链长因子(CLF)域;(h)至少一个丙二酸单酰-CoA:ACP酰基转移酶(MAT)域。在一个实施方案中,根据本发明的PUFA PKS系统还包括至少一个含有脱水酶(DH)保守活性位点基序的区域。
在一个实施方案中,裂殖壶菌属PUFA PKS系统至少包括如下的生物活性域:(a)2个烯酰基-ACP还原酶(ER)域;(b)4-5个至10个或更多个酰基载体蛋白(ACP)域,在一个方面中为9个ACP域;(c)2个β-酮酯酰-ACP合酶(KS)域;(d)1个酰基转移酶(AT)域;(e)1个β-酮酯酰-ACP还原酶(KR)域;(f)2个FabA样β-羟酰-ACP脱水酶(DH)域;(g)1个链长因子(CLF)域;和(h)1个丙二酸单酰-CoA:ACP酰基转移酶(MAT)域。在一个实施方案中,根据本发明的裂殖壶菌属PUFA PKS系统还包括至少一个含有脱水酶(DH)保守性活性位点基序的区域或域,所述基序不是FabA样DH域的一部分。这些域的结构和功能特征各自在本领域中是普遍已知的,在下文就本发明的PUFA PS系统对它们有详细描述。
在另一个优选实施方案中,破囊壶菌属PUFA PKS至少包括如下的生物活性域:(a)2个烯酰基-ACP还原酶(ER)域;(b)4或5个和10个之间或更多个酰基载体蛋白(ACP)域,在一个方面中为8个ACP域;(c)2个β-酮酯酰-ACP合酶(KS)域;(d)1个酰基转移酶(AT)域;(e)1个β-酮酯酰-ACP还原酶(KR)域;(f)2个FabA样β-羟酰-ACP脱水酶(DH)域;(g)1个链长因子(CLF)域;(h)1个丙二酸单酰-CoA:ACP酰基转移酶(MAT)域。在一个实施方案中,根据本发明的破囊壶菌属PUFA PKS系统还包括至少一个含有脱水酶(DH)保守性活性位点基序的区域或域,所述基序不是FabA样DH域的一部分。这些域的结构和功能特征各自在本领域中是普遍已知的,在下文关于本发明的PUFA PS系统中有详细描述。
PUFA PKS系统可以额外的包括一个或多个辅助蛋白(accessoryprotein),辅助蛋白在本文中定义为这样的蛋白质,其不被认为是如上所述的核心PUFA PKS系统一部分(即不是PUFA合酶系统复合体自身的部分)的,但可能是,或者确实是使用本发明的核心PUFA合酶复合体PUFA的生产,或者至少是高效PUFA的生产所必需的,特别是在某些宿主生物体(例如植物)中是如此。例如,为了产生PUFA,PUFA PKS系统必须和将4’-磷酸泛酰巯基乙胺模块从辅酶A转移到酰基载体蛋白(ACP)域的辅助蛋白一起工作。因此,可以认为PUFA PKS系统包括至少一个4’-磷酸泛酰巯基乙胺转移酶(PPT酶)域,或者这种域可以被看作是PUFA PKS系统的辅助域或蛋白。当对生物体(例如微生物或植物)进行遗传修饰使之表达根据本发明的PUFA PKS系统时,某些宿主生物体可以内源表达PUFA PKS产生PUFA所需的辅助蛋白(例如PPT酶)。然而,对于某些生物体,可以用本文描述的编码一种或多种辅助蛋白的核酸分子加以转化,使之能够产生PUFA和/或提高其PUFA生产,即便该生物体可内源地产生同源辅助蛋白(即,与宿主细胞的内源辅助蛋白相比,某些同源辅助蛋白可以更有效地或高效地与被转化PUFA合酶蛋白一起工作)。本发明和先前的申请提供了用包括辅助PPT酶的本发明PUFA PKS系统进行了遗传修饰的细菌和酵母的实例。用包含辅助PPT酶的PUFA PKS系统遗传修饰过的植物已有描述(见例如美国专利申请公开No.20070089199)。PPT酶的结构和功能特征将在下文有更详细的描述。
用于在真核生物体中合成长链PUFA(LCPUFA)的“标准”或“经典”途径涉及中长链饱和或单不饱和脂肪酸(例如上文描述的FAS系统的产物)的修饰。这些修饰由延长步骤和去饱和步骤组成。延长反应的底物是脂肪酰-CoA(待延长的脂肪酸链)和丙二酸单酰-CoA(每次延长反应期间添加的两个碳的来源)。延长反应的产物是直链中添加了2个额外碳的脂肪酰-CoA。游离脂肪酸(FFAs)通常不出现在该反应循环中。去饱和酶通过在氧依赖的反应中去除2个氢从而在预先存在的脂肪酸链内产生顺式双键。去饱和酶的底物是酰基-CoA(在一些动物体内)或酯化到PL(例如磷脂酰胆碱)的甘油骨架上的脂肪酸。同样,在该反应机制中不出现FFA。因此,FFA出现在“标准”或“经典”LCPUFA合成途径中的唯一时刻是在脂肪酸从一些FAS系统释放期间。如上面讨论的,这些通常是16或18碳脂肪酸,通常是饱和的或单不饱和脂肪酸,非更长链PUFA,例如EPA或DHA。这种长链PUFA产生方案的一个后果是经常积累该途径的中间产物,这些中间产物经常占到该系统产生的新脂肪酸的大部分。
因此,根据本发明,所称用于产生PUFA的“标准”或“经典”途径是指如下的脂肪酸合成途径,其中中等链长的饱和脂肪酸(例如脂肪酸合酶(FAS)系统的产物)通过一系列延长和去饱和反应被修饰。延长反应的底物是脂肪酰-CoA(待延长的脂肪酸链)和丙二酸单酰-CoA(每次延长反应期间添加的两个碳的来源)。延长反应的产物是直链中添加了2个额外碳的脂肪酰-CoA。去饱和酶通过在氧依赖的反应中去除2个氢从而在预先存在的脂肪酸链内产生顺式双键。这些途径和参与这些途径的基因在文献中是公知的。
如本文所使用的,术语“脂类”包括磷脂(PL);游离脂肪酸;脂肪酸酯;三酰基甘油(TAG);二酰基甘油;单酰基甘油;磷脂类(phosphatides);蜡(醇和脂肪酸的酯);固醇和固醇酯;类胡萝卜素;叶黄素(例如氧合类胡萝卜素);烃;和其它本领域普通技术人员已知的脂类。术语“多不饱和脂肪酸”和“PUFA”不仅包括游离脂肪酸形式,还包括其它的形式,例如TAG形式和PL形式。
对于生物体/宿主对PUFA PKS蛋白、域或系统的表达而言,所称“同源”生物体或“异源”宿主是指PUFA PKS系统的至少一个蛋白质、域或部分不是该生物体天然(内源)表达的蛋白质、域或部分,尽管PUFA PKS系统可能包括宿主生物体天然表达的蛋白质、域或其部分(例如本文描述的嵌合蛋白,其包含来自宿主生物体的序列和来自其它不同生物体或其它不同蛋白质的序列)。
本文描述了某些示例性的编码各种嵌合蛋白的核酸分子(构建体)(见实施例)。根据本发明,“嵌合蛋白”是由如下所述的核酸序列编码的工程化蛋白,该核酸序列是通过剪接或联结(连接)两个或更多个完整的或部分基因或核酸序列而产生的。“嵌合PUFA PKS系统”是含有来自两个或更多个不同PKS系统的蛋白和/或域,包括嵌合蛋白和/或域,的PUFA PKS系统。例如,实施例描述了一种嵌合PUFA PKS系统,其包括裂殖壶菌属PUFA PKS OrfA和OrfB,以及破囊壶菌属PUFA PKS OrfC。实施例还描述了包括裂殖壶菌属PUFA PKS OrfA、OrfB和除DH2域之外的全部OrfC的嵌合PUFA PKS系统,而上述DH2域是来自破囊壶菌属PUFA PKS的PUFA PKS DH2域。相应地,所说的后一种嵌合PUFA PKS系统包括嵌合蛋白(嵌合OrfC蛋白)。本文还描述了使用针对裂殖壶菌属的密码子用法优化过的破囊壶菌属核酸序列的相同嵌合体,来例示可以用来改变PUFA PKS系统产生的产物的遗传操作组合(见实施例)。实施例还描述了多种其他的嵌合PUFA PKS系统。
如本文所使用的,“密码子优化”或其衍生语句是指对编码给定蛋白的核酸序列的修饰(改变、变化、突变)过程,将核酸序列中的一个或多个密码子替换为包含该核酸序列的核酸分子要在其中表达的特定生物体的核酸序列中最经常使用的密码子。技术人员理解密码子偏好和普通意义上的密码子优化。更具体地,给定密码子在遗传密码中的出现频率在不同生物体之间可以有显著变化(包括例如同一属的种与种之间)。任何生物体在一小部分时间使用的、或者使用较同一氨基酸的另一个密码子为少的密码子,都会导致蛋白表达发生问题。因此,当使核酸序列所用密码子的频率与宿主表达系统/生物体相匹配时(例如通过在不修饰氨基酸序列的条件下,用更近似地反映宿主系统天然密码子偏好的密码子来替换稀有或较少使用的密码子),蛋白表达可以被显著提高。
本发明人在本文中描述了针对裂殖壶菌属的密码子用法来优化核酸序列的密码子用法的方法,但这只是本发明密码子用法优化的一个示例。根据本发明,可以针对要在其中表达该核酸分子的宿主细胞或生物体的最优(优化的)密码子用法,或者,事实上,针对另一不同生物体的优化密码子用法(例如,对于用于在植物中表达的编码破囊壶菌属PUFA PKS蛋白的核酸分子,可以针对裂殖壶菌属的密码子用法加以优化),来对编码给定蛋白(例如PUFA PKS蛋白)的核酸分子的核苷酸序列进行修饰(例如通过合成、突变、重组技术等)。实施例的表1举例说明了裂殖壶菌属的最优密码子用法。
此外,本发明人在这里提出,对于编码给定蛋白的核酸分子的核酸序列,其中该核酸序列衍生自、获知自、或获得自特定宿主,可将该核酸序列针对相同宿主进行优化,以便在该宿主或其它宿主中加以表达。后面的这个本发明的实施方案代表了多种多样的“受指导的”或“被加速的”进化,其中,例如,将编码来自某一生物体的蛋白(例如来自裂殖壶菌属的PUFA PKS蛋白)的核酸分子进行修饰(例如通过重新合成该核酸序列并替换某些核苷酸)以提高同一生物体(在本实例中是裂殖壶菌属)所喜好的密码子用法(优化密码子用法)。然后,可以在裂殖壶菌属中(作为重组核酸分子)或者在另一宿主细胞或生物体(例如在植物)中表达该核酸分子。在本实施方案中我们提出,来自某一生物体的给定核酸序列可能并不使用人们能够确定的该生物体的最优密码子(密码子偏好)。相应地,可以重新合成核酸序列来提高在该生物体中的表达。
可用于本发明的PUFA PKS系统和蛋白或它们的域包括细菌和非细菌PUFA PKS系统。非细菌PUFA PKS系统是来自或源自于非细菌生物体,例如真核生物或古细菌的PUFA PKS系统。真核生物与原核生物的区分的基础在于细胞分化的程度,真核生物分化程度比原核生物更高。一般地说,原核生物不具有核膜,在细胞分裂期间不展示有丝分裂,只有一条染色体,细胞质中含有70S核糖体,不具有线粒体、内质网、叶绿体、溶酶体或高尔基体,且可能有鞭毛,如果有的话,鞭毛仅含单根原纤维。相反,真核生物具有核膜,在细胞分裂期间展示有丝分裂,有多条染色体,细胞质中含有80S核糖体,具有线粒体、内质网、叶绿体(藻类中)、溶酶体和高尔基体,且可能有鞭毛,如果有的话,鞭毛含有多根原纤维。一般地说,细菌是原核生物,而藻类、真菌、原生生物(protist)、原生动物和高等植物是真核生物。根据本发明,可以产生这样的遗传修饰生物体,其整合有非细菌PUFA PKS功能域和细菌PUFA PKS功能域,以及来自其它PKS系统(I型重复性或模块性,II型或III型)或FAS系统的PKS功能域或蛋白。
根据本发明,具有3-酮酯酰-ACP合酶(KS)生物活性(功能)的域或蛋白质被定性为执行FAS(和PKS)延长反应循环的初始步骤的酶。术语“β-酮酯酰-ACP合酶”可以和术语“3-酮酰基-ACP合酶”(3-keto acyl-ACP synthase)、“β-酮酰基-ACP合酶”(β-keto acyl-ACP synthase)和“酮-酰基ACP合酶”(keto-acyl ACP synthase)以及类似的衍生词互换使用。要被延长的酰基基团通过硫酯键与酶活性位点的半胱氨酸残基连接。在多步反应中,酰基-酶与丙二酸单酰-ACP缩合,形成-酮酰基-ACP、CO2和游离酶。KS在延长循环中发挥关键作用,并且在许多系统中已经证明它比该反应循环中的其它酶具有更高的底物特异性。例如,大肠杆菌具有三种截然不同的KS酶——每一种都在这种生物的生理中具有自己特殊的作用(Magnuson等,Microbiol.Rev.57,522(1993))。在本文记载的海洋细菌和破囊壶菌中描述的PUFA PKS系统的两个KS域,在PUFA生物合成反应顺序中可能具有截然不同的作用。作为一类酶,KS已经获得了良好的表征。许多已验证的KS基因的序列是已知的,活性位点基序已经被鉴定,数种蛋白的晶体结构已得到确定。通过与已知KS序列的同源性可以容易地鉴定蛋白(或蛋白的域)属于酶的KS家族。
根据本发明,具有丙二酸单酰-CoA:ACP酰基转移酶(MAT)生物活性(功能)的域或蛋白被定性为将丙二酸单酰模块从丙二酸单酰-CoA转移到ACP的酶。术语“丙二酸单酰-CoA:ACP酰基转移酶(MAT)”可以和“丙二酰酰基转移酶”和类似的衍生词互换使用。除了活性位点基序(GxSxG)之外,这些酶在关键位置还具有一个R和Q氨基酸的扩展基序(extended motif),该基序使它们具有MAT酶的身份(例如,与下文描述的AT域相对)。在一些PKS系统(但非PUFA PKS域)中,MAT域优先将甲基-或乙基-丙二酸(methyl-orcthyl-malonate)加载到ACP基团上(从相应的CoA酯),从而向直碳链内引入分支。MAT域可以通过它们与已知MAT序列的同源性和其扩展基序结构来加以识别。
根据本发明,具有酰基载体蛋白(ACP)生物活性(功能)的域或蛋白被定性为小多肽(通常80-100个氨基酸长度),其发挥载体的作用,通过硫酯连接将生长中的脂肪酰链携带在共价结合于该蛋白的辅因子上。它们作为分离的单元或者作为较大蛋白质内的域出现。通过将CoA的磷酸泛酰巯基乙胺基团转移到ACP高度保守的丝氨酸残基上,使ACP从无活性的脱辅基(apo)形式变成有功能的完全(holo)形式。酰基通过磷酸泛酰巯基乙胺模块游离末端的硫酯键连接在ACP上。ACP可以通过用放射性泛酰巯基乙胺标记和与已知ACP的序列同源性加以鉴定。上述基序的变异型的存在(LGIDS*)也是ACP的标志。
根据本发明,具有酮还原酶活性——也称作3-酮酯酰-ACP还原酶(KR)生物活性(功能)——的域或蛋白被定性为催化3-酮酯酰形式的ACP发生吡啶核苷酸依赖性还原的酶。这是脂肪酸从头生物合成延长循环中的第一个还原步骤,也是聚酮生物合成中经常被执行的反应。术语“β-酮酯酰ACP还原酶”可以和术语“酮还原酶”、“3-酮酯酰-ACP还原酶”、“酮-酰基ACP还原酶”及该术语的类似衍生词互换使用。观察到与烯酰基ACP还原酶(ER)的一个家族、FAS的另一种还原酶(但不是PUFA PKS系统中的ER家族)和短链醇脱氢酶家族具有显著的序列相似性。对上面所示的PUFA PKS区域进行的Pfam分析显示,在核心区中与短链醇脱氢酶家族有同源性。对同一区域进行的Blast分析显示在核心区中与已知的KR酶有匹配,还显示了一个与来自其它已表征PUFA PKS系统的域具有同源性的延伸区域。
根据本发明,基于如下的理由,将域或蛋白称作链长因子(CLF)。CLF最初被描述为是II型(解离酶(dissociated enzymes))PKS系统的特征,人们猜测它对决定延长循环的数目,从而决定终产物的链长起作用。CLF氨基酸序列与KS域显示同源性(被认为和KS蛋白形成异源二聚体),但是它们没有活性位点半胱氨酸。关于CLF在PKS系统中的作用尚有争议。新的证据(C.Bisang等,Nature 401,502(1999))提示,它在PKS系统的引发(提供最初的待延长酰基基团)中起作用。人们认为CLF域在此作用中使丙二酸(作为丙二酸酰-ACP)脱羧基,从而形成可以被转移到KS活性位点的乙酸基(acetate group)。因此该乙酸发挥能够进行最初的延长(缩合)反应的“引发”分子的作用。II型CLF的同源物在一些模块性PKS系统中已经被鉴定为“装载”域。在所有目前已鉴定的PUFA PKS系统中都找到了具有CLF的序列特征的域,并且在所有情况下,这样的域都是作为多域蛋白的一部分存在的。
“酰基转移酶”或“AT”是指可执行多种迥异的酰基转移反应的一大类酶。术语“酰基转移酶”(acyltransferase)可以和术语“酰基转移酶”(acyltransferase)互换使用。在本文中描述的PUFA PKS系统中鉴定的AT域彼此之间显示有良好的同源性,与目前已考察过的所有其它PUFA PKS系统中存在的域之间也显示有良好的同源性,而与一些具体功能已被鉴定的酰基转移酶(例如丙二酰-CoA:ACP酰基转移酶,MAT)显示非常微弱的同源性。尽管这种AT域与MAT有微弱的同源性,但人们并不认为该AT域起MAT的作用,因为它不具有这类酶的特征性延伸基序结构(见上文MAT域的描述)。为本公开的目的,所述AT域在PUFA PKS系统中可能担当的功能包括但不限于:将脂肪酰基团从ORFA ACP域转移到水(即硫酯酶-以游离脂肪酸的形式释放脂肪酰基团),将脂肪酰基团转移到受体如CoA,在各个ACP域之间转移酰基基团,或者将脂肪酰基基团转移到亲脂性受体分子(例如到溶血磷脂酸)。
根据本发明,该域具有烯酰-ACP还原酶(ER)生物活性。ER酶还原脂酰-ACP中的反式双键(由DH活性引入的),结果使那些碳完全饱和。PUFA-PKS中的ER域与一类新近被描述的ER酶家族显示同源性(Heath等,Nature 406,145(2000))。Heath和Rock通过从肺炎链球菌(Streptococcus pneumoniae)克隆目的基因,纯化由该基因表达的一种蛋白质,并在体外测定中证明它具有ER活性,从而鉴定了这类新型ER酶。目前已考察的所有PUFA PKS系统均含有至少一个与裂殖壶菌属ER域具有非常高的序列同源性的域,而所述裂殖壶菌属ER域与肺炎链球菌ER蛋白显示同源性。
根据本发明,具有脱水酶或脱水酶(DH)活性的蛋白质或域可催化脱水反应。如本文中通用的,所称DH活性,通常是指FabA样β-羟酰-ACP脱水酶(DH)生物活性。FabA样β-羟酰-ACP脱水酶(DH)生物活性从β-酮脂酰-ACP除去HOH,并最初在碳链内产生反式双键。术语“FabA样β-羟酰-ACP脱水酶”(FabA-like β-hydroxyacyl-ACP dehydrase)可以和术语“FabA样β-羟基酰基-ACP脱水酶”(FabA-like β-hydroxy acyl-ACP dehydrase)、“β-羟酰-ACP脱水酶”(β-hydroxyacyl-ACP dehydrase)、“脱水酶”(dehydrase)和类似的衍生词互换使用。PUFA PKS系统的DH域和细菌的FAS系统相关的DH酶(而不是其它PKS系统的DH域)显示同源性。细菌DH的一个亚类:FabA样DH,具有顺反异构酶活性(Heath等,J.Biol.Chem.,271,27795(1996))。正是这种与FabA样DH蛋白质的同源性,暗示本文所述的这些DH域中的一个或全部负责在PUFA PSK产物中插入顺式双键。
本发明的蛋白质还可以具有不被定性为FabA样(例如,上文所述的顺-反活性与FabA样活性相关)的脱水酶活性,该活性在本文一般称作非FabA样DH活性(non-FabA-like DH activity),或称非FabA样β-羟酰-ACP脱水酶(DH)生物活性。更具体地说,在PKS系统的脱水酶域中发现了一种保守的活性位点基序(~13个氨基酸长:L*xxHxxxGxxxxP;*在该基序中,L也可以是I)(Donadio S,Katz L.Gene.1992Feb 1;111(1):51-60)。该保守基序(在本文中也称脱水酶(DH)保守性活性位点基序或DH基序)在迄今已有记载的所有已知PUFA-PKS序列的一个相似区域中以及本文所述的各PUFAPKS序列中均有发现,但是相信这个基序是最近才被检测到的。该保守的基序位于PUFA-PKS序列中的一个具有高度同源性的未定性区域内。提出的通过PUFA-PKS的PUFA生物合成需要非FabA样的脱水作用,而这个基序就可能负责该反应。
为举例说明的目的,下文对某些PUFA PKS系统的结构作了详细的描述。然而,应当理解,本发明并不限于这些PUFA PKS系统的使用。例如,细菌PUFA PKS系统的使用可见美国专利No.6,140,486和美国专利申请公布No.20050100995,其他PUFA PKS基因或系统的描述可见PCT专利公布No.WO 05/097982和美国专利申请公布No.20050014231。
裂殖壶菌属PUFA PKS系统
裂殖壶菌属是破囊壶菌类(thraustochytrid)海洋微生物,可积累大量富含DHA和二十二碳五烯酸(DPA;22:5ω-6)的三酰基甘油;例如以干重计30%的DHA+DPA(Barclay等,J.Appl.Phycol.6,123(1994))。在通过延长/去饱和途径合成20-和22-碳PUFA的真核生物中,18-、20-和22-碳中间产物的蓄池相对较大,因此使用[14C]-乙酸的体内标记实验可以为预测的中间产物显示清晰的前体-产物动力学(Gellerman等,Biochim.Biophys.Acta 573:23(1979))。而且,向这类生物体外源添加的放射性标记的中间产物可被转化为最终的PUFA产物。本发明人显示,[1-14C]-乙酸被裂殖壶菌属细胞快速摄取并掺入到脂肪酸中,但是在最短的标记时间(1min)条件下,DHA含有31%的从脂肪酸回收的标记,这个百分比在10-15min的[14C]-乙酸掺入过程中以及在随后的24小时培养生长中均实质上保持不变(见美国专利申请公开No.20020194641,上文)。类似地,在整个实验中,DPA占标记的10%。没有证据显示16或18碳脂肪酸与22碳多不饱和脂肪酸之间有前体-产物关系。这些结果与下述是一致的:DHA从[14C]-乙酸快速合成,涉及非常小的(可能结合了酶)中间产物蓄池。
图1是来自裂殖壶菌属PUFA PKS系统的三个开放阅读框的图示,包括该PUFA PKS系统的域结构。存在三个开放阅读框,它们形成核心裂殖壶菌属PUFA PKS系统。每个开放阅读框的域结构如下。
裂殖壶菌属开放阅读框A(OrfA):
OrfA的完整核苷酸序列在本文表示为SEQ ID NO:1。OrfA是一条8730个核苷酸的序列(不包括终止密码子),其编码一条2910个氨基酸的序列,在本文表示为SEQ ID NO:2。OrfA内有12个域:(a)一个β-酮酯酰-ACP合酶(KS)域;(b)一个丙二酸单酰-CoA:ACP酰基转移酶(MAT)域;(c)9个酰基载体蛋白(ACP)域;和(d)一个酮还原酶(KR)域。从裂殖壶菌属菌种ATCC20888以及ATCC 20888的一个子株(称作裂殖壶菌属菌株N230D)分离了编码OrfA的基因组DNA克隆(质粒)并进行了测序。N230D是这样得到的,裂殖壶菌属ATCC 20888经过了化学诱变(NTG;1-甲基-3-硝基-1-亚硝基胍)后,针对脂肪酸含量的变化进行筛选,N230D就是1000个以上的随机选择的存活者之一。该菌株的价值在于具有更好的DHA生产率。
一个从裂殖壶菌属菌种ATCC 20888分离的、在本文中称作JK1126的基因组克隆,据本发明人所知,包括SEQ ID NO:1的1-8730位的核苷酸序列,并且编码SEQ ID NO:2的相应氨基酸序列。基因组克隆pJK1126(称作pJK1126 OrfA基因组克隆,形式是含有来自裂殖壶菌属ATCC 20888的″OrfA″基因的大肠杆菌质粒载体)于2006年6月8日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并被指定ATCC登录号PTA-7648。pJK1126 OrfA基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列被本发明所涵盖。
从裂殖壶菌属菌种N230D分离的两个基因组克隆,在本文中称作pJK306 OrfA基因组克隆和pJK320 OrfA基因组克隆,据本发明人所知,它共同(重叠克隆)包含SEQ ID NO:1的核苷酸序列,并且编码SEQ ID NO:2的氨基酸序列。基因组克隆pJK306(称作pJK306 OrfA基因组克隆,其形式是含有来自裂殖壶菌属菌种N230D的OrfA基因5’部分的大肠杆菌质粒(与pJK320有2.2kB的重叠))于2006年6月8日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并被指定ATCC登录号PTA-7641。pJK306 OrfA基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列被本发明所涵盖。基因组克隆pJK320(称作pJK320 OrfA基因组克隆,其形式是含有来自裂殖壶菌属菌种N230D的OrfA基因3’部分的大肠杆菌质粒(与pJK306有2.2kB的重叠))于2006年6月8日被保藏于美国典型培养物保藏中心(ATCC),10801 UniversityBoulevard,Manassas,Va.20110-2209USA,并被指定ATCC登录号PTA-7644。pJK320 OrfA基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列被本发明所涵盖。
OrfA中的第一个域是KS域,在本文也称作ORFA-KS,含有编码该ORFA-KS域的序列的核苷酸序列在本文表示为SEQ ID NO:7(SEQ ID NO:1的1-1500位)。含有ORFA-KS域的氨基酸序列在本文表示为SEQ ID NO:8(SEQ ID NO:2的1-500位)。需要指出,ORFA-KS域含有一个活性位点基序:DXAC*(*酰基结合位点C215)。另外,位于裂殖壶菌属KS区末端的一个特征基序GFGG存在于SEQ ID NO:2的该域中,相应地,也存在于SEQ IDNO:8中。
OrfA的第二个域是MAT域,本文也称作ORFA-MAT,含有编码该ORFA-MAT域的序列的核苷酸序列在本文表示为SEQ ID NO:9(SEQ IDNO:1的1723-3000位)。含有ORFA-MAT域的氨基酸序列在本文表示为SEQID NO:10(SEQ ID NO:2的575-1000位)。MAT域包括93位的天冬氨酸和94位的组氨酸(分别对应于SEQ ID NO:2的667和668位)。需要指出,ORFA-MAT域含有一个活性位点基序:GHS*XG(*酰基结合位点S706),在本文表示为SEQ ID NO:11。
OrfA的域3-域11是9个串联ACP域,在本文也称作ORFA-ACP(序列中的第一个域是ORFA-ACP1,第二个域是ORFA-ACP2,第三个域是ORFA-ACP3,等等)。第一个ACP域,ORFA-ACP1,包含在SEQ ID NO:1(OrfA)大约3343位-大约3600位的核苷酸序列中。含有编码该ORFA-ACP1域的序列的核苷酸序列在本文表示为SEQ ID NO:12(SEQ ID NO:1的3343-3600位)。含有第一个ACP域的氨基酸序列跨SEQ ID NO:2的大约1115位-大约1200位。含有ORFA-ACP1域的氨基酸序列在本文表示为SEQIDNO:13(SEQ ID NO:2的1115-1200位)。需要指出,ORFA-ACP1域含有一个活性位点基序:LGIDS*(*泛酰巯基乙胺结合基序S1157),在本文表示为SEQ ID NO:14。
全部9个ACP域的核苷酸和氨基酸序列是高度保守的,因此在本文中不用单独的序列标识符来表示每个域的序列。然而,根据本文公开的信息,本领域的技术人员能够容易地确定含有其它8个ACP域中每一个的序列。全部9个ACP域共同占据OrfA中从SEQ ID NO:1的大约3283位到大约6288位的区域,其对应于SEQ ID NO:2从大约1095到大约2096的氨基酸位置。含全部9个域的完整ACP区的核苷酸序列在本文表示为SEQ IDNO:16。由SEQ ID NO:16代表的区域包括各个ACP域之间的连接区段。9个域的重复间隔大约是SEQ ID NO:16的每330个核苷酸(相邻活性位点丝氨酸之间的实际氨基酸数目从104到116个氨基酸不等)。9个ACP域中的每一个均含有泛酰巯基乙胺结合基序LGIDS*(本文用SEQ ID NO:14表示),其中S*是泛酰巯基乙胺结合位点丝氨酸(S)。泛酰巯基乙胺结合位点丝氨酸(S)位于每个ACP域序列的中心附近。在ACP域区的每个末端和每个ACP域之间是一个高度富含脯氨酸(P)和丙氨酸(A)的区域,其被认为是一个连接区。例如,ACP域1和域2之间的序列是:APAPVKAAAPAAPVASAPAPA,本文中表示为SEQ ID NO:15。9个ACP域的每一个中的活性位点丝氨酸残基(即泛酰巯基乙胺结合位点)位置如下(参考SEQ ID NO:2的氨基酸序列):ACP1=S1157;ACP2=S1266;ACP3=S1377;ACP4=S1488;ACP5=S1604;ACP6=S1715;ACP7=S1819;ACP8=S1930;和ACP9=S2034。考虑到ACP域的平均大小是大约85个氨基酸(不包括连接子),包括连接子则是大约110个氨基酸,而活性位点丝氨酸大约位于域的中心,本领域的技术人员可以容易地确定9个ACP域每一个在OrfA中的位置。
OrfA中的域12是一个KR域,本文也称作ORFA-KR,含有编码ORFA-KR域的序列的核苷酸序列在本文表示为SEQ ID NO:17(SEQ IDNO:1的6598-8730位)。含有ORFA-KR域的氨基酸序列在本文表示为SEQID NO:18(SEQ ID NO:2的2200-2910位)。KR域内有一个与短链醛脱氢酶类(KR是该家族的一个成员)同源的核心区。该核心区跨越SEQ ID NO:1的大约7198位-大约7500位,其对应于SEQ ID NO:2的2400-2500位氨基酸。
裂殖壶菌属开放阅读框B(OrfB)
OrfB的完整核苷酸序列在本文表示为SEQ ID NO:3。OrfB是一个6177个核苷酸的序列(不包括终止密码子),其编码一条2059个氨基酸的序列,在本文表示为SEQ ID NO:4。OrfB内有4个域:(a)一个-酮酯酰-ACP合酶(KS)域;(b)一个链长因子(CLF)域;(c)一个酰基转移酶(AT)域;和(d)一个烯酰基ACP还原酶(ER)域。
已经从裂殖壶菌属菌种ATCC 20888和ATCC 20888的一个子株(称作裂殖壶菌属菌株N230D)分离了编码OrfB的基因组DNA克隆(质粒)并进行了测序。
从裂殖壶菌属菌种ATCC 20888分离的、在本文中称作pJK1129的基因组克隆,据本发明人所知,包括SEQ ID NO:3的核苷酸序列,并且编码SEQ ID NO:4的氨基酸序列。基因组克隆pJK1129(称作pJK1129 OrfB基因组克隆,其形式为含有来自裂殖壶菌ATCC 20888的″OrfB″基因的大肠杆菌质粒载体)于2006年6月8日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并指定ATCC登录号为PTA-7649。pJK1126 OrfB基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
从裂殖壶菌属菌种N230D分离的、在本文中称作pJK324 OrfB基因组克隆的基因组克隆,据本发明人所知,包括SEQ ID NO:3的核苷酸序列,并且编码SEQ ID NO:4的氨基酸序列。基因组克隆pJK324(称作pJK324OrfB基因组克隆,其形式为含有来自裂殖壶菌属菌种N230D的OrfB基因的大肠杆菌质粒)于2006年6月8日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号为No.PTA-7643。pJK324 OrfB基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
OrfB的第一个域是KS域,在本文也称作ORFB-KS,含有编码该ORFB-KS域的序列的核苷酸序列在本文表示为SEQ ID NO:19(SEQ IDNO:3的1-1350位)。含有ORFB-KS域的氨基酸序列在本文表示为SEQ IDNO:20(SEQ ID NO:4的1-450位)。该KS域包括一个位于SEQ ID NO:20的371位(也称SEQ ID NO:20371位)的缬氨酸。需要指出,ORFB-KS域含有一个活性位点基序:DXAC*(*酰基结合位点C196)。另外,该KS区末端的一个特征基序,GFGG,存在于SEQ ID NO:4(相应地,SEQ ID NO:20)的这个域中。
OrfB中的第二个域是CLF域,本文也称作ORFB-CLF,含有编码该ORFB-CLF域的序列的核苷酸序列在本文表示为SEQ ID NO:21(SEQ IDNO:3的1378-2700位)。含有所述ORFB-CLF域的氨基酸序列在本文表示为SEQ ID NO:22(SEQ ID NO:4的460-900位)。需要指出,ORFB-CLF域含有一个KS活性位点基序,它没有结合酰基的半胱氨酸。
OrfB中的第三个域是AT域,本文也称作ORFB-AT,含有编码该ORFB-AT域的序列的核苷酸序列在本文表示为SEQ ID NO:23(SEQ IDNO:3的2701-4200位)。含有ORFB-AT域的氨基酸序列在本文表示为SEQIDNO:24(SEQ ID NO:4的901-1400位)。需要指出,ORFB-AT域含有一个活性位点基序GxS*xG(*酰基结合位点S1140),其是酰基转移酶(AT)蛋白的特征。
OrfB中的第四个域是ER域,本文也称作ORFB-ER,含有编码该ORFB-ER域的序列的核苷酸序列在本文表示为SEQ ID NO:25(SEQ ID NO:3的4648-6177位)。含有ORFB-ER域的氨基酸序列在本文表示为SEQ ID NO:26(SEQ ID NO:4的1550-2059位)。
裂殖壶菌属开放阅读框C(OrfC)
OrfC的完整核苷酸序列在本文表示为SEQ ID NO:5。OrfC是一个4506个核苷酸的序列(不包括终止密码子),其编码一个1502个氨基酸的序列,在本文表示为SEQ ID NO:6。OrfC内有3个域:(a)两个Fab样-羟酰-ACP脱水酶(DH)域;和(b)一个烯酰基ACP-还原酶(ER)域。
已经从裂殖壶菌属菌种ATCC 20888和ATCC 20888的一个子株(称作裂殖壶菌属菌株N230D)分离了编码OrfB的基因组DNA克隆(质粒)并进行了测序。
从裂殖壶菌属菌种ATCC 20888分离的、本文称作pJK1131的基因组克隆,据本发明人所知,包括SEQ ID NO:5的核苷酸序列,并且编码SEQ IDNO:6的氨基酸序列。基因组克隆pJK1131(称作pJK1131 OrfC基因组克隆,其形式为含有来自裂殖壶菌属ATCC 20888的″OrfC″基因的大肠杆菌质粒载体)于2006年6月8日被保藏于美国典型培养物保藏中心(ATCC),10801University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号为No.PTA-7650。pJK1131 OrfC基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
从裂殖壶菌属菌种N230D分离的、本文称作pBR002OrfC基因组克隆的基因组克隆,据本发明人所知,包括SEQ ID NO:5的核苷酸序列,并且编码SEQ ID NO:6的氨基酸序列。基因组克隆pBR002(称作pBR002OrfC基因组克隆,其形式为含有来自裂殖壶菌属菌种N230D的OrfC基因的大肠杆菌质粒)于2006年6月8日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号为No.PTA-7642。pBR002 OrfC基因组克隆的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
OrfC的第一个域是一个DH域,在本文中也称作ORFC-DH1。这是OrfC中两个DH域其中之一,因此被指定为DH1。含有编码该ORFC-DH1域的序列的核苷酸序列在本文表示为SEQ ID NO:27(SEQ ID NO:5的1-1350位)。含有ORFC-DH1域的氨基酸序列在本文表示为SEQ ID NO:28(SEQ IDNO:6的1-450位)。
OrfC的第二个域是一个DH域,在本文中也称作ORFC-DH2。这是OrfC两个DH域中的第二个,因此被指定为DH2。含有编码该ORFC-DH2域的序列的核苷酸序列在本文表示为SEQ ID NO:29(SEQ ID NO:5的1351-2847位)。含有ORFC-DH2域的氨基酸序列在本文表示为SEQ ID NO:30(SEQ IDNO:6的451-949位)。该DH域包括位于SEQ ID NO:30第426-440位(SEQ IDNO:6的第876-890位)的氨基酸H-G-I-A-N-P-T-F-V-H-A-P-G-K-I。
OrfC的第三个域是ER域,在本文中也称作ORFC-ER,含有编码该ORFC-ER域的序列的核苷酸序列在本文表示为SEQ ID NO:31(SEQ IDNO:5的2995-4506位)。含有ORFC-ER域的氨基酸序列在本文表示为SEQID NO:32(SEQ ID NO:6的999-1502位)。
破囊壶菌属PUFA PKS系统
有3个开放阅读框形成核心破囊壶菌23B PUFA PKS系统。它的域组织与裂殖壶菌属相同,只是破囊壶菌23B Orf A有8个相邻的ACP域,而裂殖壶菌属Orf A有9个相邻的ACP域。每个开放阅读框的域结构如下。
破囊壶菌23B开放阅读框A(OrfA)
破囊壶菌23B OrfA的完整核苷酸序列在本文表示为SEQ ID NO:38。破囊壶菌23B OrfA是一条8433个核苷酸的序列(不包括终止密码子),其编码一条2811个氨基酸的序列,在本文中表示为SEQ ID NO:39。SEQ ID NO:38编码破囊壶菌23B OrfA中的如下域:(a)一个β-酮酯酰-ACP合酶(KS)域;(b)一个丙二酸单酰-CoA:ACP酰基转移酶(MAT)域;(c)8个酰基载体蛋白(ACP)域;和(d)一个酮还原酶(KR)域。
一个从破囊壶菌23B分离的、在本文中分别称作Th23BOrfA_pBR812.1和Th23BOrfA_pBR811(OrfA基因组克隆)的两个基因组克隆,据本发明人所知,共同(重叠克隆)包含SEQ ID NO:38的核苷酸序列,且编码SEQ IDNO:39的氨基酸序列。基因组克隆Th23BOrfA_pBR812.1(称作Th23BOrfA_pBR812.1基因组克隆,其形式为含有来自破囊壶菌23B的OrfA基因的大肠杆菌质粒载体)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号No.PTA-8232。OrfA基因组克隆Th23BOrfA_pBR812.1的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。基因组克隆Th23BOrfA_pBR811(称作Th23BOrfA_pBR811基因组克隆,其形式为含有来自破囊壶菌23B的OrfA基因的大肠杆菌质粒载体)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号No.PTA-8231。OrfA基因组克隆Th23BOrfA_pBR811的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
破囊壶菌23B OrfA中的第一个域是KS域,本文中也称作破囊壶菌23BOrfA-KS,包含在SEQ ID NO:38中跨越第1-大约第1500位的核苷酸序列内,在本文中表示为SEQ ID NO:40。含有破囊壶菌23B KS域的氨基酸序列是SEQ ID NO:39中跨越第1-大约第500位的一个区域,在本文中表示为SEQID NO:41。SEQ ID NO:39的这个区域具有一个与FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越SEQ ID NO:39的第1至大约第450位(也是SEQ IDNO:41第1-大约450位)。需要指出,破囊壶菌23B OrfA-KS域含有一个活性位点基序:DXAC*(*酰基结合位点C207)。另外,破囊壶菌23B KS区末端的一个特征基序,GFGG,存在于SEQ ID NO:39的453-456位(也是SEQID NO:41的453-456位)中。
破囊壶菌23B OrfA中的第二个域是MAT域,本文中也称作破囊壶菌23B OrfA-MAT,其包含在SEQ ID NO:38的大约1503位-大约3000位的核苷酸序列内,该序列在本文中表示为SEQ ID NO:42。含有破囊壶菌23BMAT域的氨基酸序列是SEQ ID NO:39中跨越大约501-大约1000位的一个区域,本文中表示为SEQ ID NO:43。SEQ ID NO:39的这个区域具有一个与FabD(丙二酸单酰-CoA:ACP酰基转移酶)的Pfam匹配,其跨越SEQ IDNO:39的大约580-大约900位(SEQ ID NO:43第80-400位)。需要指出的是,破囊壶菌23B OrfA-MAT域含有一个活性位点基序:GHS*XG(*酰基结合位点S697),由SEQ ID NO:39的695-699位表示。
破囊壶菌23B OrfA的第3-10个域是8个串联的ACP域,在本文也称作破囊壶菌23B OrfA-ACP(该序列中的第一个域是OrfA-ACP1,第二个域是OrfA-ACP1,第三个域是OrfA-ACP1,等等)。第一个破囊壶菌23B ACP域,破囊壶菌23B OrfA-ACP1,包含在跨越SEQ ID NO:38(OrfA)大约3205位-大约3555位的核苷酸序列中,本文表示为SEQ ID NO:44。含有第一破囊壶菌23B ACP域的核苷酸序列是一个从SEQ ID NO:39大约1069位至大约1185位的区域,本文表示为SEQ ID NO:45。
破囊壶菌23B OrfA的8个ACP域彼此相邻,并可以用磷酸泛酰巯基乙胺结合位点基序LGXDS*(用SEQ ID NO:46表示)的存在加以识别,其中S*是磷酸泛酰巯基乙胺连接位点。,8个S*位点每一个的氨基酸位置(以SEQID NO:3为参照)为1128(ACP1)、1244(ACP2)、1360(ACP3)、1476(ACP4)、1592(ACP5)、1708(ACP6)、1824(ACP7)和1940(ACP8)。全部8个破囊壶菌23B ACP域的核苷酸和氨基酸序列高度保守,因此本文中每个域的序列不用分别的序列标识符表来示。然而,根据本文公开的信息,本领域的技术人员能够容易地在SEQ ID NO:38和SEQ ID NO:39中确定含有其它7个ACP域中每一个的序列。
全部8个破囊壶菌23B ACP域共同占据破囊壶菌23B OrfA中从SEQ IDNO:38的大约3205位到大约5994位的一个区域,其对应于SEQ ID NO:39中从大约1069位到大约1998位的氨基酸位置。含全部8个域的整个ACP区域的核苷酸序列在本文表示为SEQ ID NO:47。SEQ ID NO:47编码一条本文表示为SEQ ID NO:48的氨基酸序列。SEQ ID NO:48包括位于各个ACP域之间的连接区段。8个域的重复间隔大约是SEQ ID NO:48的每116个氨基酸,并且可以认为每个域均由以活性位点(如上文所描述的)为中心的大约116个氨基酸组成。
破囊壶菌23B OrfA的最后一个域是KR域,本文也称作破囊壶菌23BOrfA-KR,其包含在SEQ ID NO:38的大约6001位-大约8433位之间的核苷酸序列内,本文表示为SEQ ID NO:49。包含所述破囊壶菌23B KR域的氨基酸序列是一个跨越SEQ ID NO:39大约2001位-大约2811位的区域,本文表示为SEQ ID NO:50。SEQ ID NO:39的这个区域具有一个与FabG(β-酮酯酰-ACP还原酶)的Pfam匹配,其跨越SEQ ID NO:39的约2300位-约2550位(SEQ ID NO:50第300-550位)。
破囊壶菌23B开放阅读框B (OrfB)
破囊壶菌23B OrfB的完整核苷酸序列在本文表示为SEQ ID NO:51,其是一条5808个核苷酸的序列(不包括终止密码子),编码一条1935个氨基酸的序列,在本文表示为SEQ ID NO:52。SEQ ID NO:51编码下列破囊壶菌23B OrfB的域:(a)一个β-酮酯酰-ACP合酶(KS)域;(b)一个链长因子(CLF)域;(c)一个酰基转移酶(AT)域;和(d)一个烯酰基-ACP还原酶(KR)域。
一个从破囊壶菌23B分离的、本文称作Th23BOrfB_pBR800(OrfB基因组克隆)的基因组克隆,据本发明人所知,包括SEQ ID NO:51的核苷酸序列,并且编码SEQ ID NO:52的氨基酸序列。基因组克隆Th23BOrfB_pBR800(称作Th23BOrfB_pBR800基因组克隆,其形式为含有来自破囊壶菌23B的OrfB基因的大肠杆菌质粒载体)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号No.PTA-8227。OrfB基因组克隆Th23BOrfB_pBR800的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
破囊壶菌23B OrfB的第一个域是KS域,在本文也称作破囊壶菌23BOrfB-KS,包含在SEQ ID NO:51(破囊壶菌23B OrfB)第1-大约第1500位的核苷酸序列内,本文表示为SEQ ID NO:53。含有破囊壶菌23B KS域的氨基酸序列是SEQ ID NO:52中跨越第1-大约500位的一个区域,本文表示为SEQ ID NO:54。SEQ ID NO:52的这个区域具有一个与FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越大约第1-大约450位(SEQ ID NO:54的第1-450位)。需要指出的是,所述破囊壶菌23B OrfB-KS域含有一个活性位点基序:DXAC*,其中C*是酰基连接位点,并且其中C*位于SEQ ID NO:52的第201位。另外,KS区末端的一个特征性基序,GFGG,存在于SEQ ID NO:52的434-437位。
破囊壶菌23B OrfB的第二个域是CLF域,本文也称作破囊壶菌23BOrfB-CLF,其包含在SEQ ID NO:51(OrfB)大约1501位-大约3000位的核苷酸序列内,本文表示为SEQ ID NO:55。含有CLF域的氨基酸序列是SEQ IDNO:52中跨越大约501-大约1000位的一个区域,本文表示为SEQ ID NO:56。SEQ ID NO:52的这个区域具有一个与FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越大约550-大约910位(SEQ ID NO:56第50-410位)。尽管CLF与KS蛋白同源,但它缺少KS蛋白中作为酰基连接点的活性位点半胱氨酸。
破囊壶菌23B OrfB的第三个域是AT域,本文也称作破囊壶菌23BOrfB-AT,其包含在跨越SEQ ID NO:51(破囊壶菌23B OrfB)大约3001位-大约4500位的核苷酸序列内,本文表示为SEQ ID NO:58。含有破囊壶菌23B AT域的氨基酸序列是SEQ ID NO:52中跨越大约1001-大约1500位的一个区域,本文表示为SEQ ID NO:58。SEQ ID NO:52的这个区域具有一个与FabD(丙二酸单酰-CoA:ACP酰基转移酶)的Pfam匹配,其跨越大约1100-大约1375位(SEQ ID NO:58第100-375位)。尽管PUFA合酶的该AT域与MAT蛋白具有同源性,但它缺少MAT的延伸基序(关键的精氨酸和谷氨酰胺残基),被认为不参与丙二酸单酰-CoA转移。存在酰基转移酶的GXS*XG基序,其中S*是酰基连接位点,以SEQ ID NO:52为参照位于1123位。
破囊壶菌23B OrfB的第四个域是ER域,本文也称作破囊壶菌23BOrfB-ER,其包含在跨越SEQ ID NO:51(OrfB)大约4501位-大约5805位的核苷酸序列内,本文表示为SEQ ID NO:59。含有破囊壶菌23B ER域的氨基酸序列是SEQ ID NO:52中跨越大约1501-大约1935位的一个区域,本文表示为SEQ ID NO:60。SEQ ID NO:52的这个区域具有一个与2-硝基丙烷双加氧酶相关的双加氧酶家族Pfam匹配,其跨越大约1501-大约1810位(SEQIDNO:60第1-310位)。由于该域与来自肺炎链球菌的一个新近表征的ER酶具有同源性,可以进一步地预料其具有ER的功能。
破囊壶菌属23B开放阅读框C(OrfC)
破囊壶菌23B OrfC的完整核苷酸序列在本文表示为SEQ ID NO:61,其是一条4410个核苷酸的序列(不包括终止密码子),编码一条1470个氨基酸的序列,在本文表示为SEQ ID NO:62。SEQ ID NO:61编码破囊壶菌23BOrfC的如下域:(a)两个FabA样β-酮酯酰-ACP脱水酶(DH)域,均与FabA蛋白(一种催化合成反式-2-癸烯酰-ACP并将该产物可逆地异构化成顺式-3-癸烯酰-ACP的酶)同源;(b)一个烯酰-ACP还原酶(ER)域,其与裂殖壶菌属OrfB的ER域高度同源。
一个从破囊壶菌23B分离的、本文称作Th23BOrfC_pBR709A(OrfC基因组克隆)的基因组克隆,据本发明人所知,包括SEQ ID NO:61的核苷酸序列,并且编码SEQ ID NO:62的氨基酸序列。基因组克隆Th23BOrfC_pBR709A(称作Th23BOrfC_pBR709A基因组克隆,其形式为含有来自破囊壶菌23B的OrfC基因的大肠杆菌质粒载体)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号No.PTA-8228。OrfC基因组克隆Th23BOrfC_pBR709A的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
破囊壶菌23B OrfC的第一个域是DH域,在本文也称作破囊壶菌23BOrfC-DH1,包含在跨越SEQ ID NO:61(OrfC)大约第1-大约第1500位的核苷酸序列内,本文中表示为SEQ ID NO:63。含有破囊壶菌23B DH1域的氨基酸序列是SEQ ID NO:62中跨越大约第1-大约第500位的一个区域,本文表示为SEQ ID NO:64。SEQ ID NO:62的这个区域具有一个与如上文提到的FabA的Pfam匹配,其跨越第275-大约400位(SEQ ID NO:64的第275-大约400位)。
破囊壶菌23B OrfC的第二个域也是DH域,在本文亦称作破囊壶菌23BOrfC-DH2,包含在SEQ ID NO:61(OrfC)中跨越大约第1501-大约3000位的核苷酸序列内,本文表示为SEQ ID NO:65。含有破囊壶菌23B DH2域的氨基酸序列是SEQ ID NO:62中跨越大约第501-大约1000位的一个区域,本文表示为SEQ ID NO:66。SEQ ID NO:62的这个区域具有一个与如上文提到的FabA的Pfam匹配,其跨越大约第800-大约925位(SEQ ID NO:66的第300-大约425位)。
破囊壶菌23B OrfC的第三个域是ER域,在本文也称作破囊壶菌23BOrfC-ER,包含在跨越SEQ ID NO:61(OrfC)大约第3001-大约4410位的核苷酸序列内,本文表示为SEQ ID NO:67。含有破囊壶菌23B ER域的氨基酸序列是SEQ ID NO:62中跨越大约第1001-大约1470位的一个区域,本文表示为SEQ ID NO:68。SEQ ID NO:62的这个区域具有一个与如上所述的2-硝基丙烷双加氧酶相关的双加氧酶的Pfam匹配,其跨越大约第1025-大约1320位(SEQ ID NO:68的第25-大约320位)。由于该域与来自肺炎链球菌的一个新近表征的ER酶具有同源性,也可以预料其具有ER的功能。
合成的密码子优化的构建体
本发明还涵盖本文描述的任何核酸序列的经过重新合成的版本,它们主要具有针对异源生物体(异源宿主)优化过的密码子用法,而其中所编码的氨基酸序列相对与天然、野生型、或来源氨基酸序列没有改变。本发明人发现,为了最优密码子用法而重新合成核酸序列,是提高被来自PUFA PKS系统的核酸分子转化的异源宿主的PUFA生产的一种有效方法。在异源宿主内实现最优的表达和PUFA生产并不一定需要重新合成PUFA PKS系统中所有的核酸分子。事实上,本发明人发现,仅重新合成其中某些核酸分子就足以提高PUFA生产。例如,虽然在酵母中重新合成裂殖壶菌属OrfA和B可提高PUFA合酶的表达和PUFA产量,但是使用天然的裂殖壶菌属OrfC和天然的念珠蓝细菌HetI PPT酶就足够了。而且,为了一种异源宿主中使用而对构建体进行的密码子优化,对于提高在另一不同的异源宿主中的PUFA生产可能也是有用的(例如为了在裂殖壶菌属中使用而对来自破囊壶菌属的OrfC编码序列而进行的密码子用法优化,对增强另一种异源宿主生物体例如植物中的PUFA生产可能也是有用的)。
此外,合成的、经密码子优化的构建体的应用,可以有助于嵌合PUFAPKS构建体和/或嵌合PUFA PKS系统的生产,所述嵌合构建体或系统中来自一个PUFA PKS系统(例如来自第一生物体)的域或蛋白被引入到另一个PUFA PKS系统(例如来自第二生物体)中。在这样的系统中,不仅可以操纵PUFA谱(profile)(例如通过使用所述嵌合构建体和/或嵌合PUFA PKS系统),而且还可以通过使用合成的密码子优化的嵌合构建体来提高PUFA生产。确实,将这两个构思(嵌合和密码子优化)结合起来,可以产生PUFA谱和/或PUFA生产的协同性的结果。本发明涵盖这样的嵌合系统,其含有一些针对宿主经过密码子优化的序列和一些对于宿主而言没有密码子优化的序列。
下面通过举例描述一些经过密码子优化的序列。通过该描述,其它的密码子优化序列对于本领域的技术人员而言是显而易见的。
sOrfA
SEQ ID NO:35,以sOrfA指代,代表为酵母中的优化密码子用法而重新合成过的编码来自裂殖壶菌属的OrfA的核酸序列(SEQ ID NO:1)。SEQ IDNO:1和SEQ ID NO:35均编码SEQ ID NO:2。
sOrfB
SEQ ID NO:36,以sOrfB指代,代表为酵母中的优化密码子用法而重新合成过的编码来自裂殖壶菌属的OrfB(SEQ ID NO:3)的核酸序列。SEQ IDNO:3和SEQ ID NO:36均编码SEQ ID NO:4。
OrfB *
SEQ ID NO:37,以OrfB*(pJK962)指代,代表这样的核酸序列:它编码来自裂殖壶菌属的OrfB(SEQ ID NO:4)的核酸序列,在SEQ ID NO:3内的一部分(编码SEQ ID NO:4的核苷酸序列)中进行了重新合成以在植物细胞中使用,而且它来源于一个非常相似的、最初为了大肠杆菌中的优化密码子用法而开发的序列,该序列也被称作OrfB*(pJK780),在下文中有描述。两种形式的OrfB*(用于大肠杆菌的和用于植物的)与SEQ ID NO:3相同,只是有一个重新合成的BspHI(SEQ ID NO:3的核苷酸4415)到SacII片段(SEQ IDNO:3中的独特位置)[a resynthesized BspHI to a SacII fragment]。与orfB(SEQID NO:3)的原始基因组序列相比,这两个版本(大肠杆菌和植物)在基因的起始位置附近均具有两个其它的密码子修改。第一,第四个密码子即精氨酸(R)从基因组序列中的CGG变成了orfB*中的CGC。第二,第五个密码子即天冬酰胺(N)从基因组序列中的AAT变成了orfB*中的AAC。为了便于将该基因克隆到植物载体以产生SEQ ID NO:37,还将一个PstI位点(CTGCAG)工程化到大肠杆菌orfB*序列中距离基因起始处20个碱基的位置。这个变化未改变所编码蛋白的氨基酸序列。SEQ ID NO:37和SEQ ID NO:3(以及对大肠杆菌的OrfB*形式,下文在SEQ ID NO:69中描述)均编码SEQ ID NO:4。
SEO ID NO:69,以OrfB * (pJK780)指代,代表这样的核酸序列,它编码来自裂殖壶菌属的OrfB(SEQ ID NO:4),在SEQ ID NO:3(编码SEQ ID NO:4的核苷酸序列)的一部分中进行了重新合成,以供在大肠杆菌中使用。两种形式(用于大肠杆菌的和用于植物的)中的OrfB*构建体的序列均已在上文中记载。SEQ ID NO:69和SEQ ID NO:3均编码SEQ ID NO:4。
本文称作OrfB*_pJK780的质粒,据本发明人所知,包含SEQ ID NO:69的核苷酸序列,并编码SEQ ID NO:4的氨基酸序列。质粒OrfB*_pJK780(称为OrfB*)_pJK780克隆,以大肠杆菌质粒载体的形式)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并给予ATCC登录号PTA-8225。OrfB*_pJK780的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
pThOrfC-synPS
SEQ ID NO:70代表为了裂殖壶菌属中的最优密码子用法而重新合成过的编码破囊壶菌23B OrfC(SEQ ID NO:61,编码SEQ ID NO:62)的核酸序列。SEQ ID NO:70的2000-6412位代表破囊壶菌23B OrfC蛋白(包括终止密码子)的编码区。SEQ ID NO:70的1-1999位和6413-8394位分别代表上游和下游裂殖壶菌属OrfC序列(非编码区)。含有SEQ ID NO:70的质粒(指定为pThOrfC-synPS)的构建在实施例1中有详细描述。SEQ ID NO:70和SEQ IDNO:61均编码SEQ ID NO:62。pThOrfC-syn PS被设计为用如上所述地重新合成过的破囊壶菌23B orfC的编码区(SEQ ID NO:70)精确替换裂殖壶菌属orfC的编码区(SEQ ID NO:5)。用该构建体转化的生物体的产生和使用在下文和实施例中有详细描述。
上文描述的pThOrfC-synPS质粒,据本发明人所知,包括SEQ ID NO:70的核苷酸序列,并编码SEQ ID NO:62的相应氨基酸序列。质粒pThOrfC-synPS(以pThOrfC-synPS指称,形式为大肠杆菌质粒载体,含有为了在裂殖壶菌属或其它异源宿主中表达而优化过的“完美衔接的”(perfectstitch)合成破囊壶菌23B PUFA PKS OrfC密码子)于2007年3月1日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并给予ATCC登录号PTA-8229。pThOrfC-synPS的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
pDD26
SEQ ID NO:71代表为了裂殖壶菌属中的优化密码子用法而重新合成过的编码破囊壶菌23B OrfA的核酸序列(SEQ ID NO:38,编码SEQ ID NO:39)。SEQ ID NO:71的2044-10479位代表破囊壶菌23B OrfA蛋白(包括终止密码子)的编码区。SEQ ID NO:71的1-2043位和10480-12495位分别代表上游和下游裂殖壶菌属OrfA序列(非编码区)。含有SEQ ID NO:71的质粒(命名为pDD26)的构建在实施例8中有详细描述。SEQ ID NO:71和SEQ ID NO:38均编码SEQ ID NO:39。pDD26被设计来用如上所述地重新合成过的破囊壶菌23B orfC的编码区(SEQ ID NO:71)精确替换裂殖壶菌属orfA的编码区(CDS)(SEQ ID NO:1)。在下文和实施例中详细描述了用该构建体转化的生物体的生产和使用。
上文称为pDD26的质粒,据本发明人所知,包含SEQ ID NO:71的核苷酸序列,并编码SEQ ID NO:39的相应氨基酸序列。质粒pDD26(以pDD26指称,其形式为大肠杆菌质粒载体)于2007年5月8日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并被给予ATCC登录号PTA-8411。pDD26的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
pDD32
SEQ ID NO:72代表为了裂殖壶菌属中的优化密码子用法而重新合成过的编码破囊壶菌23B OrfB的核酸序列(SEQ ID NO:51,编码SEQ ID NO:52)。SEQ ID NO:72的1452-7259位代表破囊壶菌23B OrfB蛋白(包括终止密码子)的编码区。SEQ ID NO:72的1-1451位和7260-8647位分别代表上游和下游裂殖壶菌属OrfB序列(非编码区)。含有SEQ ID NO:72的质粒(以Pdd32指称)的构建在实施例8中有详细描述。SEQ ID NO:72和SEQ ID NO:51均编码SEQ ID NO:52。pDD32被设计为用如上所述地重新合成过的破囊壶菌23B orfC的编码区(SEQ ID NO:72)精确替换裂殖壶菌属orfB的编码区(CDS)(SEQ ID NO:3)。在下文和实施例中详细描述了用该构建体转化的生物体的生产和使用。
据本发明人所知,上文作为pDD32描述的质粒包括SEQ ID NO:72的核苷酸序列,并编码SEQ ID NO:52的相应氨基酸序列。质粒pDD32(指定为pDD32,其形式为大肠杆菌质粒载体)于2007年3月1日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并指定ATCC登录号PTA-8412。pDD32的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
嵌合PUFA PKS构建体
本发明还包括嵌合构建体,其使用两种或多种不同PUFA PKS核酸序列的一部分,例如本文中描述的那些,来产生嵌合PUFA PKS蛋白。本发明人在这里用多个不同的实施例显示,通过“混合和匹配”来自不同生物体的PUFA PKS蛋白的域或部分(即产生包含来自两种或多种不同生物体的域或多肽的嵌合PUFA PKS蛋白),与天然(自然存在的)PUFA PKS系统相比,可以修饰由表达含有这种嵌合蛋白的PUFA PKS系统的生物体所产生的PUFA谱。例如,本发明人在这里描述了在裂殖壶菌属蛋白的OrfC蛋白中使用来自破囊壶菌属PUFA PKS系统的DH2域,所得的嵌合OrfC蛋白含有来自裂殖壶菌属的DH1和ER域和来自破囊壶菌属的DH2域。对该嵌合构建体进一步通过如下方式加以修饰:在一个构建体中使用密码子优化的(针对裂殖壶菌属)破囊壶菌属DH2域,在另一个构建体中使用天然的破囊壶菌属DH2域;这显示了本文描述的各种修改方式的灵活性和效果。
下文通过举例描述了一些嵌合构建体。本领域的技术人员考虑了该描述之后可以容易地想到其它的构建体。
pDS49
SEQ ID NO:73代表这样一种核酸序列,其编码一种包含裂殖壶菌属OrfC蛋白(SEQ ID NO:6)的嵌合蛋白,该裂殖壶菌属OrfC蛋白中DH2域(SEQ ID NO:30)被来自破囊壶菌23B OrfC(SEQ ID NO:62)的DH2域(包括SEQ ID NO:66的序列)替换。在该嵌合构建体中,来自破囊壶菌属的DH2编码序列是天然(非密码子优化的)序列。含有SEQ ID NO:73的质粒(以pDS49指称)的构建在实施例2中有详细描述。pDS49中位于SEQ ID NO:73两侧的裂殖壶菌属OrfC上游和下游非编码序列与上文关于SEQ ID NO:70所述的相同(在SEQ ID NO:73中没有表示)。SEQ ID NO:73编码SEQ IDNO:74的氨基酸序列。参考SEQ ID NO:74,该嵌合OrfC多肽的长度为1493个氨基酸残基。DH2区,规定为SEQ ID NO:74的氨基酸516-1041,由破囊壶菌23B OrfC蛋白的DH2区氨基酸序列,即SEQ ID NO:62的氨基酸491-1016所组成,其包括SEQ ID NO:66的全部以及来自SEQ ID NO:62的一些侧翼氨基酸序列。关于该嵌合OrfC氨基酸序列的其余部分,SEQ IDNO:74的残基1-515和1042-1493分别与SEQ ID NO:6的裂殖壶菌属OrfC残基1-515和1051-1502相同。被该构建体转化的生物体的产生和使用在下文和实施例中有详细描述。
上文描述为pDS49的质粒,据本发明人所知,包含SEQ ID NO:73的核苷酸序列,并编码SEQ ID NO:74的相应氨基酸序列。质粒pDS49(指称为pDS49,其形式为大肠杆菌质粒载体)于2007年3月1日被保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并被给予ATCC登录号PTA-8230。pDS49的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
pDD24
SEQ ID NO:75代表另一种编码包含裂殖壶菌属OrfC蛋白(SEQ ID NO:6)的嵌合蛋白的核酸序列,该裂殖壶菌属OrfC蛋白中的DH2域(SEQ ID NO:30)被替换为来自破囊壶菌23B OrfC(SEQ ID NO:62)的DH2域(包含SEQ IDNO:66的序列)。在该嵌合构建体中,所述来自破囊壶菌属的DH2编码序列是供裂殖壶菌属中使用的经过密码子优化的序列。含有SEQ ID NO:75的质粒(指称为pDD24)的构建在实施例3中有详细描述。pDD24中位于SEQ IDNO:75两侧的裂殖壶菌属OrfC上游和下游非编码序列与上文关于SEQ IDNO:70所描述的相同(在SEQ ID NO:75中没有表示)。SEQ ID NO:75编码SEQ ID NO:74的氨基酸序列。在上文关于SEQ ID NO:73(其亦编码SEQ IDNO:74)的内容中已经详细描述了SEQ ID NO:74。不过,在本构建体中,如上面讨论的,编码SEQ ID NO:74中氨基酸516-1041的核苷酸序列来自质粒pThOrfC-synPS中所含的破囊壶菌属23B OrfC的“合成基因序列”(见实施例1和SEQ ID NO:70),该序列使用了裂殖壶菌属基因表达优选的密码子。被该构建体转化的生物体的产生和使用在下文和实施例中有详细描述。
据本发明人所知,上文作为pDD24描述的质粒包括SEQ ID NO:75的核苷酸序列,并编码SEQ ID NO:74的相应氨基酸序列。质粒pDD24(指称为pDD24,其形式为大肠杆菌质粒载体)于2007年3月1日保藏于美国典型培养物保藏中心(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并被给予ATCC登录号PTA-8226。pDD24的核苷酸序列和由该质粒编码的氨基酸序列涵盖在本发明内。
嵌合PUFA PKS系统
除了使用上文描述的密码子优化和嵌合构建体之外,本发明还包括嵌合PUFA PKS系统的生产和应用。嵌合PUFA PKS系统包括上文描述的嵌合构建体的使用,其中生成嵌合PUFA PKS蛋白并且在PUFA PKS系统中使用它;不过,此类系统还涵盖这样PUFA PKS系统,其中来自一个或多个PUFA PKS系统的一种或多种完整蛋白或多个蛋白被替换为或者添加到来自另一个PUFA PKS系统的相应的一种或多种完整蛋白,从而所得的PUFA PKS系统包括来自两个或多个不同PUFA PKS系统的蛋白。这些系统还可以包括嵌合蛋白的使用,如上文所述(例如嵌合蛋白和全蛋白替换)。例如,可以将上文描述的pTh23B_synPS构建体(包含针对裂殖壶菌属密码子用法进行了优化的破囊壶菌23B OrfC编码序列)替换到裂殖壶菌属PUFAPKS中,来完美地代替天然裂殖壶菌属OrfC编码序列,从而产生嵌合PUFAPKS系统。另举一例,可以将天然破囊壶菌23B OrfC编码序列(非密码子优化的)替换到裂殖壶菌属PUFA PKS系统中,来完美地代替天然裂殖壶菌属OrfC编码序列,从而产生另一种嵌合PUFA PKS系统。再举一例,可以将天然破囊壶菌23B OrfA和OrfC编码序列(经密码子优化或者未经优化的)替换到裂殖壶菌属PUFA PKS系统中,来分别完美地代替天然裂殖壶菌属OrfA和OrfC编码序列,从而产生再另一种嵌合PUFA PKS系统。下文实施例中描述了这些和其它的嵌合PUFA PKS系统。实施例中还包括表达包含下列组分的嵌合PUFA PKS系统的裂殖壶菌属宿主:(1)裂殖壶菌属(S)OrfA、SorfB、和破囊壶菌属(Th)OrfC;(2)SOrfA、ThOrfB和SorfC;(3)ThOrfA、SOrfB和SOrfC;(4)SOrfA、ThOrfB和ThOrfC;(5)ThOrfA、SOrfB和ThOrfC;(6)ThOrfA、ThOrfB和SorfC;和(7)ThOrfA、ThOrfB和ThOrfC。
于是,基于本文提供的讨论和例证性实验,就有可能通过在各种宿主生物体中,包括在内源地不具有用于产生PUFA的PUFA PKS系统的宿主生物体中,针对宿主的密码子用法选择性重新合成PUFA PKS核酸分子,和/或使用嵌合PUFA PKS构建体和/或嵌合PUFA PKS系统,来改善和/或修饰PUFA生产。
磷酸泛酰巯基乙胺基转移酶(PPT酶)
根据本发明,用于在异源宿主中产生和/或积累PUFA或者提高内源宿主中PUFA的产生和/或积累的PUFA PKS系统可使用各种辅助蛋白,辅助蛋白在本文中定义为这样的蛋白,它们不被认为是如上文所讨论的核心PUFA PKS系统的一部分(即不是PUFA合酶复合体本身的一部分),但是对于使用本发明的核心PUFA合酶复合体来产生PUFA,或者至少高效地产生PUFA而言,它们可能是必需的。
为了产生PUFA,PUFA PKS系统必须与将4’-磷酸泛酰巯基乙胺基从辅酶A转移到酰基载体蛋白(ACP)域的辅助蛋白一起工作。因此,PUFA PKS系统可以考虑包括至少一个4’-磷酸泛酰巯基乙胺基转移酶(PPT酶)域,或者这种域可以被看作是PUFA PKS系统的辅助域或蛋白。PPT酶的结构和功能特征已经在例如下列文献中有详细描述:美国专利申请公开No.20020194641、美国专利申请公开No.20040235127和美国专利申请公开No.20050100995。
根据本发明,具有4’-磷酸泛酰巯基乙胺基转移酶(PPT酶)生物活性(功能)的域或蛋白的特征是将4’-磷酸泛酰巯基乙胺模块从辅酶A转移到酰基载体蛋白(ACP)的酶。这种针对ACP的不变(invariant)丝氨酸残基的转移将ACP从无活性脱辅基(apo)形式激活成完全(holo)形式。在聚酮和脂肪酸合成中,磷酸泛酰巯基乙胺基与伸长中的酰基链形成巯酯。PPT酶是一个酶家族,其中的酶已经在脂肪酸合成、聚酮合成和非核糖体肽合成中得到良好表征。许多PPT酶的序列是已知的,晶体结构已经确定(例如Reuter K,MofidMR,Marahiel MA,Ficner R.“Crystal structure of the surfactinsynthetase-activating enzyme sfp:a prototype of the 4′-phosphopantetheinyltransferase superfamily”EMBO J.1999 Dec 1;18(23):6823-31),并且对于活性重要的氨基酸残基也已进行了突变分析(Mofid MR,Finking R,Essen LO,Marahiel MA.“Structure-based mutational analysis of the4′-phosphopantetheinyl transferases Sfp from Bacillus subtilis:carrier proteinrecognition and reaction mechanism”Biochemistry.2004 Apr13;43(14):4128-36)。PPT酶中的这些不变且高度保守的氨基酸包含在上述两种希瓦氏菌(Shewanella)菌株的pfaE ORF中。
一种先前已经被证明可以识别本文所述OrfA ACP域作为底物的异源PPT酶是念珠蓝细菌PCC 7120(原名鱼腥蓝细菌(Anabaena sp.)PCC 7120)的Het I蛋白。Het I存在于念珠蓝细菌的一个基因簇中,已知该基因簇负责长链羟基脂肪酸的合成,这些长链羟基脂肪酸是存在于该生物体异形胞中的糖脂层的组分(Black and Wolk,1994,J.Bacteriol.176,2282-2292;Campbell等,1997,Arch.Microbiol.167,251-258)。Het I有可能激活位于该基因簇中的一种蛋白Hgl E的ACP域。Hgl E的两个ACP域与在裂殖壶菌属OrfA发现的ACP域具有高度的序列同源性。SEQ ID NO:34代表念珠蓝细菌Het I蛋白的氨基酸序列,它是一种功能性PPT酶,可以和本文所述PUFA PKS系统,包括来自裂殖壶菌属和破囊壶菌属的PUFA PKS系统,一同使用。SEQ ID NO:34由SEQ ID NO:33编码。Het I的内源起始密码子还没有被鉴定(在推定蛋白中不存在甲硫氨酸)。在开放阅读框5’端附近存在数个潜在的可选择起始密码子(例如TTG和ATT)。序列中不存在甲硫氨酸密码子(ATG)。然而,借助PCR用甲硫氨酸密码子(ATG,作为NdeI限制性酶识别位点的一部分)替换最远端的5’潜在可选择起始密码子(TTG),并在编码序列的3’端引入一个XhoI位点,构建完成了一种Het I表达构建体,并且其编码的PPT酶(SEQ ID NO:34)已显示具有功能。
另一种先前已经被显示可识别本文所述OrfA ACP域作为底物的异源PPT酶是来源于枯草芽孢杆菌(Bacillus subtilis)的sfp。Sfp已经获得良好表征,并且因为它识别底物的范围广泛而被普遍使用。根据已公开的序列信息(Nakana等,1992,Molecular and General Genetics 232:313-321),先前已经制造了一种sfp的表达载体,其是通过把编码区和确定的上下游侧翼DNA序列一起克隆到pACYC-184克隆载体内而制成的。该构建体编码功能性的ppT酶,表现为其能够在合适的条件下与裂殖壶菌属OrfA、B*和C在大肠杆菌中共表达,导致这些细胞中积累DHA(见美国专利申请公开No.20040235127)。
当对生物体(例如微生物或植物)进行遗传修饰以表达根据本发明的PUFA PKS系统时,一些宿主生物体可能内源地表达辅助蛋白(例如PPT酶),PUFA PKS系统需要与这样的蛋白一起工作来产生PUFA。不过,对于一些生物体,可以用编码一种或多种本文所述辅助蛋白的核酸分子加以转化来能化(enable)和/或增强(enhance)该生物体的PUFA生产,即使该生物体可内源产生同源辅助蛋白(即,某些异源辅助蛋白可能比宿主细胞的内源辅助蛋白更为有效而高效地与被转化PUFA合酶蛋白一起工作)。在一个实施方案中,这样的辅助蛋白包括辅助PPT酶(accessory PPTase)。
本发明的一个实施方案涉及一种分离的核酸分子,所述分子包含来自PUFA PKS系统的核酸序列、其同源物、其片段、和/或与任意这些核酸序列互补的核酸序列。在一个方面中,本发明涉及一种分离的核酸分子,其包含从下组选出的核酸序列:(a)编码选自SEQ ID NO:2,SEQ ID NO:4,SEQID NO:6,SEQ ID NO:39,SEQ ID NO:52,SEQ ID NO:62的氨基酸序列及其生物活性片段的核酸序列:;(b)编码选自SEQ ID NO:8、SEQ ID NO:10、SEQIDNO:13、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:64、SEQ ID NO:66和SEQ ID NO:68的氨基酸序列及其生物活性片段的核酸序列;(c)编码与(a)中的任一氨基酸序列中的至少500个连续氨基酸至少大约60%同一的氨基酸序列的核酸序列,其中该氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统中的至少一个、两个、三个或多个域的生物活性;(d)编码与(b)的任何氨基酸序列至少大约60%同一的氨基酸序列的核酸序列,其中所述氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统中的至少一个域的生物活性;或(e)与(a)、(b)、(c)或(d)的核酸序列完全互补的核酸序列。在一个进一步的实施方案中,本发明涵盖这样的核酸序列,它包含本说明书上文中针对数种PUFA PKS域说明过的活性位点域或其它功能基序的编码核酸序列。
本发明特别优选的实施方案包括分离的核酸分子,其编码在如本文所述的PUFA PKS系统中有用的嵌合蛋白。本发明还包括将由来于或衍生自一种PUFA PKS系统的域或者蛋白在由来于或衍生自另一种PUFA PKS系统的域中使用,和/或与由来于或衍生自另一种PUFA PKS系统的蛋白一起使用,以产生具有独特品质的新型PUFA PKS系统。
例如,本发明的一个实施方案涉及使用来自一个PUFA PKS系统的DH2域来修饰包括来自另一不同生物体的蛋白/域的PUFA PKS系统,其中该DH2域的引入(例如在一个实施方案中,通过替换宿主的内源DH2域或相似的域)可修饰由该系统产生的PUFA的比例,特别是该系统产生的ω-3PUFA对ω-6PUFA的比例。该实施方案将在下文中描述。
一些优选的核酸分子包括:编码SEQ ID NO:74的氨基酸序列及其生物活性片段的核酸序列,编码与SEQ ID NO:74至少大约60%同一并且具有多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统至少一个、两个、三个或更多个域的生物活性的氨基酸序列的核酸序列,或者与上述核酸序列完全互补的核酸序列。在一个实施方案中,所述核酸分子包括选自SEQ ID NO:73和SEQID NO:75的核酸序列。在一个实施方案中,所述核酸分子包括编码由选自pDS49和pDD24的质粒编码的氨基酸序列的核酸序列。在一个实施方案中,所述核酸分子包括选自pDS49和pDD24的质粒的编码嵌合OrfC蛋白的核酸序列。
其它优选的实施方案包括如下的核酸分子,其包含编码来自一种PUFAPKS系统的PUFA PKS蛋白或域或其同源物的核酸序列,其中该核酸序列针对另一种不同生物体(例如要在其中表达该核酸序列的宿主)的密码子用法进行了优化。这类核酸序列的实例在本文中有描述,包括但不限于,SEQIDNO:70、SEQ ID NO:71和SEQ ID NO:72以及SEQ ID NO:75所表示的核酸序列。编码任何PUFA PKS蛋白或域(特别是任何本文所述氨基酸序列)的密码子优化核酸序列包含在本发明之内。在一个实施方案中,这种核酸分子包括编码如下氨基酸序列的核酸序列,所述氨基酸序列由选自pThOrfC-synPS、pDD26、pDD32或pDD24的质粒编码。在一个实施方案中,所述核酸分子包括从pThOrfC-synPS、pDD26、pDD32或pDD24选择的质粒的编码可在PUFA PKS系统中使用的蛋白或嵌合蛋白的核酸序列。
根据本发明,具有PUFA PKS系统至少一个域的生物活性的氨基酸序列是如下的氨基酸序列,其具有本文详细描述的PUFA PKS系统至少一个域的生物活性,所述生物活性的实例有裂殖壶菌属和破囊壶菌属PUFA PKS系统,进一步的实例见下列文献中描述的任何PUFA PKS系统的任意蛋白和域的生物活性:美国专利No.6,140,486、美国专利No.6,566,583、美国专利申请公开No.20020194641、美国专利申请公开No.20070089199、美国专利申请公开No.20040235127、美国专利申请公开No.20050100995、PCT专利公布WO 05/097982或美国专利申请公开No.20050014231,见上文。
因此,本发明的分离核酸分子能够编码任何PUFA PKS开放阅读框的翻译产物、PUFA PKS域、其生物活性片段、或天然存在的PUFA PKS开放阅读框的任何具有生物活性的同源物或域。给定蛋白或域的同源物是如下所述的蛋白或多肽,其具有与天然存在的参考氨基酸序列(即参考蛋白或域)不同的氨基酸序列,所述不同在于至少有一个或少数几个氨基酸,但不限于一个或少数几个氨基酸被删除(例如蛋白的截短形式,例如肽或片段)、插入、倒置、替换和/或衍生化(例如通过糖基化、磷酸化、乙酰化、豆蔻酰化、异戊烯化、棕榈酸化、酰胺化和/或添加糖基磷脂酰肌醇)。PUFA PKS蛋白和域的优选同源物在下文有详细描述。需要注意,同源物可以包括合成产生的同源物,给定蛋白或域的天然存在的等位变异体,或来自与参考序列所来源的生物体不同的生物体的同源序列。
一般地,蛋白或域的生物活性或生物作用是指在体内(即蛋白的自然生理环境)或体外(即在是实验室条件下)测量或观察到的、由所述蛋白或域显示或执行的、可归因于该蛋白或域的天然存在形式的任何功能。PUFA PKS系统的生物活性和构成PUFA PKS系统的各个蛋白/域的生物活性在本文其它部分有详细描述。蛋白或域的修饰,例如在同源物或模拟物中(下文中讨论)的修饰,可导致蛋白或域具有与天然存在蛋白或域的相同生物功能,或者可导致蛋白或域具有相对于天然存在蛋白或域降低或增加的生物活性。导致蛋白或域的表达降低或活性降低的修饰可以称作蛋白或域的失活(完全或部分)、下调或作用降低。类似地,导致蛋白或域的表达增加或活性增加的修饰可以称作蛋白或域的扩增、过表达、激活、增强、上调或作用提高。PUFA PKS系统的功能域是能够执行生物功能(即,具有生物活性)的域(即该域可以是蛋白的一部分)。
根据本发明,分离的核酸分子是被从其天然环境中移出(即,经过了人为操作)的核酸分子,其中所述天然环境是自然界中该核酸分子所在的基因组或染色体。因此,“分离的”不一定反映核酸分子已被纯化的程度,而是表示该分子不包括自然界中该核酸分子所在的整个基因组或整个染色体。分离的核酸分子可以包括基因。包括某基因的分离的核酸分子并不是包括该基因的染色体片段,而是包括与该基因有关的编码区和调节区,但是通常不包括相同染色体上天然存在的其它基因,尽管某些核酸分子可能包括不是PUFA PKS基因或系统必需部分的邻近/连锁基因。分离的核酸分子还可以包括如下所述的特定核酸序列,该特异核酸序列的侧翼(即在该序列的5’和/或3’末端)具有自然界中正常情况下不位于其侧翼的额外核酸(即异源序列)。分离的核酸分子可以包括DNA、RNA(例如mRNA)或DNA或RNA的衍生物(例如cDNA)。尽管词组“核酸分子”主要是指物理的核酸分子,而词组“核酸序列”主要是指核酸分子上的核苷酸的序列,但这两个词组可以互换使用,特别是就能够编码蛋白或蛋白的域的核酸分子或核酸序列而言。
优选地,本发明的分离核酸分子用重组DNA技术(例如聚合酶链式反应(PCR)扩增、克隆)或化学合成来产生。分离的核酸分子包括天然核酸分子和其同源物,包括但不限于天然等位变异体以及经修饰的核酸分子,在后者中以这样的方式插入、删除、替换和/或倒置了核苷酸,使得该修饰对本文所述的PUFA PKS系统的生物活性提供期望的影响。蛋白同源物(例如,由核酸同源物编码的蛋白)在上文中已有详细讨论。
核酸分子同源物可以用多种本领域技术人员已知的方法产生(见例如,Sambrook等,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLabs Press,1989)。例如,核酸分子可以用多种技术进行修饰,包括但不限于,经典的突变技术和重组DNA技术,例如定点诱变,对核酸分子进行化学处理以诱发突变,核酸片段的限制性酶切,核酸片段的连接,对核酸序列中选定区域加以PCR扩增和/或诱变,合成寡核苷酸混合物及连接混合物群体以“构建”核酸分子的混合物,和其组合。通过针对由该核酸编码的蛋白质的功能进行筛选和/或通过与野生型基因杂交,可以将核酸分子同源物从修饰核酸的混合物中选择出来。
本发明核酸分子的最小尺寸是足以形成探针或寡核苷酸引物的尺寸,该探针或引物能够与可用于本发明的核酸分子的互补序列形成稳定的杂交体(例如在中、高或非常高度严紧的条件下),或者该最小尺寸是足以编码具有本发明PUFA PKS系统至少一个域的生物活性的氨基酸序列的尺寸。因此,编码这样的蛋白质的核酸分子的尺寸可能取决于核酸组成,核酸分子与互补序列之间的百分比同源性或同一性,以及杂交条件本身(例如温度、盐浓度和甲酰胺浓度)。用作寡核苷酸引物或探针的核酸分子的最小尺寸,如果所述核酸分子是富含GC的,则典型地为至少大约12-大约15个核苷酸长;如果是富含AT的,则典型地为至少大约15-大约18个碱基长。除了实践的限制之外,本发明核酸分子的最大尺寸没有限制:核酸分子可以包含足以编码PUFA PKS系统的域的生物活性片段、PUFA PKS系统的完整域、PUFA PKS系统开放阅读框(Orf)内的数个域、PUFA PKS系统的完整Orf、或PUFA PKS系统的超过一个Orf的序列。
在本发明的一个实施方案中,分离的核酸分子包含,基本上组成为,或者组成为编码从下组选出的氨基酸序列的核酸序列:SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:13、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、或SEQ ID NO:74,或其生物活性片段。在一个方面中,核酸分子选自下组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ IDNO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73或SEQ ID NO:75。
在本发明的一个实施方案中,任何上述PUFA PKS氨基酸序列以及此类序列的同源物在产生时,可以在给定氨基酸序列的C和/或N末端的侧翼各带有从至少1个到最多大约20个额外的异源氨基酸。最终的蛋白和多肽可以称作“基本上组成为”所述给定的氨基酸序列。根据本发明,异源氨基酸是这样的一系列氨基酸:它们不是天然存在于(即非天然出现于体内)给定氨基酸序列两侧,或者它们不会被给定氨基酸序列的天然编码核酸序列在基因中出现时位于其侧翼的核苷酸所编码,如果使用该给定氨基酸序列所来源的生物体的标准密码子用法对天然序列中的这些核苷酸进行翻译的话。类似地,词组“基本上组成为”,当在本文中用于核酸序列时,是指如下的编码给定氨基酸序列的核酸序列,其在编码该给定氨基酸序列的核酸序列5’和/或3’的任一端的侧翼可以分别存在至少1个到多达大约60个额外的异源核苷酸。当编码该给定氨基酸序列的核酸序列出现在异源核苷酸是在天然基因中不是天然存在于(即,在体内是非天然的)的两侧。
本发明还包括分离的核酸分子,其包括编码具有PUFA PKS系统至少一个域的生物活性的氨基酸序列的核酸序列。在一个方面中,这种核酸序列编码上述任何PUFA PKS蛋白或域的同源物,其中该同源物具有本文在前面描述的PUFA PKS系统的至少一个(或者两个、三个、四个或更多个)域的生物活性。
在本发明的一个方面中,本发明涵盖的PUFA PKS蛋白或域的同源物,包括与从下组选出的氨基酸序列的至少500个连续氨基酸具有至少大约60%同一性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:39、SEQ ID NO:52、SEQ ID NO:62或SEQ ID NO:74;其中所述氨基酸序列具有PUFA PKS系统的至少一个域的生物活性。在一个进一步的方面中,同源物的氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:39、SEQ ID NO:52、SEQ ID NO:62或SEQ ID NO:74中任一个序列的至少大约600个连续氨基酸,更优选地至少大约700个连续氨基酸,更优选地至少大约800个连续氨基酸,更优选地至少大约900个连续氨基酸,更优选地至少大约1000个连续氨基酸,更优选地至少大约1100个连续氨基酸,更优选地至少大约1200个连续氨基酸,更优选地至少大约1300个连续氨基酸,更优选地至少大约1400个连续氨基酸,更优选地至少大约1500个连续氨基酸,或者与SEQ ID NO:6、SEQ ID NO:62或SEQ ID NO:74的全长至少大约60%同一。在一个进一步的方面中,同源物的氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:39或SEQ ID NO:52中任一个序列的至少大约1600个连续氨基酸,更优选地至少大约1700个连续氨基酸,更优选地至少大约1800个连续氨基酸,更优选地至少大约1900个连续氨基酸,更优选地至少大约2000个连续氨基酸,或者与SEQ ID NO:4或SEQ ID NO:52的全长至少大约60%同一。在一个进一步的方面中,同源物的氨基酸序列与SEQ ID NO:2或SEQ ID NO:39中任一个序列的至少大约2100个连续氨基酸,更优选地至少大约2200个连续氨基酸,更优选地至少大约2300个连续氨基酸,更优选地至少大约2400个连续氨基酸,更优选地至少大约25000个连续氨基酸,更优选地至少大约2600个连续氨基酸,更优选地至少大约2700个连续氨基酸,更优选地至少大约2800个连续氨基酸,甚至更优选地与其全长至少大约60%。
在另一个方面中,本发明涵盖的PUFA PKS蛋白或域的同源物包含这样的氨基酸序列,该序列在上文各段中描述的任何连续氨基酸长度上与任一上文描述的氨基酸序列具有至少大约65%的同一性,更优选地具有至少大约70%的同一性,更优选地具有至少大约80%的同一性,更优选地具有至少大约85%的同一性,更优选地具有至少大约90%的同一性,更优选地具有至少大约95%的同一性,更优选地具有至少大约96%的同一性,更优选地具有至少大约97%的同一性,更优选地具有至少大约98%的同一性,更优选地具有至少大约99%的同一性,其中该氨基酸序列具有PUFA PKS系统的至少一个域的生物活性。
在一个方面中,本发明涵盖的PUFA PKS蛋白或域的同源物包含这样的氨基酸序列,所述序列与从下组选出的氨基酸序列具有至少大约60%的同一性:SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:13、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68,或包括这些氨基酸序列任一个的组合的氨基酸序列,其中所述氨基酸序列具有PUFA PKS系统的至少一个域或其辅助蛋白的生物活性。在一个进一步的方面中,同源物的氨基酸序列与上述任一氨基酸序列具有至少大约65%的同一性,更优选地具有至少大约70%的同一性,更优选地具有至少大约80%的同一性,更优选地具有至少大约85%的同一性,更优选地具有至少大约90%的同一性,更优选地具有至少大约95%的同一性,更优选地具有至少大约96%的同一性,更优选地具有至少大约97%的同一性,更优选地具有至少大约98%的同一性,更优选地具有至少大约99%的同一性,其中该氨基酸序列具有PUFA PKS系统的至少一个域或其辅助蛋白的生物活性。
根据本发明,在指示本文所述的核算或氨基酸序列时,术语“毗邻的”或“连续的”的意思是连接形成不间断的序列。例如,所谓第一序列包含第二序列的30个毗邻(或连续)氨基酸,是指第一序列包括30个氨基酸残基的不间断序列,该序列与第二序列中30个氨基酸残基的不间断序列具有100%的同一性。类似地,关于与第二序列具有“100%同一性”的第一序列,是指第一序列与第二序列精确匹配,在核苷酸或氨基酸之间无缺口。
如本文所使用的,除非特别指出,所称百分比(%)同一性是指对用如下方法执行的同源性估计:(1)BLAST 2.0 Basic BLAST同源性搜索,其中使用blastp进行氨基酸搜索,使用blastn进行核酸搜索,及使用blastX进行核酸搜索和所有6个开放阅读框中被翻译氨基酸的搜索,均使用标准默认参数,其中默认对查询序列进行低复杂性区(low complexity regions)过滤(在下列文献中有说明:Altschul,S.F.,Madden,T.L.,A.A.,Zhang,J.,Zhang,Z.,Miller,W.& Lipman,D.J.(1997)″Gapped BLAST and PSI-BLAST:a new generation of protein database search programs.″Nucleic Acids Res.25:3389-3402,本文援引并入其全部内容);(2)BLAST 2比对(使用下文所述的参数);(3)和/或PSI-BLAST,使用标准默认参数(位置特异性迭代BLAST)。需要注意,由于BLAST 2.0Basic BLAST和BLAST 2之间标准参数存在一些差异,有可能在使用BLAST 2程序时两个具体的序列具有显著同源性,而在BLAST 2.0 Basic BLAST中用其中一个序列作为质询序列进行搜索时第二个序列可能不会被识别为高匹配。此外,PSI-BLAST提供一种自动、易用的“谱”搜索,这是一种灵敏的寻找序列同源物的方法。该程序首先执行一个带缺口的BLAST数据库搜索。PSI-BLAST程序使用来自返回的任何显著性比对(significant alignments)的信息来构建位置特异性评分矩阵(position-specific score matrix),用其取代查询序列用于下一轮数据库搜索。因此,应当理解,百分比同一性可使用这些程序中的任何一种来确定。
两个具体的序列可以用BLAST 2序列相互比对,见Tatusova andMadden,(1999),″Blast 2sequences-a new tool for comparing protein andnucleotide sequences ″,FEMS Microbiol Lett.174:247-250,本文援引并入其全部内容。BLAST 2序列比对在blastp或blastn中进行,使用BLAST 2.0算法在两个序列之间执行带缺口的BLAST搜索(Gapped Blast Search)(BLAST2.0),其中允许在所得的比对中引入缺口(删除和插入)。这里为了清楚起见,使用如下的标准默认参数执行BLAST 2序列比对。
对于blastn,使用0BLOSUM62矩阵:
匹配加分[reward for match]=1
错配罚分[penalty for mismatch]=-2
开放缺口[open gap](5)和延伸缺口[extension gap](2)罚分
缺口x_脱落[gap x_dropoff](50)期望[expect](10)字长[word size](11)过滤[filter](开)
对于blastp使用0BLOSUM62矩阵:
开放缺口(11)和延伸缺口(1)罚分
缺口x_脱落(50)期望(10)字长(3)过滤(开)。
在本发明的另一个实施方案中,具有本发明PUFA PKS系统的至少一个域的生物活性的氨基酸序列包括如下所述的氨基酸序列,其与天然PUFAPKS蛋白质或多肽足够相似,以至于编码该氨基酸序列的核酸序列能够在中等、高或非常高严紧度的条件(如下所述)下与编码天然PUFA PKS蛋白质或多肽的核酸分子(即,与编码天然PUFA PKS蛋白质或多肽的核酸分子(即,与编码天然PUFA PKS蛋白质或多肽的核酸的核酸链的互补物)杂交。优选地,具有本发明PUFA PKS系统的至少一个域的生物活性的氨基酸序列由这样的核酸序列编码,该核酸序列可在中、高或非常高严紧度条件下与编码下述蛋白质的核酸序列的互补物杂交,所述蛋白质如本文所述的任何氨基酸序列所代表的氨基酸序列。
在本发明的另一个实施方案中,本发明的核苷酸序列是这样的核苷酸序列,其是从裂殖壶菌属的核苷酸序列分离的(能够从其获得的)、与其相同的、或是其同源物,其中所述来自裂殖壶菌属的核苷酸序列(包括来自裂殖壶菌属的DNA分子的任一链)可在中、高或非常高度严紧的条件下与编码任一如下氨基酸序列的核苷酸序列杂交:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:13、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30或SEQ ID NO:32。在一个实施方案中,裂殖壶菌属是裂殖壶菌属ATCC 20888。在另一个实施方案中,裂殖壶菌属是裂殖壶菌属20888的子菌株,包括其突变菌株(例如N230D)。在一个实施方案中,核酸分子可在中、高或非常高严紧度的条件下与从下选出的核苷酸序列杂交:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:31。
在本发明的另一个实施方案中,本发明的核苷酸序列是这样的核苷酸序列,其是从破囊壶菌属的核苷酸序列分离的(能够从其获得的)、与其相同的、或是其同源物,其中所述来自破囊壶菌属的核苷酸序列(包括来自破囊壶菌属DNA分子的任一链)可以在中、高或非常高度严紧的条件下与编码任一如下氨基酸序列的核苷酸序列杂交:SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68。在一个实施方案中,裂殖壶菌属是破囊壶菌23B(ATCC 20892)。在一个实施方案中,核酸分子可在中、高或非常高严紧度的条件下与选自下组的核苷酸序列杂交:SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65或SEQ ID NO:67。
在另外一个实施方案中,本发明的核苷酸序列是这样的核苷酸序列,其是从真核生物体(例如破囊壶菌或网粘菌(labyrinthulid))或海洋细菌的核苷酸序列分离的(能够从其获得的)、与其相同的、或是其同源物,其中所述核苷酸序列能够在中、高或非常高度严紧的条件下与编码本文任一氨基酸序列的核苷酸序列杂交。
在另一个实施方案中,本发明的核苷酸序列是这样的核苷酸序列,其是从任何编码本文所述辅助蛋白的核苷酸序列分离的(能够从其获得的)、与其相同的、或是其同源物,其中,在一个实施方案中,该核苷酸序列可在中、高或非常高度严紧的条件下与编码SEQ ID NO:34所代表的氨基酸序列的核苷酸序列杂交。在一个实施方案中,核酸序列可在中、高或非常高度严紧的条件下与SEQ ID NO:33所代表的核苷酸序列杂交。
在另一个实施方案中,本发明的核苷酸序列是这样的核苷酸序列,其是从本文所述的任何密码子优化或嵌合核苷酸序列(包括DNA分子的任一链)分离的(能够从其获得的)、与其相同的、或是其同源物,其中,在一个实施方案中,该核苷酸序列能够在中、高或非常高度严紧的条件下与编码SEQ ID NO:74所代表的氨基酸序列的核苷酸序列杂交。在一个实施方案中,核酸序列能够在中、高或非常高度严紧的条件下与从下组选出的核苷酸序列杂交:SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73或SEQ IDNO:75。
推定互补序列的方法是本领域技术人员已知的。应当注意,因为氨基酸序列和核酸序列技术并非完全不出错,所以本文提供的序列,最多代表本发明PUFA PKS域和蛋白、或编码这些氨基酸序列的核苷酸序列的表观序列。
如本文所使用的,杂交条件是指标准杂交条件,在该条件下使用核酸分子鉴定相似的核酸分子。这些标准条件在下列文献中公开:Sambrook等,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Labs Press(1989)。本文引用Sambrook等如上的文献全部内容作为参考(具体见第9.31-9.62页)。此外,在例如Meinkoth等,Anal.Biochem.138,267(1984)中公开了计算的合适杂交和洗涤条件,以实现允许不同程度的核苷酸错配的杂交的公式;本文援引并入Meinkoth等的上述论文的全部内容。
更具体地,本文涉及的中等严紧度的杂交和冲洗条件是指如下条件,其允许与用于探测杂交反应的核酸分子具有至少大约70%的核酸序列同一性的核酸分子的分离(也就是说,允许大约30%或更少核苷酸错配的条件)。本文涉及的高严紧度的杂交和洗涤条件是指如下条件:其允许与用于探测杂交反应的核酸分子具有至少大约80%的核酸序列同一性的核酸分子的分离(也就是说,允许大约20%或更少的核苷酸错配的条件)。本文涉及的非常高严紧度的杂交和洗涤条件是指如下条件:其允许与用于探测杂交反应的核酸分子具有至少大约90%的核酸序列同一性的核酸分子的分离(也就是说,允许大约10%或更少的核苷酸错配的条件)。如上面讨论的,本领域技术人员可以使用Meinkoth等(同上)中的公式计算合适的杂交和洗涤条件,以实现这些特定的核苷酸错配水平。这些条件会根据所形成的是DNA:RNA还是DNA:DNA杂交体而变化。DNA:DNA杂交体算得的熔点比DNA:RNA杂交体低10℃。在特定的实施方案中,对于DNA:DNA杂交体的严紧杂交条件包括在大约20℃到大约35℃之间(低严紧度),更优选在大约28℃到大约40℃之间(更严紧的),更优选在大约35℃到大约45℃之间(更严紧的)的温度条件下,在6XSSC(0.9M Na+)的离子强度下进行杂交,以及合适的洗涤条件。在具体的实施方案中,对于DNA:RNA杂交体的严紧杂交条件包括在大约30℃到大约45℃之间,更优选在大约38℃到大约50℃之间,更优选在大约45℃到大约55℃之间的温度条件下,在6X SSC(0.9M Na+)的离子强度下进行杂交,以及相似的严紧洗涤条件。这些值是基于大于约100个核苷酸的分子、0%甲酰胺、及大约40%的G+C含量的熔点的计算结果。或者,Tm可以根据Sambrook等,如上,第9.31-9.62页中提出的那样经验地计算。一般地,洗涤条件应尽可能严紧,并应适合于所选的杂交条件。例如,杂交条件可包括特定杂交体的计算Tm低大约20-25℃的盐和温度条件的组合,洗涤条件通常包括比特定杂交体的计算Tm低大约12-20℃的盐和温度条件的组合。适合于DNA:DNA杂交体使用的杂交条件的一个实例包括在大约42℃条件下在6X SSC(50%甲酰胺)中杂交2-24小时,随后进行洗涤步骤,其包括在室温下在大约2X SSC中洗涤1次或多次,随后在更高温度和更低离子强度下进行进一步的洗涤(例如,在大约37℃和大约0.1X-0.5X SSC中进行至少一次洗涤,随后在大约68℃和大约0.1X-0.5X SSC中进行至少一次洗涤)。
本发明的再另外一个实施方案包括如下的核酸分子,其包含、基本上组成为、或组成为这样的核酸序列,该核酸序列与从下面选出的质粒的核酸序列相同或是其同源物(如上文定义的):pJK1126(ATCC登录号PTA-7648)、pJK1129(ATCC登录号PTA-7649)、pJK1131(ATCC登录号PTA-7650)、pJK306(ATCC登录号PTA-7641)、pJK320(ATCC登录号pTA-7644)、pJK324(ATCC登录号PTA-7643)、pBR002(ATCC登录号PTA-7642)、Th23BOrfA_pBR812.1(ATCC登录号PTA-8232)Th23BOrfA_pBR811(ATCC登录号PTA-8231)、Th23BOrfB_pBR800(ATCC登录号PTA-8227)或Th23BOrfC_pBR709A(ATCC登录号PTA-8228)。
在另一个实施方案中,本发明包括如下的核酸分子,其包含、基本上组成为、或组成为这样的核酸序列,该核酸序列与从下组选出的质粒的核酸序列相同或是其同源物(如上文定义的):pThOrfC-synPS(ATCC登录号PTA-8229)、pDS49(ATCC登录号TA-8230)、pDD24(ATCC登录号PTA-8226)、pDD26(ATCC登录号PTA-8411)、pDD32(ATCC登录号PTA-8412)或OrfB*_pJK780(ATCC登录号PTA-8225)。
本发明的再一个实施方案包括如下的核酸分子,其包含、基本上组成为、或组成为这样的核酸序列,该核酸序列编码与由下面选出的质粒编码的氨基酸序列相同或是其同源物(如上文定义)的氨基酸序列:pJK1126(ATCC登录号PTA-7648),pJK1129(ATCC登录号PTA-7649),pJK1131(ATCC登录号PTA-7650),pJK306(ATCC登录号PTA-7641),pJK320(ATCC登录号PTA-7644),pJK324(ATCC登录号PTA-7643),pBR002(ATCC登录号PTA-7642),Th23BOrfA_pBR812.1(ATCC登录号PTA-8232)Th23BOrfA_pBR811(ATCC登录号PTA-8231),Th23BOrfB_pBR800(ATCC登录号PTA-8227)或Th23BOrfC_pBR709A(ATCC登录号PTA-8228)。
在另一个实施方案中,本发明包括包括如下的核酸分子,其包含、基本上组成为、或组成为这样的核酸序列,该核酸序列编码与由下面选出的质粒编码的氨基酸序列相同或是其同源物(如上文定义)的氨基酸序列:pThOrfC-synPS(ATCC登录号PTA-8229)、pDS49(ATCC登录号PTA-8230)、pDD24(ATCC登录号PTA-8226)、pDD26(ATCC登录号PTA-8411)、pDD32(ATCC登录号PTA-8412)、or OrfB*_pJK780(ATCC登录号PTA-8225)。
本发明的另一个实施方案包括一种重组核酸分子,其包括重组载体和包含编码氨基酸序列的核酸序列的核酸分子,所述氨基酸序列具有如本文所述PUFA PKS系统的至少一个域或蛋白的生物活性。这类核酸序列、域或蛋白在上文中有详细描述。根据本发明,重组载体是一种工程化(即,人工产生)的核酸分子,其作为工具用于操纵选择的核酸序列并将这种核酸序列引入到宿主细胞内。因此,重组载体适用于对所选核酸序列进行克隆、测序和/或操纵,例如通过将所选核酸序列表达和/或传递到宿主细胞内,形成重组细胞。这种载体通常含有异源核酸序列,即天然不存在于要克隆或递送的核酸序列邻近的核酸序列,尽管载体还可以含有天然存在于本发明的核酸分子邻近的或者可用于表达本发明的核酸分子的调控核酸序列(将在下文详细讨论)(例如启动子、非翻译区)。载体可以是RNA或DNA,原核或真核,且通常是质粒。载体可以作为染色体外元件(例如质粒)被保持,或者可以整合到重组生物体(例如微生物或植物)的染色体中。整个载体可以在宿主细胞内保持在原位,或者,在某些条件下,质粒DNA可以被缺失,留下本发明的核酸分子。整合的核酸分子可以受染色体启动子的控制,受天然或质粒启动子的控制,或者受多个启动子的组合的控制。可以有单个拷贝或多个拷贝的核酸分子整合到染色体内。本发明的重组载体可含有至少一个可选择标记。
在一个实施方案中,本发明重组核酸分子中使用的重组载体是表达载体。如本文所使用的,词组“表达载体”用来指适合于产生编码产物(例如目的蛋白质)的载体。在本实施方案中,编码待生产产物(例如PUFA PKS域或蛋白质)的核酸序列被插入到重组载体中而产生重组核酸分子。编码待生产蛋白的核酸序列以这样的方式插入到载体中,使得载体中核酸分子与调控序列可操作地连接,从而使核酸序列能够在重组宿主细胞内进行转录和翻译。
在另一个实施方案中,本发明的重组核酸分子中使用的重组载体是靶向载体(targeting vactor)。如本文所使用的,词组“靶向载体”用来指用于将特定核酸分子递送到重组宿主细胞内的载体,其中该核酸分子被用来删除、失活或取代宿主细胞或微生物内的内源基因或基因的一部分(即,用于靶向性基因破坏(targeted gene disruption)或敲除技术)。这种载体在本领域也被称作“敲除”载体。在本实施方案的一个方面中,载体的一部分,但更典型的是插入载体内的核酸分子(即,插入序列),具有这样的核酸序列,其与宿主细胞内的靶基因(即,删除和失活的目标基因)的核酸序列同源。载体插入序列的核酸序列被设计成可与靶基因结合,使得靶基因和插入序列可进行同源重组,借此使内源靶基因缺失、失活、衰减(即通过内源靶基因的至少一部分的突变或缺失)。
通常,重组核酸分子包括本发明的至少一个核酸分子,其与一个或多个转录控制序列可操作连接。如本文所使用的,词组“重组分子”或“重组核酸分子”主要是指与转录控制序列可操作连接的核酸分子或核酸序列,但是当这种核酸分子是如本文所讨论的重组分子时,其可与词组“核酸分子”互换使用。根据本发明,词组“可操作连接”是指将核酸分子与转录控制序列以这样的方式相连接,使得该分子可以在被转化(即转化、转导、转染、接合或引导(conduce))进入宿主细胞时表达。转录控制序列是控制转录起始、延长或终止的序列。特别重要的转录控制序列是控制转录起始的序列,例如启动子、增强子、操纵基因或阻遏蛋白序列。合适的转录控制序列包括任何能够在该重组核酸分子所导入的宿主细胞或生物体中行使功能的转录控制序列。
本发明的重组核酸分子还可包含其它调控序列,例如翻译调控序列、复制起点和其它与所述重组细胞相容的调控序列。在一个实施方案中,本发明的重组分子,包括整合到宿主细胞染色体内的重组分子,还含有分泌信号(也就是信号区段核酸序列),使被表达的蛋白能够从产生该蛋白质的细胞分泌出去。合适的信号区段包括:与待表达的蛋白天然相关的信号区段,或者任何能够指导根据本发明蛋白分泌的异源信号区段。在另一个实施方案中,本发明的重组分子包括前导序列,以使被表达的蛋白能够被递送并插入到宿主细胞的膜内。合适的前导序列包括与蛋白质天然相关的前导序列,或者任何能够指导蛋白质递送到并插入细胞膜的异源前导序列。
本发明人发现裂殖壶菌属和破囊壶菌属PUFA PKS OrfA和OrfB在基因组中紧密连锁,并且这两个Orf之间的区域已经被测序。在裂殖壶菌属中,这两个Orf的方向相反(oriented in opposite direction),两个起始密码子(ATG)之间相隔4244个碱基对(即它们被如下排列:3’OrfA5’-4244bp-5’OrfB3’)。对4244bp的基因间区域进行检查没有发现任何明显的Orf(BlastX搜索中没有发现显著性匹配)。Orfs A和B均在裂殖壶菌属中高表达,至少在产油期间是如此,提示在该基因间区域内含有活性启动子元件。这些遗传元件被认为可以用作双向(bi-directional)启动子序列,用于转基因应用。例如,在优选实施方案中,可以克隆该区域,在每个末端放置任何目的基因,并将该构建体引入到裂殖壶菌属(或者该启动子可以显示功能的其它宿主)中。我们预测,在合适的条件下,该调节元件可以帮助两个导入基因协调地高水平表达。含有裂殖壶菌属PUFA PKS调节元件(例如启动子)的调节区域的完整核苷酸序列在本文中用SEQ ID NO:76表示。
按照相似的方式,OrfC在产油期间在裂殖壶菌属中高表达,预期在其起始密码子的上游区域有调节元件存在。OrfC上游的一个基因组DNA区域已经被克隆和测序,在本文中用SEQ ID NO:77表示。该序列含有直接位于OrfC起始密码子的上游的3886nt。对该区域进行检查没有发现任何明显的Orf(即,BlastX搜索中没有发现显著性匹配)。据信,该区域中所包含的调节元件在合适的条件下有助于定位于其后方的基因的高表达。因此,在合适的条件下,表达水平可能与受A-B基因间区域(SEQ ID NO:76)控制的基因相协调。
因此,在一个实施方案中,如本文公开的可用于本发明的重组核酸分子可以包括SEQ ID NO:76和/或SEQ ID NO:77中所含的PUFA PKS调节区域。这种调节区域可以包括SEQ ID NO:76和/或SEQ ID NO:77的至少具有基础水平的PUFA PKS转录活性(至少基础水平的启动子活性)的任何部分(片段)。
可以用本发明的一个或多个重组分子产生本发明的编码产物(例如PUFA PKS域、蛋白或系统)。在一个实施方案中,通过在可有效产生所述蛋白质的条件下表达本文所述的核酸分子来产生编码产物。产生编码蛋白质的一种优选方法是用一个或多个重组分子转染宿主细胞,从而形成重组细胞。供转染的合适的宿主细胞包括,但不限于,任何可被转染的细菌、真菌(例如酵母)、昆虫、植物或动物细胞。宿主细胞可以是未转染的细胞或者已经用至少一种其它重组核酸分子转染的细胞。
根据本发明,术语“转染”用于指任何可将外源核酸分子(即重组核酸分子)插入细胞的方法。当术语“转化”用来指将核酸分子导入微生物细胞,例如藻类、细菌和酵母,或导入植物细胞时,其可与术语“转染”互换使用。在微生物系统中,术语“转化”用于描述由于微生物或植物获得了外源核酸而承继(inherited)的改变,与术语“转染”基本上同义。然而,在动物细胞中,转化具有第二种意思,其可以指例如培养中的细胞在癌化之后生长性质的改变。因此,为了避免混淆,对于外源核酸导入动物细胞优选使用术语“转染”,并且,在这些术语与将外源核酸导入细胞相关的范围内,本文将使用术语“转染”来概括性地涵盖动物细胞的转染以及微生物细胞或植物细胞的转化。因此,转染技术包括,但不限于,转化、粒子轰击、电穿孔、显微注射、脂质转染、吸附、感染和原生质体融合。
本领域技术人员将认识到,使用重组DNA技术,可以通过操纵例如宿主细胞内核酸分子的拷贝数、那些核酸分子转录的效率、所得转录物翻译的效率和翻译后修饰效率等,来改善对被转染的核酸分子表达的控制。此外,可以对启动子序列进行基因工程操作,以提高与天然启动子相比的表达水平。可用于控制核酸分子表达的重组技术包括,但不限于,将核酸分子整合到一条或多条宿主细胞染色体内、向质粒添加载体稳定性序列、置换或修饰转录控制信号(例如启动子、操纵基因、增强子)、置换或修饰翻译控制信号(例如,核糖体结合位点、Shine-Dalgarno序列)、修饰核酸分子以符合宿主细胞的密码子用法、和删除使转录物不稳定的序列。
上面关于重组核酸分子和转染宿主细胞的一般性论述可适用于本文所讨论的任何核酸分子,包括编码任何具有来自PUFA PKS系统的至少一个域的生物活性的氨基酸序列的核酸分子,编码来自其它PKS系统的氨基酸序列的核酸分子,和编码其它蛋白质或域的核酸分子。
本发明还涉及来自除本文具体描述的微生物之外的微生物,并且在结构、域组织和/或功能上与本文描述的任何PUFA PKS系统(及其蛋白或域)同源的PUFA PKS系统(及其蛋白或域)。此外,本发明涉及在各种应用中使用这些微生物和来自这些微生物的PUFA PKS系统或其组件(例如DH2域),用作根据本发明的PUFA PKS系统(例如遗传修饰的生物体和产生生物活性分子的方法)。用于鉴定包含PUFA PKS系统的微生物的筛选过程在美国专利申请公开No.20020194641,见上文,中有详细描述。本文所述的有关PUFA PKS蛋白和域的结构和功能以及编码它们的核苷酸序列的知识,是鉴定、确认和/或分离这类蛋白或多核苷酸的有用工具。
根据本发明,术语“破囊壶菌”(thraustochytrid)是指破囊壶菌目(Thraustochytriales)的任何成员,其包括破囊壶菌科(Thraustochytriaceae)。术语“网粘菌(labyrinthulid)”是指网粘菌目(Labyrinthulales)的任何成员,包括网粘菌科(Labyrinthulaceae)。网粘菌科的成员从前曾被认为是破囊壶菌目的成员,但是在此类生物体的分类法的修订版本中,该科现在被认为属于网粘菌目,而网粘菌目和破囊壶菌目均被认为属于网粘菌门(Labyrinthulomycota)。破囊壶菌和网粘菌的分类随着发展而经常被修订。然而,分类学理论现在已经普遍将两个群的微生物与原生藻菌(Stramenopile)世系中的水藻或类水藻原生生物放在一起。破囊壶菌和网粘菌当前的分类学地位可以简述如下:
界:原生藻菌(Stramenopila)(Chromista)
门:网粘菌
纲:网粘菌
目:网粘菌
科:网粘菌
目:破囊壶菌
科:破囊壶菌
然而,由于仍然存在分类的不确定性,对于本发明的目的而言,最好认为本发明作为破囊壶菌描述的菌株包括如下生物体:目:破囊壶菌目;科:破囊壶菌科;属:破囊壶菌属(种:arudimentale,aureum,benthicola,globosum,kinnei,motivum,multirudimentale,pachydermum,proliferum,roseum,striatum)、Ulkenia属(种:amoeboidea,kerguelensis,minuta,profunda,radiata,sailens,sarkariana,schizochytrops,visurgensis,yorkensis)、裂殖壶菌属(种:aggregatum,limnaceum,mangrovei,minutum,octosporum),Japonochytrium(种:marinum)、Aplanochytrium属(种:haliotidis,kerguelensis,profunda,stocchinoi)、Althornia(种:crouchii)属、或Elina属(种:marisalba,sinorifica)。需要注意,Ulkenia属的原始描述没有发表在经过同行评议的杂志上,因此关于该属及其中物种的有效性仍然存在一些问题。出于本发明的目的,Ulkenia中的物种将被看作是破囊壶菌属的成员。
本发明作为网粘菌描述的菌株包括如下的生物体:目:网粘菌,科:网粘菌,属:网粘菌属(种:algeriensis,coenocystis,chattonii,macrocystis,macrocystis atlantica,macrocystis macrocystis,marina,minuta,roscoffensis,valkanovii,vitellina,vitellina pacifica,vitellina vitellina,zopfii),Labyrinthuloides属(种:haliotidis,yorkensis),Labyrinthomyxa(种:marina),Diplophrys属(种:archeri),Pyrrhosorus(种:marinus),Sorodiplophrys属(种:stercorea)或Chlamydomyxa属(种:labyrinthuloides,montana)(尽管关于Pyrrhosorus、Sorodiplophrys或Chlamydomyxa的精确分类学地位目前尚没有达成一致)。
为了用本发明的PUFA PKS系统产生显著高产率的各种生物活性分子,可以对生物体,优选微生物或植物或植物部分(例如植物细胞),进行遗传修饰,以影响PUFA PKS系统的活性。在一个方面中,这种生物体可内源含有并表达PUFA PKS系统,遗传修饰可以是对该内源PUFA PKS系统的一个或多个功能域的遗传修饰,该修饰对PUFA PKS系统的活性具有一定影响。在另一个方面中,这种生物体可内源含有并表达PUFA PKS系统,且遗传修饰可以是引入至少一个外源核酸序列(例如重组核酸分子),其中该外源核酸序列编码来自同一或另一PKS系统和/或蛋白的至少一种可影响所述PUFA PKS系统的活性生物活性域或蛋白(例如磷酸泛酰巯基乙胺基转移酶(PPT酶),下文讨论)。在另外一个方面中,生物体不一定内源(天然)地含有PUFA PKS系统,而是被遗传修饰而引入至少一种编码具有PUFA PKS系统至少一个域的生物活性的氨基酸序列的重组核酸分子。在这个方面中,PUFA PKS活性受到生物体中PUFA PKS活性的引入或提高的影响。这些方面各自的相关实施方案将在下文有详细讨论。
因此,根据本发明,一个实施方案涉及遗传修饰的生物体,其中该生物体表达这样的PKS系统,其包括多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统的至少一个生物活性域。所述PUFA PKS系统的至少一个域由如本文所述的核酸序列编码。遗传修饰影响所述PKS系统在所述生物体中的活性。遗传修饰的生物体可以包括任何一个或多个上文指出的核酸序列,和/或任何在上文中详细描述的PUFA PKS ORF或域的其它同源物。
如这里所使用的,遗传修饰的微生物可以包括遗传修饰的细菌、原生生物、微藻、真菌或其它微生物,并且特别地,属于本文所述的破囊壶菌目中的属的任何生物(例如破囊壶菌)。这种遗传修饰的微生物的基因组相对于其正常(即,野生型或天然)的形式被修饰(即,突变或改变),从而获得期望的结果(即,提高或改变PUFA PKS活性和/或使用PUFA PKS系统或其组分生产期望的产物)。微生物的遗传修饰可以用经典菌株开发和/或分子遗传技术实现。这些技术是本领域已知的,并且在例如Sambrook等,1989,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Labs Press.中一般性地公开了用于微生物的这些技术。本文引用上述Sambrook等的文献的全部内容作为参考。遗传修饰的微生物可以包括这样的微生物,其中核酸分子被插入、删除或修饰(即突变,例如通过核苷酸的插入、删除、替换和/或倒置),从而在微生物体内产生期望的效果。
用来根据本发明加以修饰的优选微生物宿主细胞包括,但不仅限于,任何细菌、原生生物、微藻、真菌或原生动物。在一个方面中,优选的用于遗传修饰的微生物包括,但不限于,任何破囊壶菌目的微生物或任何网粘菌目的微生物。用于本发明的特别优选的宿主细胞包括来自如下属的微生物,包括但不限于:破囊壶菌属、Ulkenia属、裂殖壶菌属、Japonochytrium属、Aplanochytrium属、Althornia属、Elina属、网粘菌属、Labyrinthuloides属、Labyrinthomyxa属、Diplophrys属、Pyrrhosorus属、Sorodiplophrys属或Chlamydomyxa属。用于遗传修饰的合适宿主微生物的其它实例包括,但不限于,酵母,包括酿酒酵母(Saccharomyces cerevisiae),卡尔酵母(Saccharomyces carlsbergensis),或其它酵母,例如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces),或其它真菌,例如丝状真菌如曲霉属(Aspergillus)、脉孢菌属(Neurospora)、青霉属(Penicillium)等。细菌细胞也可用作宿主。它们包括大肠杆菌(Escherichia coli),其可用在发酵过程中。或者,如乳杆菌属菌种或芽孢杆菌属菌种等宿主也可以用作宿主。
本发明的另一个实施方案涉及遗传修饰的植物或植物部分(例如,其中该植物已被遗传修饰从而表达如本文所述的PUFA PKS系统),其至少包括核心PUFA PKS酶复合体,并且在一个实施方案中,包括至少一种PUFAPKS辅助蛋白(例如PPT酶),使得该植物产生PUFA。优选地,植物是含油种子植物(oil seed plant),其中产油种子或产油种子中的油含有所述PUFAPKS系统所产生的PUFA。这些油含有可检测量的至少一种目的PUFA或主要PUFA,它是PUFA PKS系统的产物。植物尚未知内源含有PUFA PKS系统,因此,本发明的PUFA PKS系统为人们提供了产生具有独特脂肪酸生产能力的植物的机会。本发明特别优选的实施例是对植物进行遗传工程化,从而在相同植物中产生一种或多种PUFA,包括EPA、DHA、DPA(n-3and/or n-6)、ARA、GLA、SDA及其它。本发明使得人们能够制作比例不同、形式各异的各种“定制油”(designer oil)。
植物遗传工程化的方法是本领域已知的。例如,大量植物转化方法已经开发出来,包括生物和物理转化方法。见例如Miki等,″Procedures forIntroducing Foreign DNA into Plants″in Methods in Plant Molecular Biologyand Biotechnology,Glick,B.R.and Thompson,J.E.Eds.(CRC Press,Inc.,BocaRaton,1993)第67-88页。此外,可以获得用于植物细胞或组织转化和植物再生的载体和体外培养方法。见例如Gruber等,″Vectors for PlantTransformation″in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.and Thompson,J.E.Eds.(CRC Press,Inc.,Boca Raton,1993)第89-119页。
用于将表达载体引入到植物内的最广泛使用的方法是基于土壤杆菌自然转化系统。见例如Horsch等,Science 227:1229(1985)。根瘤土壤杆菌(A.Tumefaciens)和发根土壤杆菌(A.rhizogenes)是可遗传转化植物细胞的植物致病土壤细菌。根瘤土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物遗传转化的基因。见例如Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。土壤杆菌载体系统和用于土壤杆菌介导的基因转化方法的描述在大量参考文献中有提供,包括Gruber等,同上,Miki等,同上,Moloney等,Plant CellReports 8:238(1989),和美国专利4,940,838和5,464,763。
另一种可通用的植物转化方法是微粒介导的转化(microproiectile-mediated transformation),其中DNA被携载在微粒的表面上。通过基因枪(biolistic)设备将表达载体引入到植物组织中,其中基因枪将微粒加速到足以透过植物细胞壁和膜的速度。Sanford等,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988),Sanford,J.C.,Physiol.Plant79:206(1990),Klein等,Biotechnology 10:268(1992)。
另一种用于物理输送DNA到植物的方法是靶细胞的超声波降解法。Zhang等,Bio/Technology 9:996(1991)。或者,脂质体或原生质体融合已经用于将表达载体引入到植物中。Deshayes等,EMBO J.,4:2731(1985),Christou等,Proc Natl.Acad.Sci.USA 84:3962(1987)。利用CaCl2沉淀、聚乙烯酰或聚-L-鸟氨酸直接将DNA吸收进入原生质体也已有报道。Hain等,Mol.Gen.Genet.199:161(1985),和Draper等,Plant Cell Physiol.23:451(1982)。还有人说明了对原生质体和整个细胞和组织的电穿孔。Donn等,InAbstracts of VIIth International Congress on Plant Cell and Tissue CultureIAPTC,A2-38,p.53(1990);D′Halluin等,Plant Cell 4:1495-1505(1992)和Spencer等,Plant Mol.Biol.24:51-61(1994)。
在将基因构建体引入到植物细胞内之后,使植物细胞生长,并且在分化组织(例如芽和根)出现时,即生成成熟植株。典型地产生多个植株。用于再生植株的方法学是本领域技术人员公知的,并可以在下列文献中找到:Plant Cell and Tissue Culture,1994,Vasil and Thorpe Eds.Kluwer AcademicPublishers and in:Plant Cell Culture Protocols(Methods in Molecular Biology111,1999 Hall Eds Humana Press)。
如本文所使用的,遗传修饰的植物可以包括任何遗传修饰的植物,包括高等植物,特别地,任何可供消费的植物或可用于产生期望的本发明生物活性分子的植物。如本文所使用的,“植物部分”包括植物的任何部分,包括但不仅限于,种子(未成熟的或成熟的)、油、花粉、胚、花、果实、芽(shoots)、叶、根、茎、外植体等。遗传修饰植物具有相对其正常(即野生型或天然)形式被修饰(即突变或改变)了的基因组,从而获得期望的结果(例如PUFAPKS活性和PUFA的产生)。植物遗传修饰可利用经典的株系开发和/或分子遗传技术来实现。产生基因组中纳入了编码所需氨基酸序列的重组核酸分子的转基因植物的方法在本领域是已知的。根据本发明用于遗传修饰的优选植物优选地是适于动物包括人类消耗的植物。
根据本发明用于遗传修饰的优选植物(即植物宿主细胞)包括,但不限于,任何高等植物,包括双子叶和单子叶植物,特别是可消耗植物,包括作物植物,特别是油用植物。这样的植物可以包括,但不限于,例如:油菜(canola)、大豆、芸苔(rapeseed)、亚麻籽(linseed)、玉米、红花、向日葵和烟草。因此,可以选择任何植物物种或植物细胞。本文使用的并且从其生长或衍生出植物的特定细胞包括,但不仅限于,可以从如下植物获得的细胞:油菜(Brassica rapa L.);大豆(Glycine max);芸苔(Brassica spp.);亚麻籽/亚麻(Linum usitatissimum);玉米(玉蜀黍)(Zea mays);红花(Carthamustinctorius);向日葵(Helianthus annuus );烟草(Nicotiana tabacum);拟南芥(Arabidopsis thaliana),巴西坚果(Betholettia excelsa);蓖麻(Riccinuscommunis);椰子(Cocus nucifera);芫荽(Coriandrum sativum);棉花(Gossypium spp.);落花生(Arachis hypogaea);加州希蒙得木(jojoba)(Simmondsia chinensis);芥末(Brassica spp.和Sinapis alba);油棕(Elaeisguineeis);橄榄(Olea eurpaea);水稻(Oryza sativa);南瓜(Cucurbita maxima);大麦(Hordeum vulgare);小麦(Traeticum aestivum);和浮萍(Lemnaceae sp.)。应当注意,依照本文所述,一种植物物种内的遗传背景可以不同。
其它优选的植物包括已知可产生用作药剂、香味剂、营养添加剂、功能食品成分或化妆活性剂的植物,或者被遗传修饰从而产生这些化合物/作用剂的植物。
在一个进一步的实施方案中,可以依照本发明使用植物细胞培养物。在这类实施方案中,不是使植物细胞生长成分化的植物和使用普通的农业实践方法进行培养,而是使其在液体培养基中生长和维持。
根据本发明,遗传修饰的微生物或植物包括用重组技术修饰的微生物或植物。如本文使用的,对于导致基因表达、基因功能或基因产物(即由该基因编码的蛋白)功能的降低的遗传修饰,可以称作基因的失活(inactivation)(完全或部分)、缺失(deletion)、遮断(interruption)、阻断(blockage)或下调(down-regulation)。例如导致基因编码蛋白的功能降低的基因遗传修饰可以是下列因素造成的:基因的完全缺失(即基因不存在,故蛋白质不存在)、基因突变导致蛋白质翻译不完全或者不翻译(例如,蛋白质不表达)、或者基因突变降低或完全破坏蛋白质的自然功能(例如所表达的蛋白质具有降低的或者没有酶活性或作用)。导致基因表达或功能增加的遗传修饰可以称作基因的扩增(amplification)、过生产(overproduction)、过表达(overexpression)、活化(activation)、增强(enhancement)、增加(addition)或上调(up-regulation)。
根据本发明对微生物或植物的遗传修饰,优选可影响微生物或植物所表达的PKS系统的活性,不管该PKS系统是内源性并被遗传修饰,还是内源性并具有引入到生物体中的重组核酸分子(可选择修饰或者不修饰内源系统),还是完全由重组技术提供的。根据本发明,“影响PKS系统的活性”包括任何这样的遗传修饰,与不存在该遗传修饰相比,其导致该生物体表达的PKS系统产生任何可检测的或可测量的变化或修饰。PKS系统的可检测的变化或修饰包括,但不限于:引入PKS系统活性到生物体中,从而使生物体具有可测量/可检测的PKS系统活性(即生物体在所述遗传修饰之前不含有PKS系统),向生物体引入来自与该生物体内源表达的PKS系统不同的PKS系统的功能域,从而使PKS系统活性被修饰(例如,将来自一个PUFAPKS系统的DH2域引入到不同生物体的PUFA PKS系统中);改变PKS系统产生的生物活性分子的量(例如与未经遗传修饰相比,系统产生更多(增加的量)或者更少(降低的量)的给定产物);改变PKS系统产生的生物活性分子的类型(例如系统产生新的或不同的产物,或者产生该系统自然产生的PUFA或其它产物的变体);和/或改变PKS系统产生的多种生物活性分子的比例(例如系统产生的一种PUFA对另一种PUFA的比例不同,产生的脂质谱与未经遗传修饰相比完全不同,或者将各种PUFA置于甘油三酯的相对天然构型的不同位置)。这种遗传修饰包括任何类型的遗传修饰,并且尤其包括通过重组技术和/或通过经典诱变造成的修饰。
应当注意,称“增加PUFA PKS系统中功能域或蛋白质的活性”是指在包含该域或蛋白质(或要引入该域或蛋白质)的生物体中进行的任何导致所述域或蛋白质系统的功能性(functionality)增加的遗传修饰;可以包括:域或蛋白质的活性(例如比活性或体内酶活性)的增加,域或蛋白质系统所受的抑制或降解的减少,和域或蛋白质的过表达。例如,可以增加基因拷贝数,通过使用提供比天然启动子更高的表达水平的启动子来增加表达水平,或者通过可以通过基因工程操作或经典诱变来改变基因,以增加该基因编码的域或蛋白质的活性。
类似地,称“降低PUFA PKS系统中功能域或蛋白质的活性”是指在包含该域或蛋白质(或者要引入该域或蛋白质)的生物体中进行的任何导致域或蛋白质系统的功能性降低的遗传修饰,包括:域或蛋白质的活性的减少,域或蛋白质系统所受的抑制或降解的增加,和域或蛋白质的表达的降低或消除。例如,本发明域或蛋白质作用的降低,可通过阻断或降低该域或蛋白质的产生,“敲除”编码域或蛋白质的基因或其部分,降低域或蛋白质的活性,或者抑制域或蛋白质的活性来实现。域或蛋白质的产生的阻断或降低可以包括将编码该域或蛋白质的基因置于需要在生长培养基中存在诱导化合物的启动子的控制之下。通过建立使培养基中诱导物耗尽的条件,可以关闭编码所述域或蛋白质的基因的表达(从而关闭蛋白质的合成)。域或蛋白质的活性的阻断或降低还可包括使用与美国专利4,743,546(本文援引并入该专利的内容)中描述的方法相似的切除手段。为了使用该手段,将编码感兴趣的蛋白的基因克隆到特定基因序列之间,从而使该基因能够被特异地、可控地从基因组中切除。切除的引发可以通过例如培养物的培养温度的改变(例如在美国专利No.4,743,546中那样)或者通过其它一些物理信号或营养信号来实现。
在本发明的一个实施方案中,遗传修饰包括对内源(天然)表达型PUFAPKS系统的编码核酸序列的修饰,其中通过例如经典诱变和选择技术和/或分子遗传技术,包括基因工程技术,对天然含有这种系统的微生物进行遗传修饰。基因工程技术可包括,例如,使用靶向重组载体来删除内源基因的一部分,或者用异源序列替换内源基因的一部分。可以导入宿主基因组中的异源序列的实例包括:编码来自另一PUFA PKS系统的至少一个功能性域的序列,所述另一个PKS系统包括例如不同的PUFA PKS系统(细菌或非细菌)、I型PKS系统(重复性或模块性)、II型PKS系统或III型PKS系统。其它可导入宿主基因组的异源序列包括编码这样的蛋白或域的序列:该蛋白或域本身不是核心PKS系统的域,但会影响内源PKS系统的活性。例如可以将编码磷酸泛酰巯基乙胺基转移酶的核酸分子导入宿主基因组(下文中讨论)。下文中详细讨论了可对内源PUFA PKS系统进行的特定修饰。
在本发明的这个实施方案的另一个方面中,遗传修饰包括:(1)向同源或异源宿主细胞或生物体中导入编码具有PUFA PKS系统至少一个域的生物活性的氨基酸序列的重组核酸分子;和/或(2)向宿主细胞或生物体中导入编码影响PUFA PKS系统活性的蛋白质或功能域的重组核酸分子。宿主可以包括:(1)不表达任何用于产生PUFA的PKS系统的宿主细胞或生物,其中将PKS系统的所有功能域导入到该宿主细胞中;(2)表达用于产生PUFA的PKS系统(内源的或重组)的宿主细胞,将至少一个额外的PUFA PKS域或蛋白引入到该细胞或生物体中。换言之,本发明意图涵盖任何这样的遗传修饰细胞或生物体(例如微生物或植物),其中该生物体包括至少一个本文所述的PUFA PKS域或蛋白,或者被遗传修饰从而产生如本文所述的再合成和/或嵌合PUFA PKS域或蛋白。
因此,利用本文提供的指导,以及本文描述的和在本发明之前已知的关于PUFA PKS系统的描述,可以通过基因混合(或核酸分子的混合)来扩展表达PUFA PKS系统的生物体的PUFA产物的范围、PUFA产物的比例及其生产水平;其中所述基因混合可以通过例如产生如本文详述的嵌合蛋白和/或嵌合PUFA PKS系统来实现。例如,本文的教导可以用于提高PUFA的产量,改变某一种PUFA对另一种PUFA的比例,包括ω-3对ω-6PUFA的比例,和将PUFA PKS产物的范围扩展到包括EPA、DPA(n-3或n-6)、DHA、ARA、GLA、SDA等,以及产生多种多样的生物活性分子,包括抗生素、其它药物化合物和其它期望的产物。获得这些改进的方法不仅包括混合来自各种生物体的基因,还包括各种遗传修饰本文所述PUFA PKS基因和核酸分子的方法。有关本发明的细菌PUFA PKS系统的遗传基础和域结构的知识为人们设计新型遗传修饰生物体提供了基础。举例而言,下列文献中就遗传修饰和生物活性分子的问题讨论了PUFA PKS系统的各种可能操作方式:美国专利申请公开No.20020194641,美国专利申请公开No.20040235127,和美国专利申请公开No.20050100995,同上。不过,本发明提供了关于操纵宿主生物体的PUFA生产水平和操纵由宿主生物体产生的PUFA比例的新实施方案。
因此,本发明涵盖通过如下手段遗传修饰微生物或植物细胞的方法:遗传修饰生物体内的至少一种核酸分子和/或表达至少一个重组核酸分子,其中所述核酸分子编码具有根据本发明的PUFA PKS系统的至少一个功能域的生物活性的氨基酸序列,所述重组核酸分子包含编码这样的氨基酸序列的核酸序列。这些序列、遗传修饰生物体的方法、和具体修饰的各种实施方案在上文已详细描述。典型地,利用该方法来生产特定的、可产生一种或多种特定生物活性分子的遗传修饰生物体。
在本发明的一个实施方案中,设想可以把诱变程序与选择性筛选程序结合起来以获得目标生物活性分子。这包括搜索多种生物活性化合物的方法。这种搜索不限于具有顺式双键的分子的产生。突变方法可以包括,但不限于:化学诱变、基因改组(shuffling)、切换(switching)编码特定酶域的基因的区域或者限于这些基因特定区域的诱变,以及其它的方法。
例如,可使用高通量诱变方法来影响或优化期望生物活性分子的生产。一旦开发出有效的模型系统,就可以高通量方式修饰这些基因。设想可以在两个水平上利用这些技术。首先,如果能够设计针对目标产物(例如ARA)的生产具有足够的选择性的筛选方法,则可使用其来尝试改变该系统来产生该产物(例如代替或者结合其它策略,例如上面讨论的策略)。此外,如果上面列举的策略得到了一系列确实产生目标PUFA谱的基因,则可使用高通量技术优化该系统。例如,如果引入的域仅在相对较低的温度下起作用,则可设计允许除去该限制的选择方法。
人们知道,有很多种可能被导入固有(内源的、天然的)PUFA PKS系统中的遗传改变,不管是随机的或是定向的,会导致酶功能失活。本发明的一个优选实施方案包括一种系统,用于只选择那些不阻断PUFA PKS系统产生产物的能力的修饰。例如,大肠杆菌的FabB菌株不能合成不饱和脂肪酸,需要在培养基中补充可替代其正常不饱和脂肪酸的脂肪酸方能生长(见Metz等(2001),同上)。然而,当用一种功能性PUFA-PKS系统(即可在大肠杆菌宿主中产生PUFA产物的PUFA-PKS系统——见Metz等.(2001),同上,图2A)转化该菌株时,可以消除这种需要(对培养基进行补充的需要)。此时,被转化的FabB菌株需要功能性PUFA-PKS系统(来产生不饱和脂肪酸)以在没有补充的条件下生长。该示例中的关键要素是多种不饱和脂肪酸的生产要充足(乃至不饱和脂肪酸替代物,例如分枝链脂肪酸)。因此,在本发明的另一个优选实施方案中,人们可以在一个或多个本文所公开的PUFA PKS基因中生成大量突变,然后转化适当修饰的FabB菌株(例如在含ER域的表达构建体中产生突变,并转化FabB菌株,该菌株在不同质粒上具有其它必需的域,或者这些域整合在该菌株的染色体中),并仅选择可在无补充的培养基上生长(即仍然具有产生可补偿FabB缺陷的分子的能力)的转化体。可以开发进一步的筛选方法来在活性PKS系统的这个选择性子集中寻找被产生的特定化合物(例如使用GC寻找脂肪酸)。人们可以设想很多相似的用于目标生物活性分子的选择性筛选方法。
在本发明的一个实施方案中,遗传修饰的生物体具有这样的修饰:与野生型生物体相比,所述修饰可改变由内源PKS系统产生的至少一个产物。用于产生这种修饰生物体的新构建体以及用这种构建体产生的蛋白和生物体,和与此类修饰相关的方法,都包含在本发明之内。
在一个优选实施方案中,遗传修饰的生物体表达这样的PUFA PKS系统,其在对应于裂殖壶菌属或破囊壶菌属DH2域的-羟酰-ACP脱水酶(DH)域中包含遗传修饰,其中与没有该修饰相比,该修饰改变了该PUFA PKS系统所产生的长链脂肪酸的比例,特别是ω-3与ω-6长链脂肪酸的比例。在本实施方案的一个方面中,所述修饰选自:删除域的全部或部分,用来自不同生物体(例如天然地产生其它不同比例和/或量的PUFA的不同生物体)的同源域或其部分替换域的全部或部分,和使域发生突变。
更具体地,如本文例示的,裂殖壶菌属和破囊壶菌属PUFA PKS结构(域组织)与其它PUFA PKS系统结构进行比较,阐明了自然界改变域次序以及加入新的域从而产生新的终产物,或者例如改变终产物比例,的能力。此外,现在可以在实验室内对这些基因进行操纵从而产生新的产物,如实施例中描述的。本发明人已经证明,可以利用这种能力来产生具有新PUFA谱和产量的新生物体。本文描述了以定向或随机方式操纵PUFA PKS系统以影响终产物。例如,在一个优选实施方案中,用第一PUFA PKS系统的DH (FabA样)域或其生物活性部分,具体地说用本文描述的DH2域,来替换不同的第二PUFA PKS系统中的同源DH域或其生物活性部分,来改变由第二PUFA PKS系统产生的PUFA的比例,尤其是操纵由第二PUFA PKS系统产生的ω-3与ω-6脂肪酸的比例。用来自第一PUFA PKS系统的含有这种DH2域的完整蛋白或其任意生物活性部分(例如来自破囊壶菌23B的OrfC)替换第二PUFA PKS系统中的同源蛋白或其部分,可以获得类似的结果。尽管本文描述的实施例采用的是来自裂殖壶菌属和破囊壶菌属的PUFAPKS系统,但是通过修饰DH2蛋白或DH2样域对任何用于产生PUFA的PKS或DH2样系统进行的相似操作都包含在本发明之内。这种修饰可以单独进行或者与其它对PUFA PKS系统的修饰联合使用。
因此,本发明的一个实施方案包括一种嵌合PUFA PKS系统和表达这种嵌合PUFA PKS系统的生物体。在一个方面中,嵌合PUFA PKS系统包括第一PUFA PKS系统,其中该第一PUFA PKS系统的对应于DH2域或其生物活性部分的域或蛋白(例如来自本文所述的裂殖壶菌属或破囊壶菌属的)已被修饰,或者已被替换为来自第二不同PUFA PKS系统的DH2域或蛋白或其生物活性部分。“不同PUFA PKS系统”的意思是,来自不同株、种、属或生物体的PUFA PKS系统,或者甚至是天然或野生型PUFA PKS系统的同源物。产生该嵌合蛋白的目的是改变由该PUFA PKS系统产生的PUFA的比例,特别是ω-3与ω-6PUFA的比例。因此,对所述不同PUFA PKS系统的选择,应当基于对可产生与第一PUFA PKS系统相比不同的,或期望的,PUFA比例的第二系统的选择。
在本发明的一个方面中,这种嵌合PUFA PKS系统包括本文所述的裂殖壶菌属OrfA(SEQ ID NO:2)和OrfB(SEQ ID NO:4)蛋白,和本文所述的破囊壶菌属OrfC(SEQ ID NO:62)蛋白。除了表达这种嵌合PUFA PKS系统的植物和植物部分之外,表达这种嵌合PUFA PKS系统的裂殖壶菌属、大肠杆菌和酵母在实施例中有描述,并且也包含在本发明之内。在实施例中举例说明的其它实施方案中,产生了包含裂殖壶菌属和破囊壶菌属OrfA、B、C之所有组合的嵌合PUFA PKS系统。
在本发明的另一个方面中,嵌合PUFA PKS系统包含如本文所述的裂殖壶菌属OrfA(SEQ ID NO:2)和OrfB(SEQ ID NO:4)蛋白,以及嵌合OrfC蛋白(有本文中用SEQ ID NO:74表示的核酸序列编码,由SEQ ID NO:73编码)。该嵌合OrfC多肽的氨基酸长度为1493个氨基酸残基。DH2区,定义为SEQ ID NO:74的氨基酸516-1041,由破囊壶菌23B OrfC蛋白DH2区的氨基酸序列,即SEQ ID NO:62的氨基酸491-1016组成,其包括SEQ IDNO:66的全部和一些来自SEQ ID NO:62的侧翼氨基酸序列。至于嵌合OrfC氨基酸序列的其余序列,SEQ ID NO:74的残基1-515和1042-1493分别与裂殖壶菌属OrfC残基SEQ ID NO:6的1-515和1051-1502相同。
在本发明的另一个实施方案中,遗传修饰的细胞或生物体已被修饰而表达这样的PUFA PKS系统或其部分,包括嵌合PUFA PKS系统:其中编码该PUFA PKS系统或其部分的核酸序列被完全或部分优化而使用宿主细胞或生物体的优选密码子用法。下文中举例了说明本实施方案,示明了如何通过制造这种修饰而提高生物活性分子(例如PUFA)的产生。本实施方案可以和本文描述的其它遗传修饰(例如嵌合PUFA PKS和蛋白实施方案)一起使用,以改善宿主生物体内生物活性分子的生产。
在本实施方案的一个方面中,嵌合PUFA PKS系统包含如本文所述的裂殖壶菌属OrfA(SEQ ID NO:2)和OrfB(SEQ ID NO:4)蛋白,以及如本文所述的破囊壶菌属OrfC(SEQ ID NO:62)蛋白,其中编码SEQ ID NO:62的核酸序列针对宿主密码子用法是经优化的。实施例中描述了这种为了在裂殖壶菌属中表达而被优化的分子的一个实例,其中编码破囊壶菌属OrfC(合成或密码子优化的OrfC)的核酸序列本文用SEQ ID NO:70表示。在另一个实施方案中,破囊壶菌属OrfA(SEQ ID NO:39)和/或破囊壶菌属OrfB(SEQ IDNO:52)可以和裂殖壶菌属Orf A、B和/或C中的任何一个或多个组合,和/或与破囊壶菌属OrfC组合,用于在裂殖壶菌属中表达。同样,在本实例中,编码破囊壶菌属OrfA和/或破囊壶菌属OrfB的核酸分子可以是针对宿主密码子用法被优化的。这种为了在裂殖壶菌属中表达而被优化的分子的示例在实施例中有描述,其中编码破囊壶菌属OrfA(合成的或密码子优化的OrfA)的核酸序列在本文用SEQ ID NO:71表示,编码破囊壶菌属OrfB(合成的或密码子优化的OrfB)的核酸序列在本文用SEQ ID NO:72表示。
在本实施方案的另一个方面中,嵌合PUFA PKS系统包括本文所述的裂殖壶菌属OrfA(SEQ ID NO:2)和OrfB(SEQ ID NO:4)蛋白,以及嵌合的且经过部分密码子优化的OrfC蛋白(由本文中用SEQ ID NO:75表示的核酸序列编码)。由SEQ ID NO:75编码的蛋白也用SEQ ID NO:74表示,在上文关于SEQ ID NO:73内容中对其有描述。然而,在这种情况下,编码SEQ IDNO:66(DH2域)的核酸的一部分——其来自于破囊壶菌属——被优化用于在裂殖壶菌属中表达,如实施例中所述。
其它用于在大肠杆菌、酵母和植物中使用的经密码子优化的核酸序列在上文和下文的实施例中有描述。
在另一个实施方案中,遗传修饰的生物体已通过用编码可调节由PUFAPKS系统产生的脂肪酸的链长的蛋白的重组核酸分子对生物体进行转染而被修饰。例如,可调节由PUFA PKS系统产生的脂肪酸的链长的蛋白可以是能指导C20单位和/或C22单位的合成的链长因子。
在另一个实施方案中,遗传修饰的生物体表达这样的PUFA PKS系统,其在烯酰-ACP还原酶(ER)域中包括修饰,其中与不存在该修饰相比该修饰导致另一不同的化合物的产生。在本实施方案的一个方面中,修饰选自下组:删除全部或部分的ER域,用来自不同生物体的ER域替换该ER域,和使ER域突变。
在本发明的一个实施方案中,遗传修饰的生物体产生与无遗传修饰的天然生物体不同的多不饱和脂肪酸(PUFA)谱。
根据本公开,可用于产生生物活性分子的许多其它遗传修饰对本领域技术人员而言是显而易见的,并且各种其它的修饰在本文前面已经有讨论。本发明设想任何与本文所述PUFA PKS系统相关的、导致产生期望的生物活性分子的遗传修饰。
如上文所述,在本发明的一个实施方案中,遗传修饰的生物体,例如遗传修饰的微生物或植物,包括具有增强的合成期望生物活性分子(产物)的能力或者具有新引入的合成特定产物(例如合成PUFA,合成不同的PUFA谱,或合成特定抗生素)的能力的生物体。根据本发明,“增强的某产物合成能力”是指与合成该产物相关的途径的任何增强或上调,使得与在相同条件下培养或种植的野生型微生物或植物相比,该微生物或植物产生增加量的产物(包括产生之前没有的产物)。产生这种遗传修饰生物体的方法在上文已经有详细描述。在一个优选实施方案中,本发明涉及遗传修饰的植物或植物部分(例如,其中该植物被遗传修饰从而表达PUFA PKS系统,包括本文所述的嵌合PUFA PKS系统),其包括至少核心PUFA PKS酶复合体,以及,在一个实施方案中,至少一种PUFA PKS辅助蛋白(例如PPT酶),使得该植物可产生PUFA。优选地,该植物是含油种子植物,其中该含油种子或含油种子中的油含有该PUFA PKS系统产生的PUFA。这种油含有作为所述PUFA PKS系统的产物的可检测量的至少一种目标PUFA或主要PUFA。
本发明人已经证实了表达编码来自裂殖壶菌属的PUFA PKS系统和PUFA PKS辅助酶4’-磷酸泛酰巯基乙胺基转移酶(PPT酶)的基因的遗传修饰植物体内的PUFA产生(例如,见美国专利申请公开No.20070089199,如前)。由这些植物产生的油含有显著量的DHA(二十二碳六烯酸(C22:6,n-3))和DPA(二十二碳五烯酸(C22:5,n-6),它们是该PUFA PKS基因所来源的裂殖壶菌属产生的主要PUFA(主要PUFA)。引人注目的是,来自用PUFA PKS途径产生PUFA的植物的油,与通过上述的“标准”途径产生相同PUFA的遗传工程化植物相比,具有不同的脂肪酸谱。特别地,来自通过PUFA PKS途径产生特定PUFA的遗传工程化植物的油基本上没有使用标准PUFA合成途径产生的油中会积累的各种中间产物和副产物。这个特点在下文会详细讨论。
更具体地,通过“标准”途径(上文所述)在植物体内产生长链PUFA的工作使用的是相同的基本手段,这是由该合成途径决定的。这些工作依赖通过导入各种延长酶和去饱和酶来修饰植物的内源脂肪酸。植物通常通过其质体内的II型脂肪酸合酶(FAS)产生18碳脂肪酸(例如油酸、亚油酸、亚麻酸)。很多时候,当脂肪酸连接到ACP上时形成单个双键,然后通过酰基-ACP巯酯酶的作用从ACP切下油酸(18:1)。游离脂肪酸从质体输出,并被转变成酰基-CoA。18:1可以被酯化到卵磷脂(PC)上,并可以添加最多两个额外的顺式双键。新引入的延长酶可以利用酰基CoA池内的底物以每次两个碳的增加量添加碳。新引入的去饱和酶可以利用酯化到PC上的脂肪酸或酰基CoA池内的脂肪酸,这取决于酶的来源。然而,用这种机制产生长链PUFA的一个后果是会积累途径中的中间产物或副产物,而不是目标长链PUFA,这些中间产物或副产物往往占到植物油中的新脂肪酸的大部分。
例如,使用如上所述的标准或经典途径,当目标PUFA产物(即人们追求、尝试、力图利用该标准途径产生的PUFA产物)是例如DHA或EPA(如利用可从FAS系统的产物产生DHA或EPA的延长酶和去饱和酶所产生的)时,除了该DHA或EPA之外,还会产生多种中间产物和副产物,并且这些中间产物或副产物经常占通过该途径产生的产物的大多数,或者至少在生产者生物体的脂质中以显著量存在。这些中间产物和副产物包括但不限于具有比目标或主要PUFA更少的碳和/或更少的双键的脂肪酸,并可包括这样的罕见脂肪酸副产物,其可能具有与目标或主要PUFA相同数目的碳,但在可能罕见位置具有双键。举例而言,在使用标准途径的EPA生产中(例如,见美国专利申请公开2004/0172682),尽管途径的目标PUFA是EPA(即,由于使用了特异作用于FAS系统产物以产生EPA的延长酶和去饱和酶),该系统产生的油包括多种中间产物和副产物,包括:γ-亚麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-γ-亚麻酸(dihomo-gamma-linolenic acid)(DGLA或HGLA;20:3,n-6);花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各种其它的中间产物或副产物,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(mead acid)(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。该系统的中间物还可以包括不是遗传修饰目标的长链PUFA(例如,用于产生DHA的标准途径酶系可以实际上产生比DHA更多的EPA作为中间产物)。
对比地,本发明的PUFA PKS合酶不利用FAS系统的脂肪酸产物。相反,它从与FAS和延长酶所用相同的小前体分子(丙二酸单酰-CoA)产生最终的PUFA产物。因此,合成循环的中间产物不会以任何显著的量被释放,而PUFA产物(本文也称作主要PUFA产物)被高效转移到磷脂(PL)和脂质的三酯酰甘油(TAG)部分。实际上,PUFA PKS系统有可能产生两种目标或主要PUFA产物(例如来自裂殖壶菌属的PUFA PKS系统即产生DHA和DPAn-6二者作为主要产物),但是DPA不是DHA产生途径中的中间产物。在一定程度上,每一种产物都是同一PUFA PKS系统的单独产物。因此,本发明的PUFA PKS基因是一种非常优异的工具,用于在异源宿主,例如植物内产生含PUFA特别是LCPUFA的油,其中所述油基本上没有(如下文定义)会污染由“标准”PUFA途径产生的油的中间产物和副产物。
因此,本发明的一个目的是,通过如本文所述进行植物的遗传操作,来产生多不饱和脂肪酸以及,进一步地,从这些植物获得的(例如从这些植物的含油种子中获得)、包含这些PUFA的油。可以通过本发明产生的PUFA的实例包括但不限于,DHA(二十二碳六烯酸(C22:6,n-3))、ARA(二十碳四烯酸或花生四烯酸(C20:4,n-6))、DPA(二十二碳五烯酸(C22:5,n-6或n-3))、和EPA(二十碳五烯酸(C20:5,n-3))。本发明人利用本发明的可产生PUFA的聚酮合酶系统或其组分开发了遗传修饰植物,藉此本发明为生产有商业价值的、富含一种或多种期望(目标或主要)PUFA的脂质提供了条件。
根据本发明,所称“主要PUFA”、“目标PUFA”、“意图PUFA”或“期望PUFA”,是指特定的一种或多种PUFA,其是使用产生所述PUFA的酶途径的意图或目标产物。例如,当使用延长酶和去饱和酶修饰FAS系统的产物时,可以选择延长酶和去饱和酶的特定组合,它们在一起使用时可产生目标或期望的PUFA(例如DHA或EPA)。如上文讨论的,由于形成的中间产物和副产物可能实际上占到该系统产物量的大部分,由标准途径产生的这些目标或期望PUFA,就PUFA占由该系统产生的总脂肪酸的百分比而言,可能实际上不是“主要”的PUFA。然而,即使在这种情况下,仍然可以使用术语“主要PUFA”来指代该系统使用的延长酶和去饱和酶所产生的目标或意图PUFA产物。
当使用本发明的优选PUFA PKS系统时,来自特定生物体的给定PUFAPKS系统可产生特定的PUFA,从而来自特定生物体的PUFA PKS系统的选择将导致特定的目标或主要PUFA的产生。例如,使用来自裂殖壶菌属的PUFA PKS系统将产生DHA和DPAn-6作为目标或主要PUFA。另一方面,使用来自各种希瓦氏菌种的PUFA PKS系统,将产生EPA作为目标或主要PUFA。需要注意,主要或目标PUFA的比例可以根据特定PUFA PKS系统的选择以及该系统如何响应它的具体表达条件而不同。例如,使用来自破囊壶菌23B(ATCC No.20892)的PUFA PKS系统也将产生DHA和DPAn-6作为目标或主要PUFA;然而,在破囊壶菌23B的情况下,DHA对DPAn-6的比例为大约10:1(范围可以从8:1到40:1),而在裂殖壶菌属中,该比例通常为2.5:1。因此,与裂殖壶菌属相比,即使靶PUFA相同,使用破囊壶菌属PUFA PKS系统或蛋白或域可以改变生物体产生的PUFA的比例。然而,如上文详细描述的,具有来自其它PUFA PKS系统或其它PKS系统(可产生除PUFA之外的生物活性分子的)的蛋白和域的各种蛋白和域的使用可以组合(“混合和匹配”)起来,而产生嵌合蛋白和/或嵌合PUFA PKS系统(如上所述),导致产生不同的PUFA谱,包括不同的PUFA类型、量和/或一种PUFA对另一种PUFA的比例。
当使用本发明的PUFA PKS系统时,生物体(例如植物)产生的油中基本上没有如下所述的中间产物或副产物:它们不是目标或主要PUFA产物,而且它们不是由野生型生物体中内源FAS系统天然产生的(例如,野生型植物通过FAS系统产生一些较短链或中等链长的PUFA,例如18碳PUFA,但是在用PUFA PKS系统进行遗传修饰后的植物内会产生新的或额外的脂肪酸)。换言之,与来自野生型植物(非遗传修饰的)或用作所说的遗传修饰的受体的亲本植物的总脂肪酸谱相比,在用本发明PUFA PKS系统(或其部分)遗传修饰的植物产生的总脂肪酸谱中,大多数的附加(additional)脂肪酸包含PUFA PKS系统的目标或意图PUFA产物(即,在由遗传修饰植物产生的总脂肪酸中,附加脂肪酸的大多数是目标PUFA)。
根据本发明,用于产生PUFA的酶系统的“中间产物”或“副产物”是指任何如下所述的产物,尤其是脂肪酸产物:其是作为酶系统产生目标或主要PUFA的结果由该系统产生的,但不是主要或目标PUFA。在一个实施方案中,中间产物和副产物可以包括如下所述的非目标脂肪酸,它们是由野生型植物或作为所述遗传修饰受体的亲本植物自然产生的,但现在被归类为中间产物或副产物,因为由与野生型植物或作为所述遗传修饰受体的母本植物产生的水平相比,它们由于所述遗传修饰而以更高的水平产生。中间产物和副产物在PUFA合成的标准途径中是特别显著的,而在PUFA PKS途径中则远不那么显著,如上面讨论的。需要注意,一个酶系统的主要或目标PUFA可能是以不同PUFA作为主要或目标产物的另一酶系统的中间产物,对于PUFA产生的标准途径的产物而言尤为如此,因为PUFA PKS系统实质上避免了中间产物的生成。例如,当利用标准途径产生EPA时,脂肪酸,例如GLA,DGLA和SDA,作为中间产物以显著的量产生(例如,美国专利申请公开2004/0172682例证了这一点)。相似地,同样如美国专利申请公开2004/0172682所示,在使用标准途径产生DHA时,除了上述脂肪酸之外,ETA和EPA(注意,它们是上面第一个实例的目标PUFA)以显著的量产生,而且实际上,相对于总脂肪酸产物,它们可能以显著高于目标PUFA本身的量存在。后面一点也可从美国专利申请公开2004/0172682中看出,其中通过标准途径产生DHA的工程化植物所产生的EPA占总脂肪酸的百分比高于目标DHA。
而且,称“基本上没有”用于合成PUFA的系统的中间产物或副产物,或者不存在显著量的中间产物或副产物,意思是指在遗传修饰的植物(和/或植物部分和/或种子油部分)中,作为用于产生PUFA的酶系统的引入或存在的结果而产生的(即,不是由该野生型植物或所述遗传修饰的受体亲本植物产生的)任何中间产物或副产物脂肪酸(非目标PUFA)的存在量少于由该植物产生的总脂肪酸重量的大约10%,更优选地少于大约9%,更优选地少于大约8%,更优选地少于大约7%,更优选地少于大约6%,更优选地少于大约5%,更优选地少于大约4%,更优选地少于大约3%,更优选地少于大约2%,更优选地少于大约1%,更优选地少于由该植物产生的总脂肪酸重量的大约0.5%。
在一个优选实施方案中,称“基本上没有”用于合成PUFA的系统的中间产物或副产物,或者不存在显著量的中间产物或副产物,意思是指在遗传修饰的植物(和/或植物部分和/或种子油部分)中作为用于产生PUFAS的酶系统的结果而产生的(即,不是由该野生型植物或所述为了产生目标PUFA的遗传修饰的受体亲本植物产生的)任何中间产物或副产物脂肪酸的存在量少于由该植物产生的总附加脂肪酸重量的大约10%(附加脂肪酸定义为这样的脂肪酸或脂肪酸的水平,其不是由所述野生型植物或所述为了产生目标PUFA的遗传修饰的受体亲本植物所天然产生的),更优选地少于有该植物产生的总附加脂肪酸的大约9%,更优选地少于大约8%,更优选地少于大约7%,更优选地少于大约6%,更优选地少于大约5%,更优选地少于大约4%,更优选地少于大约3%,更优选地少于大约2%,更优选地少于大约1%。因此,与通过标准途径产生PUFA的遗传修饰植物的脂肪酸谱相反,用PUFA PKS系统进行遗传修饰而产生的脂肪酸产物中的大多数将是目标或意图的脂肪酸产物。
当PUFA PKS系统的目标产物是长链PUFA,例如由本文所述本发明的PUFA PKS系统所产生的DHA或DPA(n-6或n-3)时,在用这种PUFA PKS遗传修饰的植物的总脂质中不以显著量存在的中间产物和副产物可以包括,但不限于:γ-亚麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-γ-亚麻酸(DGLA或HGLA;20:3,n-6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各种其它中间产物或副产物,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。此外,当目标产物是特定PUFA,例如DHA时,在遗传修饰的植物的总脂质中不以显著量存在的中间产物和副产物还包括其它PUFA,包括作为另一不同PUFA PKS系统的天然产物的其它PUFA,例如本实例中的EPA。在一些系统中,PUFAPKS系统可能产生超过一种PUFA,例如C22和C20PUFA,PUFA的这种组合可能代表目标产物,而其它的PUFA可能代表中间产物或副产物。应当注意,如果期望的话,本发明的PUFA PKS系统还可以用于产生可包括GLA、SDA或DGLA的PUFA(a PUFA that can included GLA,SDA or DGLA)作为目标PUFA(参考本文所述的使用PUFA PKS系统的组分来生产油的实施方案)。
本发明人利用本文所述的PUFA PKS系统的遗传学基础和域结构的知识,设计和制造了编码这样的PUFA PKS系统的构建体,并成功制造了表达该PUFA PKS系统的转基因植物。这些转基因植物产生含有PUFA的油,这样的油基本上没有在标准PUFA途径中积累的中间产物(见美国专利中请公开No.20070089199,上文)。本发明人还显示了在大肠杆菌以及在另一种真核生物——酵母中使用该构建体产生PUFA,作为产生该转基因植物之前的构思验证实验(见美国专利申请公开No.20070089199,上文)。这些实例显示,用产生DHA和DPAn-6作为目标PUFA的PUFA PKS系统对酵母和植物进行转化后,这些PUFA均作为植物和酵母中总脂肪酸中的主要附加脂肪酸(即,减去野生型植物中产生的脂肪酸)产生,而且进一步地,任何不存在于野生型植物脂肪酸中的其它脂肪酸都实际上检测不到。本发明遗传修饰的植物及其部分和油的具体特征在本文其它部分有详细描述。
因此,本发明的一个实施方案是一种通过种植或培养本发明的遗传修饰微生物或遗传修饰植物(上文中详述的)来产生期望的生物活性分子(也称作产物或化合物)的方法。这种方法包括分别在生长或发酵培养基中培养或在合适环境下(例如土壤中)种植具有如前文所述且与本发明一致的遗传修饰的微生物或植物。在优选实施方案中,本发明的产生生物活性分子的方法包括在可有效产生该生物活性分子的条件下培养表达如下所述的PKS系统的遗传修饰生物体的步骤,该PKS系统包含至少一种如本文所述的多不饱和脂肪酸(PUFA)聚酮合酶(PKS)系统的生物活性域。
在本发明期望生物活性化合物的生产方法中,在合适的培养基中在有效产生该生物化学化合物的条件下培养或种植遗传修饰的微生物。合适的、或者有效的培养基是指任何这样的培养基,本发明的遗传修饰微生物在其中培养时能够产生期望的产物。这种培养基典型地是水性培养基,包括可同化的碳、氮和磷源。这种培养基还可以包括合适的盐、矿物质、金属和其它营养物。本发明的微生物能够在常规的发酵生物反应器中培养。微生物可以通过任何发酵过程培养,其包括,但不仅限于,分批发酵、补料-分批发酵、细胞回收和连续发酵。根据本发明的用于潜在宿主微生物的优选生长条件在本领域是众所周知的。由遗传修饰微生物产生的期望生物活性分子可以用常规的分离和纯化技术从发酵培养基回收。例如,可以过滤或离心发酵培养基以除去微生物、细胞碎片和其它颗粒物质,产物可以通过常规方法,例如离子交换、色谱、萃取、溶剂萃取、膜分离、电渗析、反向渗透、蒸馏、化学衍生化和结晶等,从无细胞上清液回收。或者,产生期望化合物、提取物或其各种组分的微生物可以即行使用,而不用从产物除去微生物组分。
在本发明用于产生期望的生物活性化合物的方法中,遗传修饰的植物或植物部分(包括植物细胞)在生长培养基中培养或视情况在合适培养基(例如土壤)中培养。合适的或有效的生长基质或培养基已经在上文详细讨论。用于高等植物的合适生长基质包括任何用于植物的生长基质,包括但不限于,土壤、沙子、任何其它支持根生长的颗粒介质(例如蛭石、珍珠岩等)或水培培养基,以及优化高等植物生长的合适的光、水及营养补充。本发明的遗传修饰植物被工程化,从而藉由根据本发明遗传修饰的PUFA PKS系统的活性产生显著量的期望产物。化合物可以通过纯化处理从植物提取化合物加以回收。在优选实施方案中,该化合物通过收获植物加以回收。在特别优选的实施方案中,通过从植物或植物部分(例如从含油种子)收获油来回收PUFA。在本实施方案中,植物可以其自然状态消费,或者被进一步加工成可供消费的产物。
根据本发明,生物活性分子包括任何具有生物活性的分子(化合物、产物等),其能够被包含具有如本文所述的非细菌PUFA PKS系统的至少一个功能域的生物活性的至少一种氨基酸序列的PKS系统产生。这样的生物活性分子可以包括,但不限于:多不饱和脂肪酸(PUFA)、抗炎制剂、化疗剂、活性赋形剂、骨质疏松药物、抗抑郁药、抗惊厥药、抗幽门螺杆菌(Heliobacterpylori)药物、治疗神经变性疾病的药物、治疗退行性肝病的药物、抗生素、和降胆固醇制剂。本发明的非细菌PUFA PKS系统的一个优势是这种系统能够引入顺式构型的碳-碳双键,和每三个碳含有一个双键的分子。可以利用这种能力来产生多种化合物。
关于微生物,优选地,遗传修饰微生物产生的目标生物活性化合物的量大于该微生物干重的大约0.05%,优选地大于大约0.1%,更优选地大于大约0.25%,更优选地大于大约0.5%,更优选地大于大约0.75%,更优选地大于大约1%,更优选地大于大约2.5%,更优选地大于大约5%,更优选地大于大约10%,更优选地大于大约15%,更优选地大于大约20%。对于脂质化合物,优选地,这类化合物的生产量大于该微生物干重的大约5%。对于其它的生物活性化合物,例如抗生素或合成量更小的化合物,其产量可以是本领域技术人员已知的量,并且将具有这类化合物的株系定性为“可预见地含有”(predictably containing)本文所述类型的新PKS系统。
在一些实施方案中,特定生物活性分子(化合物)被微生物分泌,而非积累在细胞中。因此,这种生物活性分子一般地从培养基回收,并且所产生分子的浓度将根据微生物和培养物的规模而变化,可并以用g/L,而非干细胞重量,来加以量度。
优选地,本发明的遗传修饰的生物体(例如微生物或植物)产生一种或多种多不饱和脂肪酸,包括但不限于,EPA(C20:5,n-3),DHA(C22:6,n-3),DPA(C22:5,n-6或n-3),ARA(C20:4,n-6),GLA(C18:3,n-6),ALA(C18:3,n-3),和/或SDA(C18:4,n-3)),更优选地,一种或多种长链脂肪酸(LCPUFA),包括但不限于EPA(C20:5,n-3),DHA(C22:6,n-3),DPA(C22:5,n-6或n-3)或DTA(C22:4,n-6)。在特别优选的实施方案中,本发明的遗传修饰生物体产生一种或多种多不饱和脂肪酸,包括但不限于EPA(C20:5,n-3),DHA(C22:6,n-3)和/或DPA(C22:5,n-6或n-3)。
优选地,本发明遗传修饰的生物体产生至少一种PUFA(目标PUFA),其中生物体(或生物体中积累PUFA的部分,例如成熟种子或来自这些种子的油,如果生物体是含油种子植物的话)中的总脂肪酸谱,包含可检测量的这种或这些PUFA。优选地,所述PUFA是至少20个碳的PUFA,并包括至少3个双键,更优选地至少4个双键,更加优选地至少5个双键。在一个实施方案中,该PUFA是不被该生物体以可检测的或显著的量天然产生的PUFA(例如,没有遗传修饰的野生型生物体,或者用作所述遗传修饰的受体的亲本生物体)。
优选地,生物体(或生物体中积累PUFA的部分)中的总脂肪酸谱包含占总脂肪酸重量至少0.1%的目标PUFA,更优选包含占总脂肪酸重量至少大约0.2%,更优选至少大约0.3%,更优选至少大约0.4%,更优选至少大约0.5%,更优选至少大约1%,更优选至少大约2%,更优选至少大约3%,更优选至少大约4%,更优选至少大约5%,更优选至少大约10%,更优选至少大约20%,更优选至少大约25%,更优选至少大约30%,更优选至少大约35%,更优选至少大约40%,更优选至少大约45%,更优选至少大约50%,更优选至少大约55%,更优选至少大约60%,更优选至少大约65%,更优选至少大约70%,更优选至少大约75%,更优选大于75%的至少一种多不饱和脂肪酸(目标PUFA),或者包含从0.1%至75%,或大于75%(直到100%或大约100%),以0.1%为增量的任何百分比的目标PUFA。如本文中通用的,称PUFA百分比的生产量是占该生物体产生的总脂肪酸的重量,除非另外指出(例如,在一些情况下,重量百分比是相对于由酶复合体,例如PUFA PKS系统,产生的总脂肪酸)。在一个实施方案中,由植物产生的总脂肪酸用作为通过对脂肪酸甲酯(FAME)制备物的气相色谱(GC)分析确定的重量百分比表示。
如上文描述的,上文描述的植物(和/或植物的部分或种子油部分)所产生的总脂肪酸的一个额外特征是,由该植物产生的这些总脂肪酸中,除了由产生目标PUFA的酶复合体所产生的目标PUFA之外的任何脂肪酸的含量以重量计少于(或者不多于)大约10%。优选地,由产生目标PUFA的酶复合体所产生(例如作为用产生目标PUFA的酶或酶复合体遗传修饰植物的结果)的、除目标PUFA之外任何脂肪酸,占由该植物产生的总脂肪酸重量的少于大约9%,更优选地少于大约8%,更优选地少于大约7%,更优选地少于大约6%,更优选地少于大约5%,更优选地少于大约4%,更优选地少于大约3%,更优选地少于大约2%,更优选地少于大约1%。
在另一个实施方案中,由所述产生目标PUFA的酶复合体所产生的、除目标PUFA之外任何脂肪酸,占植物中由所述产生目标PUFA的酶复合体所产生的总脂肪酸重量(即该量度仅限于由所述产生目标PUFA的酶复合体所产生的总脂肪酸)的少于(或含有不多于)大约10%,更优选地少于大约9%,更优选地少于大约8%,更优选地少于大约7%,更优选地少于大约6%,更优选地少于大约5%,更优选地少于大约4%,更优选地少于大约3%,更优选地少于大约2%,更优选地少于总脂肪酸重量的大约1%,更优选地少于植物中由所述产生该目标PUFA的酶复合体所产生的总脂肪酸重量的大约0.5%。
在本发明这个实施方案的另一个方面中,由植物(和/或植物的部分或种子油组分)产生的总脂肪酸中含有少于(或含有不超过)占由该植物产生的总脂肪酸重量的10%的具有18个或更多个碳的PUFA,但目标PUFA或者在野生型植物(没有遗传修饰的)中或用作所述(初始的或顺序的)遗传修饰的受体的亲本植物中存在的PUFA除外。在进一步的方面中,由植物(和/或植物的部分或种子油部分)产生的总脂肪酸中含有少于占由该植物产生的总脂肪酸重量的9%的具有18个或更多个碳的PUFA,或者少于8%的具有18个碳或更多个碳的PUFA,或者少于7%的具有18个碳或更多个碳的PUFA,或者少于6%的具有18个碳或更多个碳的PUFA,或者少于5%的具有18个碳或更多个碳的PUFA,或者少于4%的具有18个碳或更多个碳的PUFA,或者少于3%的具有18个碳或更多个碳的PUFA,或者少于2%的具有18个碳或更多个碳的PUFA,或者少于1%的具有18个碳或更多个碳的PUFA,但目标PUFA或者在野生型植物(没有遗传修饰的)中或用作所述遗传修饰的受体的亲本植物中存在的PUFA除外。
在本发明这个实施方案的另一个方面中,由植物(和/或植物的部分或种子油部分)产生的总脂肪酸中含有少于(或含有不超过)占由该植物产生的总脂肪酸重量的10%的具有20个或更多个碳的PUFA,但目标PUFA或者在野生型植物(没有遗传修饰的)中或用作所述(初始的或顺序的)遗传修饰的受体的亲本植物中存在的PUFA除外。在进一步的方面中,由植物(和/或植物的部分或种子油部分)产生的总脂肪酸含有少于占由该植物产生的总脂肪酸重量的9%的具有20个或更多个碳的PUFA,或者少于8%的具有20个碳或更多个碳的PUFA,或者少于7%的具有20个碳或更多个碳的PUFA,或者少于6%的具有20个碳或更多个碳的PUFA,或者少于5%的具有20个碳或更多个碳的PUFA,或者少于4%的具有20个碳或更多个碳的PUFA,或者少于3%的具有20个碳或更多个碳的PUFA,或者少于2%的具有20个碳或更多个碳的PUFA,或者少于1%的具有20个碳或更多个碳的PUFA,但目标PUFA或在野生型植物(没有遗传修饰的)中或用作所述遗传修饰的受体的亲本植物中存在的PUFA除外。
在一个实施方案中,植物(和/或植物的部分或种子油部分)中的总脂肪酸含有少于占由该植物产生的总脂肪酸重量的10%,更优选地少于大约9%,更优选地少于大约8%,更优选地少于大约7%,更优选地少于大约6%,更优选地少于大约5%,更优选地少于大约4%,更优选地少于大约3%,更优选地少于大约2%,更优选地少于大约1%的选自下列物质的一种或多种脂肪酸:γ-亚麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-γ-亚麻酸(DGLA或HGLA;20:3,n-6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。
在另一个实施方案中,由在植物内产生长链PUFA的酶系统所产生的脂肪酸含有重量少于大约10%的选自下组的脂肪酸,作为由该植物产生的总脂肪酸的百分比:γ-亚麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-γ-亚麻酸(DGLA或HGLA;20:3,n-6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17);更优选包含小于大约9%,更优选小于大约8%,更优选小于大约7%,更优选小于大约6%,更优选小于大约5%,更优选小于大约4%,更优选小于大约3%,更优选小于大约2%,更优选小于大约1%的从下选出的脂肪酸:γ-亚麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-γ-亚麻酸(DGLA或HGLA;20:3,n-6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。
在另一个实施方案中,由在植物内产生长链PUFA的酶系统产生的脂肪酸含有以重量计少于大约10%的下列所有PUFA,作为由该植物产生的总脂肪酸的百分比:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,以及具有22个碳和2个或3个碳-碳双键的PUFA;更优选少于大约9%,更优选少于大约8%,更优选小于大约7%,更优选小于大约6%,更优选小于大约5%,更优选小于大约4%,更优选小于大约3%,更优选小于大约2%,更优选小于大约1%的下列所有PUFA:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,以及具有22个碳和2个或3个碳-碳双键的PUFA。
在另一个实施方案中,由在植物内产生长链PUFA的酶系统产生的脂肪酸含有以重量计少于大约10%的下列每一种PUFA,作为由该植物产生的总脂肪酸的百分比:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,以及具有22个碳和2个或3个碳-碳双键的PUFA;更优选少于大约9%,更优选少于大约8%,更优选小于大约7%,更优选小于大约6%,更优选小于大约5%,更优选小于大约4%,更优选小于大约3%,更优选小于大约2%,更优选小于大约1%的下列每一种PUFA:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,以及具有22个碳和2个或3个碳-碳双键的PUFA。
在另一个实施方案中,由在植物中产生长链PUFA的酶系统产生的脂肪酸含有以重量计少于大约10%的任何一种或多种下列PUFA,作为由该植物产生的总脂肪酸的百分比:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,具有22个碳和2个或3个碳-碳双键的PUFA;更优选少于大约9%,更优选少于大约8%,更优选小于大约7%,更优选小于大约6%,更优选小于大约5%,更优选小于大约4%,更优选小于大约3%,更优选小于大约2%,更优选小于大约1%的下列任何一种或多种PUFA:γ-亚麻酸(GLA;18:3,n-6),具有18个碳和4个碳-碳双键的PUFA,具有20个碳和3个碳-碳双键的PUFA,具有22个碳和2个或3个碳-碳双键的PUFA。
在本实施方案的一个方面中,植物产生至少两种目标PUFA,并且该植物或该植物的积累PUFA的部分(包括来自含油种子的油)中的总脂肪酸谱,包括可检测量的这些PUFA。在一个实施方案中,PUFA优选地每一个均是至少20碳PUFA,包括至少3个双键,更优选至少4个双键,再优选地至少5个双键。这些PUFA最优选地从DHA,DPAn-6和EPA中选择。在一个方面中,植物产生DHA和DPAn-6,并且DHA对DPAn-6的比例为从大约1∶10到大约10∶1或者更大,包括之间的任何比例。在一个实施方案中,DHA对DPAn-6的比例从大约1∶1到大约3∶1,在另一个实施方案中,为大约2.5∶1.在一个实施方案中,植物产生DHA和EPA。
本发明进一步包括由上述植物产生的任何种子,以及任何植物部分,由该植物产生的油或由该植物产生的种子。本发明还包括用本文描述的植物、植物部分、种子或油产生的任何产物。
本发明的一个实施方案涉及一种修饰含有至少一种脂肪酸的终产物的方法,包括向所述终产物添加由重组宿主细胞产生的油,其中所述重组宿主细胞表达至少一种重组核酸分子,所述重组核酸分子包括编码本文所述PUFA PKS系统至少一个生物活性域的核酸序列。
优选地,终产物选自下组:食物、膳食补充剂、药物制剂、人源化动物奶(humanized animal milk)和婴儿配方食品。合适的药物制剂包括,但不限于,抗炎制剂、化疗剂、活性赋形剂(active excipient)、骨质疏松药物、抗抑郁药、抗惊厥药、抗幽门螺杆菌药、用于治疗神经变性疾病的药物、用于治疗退行性肝病的药物、抗生素和降胆固醇制剂。在一个实施方案中,终产物用于治疗选自下组的病症:慢性炎症、急性炎症、胃肠道病症、癌症、恶病质、心脏再狭窄、神经变性疾病、肝退行性病症、血脂紊乱、骨质疏松、骨关节炎、自身免疫性疾病、先兆子痫、早产、老化相关的黄斑病变、肺部疾病和过氧化物酶体异常。
合适的食品包括,但不限于,烤制点心(fine bakery wares)、面包和面包卷(bread and rolls)、早餐麦片(breakfast cereals)、加工的和未加工的奶酪、调味品(番茄酱、蛋黄酱等)、乳制品(奶、酸奶)、布丁和胶质甜品(gelatinedesserts)、碳酸饮料、茶类饮料(teas)、粉末饮料混合物(powdered beveragemixes)、经过加工的鱼制品、基于水果的饮料、口香糖、硬糖果、冷冻乳制品、经过加工的肉制品、坚果和基于坚果的涂抹料(nut-based spreads)、面食、经过加工的禽肉制品、肉汁和酱汁、马铃薯片和其它片(chip)或脆马铃薯片(crisps)、巧克力和其它糖果、汤和制汤料(soup mix)、基于大豆的产品(奶、饮料、奶油、增白剂(whiteners))、基于植物油的涂抹料(vegetable oil-basedspreads)、和基于蔬菜的饮料。
本发明的再一个实施方案涉及产生人源化动物奶的方法。该方法包括用至少一种重组核酸分子对产奶动物的产奶细胞进行遗传修饰的步骤,该重组核酸分子包括编码如本文所述PUFA PKS系统至少一个生物活性域的核酸序列。
遗传修饰宿主细胞以产生遗传修饰的非人产奶动物的方法是本领域已知的。可修饰的宿主动物的实例包括牛、羊、猪、羊、牦牛等,它们适于进行遗传操作和克隆,用于快速扩增转基因表达群体。对于动物,可以通过对基因调节区域的修饰使PKS样转基因在目标细胞器、组织和体液中表达。特别感兴趣的是在宿主动物母乳中产生PUFA。
本申请援引并入本文中引用的每一篇出版物或参考文献的全部内容。
提供下列实施例的目的是为了举例,不意图限制本发明的范围。
实施例
实施例1
下面的实施例描述了用于在裂殖壶菌属中使用的合成裂殖壶菌23BOrfC克隆载体的构建。
将关于来自裂殖壶菌属(例如ATCC 20888或裂殖壶菌属N230D)的四个大基因的密码子用法数据(orfA,orfB,orfC,和FAS;如美国专利申请公开No.20020194641、美国专利申请公开No.20070089199或美国专利申请公开No.20050191679所述)组合在一起。因为裂殖壶菌属ATCC 20888可产生高水平的脂肪酸,预期这些基因是高表达的。除去(给定氨基酸的诸密码子中)代表度(representation)小于3%的密码子,并调节其余密码子的相对使用率。表1显示了裂殖壶菌属密码子用法、经过调节的用法和用于非合成裂殖壶菌23B orfC的密码子用法。使用DNA2.0(Menlo Park,CA)对这些密码子用法数据进行分析,以设计和合成破囊壶菌23B orfC的编码区。在编码区的两端添加核苷酸,以编码限制酶识别位点便于随后的合成基因操作。对少量密码子进行调节(不改变被编码的氨基酸SEQ ID NO:62)以消除或添加某些限制酶识别序列(例如见下文)。最终的合成序列通过DNA2.0在一个质粒载体内开发,并在图2B中显示为“pThOrfC synth”。表1显示了合成编码区的密码子用法。
表1.
                    裂殖壶菌属A,B  经调节的/   破囊壶菌23B   合成的破囊壶
氨基酸    密码子    &C加 FAS        目标用法    orfC          菌23BorfC
                    数目   分数                 数目   分数   数目   分数
Arg        CGG      7      0.013    0           13     0.18    0     0
Arg        CGA      6      0.011    0           13     0.18    0     0
Arg        CGT      94     0.173    0.21        17     0.24    11    0.15
Arg        CGC      436    0.803    0.79        17     0.24    61    0.85
Arg        AGG      0      0.000    0.00        9      0.13    0     0
Arg        AGA      0      0.000    0.00        3      0.04    0     0
Ser        TCG      244    0.327    0.34        19     0.19    32    0.33
Ser        TCA      10     0.013    0.00        16     0.16    0     0
Ser        TCT      64     0.086    0.10        12     0.12    10    0.10
Ser        TCC      230    0.308    0.29        19     0.19    32    0.33
Ser        AGT      19     0.025    0.00        12     0.12    0     0
Ser        AGC      179    0.240    0.27        20     0.20    24    0.24
Leu        CTG      111    0.123    0.13        36     0.28    13    0.10
Leu        CTA      2      0.002    0.00        7      0.05    0     0
Leu        CTT      148    0.164    0.18        33     0.26    33    0.26
Leu        CTC      623    0.690    0.69        27     0.21    82    0.64
Leu        TTG      18     0.020    0.00        21     0.16    0     0
Leu        TTA      1      0.001    0.00        4      0.03    0     0
Gly        GGG      7      0.009    0.00        21     0.18    0     0
Gly        GGA      38     0.047    0.04        33     0.29    5     0.04
Gly        GGT      174    0.216    0.25        17     0.15    35    0.30
Gly        GGC      585    0.728    0.71        44     0.38    75    0.65
Val        GTG      198    0.242    0.29        44     0.38    29    0.25
Val        GTA      4      0.005    0.00        14     0.12    0     0
Val        GTT      103    0.126    0.13        34     0.29    18    0.16
Val        GTC      512    0.627    0.58        24     0.21    69    0.59
Ala        GCG      214    0.159    0.17        21     0.18    20    0.17
Ala        GCA      41     0.031    0.00        36     0.31    0     0
Ala        GCT      236    0.176    0.21        33     0.28    25    0.22
              裂殖壶菌属A,B  经调节的/破囊壶菌23B  合成的破囊壶
氨基酸 密码子 &C加FAs         目标用法orfC          菌23BorfC
              数目   分数             数目  分数    数目  分数
Ala    GCC    853    0.635    0.62    26    0.22    71    0.61
Thr    ACG    156    0.297    0.28    19    0.30    21    0.33
Thr    ACA    13     0.025    0.00    8     0.13    0     0
Thr    ACT    71     0.135    0.22    16    0.25    10    0.16
Thr    ACC    285    0.543    0.50    20    0.32    32    0.51
Pro    CCG    195    0.340    0.32    19    0.24    27    0.35
Pro    CCA    12     0.021    0.00    17    0.22    0     0
Pro    CCT    116    0.202    0.27    29    0.37    19    0.24
Pro    CCC    250    0.436    0.41    13    0.17    32    0.41
Ile    ATA    0      0.000    0.00    2     0.03    0     0
Ile    ATT    136    0.298    0.28    40    0.57    16    0.23
Ile    ATC    320    0.702    0.72    28    0.40    54    0.77
Glu    GAG    683    0.912    0.90    47    0.56    77    0.92
Glu    GAA    66     0.088    0.10    37    0.44    7     0.08
Asp    GAT    143    0.237    0.26    33    0.37    22    0.24
Asp    GAC    460    0.763    0.74    57    0.63    68    0.76
Lys    AAG    551    0.960    0.90    40    0.48    73    0.88
Lys    AAA    23     0.040    0.10    43    0.52    10    0.12
Asn    AAT    22     0.062    0.11    12    0.21    6     0.10
Asn    AAC    331    0.938    0.89    46    0.79    52    0.90
Cys    TGT    7      0.050    0.06    12    0.36    4     0.12
Cys    TGC    134    0.950    0.94    21    0.64    29    0.88
Tyr    TAT    13     0.057    0.39    15    0.34    14    0.32
Tyr    TAC    214    0.943    0.61    29    0.66    30    0.68
Phe    TTT    160    0.451    0.47    44    0.62    28    0.39
Phe    TTC    195    0.549    0.43    27    0.38    43    0.61
Gln    CAG    306    0.924    0.90    26    0.47    50    0.91
Gln    CAA    25     0.076    0.10    29    0.53    5     0.09
His    CAT    29     0.173    0.15    10    0.32    7     0.23
His    CAC    139    0.827    0.85    21    0.68    24    0.77
Met    ATG    291    1.00     1       46    1       46    1
Trp    TGG    104    1.00     1       19    1       19    1
如上所述,本发明人和同事的先前工作(见美国专利申请公开No.20050100995的实施例8)创建了一种质粒,其中(非合成的)破囊壶菌23BorfC编码区被克隆在裂殖壶菌属orfC上游和下游非编码区之间,从而形成与破囊壶菌23B编码区的“完美衔接”(perfect stitch)。该过程中的中间质粒可以用于克隆合成破囊壶菌23B orfC编码区(见图2A和2B)。为了最容易使用其中一个这些中间构建体,本发明人设计并通过DNA2.0合成了一个283bp核苷酸序列,以便产生“完美衔接”连接和利用裂殖壶菌属orfC上游/下游区内的限制位点,并设计到合成破囊壶菌23B orfC基因内,用于随后的克隆反应。这个短DNA序列被指称为“Th23B synth orfC INT”,包含在质粒“pThOrfC stitch INT”中。
283bp“Th23B synth orfC INT”由5个区段组成。第一个区段包括裂殖壶菌属orfC上游(非编码)区的最后102bp,从裂殖壶菌属orfC的SpeI位点起到但不包括ATG密码子止(见SEQ ID NO:77)。第二个区段由合成的破囊壶菌23B orfC编码区(SEQ ID NO:61)的最先9bp构成,并包含与设计的SanDI位点(GGGTCCC)有重叠的起始ATG。这些片段生成上游“完美衔接”连接。第三个区段是一个6bp BamHI限制位点(GGATCC),其发挥间隔序列(spacer)的作用。第四个区段由破囊壶菌23B orfC编码区(SEQ ID NO:61)的最后45bp构成,从设计的ClaI位点起到TAA终止密码子止。第五个区段包括裂殖壶菌属orfC(非编码)下游区的最先121bp(不包括终止密码子),直到“反向”BsmI位点。“Th23B synth orfC INT”片段沿“正向”的最后6个核苷酸是5′>GCATTC>3′。反向互补序列5′>GAATGC>3′是BsmI的识别序列。第四和第五个区段形成下游“完美衔接”连接。
合成破囊壶菌23B orfC编码序列的“完美衔接”版本的构建细节在下文中给出(另见图2A和2B)。
步骤1(图2A)。用SpeI和BsmI限制酶消化从pThOrfC stitch INT移出“Th23B synth orfC INT”片段,并通过琼脂糖凝胶电泳(GeneClean Turbo kit,QBioGene)纯化该片段。类似地,获得来自pREZ22(见美国专利申请公开No.20050100995)的SpeI/BsmI载体片段,其含有分别大约2000bp的裂殖壶菌属orfC上游和下游区,二者被一个BamHI识别位点间隔序列所隔开,克隆在pBlueScriptII SK(+)中。将这两个片段连接并转化到大肠杆菌XL-1Blue(Stratagene,La Jolla,CA)中。通过限制性消化和部分DNA测序了鉴定含有期望质粒“pREZ22orfC INT”的克隆。该质粒含有分别与合成orfC编码区的5’和3’区完美衔接的裂殖壶菌属orfC上游和下游区,但是没有编码区的主体。
步骤2(图2B).通过用SanDI和ClaI限制酶消化并纯化期望DNA片段(见上文)从”pThOrfC synth”获得合成破囊壶菌23B orfC编码区的主体。将该片段连接到以类似方式从pREZ22 orfC INT获得的载体片段内,并克隆到大肠杆菌中(如上文)。所得的质粒“pThOrfC-synPS”含有与裂殖壶菌属orfC基因的上游和下游区完美衔接的全长合成破囊壶菌23B orfC编码区。pThOrfC-synPS的编码区核苷酸序列在本文用SEQ ID NO:70表示。SEQ IDNO:70编码SEQ ID NO:62。pThOrfC-synPS已经保藏于ATCC,保藏号为No.PTA-8229,如本文前面所述。
实施例2
下面的实施例描述了如下构建体的产生,其编码裂殖壶菌属OrfC,该裂殖壶菌属OrfC包含来自破囊壶菌23B的DH2域。
利用基于PCR的重叠延长(“Splicing by Overlap Extension”或“SOEing”(Horton,R.M.,(1993)In Vitro Recombination and Mutagenesis ofDNA.SOEing together tailor-made genes.Methods in molecular Biology第15卷:PCR Protocols:Current Methods and Applications第25章251-266页(B.A.White,Ed.)Humana Press,Totawa,NJ)和限制性克隆相结合,将裂殖壶菌属ATCC20888 OrfC的DH2域(SEQ ID NO:30)在特异的5’和3’交换点(crossover point)用来自破囊壶菌23B ATCC 20892的DH2域(SEQ ID NO:66)替换。
更具体地说,在本实施例中,发明人构建了一种核酸分子,其编码一种杂合(嵌合)型OrfC多肽(本文用SEQ ID NO:74表示的氨基酸序列),长度为1493个氨基酸残基,其中DH2区——定义为该杂合体的氨基酸516-1041——由破囊壶菌23B OrfC蛋白DH2区的氨基酸序列,即SEQ ID NO:62的氨基酸491-1016组成,包括全部的SEQ ID NO:66(本文称作破囊壶菌23B的DH2域)。杂合体OrfC氨基酸序列的其余部分,即SEQ ID NO:74的残基1-515和1042-1493,分别与SEQ ID NO:6的裂殖壶菌属OrfC残基1-515和1051-1502相同。
编码该嵌合蛋白的质粒的构建如图3A-3C所示。
步骤1使用引物prREZ197(SEQ ID NO:78)和prREZ198(SEQ IDNO:79)用未修饰的裂殖壶菌属orfC基因作为模板扩增DH2区上游的裂殖壶菌属orfC阅读框的大约1.5Kb:
prREZ197    CATATGGCGCTCCGTGTCAA
prREZ198    GCCAGGAAGCTTTGA
引物prREZ197在起始ATG密码子处生成一个NdeI位点(下划线标记)。反向引物prREZ198(35聚体)含有5’交换点,其是由与裂殖壶菌属OrfC同源的20bp序列(粗体)和与破囊壶菌23B OrfC同源的15bp序列形成的。PCR条件:50μL反应物,1μL PfuUltra聚合酶(Stratagene)和1X PfuUltra缓冲液,2%DMSO,每种dNTP各0.5μM,prRZ197和prRZ198各0.4μM,10ng模板(克隆的裂殖壶菌属orfC编码区),94℃1min初始变性,20个循环的94℃变性1min,52℃退火1min,72℃延伸90sec,和最后延伸10min。琼脂糖凝胶电泳之后,用Gel Extraction Kit(Qiagen,Valencia,CA)纯化PCR产物。
步骤2使用引物prREZ199(SEQ ID NO:80)和prREZ200(SEQ IDNO:81)以破囊壶菌23B orfC基因作为模板扩增破囊壶菌23B DH2区(大约1.5Kb)。
prREZ199
TCAAAGCTTCCTGGCAACCCTA
prREZ200    AGTATACAGAGGTGCTGACA
引物prREZ199(37聚体)含有5’交换点,其是由与破囊壶菌23B orfC(DH2)序列同源的22bp序列和与裂殖壶菌属orfC序列同源的15bp序列(粗体)生成的。后面的15bp还提供了与prREZ198(因此与步骤1的PCR产物)的重叠。反向引物prREZ200在3’交换点含有一个破囊壶菌23B orfC中的天然BstZ17I位点(下划线标注)。PCR条件和片段纯化与上文相同,只是使用引物prREZ199和prREZ200和以10ng克隆的破囊壶菌23B orfC编码区作为模板。
步骤3.利用重叠延伸来产生裂殖壶菌属orfC编码区5’端和破囊壶菌23B DH2区之间的全长融合。用步骤1(prREZ197x prREZ198)和步骤2(prREZ199x prREZ200)的产物作为模板,prREZ197和prREZ200为外侧(outside)引物进行PCR。PCR条件:50μL反应物,1μL PfuUltra聚合酶(Stratagene)和1X PfuUltra缓冲液,2%DMSO,每种dNTP各0.5μM,prRZ197和prRZ200各0.4μM,步骤1和2的PCR产物各50ng,94℃1min初始变性,20个循环的94℃变性1min,52℃退火1min,72℃延伸3.5min,和最后延伸10min。PCR产物如步骤1所述进行纯化。
步骤4用制造商推荐的条件将步骤3的PCR产物克隆到pCR-BluntII-TOPO(Invitrogen)内,并转化进入TOP 10大肠杆菌(Invitrogen)中,从而产生pREZ171。确认了插入DNA的序列与设计的一致。
步骤5利用各个载体序列中的限制位点,将pREZ171中的克隆DNA作为XbaI/SpeI片段转移到载体pBC KS(+)(Stratagene),从而产生pREZ175。
步骤6将质粒pREZ175用BstZ17I消化(线性化),然后用NdeI部分消化。将代表融合的裂殖壶菌属orfC 5’区和破囊壶菌23B DH2区的一个大约6Kb的片段克隆到pREZ172NdeI/BstZ17I载体片段内,产生pREZ177。质粒pREZ172包含克隆到大肠杆菌表达载体pColADuet-1(Novagen)内的完整裂殖壶菌属orfC编码区,使得起始ATG密码子包含一个NdeI位点。该质粒衍生自pREZ101(见实施例5),并经过定点诱变(Quik Change kit,Stratagene)修饰,在3’交换位点插入了一个氨基酸中性(amino acid-neutral)BstZ17I位点。具体地说,1051位氨基酸的TAC酪氨酸密码子被修改成TAT。
步骤7在通过DNA测序对pREZ177进行分析时,发现BstZ17I位点中的一个单碱基对被删除。具体地说,预期的<GTATAC>变成了<GTAAC>。为了修正这个错误,使用来自pDS26的含有正确BstZ17I交换点的PciI限制片段替换pREZ177中的缺陷PciI片段。质粒pDS26包含一个先前为其它目的而产生的杂合orfC编码区。因此所得的质粒pREZ179含有一个完整orfC编码区,其主要来自裂殖壶菌属,但是DH2区被精确地替换成来自破囊壶菌23B的DH2区(本文用SEQ ID NO:74表示的氨基酸序列)。质粒pREZ179进一步可以作为一种独特的工具用于研究该杂合基因在大肠杆菌中的功能,并为开发用于其它生物体的表达载体提供了起点。
下面的额外步骤(见图3C)描述了将来自pREZ179的杂合基因转移到一个用于在裂殖壶菌属中进行基因替换的载体中。
步骤8从pBR002(orfC基因组区的一个克隆)中以NheI/BspEI片段的形式分离出(未修饰的)裂殖壶菌属orfC编码区加上小部分的上游和下游侧翼序列。然后将该片段克隆到用NheI/BspEI消化的pREZ31(功能上等价于在美国专利申请公开No.20050100995实施例8中描述的pREZ33)的载体部分内。由此所得的质粒,pDS48,包含(未修饰的)裂殖壶菌属orfC编码区加上与用于驱动orfC座位基因交换的相同的上游和下游序列。
步骤9以PstI/PflMI片段的形式从pREZ179分离出杂合orfC阅读框中含有整个经交换的破囊壶菌23B DH2区的部分。将该片段克隆到用PstI/PflMI消化的pDS48的载体部分中,产生pDS49。结果,质粒pDS49将该杂合orfC包含在与pREZ33相同的环境中(全长破囊壶菌23B orfC编码区作为“完美衔接”的基因替换;见专利申请公开No.20050100995实施例8)。pDS49编码区的核苷酸序列在本文用SEQ ID NO:73表示。SEQ ID NO:73编码SEQ ID NO:74。质粒pDS49已经保藏于ATCC,保藏号为PTA-8230,如本文前面详述。
实施例3
下面的实施例描述了一种编码裂殖壶菌属OrfC的构建体的构建,该裂殖壶菌属OrfC包含来自破囊壶菌23B的DH2域,其中该DH2域被重新合成,以针对裂殖壶菌属的密码子用法进行优化。
在本实施例中,发明人构建了一种核酸分子,其编码杂合体OrfC多肽(SEQ ID NO:74),长度为1493个氨基酸残基,其中的DH2区,定义为该杂合体的氨基酸516-1041,由破囊壶菌23B OrfC蛋白DH2区的氨基酸序列,即SEQ ID NO:62的氨基酸491-1016组成,其包括整个SEQ ID NO:66(本文称作破囊壶菌23B的DH2域)。杂合OrfC氨基酸序列的其余部分,SEQ IDNO:74的残基1-515和1042-1493,分别与SEQ ID NO:6的裂殖壶菌属OrfC残基1-515和1051-1502相同。而且,在该构建体中,编码氨基酸516-1041的DNA序列衍生自质粒pThOrfC synth和pThOrfC_synPS中所含的破囊壶菌23B OrfC的“合成基因序列”(见实施例1和SEQ ID NO:70),并且采用了裂殖壶菌属中的基因表达优选的密码子。该构建的细节如图4A-4C所示,并在下文中描述。
通过PCR(Rxn 59/60)从pThOrfC synth扩增编码T23B OrfC多肽DH2域的DNA序列,使用寡核苷酸引物dhd59(5>G CAC CCC ATG AGC AAG CTC CCC GGC AAC>3;SEQ ID NO:82)和dhd60(5>GTAGGCGC AGA CAC GTT GTA AG>3;SEQ ID NO:83)。“正向”或有义链引物dhd59与编码破囊壶菌23B OrfC蛋白氨基酸残基491-501(WHPMSKLPGNP;SEQ ID NO:62的位置491-501)的DNA序列重叠。“反向”或反义链引物dhd60与编码破囊壶菌23B OrfC蛋白氨基酸残基1008-1017(TYNVSAPLYT;SEQ ID NO:62的位置1008-1017)的DNA序列重叠。引物dhd60包含两个与pThOrfC synth序列的错配,其在上面的dhd60序列中用画框残基表示。这些改变产生了一个BstZ17 I限制内切酶位点,在上面的dhd60序列中用双下划线部分表示,以便于随后的克隆步骤,另外在杂合蛋白的编码序列中引入了两个“沉默突变”:CTT(L)变为CTG(L)和TAC(Y)变为TAT(Y)。该扩增在反应体积为40μl的1X PfuUltraTM HF反应缓冲液(Stratagene,LaJolla,CA)中进行,该体系含有dhd59和dhd60各0.5μM,200μM dNTPs,2单位PfuUltraTM高保真DNA聚合酶(Stratagene,LaJolla,CA),和1ng pThOrfC synth DNA。循环参数为:1X[1min 94℃],28X[(1min94℃),(0.5min 60℃),(1.5min 72℃)],1X[8.5min 72℃],和保持于4℃。反应在Perkin ElmerPCR System 2400 thermocycler(AppliedBiosystems,Foster City,CA)中进行。
通过PCR(Rxn 57/58)从pREZ179扩增由pREZ179编码的杂合OrfC蛋白的氨基酸残基331-522的编码DNA序列,使用寡核苷酸引物dhd57(5>CTGC AGC CAG ATG CTC AAG ATG TAC ATG>3;SEQ ID NO:84)和dhd58(5>G GAG CTT GCT CAT GGG GTG CCA GGA CAT CTC>3;SEQ IDNO:85)。“正向”或有义链引物dhd57与由pREZ179编码的杂合OrfC蛋白的氨基酸残基330-339(GCSQMLKMYM;SEQ ID NO:74的位置330-339)的编码DNA序列重叠。“反向”或反义链引物dhd58与杂合OrfC蛋白氨基酸残基513-523(EMSWHPMSKLP;SEQ ID NO:74的位置513-523)的编码DNA序列重叠。正向引物dhd57的5’端与pREZ179所含杂合OrfC编码序列中存在的Pst I位点重叠。该扩增在反应体积为40μl的1X PfuUltraTM HF反应缓冲液(Stratagene,LaJolla,CA)中进行,该体系含有dhd57和dhd58各0.5μM,200μM dNTPs,2单位Pfu UltraTM高保真DNA聚合酶(Stratagene,LaJolla,CA),和1ng pThOrfC synth DNA。循环参数为:1X[1min 94℃],28X[(1min 94℃),(0.5min 60℃),(1.5min 72℃)],1X[8.5min 72℃],和保持于4℃。反应在Perkin ElmerPCR System 2400thermocycler(AppliedBiosystems,Foster City,CA)中进行。
57/58和59/60反应产物各取4微升跑1.2%琼脂糖凝胶。每种情况下都观察到了与预期产物大小一致的DNA条带:57/58产物为578bp,59/60产物为1578bp。将这些条带从凝胶切离,并用Gel Extraction Kit(QIAGEN,Inc.Valencia,CA)根据制造商规程从凝胶片段回收DNA。PCR产物回收在40μl洗脱缓冲液中。
反向引物dhd58的5’20个核苷酸(上文用下划线标注)包括dhd59的5’20个核苷酸(也用下划线标注)的反向互补序列。结果,Rxn 57/58产物3’端与Rxn 59/60产物5’端之间存在一个20bp的相同的重叠,并且该重叠允许随后通过PCR“重叠延伸剪接(Splicing by Overlap Extension)”或“SOE”技术[Horton,R.M.,(1993)In Vitro Recombination and Mutagenesis of DNA.SOEing together tailor-made genes.Methods in molecular Biology Vol.15:PCR Protocols:Current Methods and Applications Chapter 25pp 251-266(B.A.White,Ed.)Humana Press,Totawa,NJ]对这两个产物进行PCR剪接(splicing)。那样,该剪接的片段在其末端(BstZ17I &Pst I)或接近(BsiW I)其末端含有有用的限制位点。
PCR剪接反应(Rxn 57/60)如下进行。反应体积为40μl的1XPfuUltraTM HF反应缓冲液(Stratagene,LaJolla,CA),其含有dhd57和dhd60各0.5μM,200μM dNTPs,2单位PfuUltraTM高保真DNA聚合酶(Stratagene,LaJolla,CA),和50倍稀释的每种凝胶纯化PCR产物57/58和59/60各0.8μl。进行一系列的PCR剪接反应,其中退火温度在66-70℃之间以1℃递增变化。其它的循环参数保持恒定:1X[1min 98℃],33X[(1min 98℃),(1min66-70℃),(2.5min 72℃)],1X[7.5min 72℃],和保持于6℃。反应在Temperature Cycler(Stratagene,LaJolla,CA)上进行。将这些反应产物的等量样品跑1%琼脂糖凝胶,观察到所有的反应物均含有一个与预期产物(2136bp)大小一致的产物,但是在所有的退火温度下也观察到了其它的条带。因此,将在67、68和69℃退火的3个反应产物合并,跑1%琼脂糖凝胶,切割大约2.1kb的目的条带,并用Gel Extraction Kit(QIAGEN,Inc.Valencia,CA)根据制造商规程回收DNA片段。洗脱的DNA收集于30μl洗脱缓冲液中,并用ZeroPCR Cloning Kit(Invitrogen Corp.,Carlsbad,CA)根据制造商的规程克隆到PCR片段克隆载体-Blunt II(Invitrogen Corp.,Carlsbad,CA)中。使用TOPO克隆反应的产物根据制造商规程转化TOP10化学感受态大肠杆菌(Invitrogen)。将8个所得的转化体过夜培养,通过限制酶消化和琼脂糖凝胶电泳制备和分析质粒DNA。8个中的7个被发现含有克隆的2.1kb PCR产物57/60。对一个分离物的克隆PCR57/60产物进行测序,并显示与预期序列完全匹配。DNA测序在康奈尔大学生物技术资源中心(Ithaca,New York)付费进行,使用Applied Biosystems Automated 3730DNA Analyzer,并使用Big Dye Terminator chemistry和AmpliTaq-FS DNA聚合酶(AppliedBiosystems,Foster City,CA)。含有确认插入序列的质粒被指称为pDD21,并用于进一步的构建步骤,如下文所述。
将编码破囊壶菌23B DH2域并针对裂殖壶菌属密码子用法优化过的DNA片段从pDD21切离,并克隆到pREZ179中(见实施例2),使之替换该构建体中存在的天然破囊壶菌23B DH2域编码序列。所得质粒,pDD22,的构建如下。用BsiWI和BstZ 17I(New England BioLabs,Beverly MA)根据制造商规程消化纯化的pDD21DNA。随后用Spin PurificationProcedure andPCR Purification Kit(QIAGEN Inc.,Valencia,CA)根据制造商规程对反应产物进行处理。纯化的消化产物跑1%琼脂糖凝胶,并切离1940bp BsiWI-BstZ17I片段,并用QIAEX II Gel Extraction Kit(QIAGEN Inc.,Valencia,CA)根据制造商规程从琼脂糖洗脱。纯化的pREZ179 DNA同样用BsiWI和BstZ17I消化,并随后用Antarctic磷酸酶(NewEngland BioLabs,Beverly,MA)根据制造商规程进行处理。磷酸酶消化产物也用如上所述的规程处理,并跑0.7%琼脂糖凝胶。从凝胶切离~6.1Kb BsiWI-BstZ17I载体片段,用QIAEX II Gel Extraction Kit如上所述地从琼脂糖洗脱。在1X T4连接酶反应缓冲液中用T4连接酶连接这两个片段,缓冲液和酶均来自New England BioLabs(Beverly,MA)。连接产物用于根据制造商规程转化OneTOP10化学感受态大肠杆菌(Invitrogen)。通过限制内切酶消化和琼脂糖凝胶电泳对来自三个所得转化体的质粒DNA进行分析,发现三个转化体均具有预期重组体的结构。将一个质粒命名为pDD22,并用于进一步的构建。
为了便于将编码杂合OrfC(其含有用裂殖壶菌属优选密码子编码的破囊壶菌23B DH2区)的DNA引入到裂殖壶菌属基因组中,从pDD22切离一个跨越DH2区编码序列的PstI-PflMI DNA区段,并把它克隆到被设计用于在裂殖壶菌属orfC基因座位的序列处进行基因替换的载体pDS48中(见实施例2)。所得的质粒pDD24用于随后的基因替换,其构建方法如下。从pDD22切离编码T23B DH2域并具有优化密码子用法的DNA片段,并把它克隆到pDS48中,使之代替该构建体中存在的天然裂殖壶菌属DH2域编码序列。根据制造商规程用PstI,PflMI和ClaI(New England BioLabs,Beverly MA)消化纯化的pDD22DNA。用ClaI消化切开一个PflMI-PflMI片段,该片段本身可迁移到接近目的PflMI-PflMI~3.2Kb片段的位置附近。随后利用Spin Purification Procedure和PCR Purification Kit(QIAGEN Inc.,Valencia,CA)根据制造商规程对反应物进行处理。纯化的消化产物跑0.7%琼脂糖凝胶,并切离感兴趣的~3.2Kb的PstI-PflMI片段,用QIAEX II Gel Extraction Kit(QIAGEN Inc.,Valencia,CA)根据制造商规程从琼脂糖中洗脱出来。纯化的pDS48DNA类似地用PflMI和PstI消化,进行如上所述的处理,并跑0.7%琼脂糖凝胶。从凝胶切离~8.0KbPstI-PflMI载体片段,并用QIAEX II Gel Extraction Kit如上所述地从琼脂糖洗脱出来。将这两个片段在1X T4连接酶缓冲液中用T41连接酶连接起来,两种试剂均来自New England BioLabs(Beverly,MA)。根据制造商规程,用连接产物转化OneTOP10化学感受态大肠杆菌(Invitrogen)。所得的转化体在含有100μg/ml氨苄青霉素的液体培养基中30℃过夜生长。这些转化体在37℃液体培养基中的增殖导致质粒在一些环境下不稳定。通过限制内切酶消化和琼脂糖凝胶电泳对来自其中三个所得转化体的质粒DNA进行分析,发现全部三个均具有预期重组体的结构。将一个质粒命名为pDD24并进行进一步的内切酶分析,在裂殖壶菌属中的基因替换实验中使用了该质粒(见实施例4)。pDD24编码区的核苷酸序列在本文用SEQ ID NO:75表示。SEQ ID NO:75编码SEQ ID NO:74。质粒pDD24已经保藏于ATCC,保藏号为No.PTA-8226,如本文前面所述。
实施例4
下面的实施例描述了上面在实施例1-3中描述的各种破囊壶菌23B orfC构建体在裂殖壶菌属中的表达,和对由这些生物体产生的PUFA进行的分析。
变异体破囊壶菌23B orfC基因在裂殖壶菌属中的表达
使用前人所描述的技术(见美国专利申请公开No.2003/0166207),通过离子轰击用质粒pThOrfC-synPS(全长合成的破囊壶菌23B orfC;见实施例1),pDS49(非合成破囊壶菌23B DH2区;见实施例2),和pDD24(合成的破囊壶菌23B DH2区;见实施例3)转化裂殖壶菌属菌株B32-Z1(见上文及美国专利申请公开No.20050100995的实施例8),其是在裂殖壶菌属orfC编码区具有一个精确缺失的裂殖壶菌属。获得了自养型ZeocinTM-敏感转化体。通过所选菌株的Southern印迹和/或PCR确认,这种转化体是通过双交换基因替换事件产生的。
简而言之,离子轰击使用BioRad(Hercules,CA)PDS-1000/He粒子输送系统。用于转化的裂殖壶菌属菌株在回转平台(200rpm)上于M2B培养基(视情况加DHA)中29-30℃生长至OD600=1-2.5(BioPhotometer,Eppendorf)。通过离心(3000rpm,5min)收集细胞,并重新悬浮于无菌7.5g/LNa2SO4中,使OD600=30。将150μL体积的悬浮细胞在含有M2B琼脂糖(无DHA)的Petri平皿上铺散成圆形片(直径6cm)。为了PUFA营养缺陷型的生长,利用溶于40%(w/v)随机甲基化β-环糊精(CTD Inc,High Springs,FL.)的25mM DHA储液向M2B补充DHA至0.25mM。当为了补足DHA营养缺陷型进行轰击时,琼脂糖培养基中不加DHA。轰击在层流洁净室中执行,使用1100psi爆破圆盘(rupture discs),圆盘固定帽(disc retaining cap)与大载体盖(macrocarrier cover lid)之间缝隙为0.25in,停止屏支座处于中间位置。目标架(target shelf)置于L2(6cm)位置。将含有经轰击的DHA营养缺陷型裂殖壶菌属菌株的Petri平皿温育在29-30℃,直到(预期自养型)菌落出现(3-5天)。随机选择的菌落在M2B琼脂平板上划线。生长后,将数个分离良好的克隆转移到含有或不含(50μg/mL)的M2B平板上。选择Zeocin敏感性DHA自养型(提示有基因替换事件)用于进一步的研究。
用于脂肪酸分析的裂殖壶菌属的培养
在含有50mL M50-20培养基的锥形瓶(250mL)中接种一个指定菌株冷冻小瓶中的内容物(1mL)。锥形瓶在旋转摇床上在29-30℃下以200rpm温育72小时。在含有SSFM培养基的相似锥形瓶中接种0.5mL M50-20培养物,并如上所述地温育5天。用等体积的70%异丙醇稀释培养液之后,通过离心(4000g,5min)收集细胞。将所得的细胞离心沉淀悬浮在原体积的35%异丙醇水溶液中,并再次离心。将清洗过的细胞离心沉淀直接冷冻在-70℃,随后冻干。用酸性甲醇制备脂肪酸甲酯(FAME),将它们萃取到己烷中,再通过气-液色谱进行分析,来确定干燥后生物质的脂肪酸含量。
M50-20培养基
每升M50-20培养基的组分如下:12.5g NaCl、2.5g MgSO4·7H2O、0.5gKCl、0.05g CaCl2、20.0g葡萄糖、20.0g Na-谷氨酸、0.4g KH2PO4、1.0g酵母提取物、0.4g NaHCO3、5ml PII痕量金属(200X PII痕量金属溶液含有(每升):6.0g Na2EDTA、0.29g FeCl3·6H2O、6.84g H3BO3、0.86g MnCl2·4H2O、60mg ZnCl2、26mg CoCl2·6H2O、52mg NiSO4·6H2O、2mg CuSO4·5H2O、和5mg NaMoO4·2H2O、pH8.0)、1ml PII维生素混合物(1000X PII微生物混合物含有(每升):100mg硫胺素、0.5mg生物素、和0.5mg维生素B12),pH7.0。
SSFM培养基
每升SSFM培养基的组分如下:13.62g Na2SO4、0.72g K2SO4、0.56g KCl、2.27g MgSO4·7H2O、0.19g CaCl2、0.0565g KH2PO4、0.57g(NH4)2SO4、0.13gNa-谷氨酸、100mM MES(4-吗啉乙磺酸)pH6.0、50.0g葡萄糖、0.16mg维生素B12、9.75mg硫胺素、3.33mg泛酸钙、10.3mg FeSO4·7H2O、3.1mgMnCl2·4H2O、1.93mg  ZnSO4·7H2O、0.04mg  CoCl2·6H2O、0.04mgNaMoO4·2H2O、2.07mg CuSO4·5H2O、2.07mg NiSO4·6H2O、2.0mg柠檬酸。
M2B培养基
每升M2B培养基的组分如下:葡萄糖10g、(NH4)2SO40.8g、Na2SO45.0g、MgSO4·7H2O 2.0g、KH2PO40.5g、KCl 0.5g、CaCl2·2H2O 0.1g、维生素B120.05mg、硫胺素·HCl、0.2mg、泛酸钙0.2mg、FeSO4·7H2O 3.0mg、MnCl2·4H2O1.0mg、ZnSO4·7H2O 0.8mg、CoCl2·6H2O 0.02mg、Na2MoO4·2H2O 0.01mg、CuSO4·5H2O 0.6mg、NiSO4·6H2O 0.8mg、MES缓冲液0.1M、pH6.0(用NaOH调节)。
重组裂殖壶菌属菌株的PUFA分析
表2显示了裂殖壶菌属ATCC 20888和衍生菌株的总脂肪酸、DHA和DPAn-6含量(表示为FAME(脂肪酸甲酯)),在上述衍生菌株中,天然的orfC编码区被破囊壶菌23B的orfC编码区的全部或其一部分替换(在实施例1-3中描述)。整个裂殖壶菌属ATCC 20888orfC编码区被来自破囊壶菌23B(菌株B34-1)的orfC编码区替换导致DHA/PAn-6比例升高(接近破囊壶菌23B的比例),但总PUFA含量降低。密码子优化(合成)的破囊壶菌23B orfC编码区的使用(例如在pThOrfC_syn-PS转化的菌株B67-5中)——其中PUFA产生相对于野生型水平增加,但仍然保持提高的DHA/DPAn-6比例——证明了蛋白表达可能是总PUFA含量较低的原因。当仅将裂殖壶菌属DH2区替换为破囊壶菌属的DH2域时,表现出类似的情况。具有密码子优化的破囊壶菌23B DH2区的菌株(B69-2;用pDD24转化)可产生比具有非优化DH2区的菌株(B105-1A1;用pDS49转化)更高的PUFA。然而,菌株B105-1A1(非优化DH2区)中的DHA/DPA比例显著较高。
有趣的是,菌株B69-6可产生高水平的DHA和相对高的DHA/DPA比例。该菌株与菌株B69-2同样是用质粒pDD24转化菌株B32-Z1而获得的。但是,菌株B69-6不具有修饰orfC编码区的正确整合/基因替换(如PCR分析确定的),尽管该差异的确切性质尚不知晓。
给定这些数据,可以使用菌株B69-2开发工业生产规模的发酵,以实现最大的DHA产量;或者,如果追求最大的DHA/DPA比例,可以使用菌株B69-6或B105-1A1。
表2.orfC变异体概览
Dcw       干细胞重量
FAME      脂肪酸甲酯
Th.23B    破囊壶菌23B;ATCC20892
实施例5
下面的实施例描述了利用多质粒系统在大肠杆菌中产生DHA和DPA,并进一步示例说明了PUFA PKS系统的DH2域可控制由系统产生的脂肪酸的比例。
发明人在先前已经演示了通过使用T7诱导型系统表达来自裂殖壶菌属的OrfA、OrfB*、OrfC和来自念珠蓝细菌的HetI在大肠杆菌中产生DHA和DPA(美国专利申请公开No.20050100995实施例3第41页)。在这个先前的实例中,OrfA,OrfB*和OrfC包含在一个单一的质粒上。为了产生更容易进行遗传操作的系统,将各个来自裂殖壶菌属的编码区克隆在一系列相容表达质粒上,这些质粒被设计用于共表达多个靶基因。这些靶基因的表达同样也是被这些Duet系列质粒(Novagen)上的诱导型T7启动子驱动的。将裂殖壶菌属orfA以NdeI-XbaI片段的形式从pBR115L1克隆到表达载体pETDuet-1中,生成pREZ91(美国专利申请公开No.20050100995中实施例3第41页的最终表达质粒的生成中提及了pBR115L1)。将裂殖壶菌属orfB*以NdeI-XbaI片段的形式从pJK780克隆到表达载体pCDFDuet-1中,生成pREZ96(美国专利申请公开No.20050100995中实施例3第41页的最终表达质粒的生成中提及了pJK780)。将裂殖壶菌属orfC以NdeI-XbaI片段的形式从pJK510克隆到表达载体pColADuet-1中,生成pREZ101(pJK510参考美国专利申请公开No.20050100995中实施例3第41页的最终表达质粒的产生)。必需的辅助基因hetI,其编码磷酸泛酰巯基乙胺基转移酶(PPT酶),由基于pACYC184的质粒pJK737来提供,如先前所述(美国专利申请公开No.20050100995中实施例3第41页)。将分别包含在质粒pREZ91、pREZ96、pREZ 101和pJK737中的OrfA、OrfB*、OrfC和hetI转化到大肠杆菌菌株BLR(DE3)(Novagen)中,后者含有诱导型T7RNA聚合酶。
使用这些多质粒菌株在Luria Broth (LB)中25℃和30℃下培养大肠杆菌细胞,检测大肠杆菌细胞中的DHA和DPA的产生(见下面的表3)。将单个菌落接种在含有抗生素的LB培养液中,以使得每种质粒保持在给定菌株内,在期望温度(25℃或30℃)下过夜培养。然后,将300μL体积的这样的培养物接种在含有合适抗生素的30mL LB主培养物中。主培养物在指定温度下培养,直到OD600(BioPhotometer,Eppendorf)到0.45-0.55,此时用终浓度为1mM的IPTG对培养物进行诱导。然后,将培养物在这些表达条件下保持24小时,之后通过离心收集和制备细胞用于FAME分析。对于携带裂殖壶菌属orfC的菌株,在30℃产生的PUFA的典型水平(以总FAME的百分比计)为10%DHA和6%DPA(16%总PUFA)。DHA/DPA的比例为1.7,其接近在裂殖壶菌属中所见(见下面的表2)。
大肠杆菌中产生DHA和DPA所必需的裂殖壶菌属基因在不同质粒上的表达,使本发明人能够更容易地研究和操作PUFA生物合成基因。如美国专利申请公开No.2005/0100995实施例8所述,已经证明,在裂殖壶菌属中,将orfC替换为来自破囊壶菌23B的同源基因可改变PUFA谱,使DHA对DPA的比例发生偏移。用上述的大肠杆菌多质粒表达系统进行了类似的实验,其中裂殖壶菌属orfC表达质粒(pREZ101)被替换为相似的破囊壶菌23B orfC表达质粒(pREZ142)。
为了生成pREZ142,将来自pREZ31的破囊壶菌23B orfC编码区以NcoI/SalI片段的形式克隆到Duet载体pColADuet-1中。质粒pREZ31是pREZ33的一种变异体,后者是“完美衔接”的基因替换载体(如在上文实施例1和美国专利申请公开No.2005/0100995的实施例8中所描述的),其中在起始密码子ATG(下文中的小写字母)的紧邻上游处工程化设置一个BamHI限制位点(下文中的下划线)。该工程化恰好在pREZ31中产生了一个包含起始ATG在内的NcoI限制位点(下文中的斜体),其包括所述BamHI位点的最后2个碱基和破囊壶菌23B orfC编码区的最初4个碱基:
GGATCCatgG(SEO ID NO:86)
在该克隆中使用的SalI限制位点是裂殖壶菌属orfC下游区固有的,位于TAA终止密码子下游大约250bp。这种在大肠杆菌表达系统中用破囊壶菌23B orfC代替裂殖壶菌属orfC的替换,导致菌株在25℃生长并诱导时的PUFA谱发生改变,DHA与DPA比例从1.5变为6.8,DHA+DPA的总量从10%降至4%。
产生杂合orfC编码区,以确定用于控制DHA与DPA比例的基因的区或域。表达质粒pREZ179中的杂合orfC含有来自破囊壶菌23B orfC的中央DH2区,两侧是裂殖壶菌属orfC序列的上游和下游(见实施例2)。当在上述系统中表达pREZ179替代pREZ101时,当在25℃表达和诱导时,可见DHA与DPA的比例为6.5,而总PUFA量为9%(见下表)。这种在大肠杆菌模型表达中的DHA与DPA比例的迁移和生产的保持,表明orfC的中央DH2区控制PUFA生物合成中大部分或全部的DHA与DPA的比例。当随后用额外的侧翼DNA对该构建体进行修饰,并转化进裂殖壶菌属中替换天然orfC时,可见到DHA与DPA比例的相似迁移,并且没有生产下降(见实施例4)。类似地,在酵母系统中表达杂合orfC,可再次见到DHA与DPA比例的迁移(见实施例6)。
表3
多表达质粒系统的使用
上面的实施例使用大肠杆菌和酵母多质粒表达模型系统阐释了orfC尤其是DH2区在控制PUFA生物合成中DHA与DPA比例中的作用,显示了这些异源系统的功用。在orfC来源对DHA/DPA比的相对影响这一点上,大肠杆菌和酵母中所见的结果与裂殖壶菌属中所见的结果相似(parallel)。按照相似的方式,本文描述了大肠杆菌和酵母中的多质粒表达模型系统,用于研究和工程化PUFA生物合成的其它方面,包括PUFA链长、脂肪酸饱和度和双键位置。这些系统还有助于容易地表达参与其它类型脂肪酸修饰,例如羟基化和糖基化,的基因。按照相似的方式,可以把来自单个生物体(例如美国专利申请公开No.2005/0100995实施例2中描述的针对Shewanellajaponica基因簇进行的克隆)或两个以上生物体的其它PUFA生物合成基因克隆到该大肠杆菌系统中,以便于研究。
实施例6
下面的实施例描述了在酵母中表达裂殖壶菌属PUFA合酶亚基A、B和C和念珠蓝细菌(Nostoc)hetI的方法,并进一步例证了PUFA PKS系统的DH2域可控制该系统的脂肪酸生产的比例。
部分A
先期表达实验表明可以使用天然编码区在酵母中以全长蛋白的形式产生裂殖壶菌属OrfC和Het I。相反,裂殖壶菌属OrfsA和B的天然编码区的表达没有产生可检测量的预期蛋白。这个问题似乎与mRNA的翻译有关(Northern印迹显示存在正确大小的mRNA)。因此,为了提高这两个编码区在酵母中的表达,制造了这两个编码区的合成版本。由这些合成基因编码的蛋白的氨基酸序列与由天然基因编码的蛋白的氨基酸序列相同(即,SEQID NO:2和SEQ ID NO:4)。orfA和orfB的最初基因设计和完全基因合成由Blue Heron Biotechnology,Inc.(Bothell,WA)进行。密码子优化考虑了酿酒酵母(S.cerevisiae)的密码子偏好。合成编码区的完整序列(指称为sOrfA和sOrfB)如SEQ ID NO:35(sOrfA)和SEQ ID NO:36(sOrfB)所示。每个合成编码区附加如下的DNA,以便于在酵母转化载体中进行克隆:
上游序列(SEQ ID NO:87)
GTGCAGTCAAGTGCGCAAAACCATG
下游序列(SEQ ID NO:88)
TAACCCGGG
起始和终止密码子位置用下划线标注,HindIII(上游)和XbaI(下游)限制酶的限制位点用粗体显示。
使用酿酒酵母菌株InvSC1(MATa his3-Δ1,leu2,trp1-289,ura3-52)(Invitrogen,Carlsbad,CA)进行这些实验。该菌株的保存和转化按照供应商的推荐。根据制造商(Invitrogen)的使用说明,用葡萄糖固体培养基、棉籽糖培养液和半乳糖诱导培养基培养转化体。所有的酵母培养基组分均从Q-BIOgene(Carlsbad,CA)购得。
将裂殖壶菌属PUFA合酶基因和hetI克隆到如下的转化载体中:pYES-Leu*(sOrfA;SEQ ID NO:35),pYES3-Tryp(sOrfB;SEQ ID NO:36),pYES2/CT(OrfC;SEQ ID NO:5)和pYES-His*(hetI;SEQ ID NO:33)。这些载体的产生在下文有详细描述。对一些载体和基因进行修饰以满足特定的克隆和表达需要(在下文详述)。根据具体的实验使用合适的选择培养基。在所有情况下,将这些基因克隆在GAL1启动子的后面,并根据Invitrogen提供的指导,通过将经过清洗的细胞重新悬浮在含有半乳糖的培养基中来诱导表达。30℃培养细胞,并在转移到诱导培养基上指定时间后(通过离心)收集。将细胞离心沉淀冻干,用酸性甲醇制备FAME,萃取到己烷中,并通过GC进行分析。
sOrfA表达构建体:将sOrfA克隆到定制的载体pYES-Leu/CT中,该载体构建如下。对pYES6/CT载体(Invitrogen)进行修饰,用含有leu2基因(用于利用缺少亮氨酸的培养基进行筛选)的DNA片段替换其含有杀稻瘟素耐受基因的DNA区域。用BglII和NheI消化pYES6/CT并凝胶纯化最终的~4913bp载体片段,从而除去杀稻瘟素基因。leu2基因从酵母载体pRS425(ATCC 77106,GenBank#U03452)获得。在PCR反应中使用引物PO-Leu5′(SEQ ID NO:89)和PO-Leu3′(SEQ ID NO:90),并使用pRS425作为模板,生成一个含有leu2基因的~1812bp DNA片段(pRS425的bp 664-2475)。
PO-Leu5′GACTGCTAGCTTAAGCAAGGATTTTCTTAAC
PO-Leu3′GACTGGATCCTCCTGATGCGGTATTTTCTCC
在引物中引入限制酶识别位点,以便于克隆(5′NheI and 3′BamHI加了下划线标记)。用BamHI和NheI消化PCR片段,并连接到从pYES6/CTBglII/NheI消化物获得的4913bp载体片段上,形成pYES6-Leu。用HindIII和XbaI消化该载体,以备插入sOrfA。来自Blue Heron的、含有sOrfA和合适侧翼DNA的质粒用HindIII和XbaI消化。将具有完整sOrfA的8.8kb片段用凝胶纯化,并连接到已制备好的pYES6-Leu载体上,形成pBR882(pYES6-Leu:sOrfA)。
sORfB表达构建体:本发明人希望将sOrfB克隆到具有色氨酸选择标记的pYES3酵母表达载体中。因为pYES3载体还含有一个XbaI限制位点(该第二个位点在trp1基因内),所以该限制酶不能方便地用于引入sOrf B DNA片段。对sOrfB下游含有XbaI位点的区域进行如下修饰,以引入一个唯一的NotI位点(在pYES3中其也可作为基因插入克隆位点使用)。含有来自BlueHeron的sOrfB片段的质粒用HindIII和XbaI消化,将所得的6.2kb的感兴趣片段用凝胶纯化。将该片段连接到已经用相同的酶切割过的pYES2/CT(Invitrogen)中,产生质粒pBR879。通过在唯一的XbaI位点进行切割打开该质粒。使用自身互补的寡核苷酸接头5’-CTAGGCGGCCGC-3’(SEQ IDNO:91)产生一个唯一的NotI位点(下划线标注的;它还消除了XbaI位点)。这产生了质粒pJK894。将该构建体用HindIII和NotI消化,并将所得的6.2kb感兴趣片段用凝胶纯化。将该片段连接进入已经用相同的酶切割过的pYES3/CT(Invitrogen)中,形成pJK908(pYES3:sOrfB)。
OrfC表达构建体:天然orfC先前已经被克隆在一个细菌表达载体中,把该细菌表达载体作为酵母表达用基因的来源。该细菌载体是pBluescript IIKS(Stratagene);编码区连同侧翼DNA被克隆到了该载体的EcoRI(5′)和XbaI (3′)位点中。该插入DNA包括一个作为ATG起始密码子的一部分的NdeI限制位点;TAA终止密码子恰好在XbaI位点之前。在EcoRI位点和NdeI位点之间含有起始密码子的区域中包含有一个细菌核糖体结合位点序列。在克隆到酵母载体之前,将核糖体结合位点DNA除去,并用适于在酵母系统中表达的DNA代替。用EcoRI和NdeI消化含有orfC的pBluescript质粒,并将它与寡核苷酸接头FL5′(AATTCAA)和FL3′(TATTG)连接。所得的质粒(称为pKCFL)用HindIII(恰好在pBluescript KS多接头(polylinker)中EcoRI位点的上游)和XbaI消化,以释放一个~4526bp片段。将该片段连接到HindIII/XbaI-消化的pYES2/CT,以产生:pYES2/ORFCwt(pYES2:OrfC)。
HetI构建体:将来自念珠蓝细菌的编码PPT酶的hetI基因克隆到定制的载体pYES6-His/CT中。pYES6-His/CT的构建如下。对pYES6/CT载体(Invitrogen)进行修饰,用含有his3基因(用于用缺少组氨酸的培养基进行筛选)的DNA片段替换其含有杀稻瘟素耐受基因的DNA区域。用BglII和NheI消化pYES6/CT并凝胶纯化最终的~4913bp载体片段,从而除去杀稻瘟素基因。用引物PO-His5′(SEQ ID NO:92)和PO-His3(SEQ ID NO:93)从酵母载体pRS423(ATCC 77104,GenBank#U03454)扩增his3基因。
PO-His5′GACTACTAGTCTAAGAAACCATTATTATCAT
PO-His3′GACTGGATCCAGCTTTAAATAATCGGTGTCA
这产生了pRS423质粒的一个含有his3基因的~1251bp的区域。引物中含有限制酶识别位点以便于克隆(5′SpeI,和3′BamHI,下划线标注)。用SpeI和BamHI消化PCR片段,连接到从pYES6/CT获得的~4913bp载体片段上,形成pYES6-His。将这个载体用BamHI和XbaI消化,准备插入hetI基因。
hetI基因先前已经被克隆,并与裂殖壶菌属PUFA合酶基因一起用于在大肠杆菌中产生PUFA(美国专利申请公开No.20040235127实施例2)。如该申请中指出的,在开放阅读框中没有甲硫氨酸密码子,但在5’端附近有数个潜在的可选起始密码子(TTG和ATT)(Black and Wolk,1994,JBC 176,2282-2292)。使用PCR从念珠蓝细菌基因组DNA扩增Orf。设计5’引物,使最外侧5’TTG密码子的第一个T用A代替,从而产生一个甲硫氨酸密码子(ATG)。3’引物包含TGA终止密码子。扩增区域的范围从作为GenBank#L22883登录的念珠蓝细菌核苷酸序列的bp3994到3282(核苷酸3994,即TTG密码子中的第二个T被改变,从而形成ATG密码子)。将该扩增的hetIOrf与用于在大肠杆菌中表达的侧翼调节元件一起克隆到pACYC184载体中。用hetI Orf的这个克隆作为模板DNA以扩增基因,准备克隆到pYES6-His中。使用引物HetI 5′(SEQ ID NO:94)和HetI 3′(SEQ ID NO:95)产生一个含有hetI Orf的740bp片段。
HetI 5′GACTGGATCCGCCACCTTGCAGCATACTTGGCTACCAAAACCC
HetI3′GACTTCTAGA ATAATGCCAGAATTTTGGCTGC
引物中加入了限制酶识别位点以便于克隆(5′BamHI和3′XbaI,下划线标注)。ATG甲硫氨酸起始密码子(5’引物)和TGA终止密码子(显示为3’引物中倒置的TCA三联体)用粗体显示。PCR产物用BamHI和XbaI消化,并连接到先前制备的pYES6-His载体中,形成pYES-His/Het/CT(pYES6-His:HetI)。
在酵母中表达pYES6-Leu:sOrfA,pYES3:sOrfB,pYES2:OrfC和pYES6-His:HetI的结果
图7显示了来自表达裂殖壶菌属PUFA合酶系统(sOrfA、sOrfB、OrfC和hetI)的酵母细胞的FAME的GC谱与来自对照细胞(缺少sOrfA基因)的FAME GC谱的比较,这两种酵母菌株在本文分别表示为菌株BRY 4.5和BRY 3.3。细胞在诱导~20h后收集。可以看到,在表达完整PUFA合酶系统的菌株的谱中出现了两个新的FAME峰。通过与真正标准品的洗脱时间进行比较和随后的MS分析,这两个峰被鉴定为DPAn-6和DHA。正如从我们对裂殖壶菌属PUFA合酶的表征中推测的那样,除了DPAn-6和DHA之外,谱中没有明显的其它的新峰。图8显示了图8GC色谱图中包含PUFAFAME的区域。对照细胞和表达PUFA合酶的细胞均含有一个在DHA FMAE附近洗脱的峰。这个峰已经被鉴定为C26:0FAME(通过质谱分析),很可能来自鞘脂类。尽管它在DHA峰附近洗脱,但分辨率足以使其不对DHA的定量产生影响。DPAn-6峰与FAME谱中的其它内源酵母脂类良好分离。在这个菌株BRY 4.5的特定实例中,表达裂殖壶菌属PUFA合酶系统的细胞积累了2.4%DHA和2.0%DPAn-6(占总FAME的百分比;见下面的表4)。DHA和DPAn-6的总量占细胞中被测量脂肪酸的4.4%。细胞中观察到的DHA与DPAn-6的比例为~1.2∶1。
上面提供的显示裂殖壶菌属PUFA合酶在酵母中的表达的结果,为先前申请中提出的途径以及针对酵母及植物中可能发生的脂肪酸谱改变的预测提供了验证。
部分B
裂殖壶菌属PUFA合酶Orfs A、B和念珠蓝细菌Het I与编码含有来自破囊壶菌23B orfC同源物的DH2区的OrfC的杂合基因的组合在酵母中的表达,以及对这些细胞中产生的PUFA的影响
裂殖壶菌属/破囊壶菌23B OrfC杂合基因在酵母中的表达:如在本申请其它部分中描述的,本发明人发现,PUFA合酶n-3与n-6PUFA产物比例的主要决定因素在于OrfC蛋白,更具体地说,在于该蛋白的DH2区。使用来自破囊壶菌23B的OrfC同源物与来自裂殖壶菌属的PUFA合酶基因的组合在大肠杆菌和裂殖壶菌属中进行基因替换实验,均导致由这些混合系统产生的DHA与DPAn-6比例发生改变。在大肠杆菌中,PUFA系统的产物作为游离脂肪酸积累,而且可以推测它们不会影响宿主生物体脂质合成酶类对该酶的主要产物的积累。在裂殖壶菌属中,PUFA产物积累在酯化的脂质中,不过内源的脂质合成酶类应当能够容易地处理DHA和DPAn-6,因为它们是未修饰宿主的脂质部分的主要组分。混合PUFA合酶系统在酵母中的表达可提供异源真核宿主(例如植物)的模型。
在酵母中表达非合成或全合成破囊壶菌23B orfC基因的尝试并不成功,因为没有检测到预期的蛋白。相反,杂合orfC构建体(下文中描述)的表达产生了活性蛋白。
pYES2中的杂合裂殖壶菌属/破囊壶菌23B OrfCs:将含有天然裂殖壶菌属orfC的质粒pYES2:OrfC(上文中讨论的)用BsiWI和PmlI消化,以除去编码DH2区的DNA区段和一些侧翼DNA。除去的区域为裂殖壶菌属orfC序列(SEQ ID NO:5)的~1179bp(BsiWI位点)到~3256bp(PmlI位点)。所得的8.4kb片段(包含该载体以及orfC的5’和3’部分)进行凝胶纯化。将一个先前描述的(见实施例2)含有杂合裂殖壶菌属/破囊壶菌23B orfC的质粒(pREZ179=pColA DUET-Schizo.orfC-破囊壶菌23B DH2杂合)用BsiWI和PmlI消化,并对含有破囊壶菌23B DH2区和侧翼裂殖壶菌属DNA的2kb片段进行凝胶纯化。将两个纯化的片段连接在一起,形成pYES2:OrfC-23BDH2。
使用相似的策略产生pYES2:OrfC-s23BDH2。在这里,用作合成破囊壶菌23B DH2区的来源的质粒(pDD22;见实施例3)是杂合orfC,其中编码破囊壶菌23B DH2域的DNA来自一个合成编码区,该编码区中的密码子被修饰从而更加符合裂殖壶菌属的偏好(见实施例3)。
在酵母中表达pYES6-Leu:sOrf A,pYES3:sOrf B,pYES6-His:HetI和pYES2:OrfC-23BDH2或pYES2:OrfC-s23BDH2的结果:表4显示了在表达杂合OrfC构建体与裂殖壶菌属亚基A和B以及念珠蓝细菌HetI的组合的酵母中产生的PUFA。如在上文部分A中观察到的,这些酵母样品中检测到的新峰只有DHA和DPAn-6。生长条件和样品制备如上所述。仅显示了相关的PUFA数据(以面积%表示FAME)。标记为BRY 4.21的样品包含具有天然破囊壶菌23B DH2区的杂合orfC,而标记为BRY 4.23的样品包含具有来自合成基因的破囊壶菌23B DH2区的杂合orfC。对BRY 4.21菌株测试了两个样品(a和b,来自独立的分离物),而对BRY 4.23菌株测试了一个分离物。相对于表达裂殖壶菌属orfC的细胞,表达两种杂合orfC形式中任一种的细胞都具有更高的DHA/DPAn-6比例(具有天然破囊壶菌23B DH2的样品的平均值为~2.6,而具有合成破囊壶菌23B DH2的样品的值为~2.9)。杂合orfC基因在酵母中的表达明显导致DHA与DPAn-6的比例相对于表达天然裂殖壶菌属orfC基因的酵母增高。破囊壶菌23B细胞或表达杂合orfC的裂殖壶菌属中DHA/DPAn-6比例大大增高(~8-10)的事实表明,有其它的因素在对DHA相对于DPAn-6的优先积累起贡献。酵母中该比例确实增加的观察结果表明,该构建体是用于在异源真核宿主(例如酵母或植物)中表达PUFA合酶系统的有用模型。
表4
实施例7
下面的实施例显示了用实施例4中所述的各种遗传修饰裂殖壶菌属菌株以发酵规模生产PUFA的实验。
实验1
用2升发酵罐在典型的发酵条件下,接种两种野生型裂殖壶菌属(ATCC 20888)培养物和两种转基因裂殖壶菌属(B67-5,用密码子优化的(合成)破囊壶菌23B orfC编码区代替天然裂殖壶菌属orfC编码区;见实施例4)培养物,以比较脂肪酸谱。每种菌株在含有碳、氮、磷、盐、痕量金属和维生素的培养基中发酵。每个发酵罐接种典型的种子培养物,然后培养80小时,在培养期间补充碳源和氮源。氮源仅在生长期中补充和消耗,而碳源在整个发酵期间补充和消耗。80小时后,对来自每个发酵罐的样品进行离心、冷冻干燥,并通过气相色谱对脂肪酸含量进行分析。
典型的发酵条件:
温度:28-30℃
pH:5.0-7.5
搅拌:100-300cps
气流:0.25-2.0vvm
葡萄糖:5-35g/L(浓度)
接种物:7.5%-15%
结果如下面的表5所示:
表5
如表5所示,含有取代了天然裂殖壶菌属编码区的合成破囊壶菌23BorfC编码区的菌株B67-5产生比野生型裂殖壶菌属菌株更多的DHA和更大的DHA对DPAn-6比值。
实验2
用10升发酵罐在典型的发酵条件下,接种一种野生型裂殖壶菌属(ATCC 20888)培养物和一种转基因裂殖壶菌属(B105-1A1;含有取代了天然裂殖壶菌属DH2编码区的非密码子优化的(破囊壶菌属固有的)破囊壶菌23BDH2编码区;见实施例4)培养物,以比较脂肪酸谱。每种菌株在含有碳、氮、磷、盐、痕量金属和维生素的培养基中发酵。每个发酵罐接种典型的种子培养物,然后培养72小时,在培养期间补加碳源和氮源。氮源仅在生长相期间补加和消耗,而碳源在整个发酵期间补加和消耗。72小时后,对来自每个发酵罐的样品进行离心、冷冻干燥,并通过气相色谱对脂肪酸含量进行分析。
典型的发酵条件:
温度:28-30℃
pH:5.0-7.5
搅拌:100-300cps
气流:0.25-2.0vvm
葡萄糖:5-35g/L(浓度)
接种物:7.5%-15%
结果如下面的表6所示:
表6
表6显示,含有取代了裂殖壶菌属DH2区的合成破囊壶菌23B DH2编码区的菌株具有高得多的DHA/DPAn-6比值,再次证明了可以通过使用本文所述的嵌合PUFA PKS系统实现DHA比例的改善。
实施例8
本实施例描述了在裂殖壶菌属中表达的合成密码子优化破囊壶菌23BorfA、orfB和orfC编码区所有组合的构建和评估。
上面(实施例1和4)已经给出了用破囊壶菌23B合成密码子优化型orfC编码区精确替换裂殖壶菌属orfC编码区的方法的详细说明。本领域的技术人员会认识到,该技术可一般性地应用于大多数感兴趣的基因。本领域技术人员会进一步认识到,这些基因设计和替换能够通过这些方法或所有其它方法的改变形式加以实现。例如,多个基因/编码区可以被同时删除和同时被替换。在裂殖壶菌属中,orfA和ofB基因被发现在基因组中靠得很近(“连锁的”(linked)),隔着一个基因间区域(包括SEQ ID NO:76)。对于这两个编码区(连同基因间区域),可以依照与前人记载的关于orfC的方法(美国专利申请公开No.20050100995)相似的方法将它们同时删除。然后可以使用与实施例1和4中描述的方法相似的方法,将合成的、经密码子优化的破囊壶菌23B orfA和orfB编码区(包括整个裂殖壶菌属基因间区域)以“完美衔接”的方式替换到裂殖壶菌属orfA/orfB座位中。B80-1和B80-20(表7)等菌株就是这样产生的。
在另一个实例中,编码区缺失可以通过“两步”法实现,其中,首先,携带被标记的缺失结构加上第二可筛选标记的质粒通过一个单交换事件而整体重组到目标座位中。然后,该整合体结构通过在该缺失结构的相对侧上的某个位点上发生单交换事件而“解体(resolve)”,从而使第二可筛选标记丢失,而该缺失结构仍保留替换原始的基因结构(Rothstein R.,“Targeting,Disruption,Replacement,and Allele Rescue:Integrative DNA Transformation inYeast”,Methods in Enzymology,vol.194(1991)第281-301页,Elsevier/Academic Press,Amsterdam)。菌株B71-1(表7)的前体就是用这种方法产生的。
通过这里概述的方法,产生了一系列裂殖壶菌属菌株,这些菌株中用合成的(密码子优化的)破囊壶菌23B orfA、orfB、和orfC编码区的所有组合替换了同源的裂殖壶菌属编码区。这个系列中不含破囊壶菌23B基因的成员是野生型裂殖壶菌属ATCC20888;仅含有(全长)合成的、密码子优化的破囊壶菌23B orfC编码区的成员,B67-5,在上文实施例4和表1中有描述。如实施例4所述的那样对这一系列8个菌株在SSFM培养基中生长期间的脂肪酸生产进行评估,数据在表7中给出。
质粒pDD26包含全长的合成破囊壶菌23B orfA编码区,其与裂殖壶菌属orfA基因的上游和下游区完美衔接。pDD26编码区的核苷酸序列在本文用SEQ ID NO:71表示。SEQ ID NO:71编码SEQ ID NO:39。pDD26已经作为ATCC保藏号No.PTA-8411保藏,如本文前面所述。
质粒pDD32包含全长的合成破囊壶菌23B orfB编码区,其与裂殖壶菌属orfB基因的上游和下游区完美衔接。pDD32编码区的核苷酸序列在本文用SEQ ID NO:72表示。SEQ ID NO:72编码SEQ ID NO:52。pDD32已经作为ATCC保藏号No.PTA-8412保藏,如本文前面所述。
所有三个经密码子优化的合成破囊壶菌23B orf编码区的蛋白产物在裂殖壶菌属中都可发挥功能,并成功地与其它PUFA合酶组分(无论其来源如何)相互作用。破囊壶菌23B OrfC蛋白(菌株B67-5)的表达导致DHA/DPA比例增加到接近天然破囊壶菌23B菌株的水平,这个结果前面在实施例4中已演示过。这个现象在所有表达破囊壶菌23B OrfC蛋白的组合(B67-5,B79-11,B79-1和B80-20)中均可见到。令人惊讶的是,密码子优化的合成破囊壶菌23B orfC加上密码子优化的合成破囊壶菌23B orfA编码区的组合(菌株B79-1)导致最高水平的DHA产生,同时维持高DHA/DPA比例。这种裂殖壶菌属菌株中DHA生产增加似乎是由如下两点因素导致的:由破囊壶菌23B OrfC导致的n-3/n-6比例增加,和由破囊壶菌23B OrfA与破囊壶菌23BOrfC相互作用导致的总PUFA生产增加。
这些数据显示,来自不同生物体的PUFA合酶复合体的组分可以成功地共同发挥功能,并能够赋予新宿主以来源生物体的特定特征。而且,通过对来源和PUFA合酶组分的表达水平进行操作,可以的产生新的目标脂肪酸谱,提高其产率,降低其成本。
表7
本文通过这里参引的每一篇参考文献的全文作为参考。
尽管已经对本发明的各种实施方案进行了详细描述,但是显然,本领域的技术人员可以想到对这些实施方案进行修改和调适。然而应当容易理解,这些修改和调适处于本发明的范围之内,本发明的范围由下面的权利要求提出。
序列表
<110>马泰克生物科学公司(Martek Biosciences Corporation)
<120>嵌合PUFA聚酮合酶系统及其用途
<130>2997-49-2-PCT
<150>11/749,686
<151>2007-05-16
<160>95
<170>PatentIn version 3.4
<210>1
<211>8733
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(8733)
<400>1
atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc    48
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1               5                   10                  15
att gcc atc atc ggc atg tcg gcc atc ctc ccc tgc ggc acg acc gtg    96
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
            20                  25                  30
cgc gag tcg tgg gag acc atc cgc gcc ggc atc gac tgc ctg tcg gat    144
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
        35                  40                  45
ctc ccc gag gac cgc gtc gac gtg acg gcg tac ttt gac ccc gtc aag    192
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
    50                  55                  60
acc acc aag gac aag atc tac tgc aag cgc ggt ggc ttc att ccc gag    240
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65                  70                  75                  80
tac gac ttt gac gcc cgc gag ttc gga ctc aac atg ttc cag atg gag    288
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
                85                  90                  95
gac tcg gac gca aac cag acc atc tcg ctt ctc aag gtc aag gag gcc    336
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
            100                 105                 110
ctc cag gac gcc ggc atc gac gcc ctc ggc aag gaa aag aag aac atc    384
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
        115                 120                 125
ggc tgc gtg ctc ggc att ggc ggc ggc caa aag tcc agc cac gag ttc    432
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
    130                 135                 140
tac tcg cgc ctt aat tat gtt gtc gtg gag aag gtc ctc cgc aag atg    480
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145                 150                 155                 160
ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc    528
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
                165                 170                 175
aac ttc ccc gag tgg cgc ctc gac tcc ttc cct ggc ttc ctc ggc aac     576
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
            180                 185                 190
gtc acc gcc ggt cgc tgc acc aac acc ttc aac ctc gac ggc atg aac     624
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
        195                 200                 205
tgc gtt gtc gac gcc gca tgc gcc tcg tcc ctc atc gcc gtc aag gtc     672
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
    210                 215                 220
gcc atc gac gag ctg ctc tac ggt gac tgc gac atg atg gtc acc ggt     720
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225                 230                 235                 240
gcc acc tgc acg gat aac tcc atc ggc atg tac atg gcc ttc tcc aag     768
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
                245                 250                 255
acc ccc gtg ttc tcc acg gac ccc agc gtg cgc gcc tac gac gaa aag     816
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
            260                 265                 270
aca aag ggc atg ctc atc ggc gag ggc tcc gcc atg ctc gtc ctc aag     864
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
        275                 280                 285
cgc tac gcc gac gcc gtc cgc gac ggc gat gag atc cac gct gtt att     912
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
    290                 295                 300
cgc ggc tgc gcc tcc tcc agt gat ggc aag gcc gcc ggc atc tac acg     960
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly lle Tyr Thr
305                 310                 315                 320
ccc acc att tcg ggc cag gag gag gcc ctc cgc cgc gcc tac aac cgc     1008
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
                325                 330                 335
gcc tgt gtc gac ccg gcc acc gtc act ctc gtc gag ggt cac ggc acc     1056
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
            340                 345                 350
ggt act ccc gtt ggc gac cgc atc gag ctc acc gcc ttg cgc aac ctc     1104
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
        355                 360                 365
ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc gct gtg ggc     1152
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
    370                 375                 380
agc atc aag tcc agc atc ggc cat ctc aag gcc gtc gcc ggt ctc gcc     1200
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385                 390                 395                 400
ggt atg atc aag gtc atc atg gcg ctc aag cac aag act ctc ccg ggc     1248
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
                405                 410                 415
acc atc aac gtc gac aac cca ccc aac ctc tac gac aac acg ccc atc     1296
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
            420                 425                 430
aac gag tcc tcg ctc tac att aac acc atg aac cgc ccc tgg ttc ccg     1344
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
        435                 440                 445
ccc cct ggt gtg ccc cgc cgc gcc ggc att tcg agc ttt ggc ttt ggt     1392
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
    450                 455                 460
ggc gcc aac tac cac gcc gtc ctc gag gag gcc gag ccc gag cac acg     1440
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465                 470                 475                 480
acc gcg tac cgc ctc aac aag cgc ccg cag ccc gtg ctc atg atg gcc     1488
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
                485                 490                 495
gcc acg ccc gcg gcc ctc cag tcg ctc tgc gag gcc cag ctc aag gag     1536
Ala Thr Pro Ala Ala Leu Gln Ser Leu Cys Glu Ala Gln Leu Lys Glu
            500                 505                 510
ttc gag gcc gcc atc aag gag aac gag acc gtc aag aac acc gcc tac     1584
Phe Glu Ala Ala Ile Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr
        515                 520                 525
atc aag tgc gtc aag ttc ggc gag cag ttc aaa ttc cct ggc tcc atc     1632
Ile Lys Cys Val Lys Phe Gly Glu Gln Phe Lys Phe Pro Gly Ser Ile
    530                 535                 540
ccg gcc aca aac gcg cgc ctc ggc ttc ctc gtc aag gat gct gag gat     1680
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp
545                 550                 555                 560
gcc tgc tcc acc ctc cgt gcc atc tgc gcc caa ttc gcc aag gat gtc     1728
Ala Cys Ser Thr Leu Arg Ala Ile Cys Ala Gln Phe Ala Lys Asp Val
                565                 570                 575
acc aag gag gcc tgg cgc ctc ccc cgc gag ggc gtc agc ttc cgc gcc     1776
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala
            580                 585                 590
aag ggc atc gcc acc aac ggc gct gtc gcc gcg ctc ttc tcc ggc cag     1824
Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gln
        595                 600                 605
ggc gcg cag tac acg cac atg ttt agc gag gtg gcc atg aac tgg ccc     1872
Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro
    610                 615                 620
cag ttc cgc cag agc att gcc gcc atg gac gcc gcc cag tcc aag gtc     1920
Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser Lys Val
625                 630                 635                 640
gct gga agc gac aag gac ttt gag cgc gtc tcc cag gtc ctc tac ccg     1968
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu Tyr Pro
                645                 650                 655
cgc aag ccg tac gag cgt gag ccc gag cag gac cac aag aag atc tcc     2016
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys Ile Ser
            660                 665                 670
ctc acc gcc tac tcg cag ccc tcg acc ctg gcc tgc gct ctc ggt gcc     2064
Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala
        675                 680                 685
ttt gag atc ttc aag gag gcc ggc ttc acc ccg gac ttt gcc gcc ggc     2112
Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly
    690                 695                 700
cat tcg ctc ggt gag ttc gcc gcc ctc tac gcc gcg ggc tgc gtc gac     2160
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp
705                 710                 715                 720
cgc gac gag ctc ttt gag ctt gtc tgc cgc cgc gcc cgc atc atg ggc     2208
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile Met Gly
                725                 730                 735
ggc aag gac gca ccg gcc acc ccc aag ggc tgc atg gcc gcc gtc att     2256
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val Ile
            740                 745                 750
ggc ccc aac gcc gag aac atc aag gtc cag gcc gcc aac gtc tgg ctc     2304
Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val Trp Leu
        755                 760                 765
ggc aac tcc aac tcg cct tcg cag acc gtc atc acc ggc tcc gtc gaa     2352
Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser Val Glu
    770                 775                 780
ggt atc cag gcc gag agc gcc cgc ctc cag aag gag ggc ttc cgc gtc     2400
Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe Arg Val
785                 790                 795                 800
gtg cct ctt gcc tgc gag agc gcc ttc cac tcg ccc cag atg gag aac     2448
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met Glu Asn
                805                 810                 815
gcc tcg tcg gcc ttc aag gac gtc atc tcc aag gtc tcc ttc cgc acc     2496
Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe Arg Thr
            820                 825                 830
ccc aag gcc gag acc aag ctc ttc agc aac gtc tct ggc gag acc tac     2544
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr
        835                 840                 845
ccc acg gac gcc cgc gag atg ctt acg cag cac atg acc agc agc gtc     2592
Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser Ser Val
    850                 855                 860
aag ttc ctc acc cag gtc cgc aac atg cac cag gcc ggt gcg cgc atc     2640
Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala Arg Ile
865                 870                 875                 880
ttt gtc gag ttc gga ccc aag cag gtg ctc tcc aag ctt gtc tcc gag     2688
Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val Ser Glu
                885                 890                 895
acc ctc aag gat gac ccc tcg gtt gtc acc gtc tct gtc aac ccg gcc     2736
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala
            900                 905                 910
tcg ggc acg gat tcg gac atc cag ctc cgc gac gcg gcc gtc cag ctc     2784
Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val Gln Leu
        915                 920                 925
gtt gtc gct ggc gtc aac ctt cag ggc ttt gac aag tgg gac gcc ccc     2832
Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp Ala Pro
    930                 935                 940
gat gcc acc cgc atg cag gcc atc aag aag aag cgc act acc ctc cgc     2880
Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr Leu Arg
945                 950                 955                 960
ctt tcg gcc gcc acc tac gtc tcg gac aag acc aag aag gtc cgc gac     2928
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp
                965                 970                 975
gcc gcc atg aac gat ggc cgc tgc gtc acc tac ctc aag ggc gcc gca     2976
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala
            980                 985                 990
ccg ctc atc aag gcc ccg gag ccc gtt gtc gac gag gcc gcc aag cgc     3024
Pro Leu Ile Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg
        995                 1000                1005
gag gcc gag cgt ctc cag aag gag ctt cag gat gcc cag cgc cag      3069
Glu Ala Glu Arg Leu Gln Lys Glu Leu Gln Asp Ala Gln Arg Gln
    1010                1015                1020
ctc gac gac gcc aag cgc gcc gcc gcc gag gcc aac tcc aag ctc      3114
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu
    1025                1030                1035
gcc gct gcc aag gag gag gcc aag acc gcc gct gct tcg gcc aag      3159
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys
    1040                1045                1050
ccc gca gtt gac act gct gtt gtc gaa aag cat cgt gcc atc ctc      3204
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala Ile Leu
    1055                1060                1065
aag tcc atg ctc gcg gag ctc gat ggc tac gga tcg gtc gac gct      3249
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala
    1070                1075                1080
tct tcc ctc cag cag cag cag cag cag cag acg gcc ccc gcc ccg      3294
Ser Ser Leu Gln Gln Gln Gln Gln Gln Gln Thr Ala Pro Ala Pro
    1085                1090                1095
gtc aag gct gct gcg cct gcc gcc ccc gtt gcc tcg gcc cct gcc      3339
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala
    1100                1105                1110
ccg gct gtc tcg aac gag ctt ctt gag aag gcc gag act gtc gtc      3384
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val
    1115                1120                1125
atg gag gtc ctc gcc gcc aag acc ggc tac gag acc gac atg atc      3429
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile
    1130                1135                1140
gag gct gac atg gag ctc gag acc gag ctc ggc att gac tcc atc      3474
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile
    1145                1150                1155
aag cgt gtc gag atc ctc tcc gag gtc cag gcc atg ctc aat gtc      3519
Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val
    1160                1165                1170
gag gcc aag gat gtc gat gcc ctc agc cgc act cgc act gtt ggt      3564
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly
    1175                1180                1185
gag gtt gtc aac gcc atg aag gcc gag atc gct ggc agc tct gcc      3609
Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala
    1190                1195                1200
ccg gcg cct gct gcc gct gct ccg gct ccg gcc aag gct gcc cct      3654
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro
    1205                1210                1215
gcc gcc gct gcg cct gct gtc tcg aac gag ctt ctc gag aag gcc      3699
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala
    1220                1225                1230
gag acc gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag      3744
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu
    1235                1240                1245
act gac atg atc gag tcc gac atg gag ctc gag act gag ctc ggc      3789
Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly
    1250                1255                1260
att gac tcc atc aag cgt gtc gag atc ctc tcc gag gtt cag gcc       3834
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala
    1265                1270                1275
atg ctc aac gtc gag gcc aag gac gtc gac gct ctc agc cgc act       3879
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr
    1280                1285                1290
cgc act gtg ggt gag gtc gtc aac gcc atg aag gct gag atc gct       3924
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala
    1295                1300                1305
ggt ggc tct gcc ccg gcg cct gcc gcc gct gcc cca ggt ccg gct       3969
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala
    1310                1315                1320
gct gcc gcc cct gcg cct gcc gcc gcc gcc cct gct gtc tcg aac       4014
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn
    1325                1330                1335
gag ctt ctt gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc       4059
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala
    1340                1345                1350
gcc aag act ggc tac gag act gac atg atc gag tcc gac atg gag       4104
Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu
    1355                1360                1365
ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc gag att       4149
Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile
    1370                1375                1380
ctc tcc gag gtc cag gcc atg ctc aac gtc gag gcc aag gac gtc       4194
Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
    1385                1390                1395
gac gct ctc agc cgc acc cgc act gtt ggc gag gtc gtc gat gcc       4239
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala
    1400                1405                1410
atg aag gcc gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc       4284
Met Lys Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala
    1415                1420                1425
gct gct cct gct ccg gct gct gcc gcc cct gcg cct gcc gcc cct       4329
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro
    1430                1435                1440
gcg cct gct gtc tcg agc gag ctt ctc gag aag gcc gag act gtc       4374
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val
    1445                1450                1455
gtc atg gag gtc ctc gcc gcc aag act ggc tac gag act gac atg       4419
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met
    1460                1465                1470
atc gag tcc gac atg gag ctc gag acc gag ctc ggc att gac tcc       4464
Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser
    1475                1480                1485
atc aag cgt gtc gag att ctc tcc gag gtc cag gcc atg ctc aac       4509
Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn
    1490                1495                1500
gtc gag gcc aag gac gtc gac gct ctc agc cgc acc cgc act gtt       4554
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val
    1505                1510                1515
ggc gag gtc gtc gat gcc atg aag gcc gag atc gct ggt ggc tct      4599
Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Gly Ser
    1520                1525                1530
gcc ccg gcg cct gcc gcc gct gct cct gct ccg gct gct gcc gcc      4644
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala
    1535                1540                1545
cct gcg cct gcc gcc cct gcg cct gcc gcc cct gcg cct gct gtc      4689
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val
    1550                1555                1560
tcg agc gag ctt ctc gag aag gcc gag act gtc gtc atg gag gtc      4734
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val
    1565                1570                1575
ctc gcc gcc aag act ggc tac gag act gac atg att gag tcc gac      4779
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp
    1580                1585                1590
atg gag ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc      4824
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val
    1595                1600                1605
gag att ctc tcc gag gtt cag gcc atg ctc aac gtc gag gcc aag      4869
Glu lle Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys
    1610                1615                1620
gac gtc gac gct ctc agc cgc act cgc act gtt ggt gag gtc gtc      4914
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val
    1625                1630                1635
gat gcc atg aag gct gag atc gct ggc agc tcc gcc tcg gcg cct      4959
Asp Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala Ser Ala Pro
    1640                1645                1650
gcc gcc gct gct cct gct ccg gct gct gcc gct cct gcg ccc gct      5004
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala
    1655                1660                1665
gcc gcc gcc cct gct gtc tcg aac gag ctt ctc gag aaa gcc gag      5049
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu
    1670                1675                1680
act gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag act      5094
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr
    1685                1690                1695
gac atg atc gag tcc gac atg gag ctc gag act gag ctc ggc att      5139
Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile
    1700                1705                1710
gac tcc atc aag cgt gtc gag atc ctc tcc gag gtt cag gcc atg      5184
Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met
    1715                1720                1725
ctc aac gtc gag gcc aag gac gtc gat gcc ctc agc cgc acc cgc      5229
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg
    1730                1735                1740
act gtt ggc gag gtt gtc gat gcc atg aag gcc gag atc gct ggt      5274
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly
    1745                1750                1755
ggc tct gcc ccg gcg cct gcc gcc gct gcc cct gct ccg gct gcc      5319
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala
    1760                1765                1770
gcc gcc cct gct gtc tcg aac gag ctt ctc gag aag gcc gag act      5364
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr
    1775                1780                1785
gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag acc gac     5409
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp
    1790                1795                1800
atg atc gag tcc gac atg gag ctc gag acc gag ctc ggc att gac     5454
Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp
    1805                1810                1815
tcc atc aag cgt gtc gag att ctc tcc gag gtt cag gcc atg ctc     5499
Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu
    1820                1825                1830
aac gtc gag gcc aag gac gtc gat gct ctc agc cgc act cgc act     5544
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr
    1835                1840                1845
gtt ggc gag gtc gtc gat gcc atg aag gct gag atc gcc ggc agc     5589
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Ser
    1850                1855                1860
tcc gcc ccg gcg cct gcc gcc gct gct cct gct ccg gct gct gcc     5634
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala
    1865                1870                1875
gct cct gcg ccc gct gcc gct gcc cct gct gtc tcg agc gag ctt     5679
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu
    1880                1885                1890
ctc gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc gcc aag     5724
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys
    1895                1900                1905
act ggc tac gag act gac atg att gag tcc gac atg gag ctc gag     5769
Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu
    1910                1915                1920
act gag ctc ggc att gac tcc atc aag cgt gtc gag atc ctc tcc     5814
Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser
    1925                1930                1935
gag gtt cag gcc atg ctc aac gtc gag gcc aag gac gtc gat gcc     5859
Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala
    1940                1945                1950
ctc agc cgc acc cgc act gtt ggc gag gtt gtc gat gcc atg aag     5904
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys
    1955                1960                1965
gcc gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc gct gcc     5949
Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala
    1970                1975                1980
cct gct ccg gct gcc gcc gcc cct gct gtc tcg aac gag ctt ctt     5994
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu
    1985                1990                1995
gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc gcc aag act     6039
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr
    2000                2005                2010
ggc tac gag acc gac atg atc gag tcc gac atg gag ctc gag acc     6084
Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr
    2015                2020                2025
gag ctc ggc att gac tcc atc aag cgt gtc gag att ctc tcc gag     6129
Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu
    2030                2035                2040
gtt cag gcc atg ctc aac gtc gag gcc aag gac gtc gac gct ctc      6174
Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu
    2045                2050                2055
agc cgc act cgc act gtt ggc gag gtc gtc gat gcc atg aag gct      6219
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala
    2060                2065                2070
gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc gct gct cct      6264
Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro
    2075                2080                2085
gcc tcg gct ggc gcc gcg cct gcg gtc aag att gac tcg gtc cac      6309
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys Ile Asp Ser Val His
    2090                2095                2100
ggc gct gac tgt gat gat ctt tcc ctg atg cac gcc aag gtg gtt      6354
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val
    2105                2110                2115
gac atc cgc cgc ccg gac gag ctc atc ctg gag cgc ccc gag aac      6399
Asp Ile Arg Arg Pro Asp Glu Leu Ile Leu Glu Arg Pro Glu Asn
    2120                2125                2130
cgc ccc gtt ctc gtt gtc gat gac ggc agc gag ctc acc ctc gcc      6444
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu Thr Leu Ala
    2135                2140                2145
ctg gtc cgc gtc ctc ggc gcc tgc gcc gtt gtc ctg acc ttt gag      6489
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu Thr Phe Glu
    2150                2155                2160
ggt ctc cag ctc gct cag cgc gct ggt gcc gct gcc atc cgc cac      6534
Gly Leu Gln Leu Ala Gln Arg Ala Gly Ala Ala Ala Ile Arg His
    2165                2170                2175
gtg ctc gcc aag gat ctt tcc gcg gag agc gcc gag aag gcc atc      6579
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala Ile
    2180                2185                2190
aag gag gcc gag cag cgc ttt ggc gct ctc ggc ggc ttc atc tcg      6624
Lys Glu Ala Glu Gln Arg Phe Gly Ala Leu Gly Gly Phe Ile Ser
    2195                2200                2205
cag cag gcg gag cgc ttc gag ccc gcc gaa atc ctc ggc ttc acg      6669
Gln Gln Ala Glu Arg Phe Glu Pro Ala Glu Ile Leu Gly Phe Thr
    2210                2215                2220
ctc atg tgc gcc aag ttc gcc aag gct tcc ctc tgc acg gct gtg      6714
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val
    2225                2230                2235
gct ggc ggc cgc ccg gcc ttt atc ggt gtg gcg cgc ctt gac ggc      6759
Ala Gly Gly Arg Pro Ala Phe Ile Gly Val Ala Arg Leu Asp Gly
    2240                2245                2250
cgc ctc gga ttc act tcg cag ggc act tct gac gcg ctc aag cgt      6804
Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser Asp Ala Leu Lys Arg
    2255                2260                2265
gcc cag cgt ggt gcc atc ttt ggc ctc tgc aag acc atc ggc ctc      6849
Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys Thr Ile Gly Leu
    2270                2275                2280
gag tgg tcc gag tct gac gtc ttt tcc cgc ggc gtg gac att gct      6894
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp Ile Ala
    2285                2290                2295
cag ggc atg cac ccc gag gat gcc gcc gtg gcg att gtg cgc gag      6939
Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val Arg Glu
    2300                2305                2310
atg gcg tgc gct gac att cgc att cgc gag gtc ggc att ggc gca      6984
Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly Ala
    2315                2320                2325
aac cag cag cgc tgc acg atc cgt gcc gcc aag ctc gag acc ggc      7029
Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
    2330                2335                2340
aac ccg cag cgc cag atc gcc aag gac gac gtg ctg ctc gtt tct      7074
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser
    2345                2350                2355
ggc ggc gct cgc ggc atc acg cct ctt tgc atc cgg gag atc acg      7119
Gly Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr
    2360                2365                2370
cgc cag atc gcg ggc ggc aag tac att ctg ctt ggc cgc agc aag      7164
Arg Gln Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys
    2375                2380                2385
gtc tct gcg agc gaa ccg gca tgg tgc gct ggc atc act gac gag      7209
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu
    2390                2395                2400
aag gct gtg caa aag gct gct acc cag gag ctc aag cgc gcc ttt      7254
Lys Ala Val Gln Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe
    2405                2410                2415
agc gct ggc gag ggc ccc aag ccc acg ccc cgc gct gtc act aag      7299
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys
    2420                2425                2430
ctt gtg ggc tct gtt ctt ggc gct cgc gag gtg cgc agc tct att      7344
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser Ile
    2435                2440                2445
gct gcg att gaa gcg ctc ggc ggc aag gcc atc tac tcg tcg tgc      7389
Ala Ala Ile Glu Ala Leu Gly Gly Lys Ala Ile Tyr Ser Ser Cys
    2450                2455                2460
gac gtg aac tct gcc gcc gac gtg gcc aag gcc gtg cgc gat gcc      7434
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala
    2465                2470                2475
gag tcc cag ctc ggt gcc cgc gtc tcg ggc atc gtt cat gcc tcg      7479
Glu Ser Gln Leu Gly Ala Arg Val Ser Gly Ile Val His Ala Ser
    2480                2485                2490
ggc gtg ctc cgc gac cgt ctc atc gag aag aag ctc ccc gac gag      7524
Gly Val Leu Arg Asp Arg Leu Ile Glu Lys Lys Leu Pro Asp Glu
    2495                2500                2505
ttc gac gcc gtc ttt ggc acc aag gtc acc ggt ctc gag aac ctc      7569
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu
    2510                2515                2520
ctc gcc gcc gtc gac cgc gcc aac ctc aag cac atg gtc ctc ttc      7614
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe
    2525                2530                2535
agc tcg ctc gcc ggc ttc cac ggc aac gtc ggc cag tct gac tac      7659
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser Asp Tyr
    2540                2545                2550
gcc atg gcc aac gag gcc ctt aac aag atg ggc ctc gag ctc gcc      7704
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala
    2555                2560                2565
aag gac gtc tcg gtc aag tcg atc tgc ttc ggt ccc tgg gac ggt      7749
Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
    2570                2575                2580
ggc atg gtg acg ccg cag ctc aag aag cag ttc cag gag atg ggc      7794
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly
    2585                2590                2595
gtg cag atc atc ccc cgc gag ggc ggc gct gat acc gtg gcg cgc      7839
Val Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg
    2600                2605                2610
atc gtg ctc ggc tcc tcg ccg gct gag atc ctt gtc ggc aac tgg      7884
Ile Val Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp
    2615                2620                2625
cgc acc ccg tcc aag aag gtc ggc tcg gac acc atc acc ctg cac      7929
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His
    2630                2635                2640
cgc aag att tcc gcc aag tcc aac ccc ttc ctc gag gac cac gtc      7974
Arg Lys Ile Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val
    2645                2650                2655
atc cag ggc cgc cgc gtg ctg ccc atg acg ctg gcc att ggc tcg      8019
Ile Gln Gly Arg Arg Val Leu Pro Met Thr Leu Ala Ile Gly Ser
    2660                2665                2670
ctc gcg gag acc tgc ctc ggc ctc ttc ccc ggc tac tcg ctc tgg      8064
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp
    2675                2680                2685
gcc att gac gac gcc cag ctc ttc aag ggt gtc act gtc gac ggc      8109
Ala Ile Asp Asp Ala Gln Leu Phe Lys Gly Val Thr Val Asp Gly
    2690                2695                2700
gac gtc aac tgc gag gtg acc ctc acc ccg tcg acg gcg ccc tcg      8154
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser
    2705                2710                2715
ggc cgc gtc aac gtc cag gcc acg ctc aag acc ttt tcc agc ggc      8199
Gly Arg Val Asn Val Gln Ala Thr Leu Lys Thr Phe Ser Ser Gly
    2720                2725                2730
aag ctg gtc ccg gcc tac cgc gcc gtc atc gtg ctc tcc aac cag      8244
Lys Leu Val Pro Ala Tyr Arg Ala Val Ile Val Leu Ser Asn Gln
    2735                2740                2745
ggc gcg ccc ccg gcc aac gcc acc atg cag ccg ccc tcg ctc gat      8289
Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro Pro Ser Leu Asp
    2750                2755                2760
gcc gat ccg gcg ctc cag ggc tcc gtc tac gac ggc aag acc ctc      8334
Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly Lys Thr Leu
    2765                2770                2775
ttc cac ggc ccg gcc ttc cgc ggc atc gat gac gtg ctc tcg tgc      8379
Phc His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu Ser Cys
    2780                2785                2790
acc aag agc cag ctt gtg gcc aag tgc agc gct gtc ccc ggc tcc      8424
Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser
    2795                2800                2805
gac gcc gct cgc ggc gag ttt gcc acg gac act gac gcc cat gac      8469
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
    2810                2815                2820
ccc ttc gtg aac gac ctg gcc ttt cag gcc atg ctc gtc tgg gtg 8514
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val
    2825                2830                2835
cgc cgc acg ctc ggc cag gct gcg ctc ccc aac tcg atc cag cgc 8559
Arg Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg
    2840                2845                2850
atc gtc cag cac cgc ccg gtc ccg cag gac aag ccc ttc tac att 8604
Ile Val Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile
    2855                2860                2865
acc ctc cgc tcc aac cag tcg ggc ggt cac tcc cag cac aag cac 8649
Thr Leu Arg Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His
    2870                2875                2880
gcc ctt cag ttc cac aac gag cag ggc gat ctc ttc att gat gtc 8694
Ala Leu Gln Phe His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val
    2885                2890                2895
cag gct tcg gtc atc gcc acg gac agc ctt gcc ttc taa         8733
Gln Ala Ser Val Ile Ala Thr Asp Ser Leu Ala Phe
    2900                2905                2910
<210>2
<211>2910
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>2
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1                5                   10                  15
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
            20                  25                  30
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
        35                  40                  45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
    50                  55                  60
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65                  70                  75                  80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
                85                  90                  95
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
            100                 105                 110
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
        115                 120                 125
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
    130                 135                 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145                 150                 155                 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
                165                 170                 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
            180                 185                 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
        195                 200                 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
    210                 215                 220
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225                 230                 235                 240
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
                245                 250                 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
            260                 265                 270
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
        275                 280                 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
    290                 295                 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305                 310                 315                 320
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
                325                 330                 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
            340                 345                 350
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
        355                 360                 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
    370                 375                 380
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385                 390                 395                 400
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
                405                 410                 415
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
            420                 425                 430
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
        435                 440                 445
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
    450                 455                 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465                 470                 475                 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
                485                 490                 495
Ala Thr Pro Ala Ala Leu Gln Ser Leu Cys Glu Ala Gln Leu Lys Glu
            500                 505                 510
Phe Glu Ala Ala Ile Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr
        515                 520                 525
Ile Lys Cys Val Lys Phe Gly Glu Gln Phe Lys Phe Pro Gly Ser Ile
    530                 535                 540
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp
545                 550                 555                 560
Ala Cys Ser Thr Leu Arg Ala Ile Cys Ala Gln Phe Ala Lys Asp Val
                565                 570                 575
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala
            580                 585                 590
Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gln
        595                 600                 605
Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro
    610                 615                 620
Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser Lys Val
625                 630                 635                 640
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu Tyr Pro
                645                 650                 655
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys Ile Ser
            660                 665                 670
Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala
        675                 680                 685
Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly
    690                 695                 700
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp
705                 710                 715                 720
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile Met Gly
                725                 730                 735
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val Ile
            740                 745                 750
Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val Trp Leu
        755                 760                 765
Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser Val Glu
    770                 775                 780
Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe Arg Val
785                 790                 795                 800
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met Glu Asn
                805                 810                 815
Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe Arg Thr
            820                 825                 830
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr
        835                 840                 845
Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser Ser Val
    850                 855                 860
Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala Arg Ile
865                 870                 875                 880
Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val Ser Glu
                885                 890                 895
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala
            900                 905                 910
Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val Gln Leu
        915                 920                 925
Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp Ala Pro
    930                 935                 940
Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr Leu Arg
945                 950                 955                 960
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp
                965                 970                 975
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala
            980                 985                 990
Pro Leu Ile Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg
        995                 1000                1005
Glu Ala Glu Arg Leu Gln Lys Glu Leu Gln Asp Ala Gln Arg Gln
    1010                1015                1020
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu
    1025                1030                1035
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys
    1040                1045                1050
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala Ile Leu
    1055                1060                1065
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala
    1070                1075                1080
Ser Ser Leu Gln Gln Gln Gln Gln Gln Gln Thr Ala Pro Ala Pro
    1085                1090                1095
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala
    1100                1105                1110
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val
    1115                1120                1125
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile
    1130                1135                1140
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile
    1145                1150                1155
Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val
    1160                1165                1170
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly
    1175                1180                1185
Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala
    1190                1195                1200
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro
    1205                1210                1215
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala
    1220                1225                1230
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu
    1235                1240                1245
Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly
    1250                1255                1260
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala
    1265                1270                1275
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr
    1280                1285                1290
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala
    1295                1300                1305
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala
    1310                1315                1320
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn
    1325                1330                1335
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala
    1340                1345                1350
Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu
    1355                1360                1365
Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile
    1370                1375                1380
Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
    1385                1390                1395
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala
    1400                1405                1410
Met Lys Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala
    1415                1420                1425
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro
    1430                1435                1440
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val
    1445                1450                1455
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met
    1460                1465                1470
Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser
    1475                1480                1485
Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn
    1490                1495                1500
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val
    1505                1510                1515
Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Gly Ser
    1520                1525                1530
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala
    1535                1540                1545
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val
    1550                1555                1560
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val
    1565                1570                1575
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp
    1580                1585                1590
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val
    1595                1600                1605
Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys
    1610                1615                1620
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val
    1625                1630                1635
Asp Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala Ser Ala Pro
    1640                1645                1650
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala
    1655                1660                1665
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu
    1670                1675                1680
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr
    1685                1690                1695
Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile
    1700                1705                1710
Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met
    1715                1720                1725
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg
    1730                1735                1740
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly
    1745                1750                1755
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala
    1760                1765                1770
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr
    1775                1780                1785
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp
    1790                1795                1800
Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp
    1805                1810                1815
Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu
    1820                1825                1830
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr
    1835                1840                1845
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Ser
    1850                1855                1860
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala
    1865                1870                1875
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu
    1880                1885                1890
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys
    1895                1900                1905
Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu
    1910                1915                1920
Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser
    1925                1930                1935
Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala
    1940                1945                1950
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys
    1955                1960                1965
Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala
    1970                1975                1980
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu
    1985                1990                1995
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr
    2000                2005                2010
Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr
    2015                2020                2025
Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu
    2030                2035                2040
Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu
    2045                2050                2055
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala
    2060                2065                2070
Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro
    2075                2080                2085
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys Ile Asp Ser Val His
    2090                2095                2100
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val
    2105                2110                2115
Asp Ile Arg Arg Pro Asp Glu Leu Ile Leu Glu Arg Pro Glu Asn
    2120                2125                2130
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu Thr Leu Ala
    2135                2140                2145
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu Thr Phe Glu
    2150                2155                2160
Gly Leu Gln Leu Ala Gln Arg Ala Gly Ala Ala Ala Ile Arg His
    2165                2170                2175
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala Ile
    2180                2185                2190
Lys Glu Ala Glu Gln Arg Phe Gly Ala Leu Gly Gly Phe Ile Ser
    2195                2200                2205
Gln Gln Ala Glu Arg Phe Glu Pro Ala Glu Ile Leu Gly Phe Thr
    2210                2215                2220
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val
    2225                2230                2235
Ala Gly Gly Arg Pro Ala Phe Ile Gly Val Ala Arg Leu Asp Gly
    2240                2245                2250
Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser Asp Ala Leu Lys Arg
    2255                2260                2265
Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys Thr Ile Gly Leu
    2270                2275                2280
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp Ile Ala
    2285                2290                2295
Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val Arg Glu
    2300                2305                2310
Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly Ala
    2315                2320                2325
Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
    2330                2335                2340
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser
    2345                2350                2355
Gly Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr
    2360                2365                2370
Arg Gln Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys
    2375                2380                2385
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu
    2390                2395                2400
Lys Ala Val Gln Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe
    2405                2410                2415
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys
    2420                2425                2430
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser Ile
    2435                2440                2445
Ala Ala Ile Glu Ala Leu Gly Gly Lys Ala Ile Tyr Ser Ser Cys
    2450                2455                2460
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala
    2465                2470                2475
Glu Ser Gln Leu Gly Ala Arg Val Ser Gly Ile Val His Ala Ser
    2480                2485                2490
Gly Val Leu Arg Asp Arg Leu Ile Glu Lys Lys Leu Pro Asp Glu
    2495                2500                2505
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu
    2510                2515                2520
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe
    2525                2530                2535
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser Asp Tyr
    2540                2545                2550
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala
    2555                2560                2565
Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
    2570                2575                2580
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly
    2585                2590                2595
Val Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg
    2600                2605                2610
Ile Val Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp
    2615                2620                2625
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His
    2630                2635                2640
Arg Lys Ile Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val
    2645                2650                2655
Ile Gln Gly Arg Arg Val Leu Pro Met Thr Leu Ala Ile Gly Ser
    2660                2665                2670
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp
    2675                2680                2685
Ala Ile Asp Asp Ala Gln Leu Phe Lys Gly Val Thr Val Asp Gly
    2690                2695                2700
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser
    2705                2710                2715
Gly Arg Val Asn Val Gln Ala Thr Leu Lys Thr Phe Ser Ser Gly
    2720                2725                2730
Lys Leu Val Pro Ala Tyr Arg Ala Val Ile Val Leu Ser Asn Gln
    2735                2740                2745
Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro Pro Ser Leu Asp
    2750                2755                2760
Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly Lys Thr Leu
    2765                2770                2775
Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu Ser Cys
    2780                2785                2790
Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser
    2795                2800                2805
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
    2810                2815                2820
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val
    2825                2830                2835
Arg Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg
    2840                2845                2850
Ile Val Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile
    2855                2860                2865
Thr Leu Arg Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His
    2870                2875                2880
Ala Leu Gln Phe His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val
    2885                2890                2895
Gln Ala Ser Val Ile Ala Thr Asp Ser Leu Ala Phe
    2900                2905                2910
<210>3
<211>6180
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(6180)
<400>3
atg gcc gct cgg aat gtg agc gcc gcg cat gag atg cac gat gaa aag    48
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1               5                   10                  15
cgc atc gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc    96
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
            20                  25                  30
aag gac gag ttc tgg gag gtg ctc atg aac ggc aag gtc gag tcc aag    144
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
        35                  40                  45
gtg atc agc gac aaa cga ctc ggc tcc aac tac cgc gcc gag cac tac    192
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
    50                  55                  60
aaa gca gag cgc agc aag tat gcc gac acc ttt tgc aac gaa acg tac    240
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65                  70                  75                  80
ggc acc ctt gac gag aac gag atc gac aac gag cac gaa ctc ctc ctc    288
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
                85                  90                  95
aac ctc gcc aag cag gca ctc gca gag aca tcc gtc aaa gac tcg aca      336
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
            100                 105                 110
cgc tgc ggc atc gtc agc ggc tgc ctc tcg ttc ccc atg gac aac ctc      384
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
        115                 120                 125
cag ggt gaa ctc ctc aac gtg tac caa aac cat gtc gag aaa aag ctc      432
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
    130                 135                 140
ggg gcc cgc gtc ttc aag gac gcc tcc cat tgg tcc gaa cgc gag cag      480
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145                 150                 155                 160
tcc aac aaa ccc gag gcc ggt gac cgc cgc atc ttc atg gac ccg gcc      528
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
                165                 170                 175
tcc ttc gtc gcc gaa gaa ctc aac ctc ggc gcc ctt cac tac tcc gtc      576
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
            180                 185                 190
gac gca gca tgc gcc acg gcg ctc tac gtg ctc cgc ctc gcg cag gat      624
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
        195                 200                 205
cat ctc gtc tcc ggc gcc gcc gac gtc atg ctc tgc ggt gcc acc tgc      672
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
    210                 215                 220
ctg ccg gag ccc ttt ttc atc ctt tcg ggc ttt tcc acc ttc cag gcc      720
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225                 230                 235                 240
atg ccc gtc ggc acg ggc cag aac gtg tcc atg ccg ctg cac aag gac      768
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
                245                 250                 255
agc cag ggc ctc acc ccg ggt gag ggc ggc tcc atc atg gtc ctc aag      816
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
            260                 265                 270
cgt ctc gat gat gcc atc cgc gac ggc gac cac atc tac ggc acc ctt      864
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
        275                 280                 285
ctc ggc gcc aat gtc agc aac tcc ggc aca ggt ctg ccc ctc aag ccc      912
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
    290                 295                 300
ctt ctc ccc agc gag aaa aag tgc ctc atg gac acc tac acg cgc att      960
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305                 310                 315                 320
aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gcc acc ggc      1008
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
                325                 330                 335
acg ccc cag ggt gat cgt gtg gaa atc gac gcc gtc aag gcc tgc ttt      1056
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
            340                 345                 350
gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac      1104
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
        355                 360                 365
acc ctc gtc gca gcc ggc ttt gcc ggt atg tgc aag gtc ctc ctc tcc     1152
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
    370                 375                 380
atg aag cat ggc atc atc ccg ccc acc ccg ggt atc gat gac gag acc     1200
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385                 390                 395                 400
aag atg gac cct ctc gtc gtc tcc ggt gag gcc atc cca tgg cca gag     1248
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
                405                 410                 415
acc aac ggc gag ccc aag cgc gcc ggt ctc tcg gcc ttt ggc ttt ggt     1296
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
            420                 425                 430
ggc acc aac gcc cat gcc gtc ttt gag gag cat gac ccc tcc aac gcc     1344
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
        435                 440                 445
gcc tgc acg ggc cac gac tcc att tct gcg ctc tcg gcc cgc tgc ggc     1392
Ala Cys Thr Gly His Asp Ser Ile Ser Ala Leu Ser Ala Arg Cys Gly
    450                 455                 460
ggt gaa agc aac atg cgc atc gcc atc act ggt atg gac gcc acc ttt     1440
Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly Met Asp Ala Thr Phe
465                 470                 475                 480
ggc gct ctc aag gga ctc gac gcc ttc gag cgc gcc att tac acc ggc     1488
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala Ile Tyr Thr Gly
                485                 490                 495
gct cac ggt gcc atc cca ctc cca gaa aag cgc tgg cgc ttt ctc ggc     1536
Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly
            500                 505                 510
aag gac aag gac ttt ctt gac ctc tgc ggc gtc aag gcc acc ccg cac     1584
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His
        515                 520                 525
ggc tgc tac att gaa gat gtt gag gtc gac ttc cag cgc ctc cgc acg     1632
Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe Gln Arg Leu Arg Thr
    530                 535                 540
ccc atg acc cct gaa gac atg ctc ctc cct cag cag ctt ctg gcc gtc     1680
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln Gln Leu Leu Ala Val
545                 550                 555                 560
acc acc att gac cgc gcc atc ctc gac tcg gga atg aaa aag ggt ggc     1728
Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly Met Lys Lys Gly Gly
                565                 570                 575
aat gtc gcc gtc ttt gtc ggc ctc ggc acc gac ctc gag ctc tac cgt     1776
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg
            580                 585                 590
cac cgt gct cgc gtc gct ctc aag gag cgc gtc cgc cct gaa gcc tcc     1824
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser
        595                 600                 605
aag aag ctc aat gac atg atg cag tac att aac gac tgc ggc aca tcc     1872
Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn Asp Cys Gly Thr Ser
    610                 615                 620
aca tcg tac acc tcg tac att ggc aac ctc gtc gcc acg cgc gtc tcg     1920
Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Val Ser
625                 630                 635                 640
tcg cag tgg ggc ttc acg ggc ccc tcc ttt acg atc acc gag ggc aac     1968
Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Ile Thr Glu Gly Asn
                645                 650                 655
aac tcc gtc tac cgc tgc gcc gag ctc ggc aag tac ctc ctc gag acc     2016
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr
            660                 665                 670
ggc gag gtc gat ggc gtc gtc gtt gcg ggt gtc gat ctc tgc ggc agt     2064
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser
        675                 680                 685
gcc gaa aac ctt tac gtc aag tct cgc cgc ttc aag gtg tcc acc tcc     2112
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser
    690                 695                 700
gat acc ccg cgc gcc agc ttt gac gcc gcc gcc gat ggc tac ttt gtc     2160
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val
705                 710                 715                 720
ggc gag ggc tgc ggt gcc ttt gtg ctc aag cgt gag act agc tgc acc     2208
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr
                725                 730                 735
aag gac gac cgt atc tac gct tgc atg gat gcc atc gtc cct ggc aac     2256
Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala Ile Val Pro Gly Asn
            740                 745                 750
gtc cct agc gcc tgc ttg cgc gag gcc ctc gac cag gcg cgc gtc aag     2304
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gln Ala Arg Val Lys
        755                 760                 765
ccg ggc gat atc gag atg ctc gag ctc agc gcc gac tcc gcc cgc cac     2352
Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His
    770                 775                 780
ctc aag gac ccg tcc gtc ctg ccc aag gag ctc act gcc gag gag gaa     2400
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu
785                 790                 795                 800
atc ggc ggc ctt cag acg atc ctt cgt gac gat gac aag ctc ccg cgc     2448
Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp Asp Lys Leu Pro Arg
                805                 810                 815
aac gtc gca acg ggc agt gtc aag gcc acc gtc ggt gac acc ggt tat     2496
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr
            820                 825                 830
gcc tct ggt gct gcc agc ctc atc aag gct gcg ctt tgc atc tac aac     2544
Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala Leu Cys Ile Tyr Asn
        835                 840                 845
cgc tac ctg ccc agc aac ggc gac gac tgg gat gaa ccc gcc cct gag     2592
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu
    850                 855                 860
gcg ccc tgg gac agc acc ctc ttt gcg tgc cag acc tcg cgc gct tgg     2640
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln Thr Ser Arg Ala Trp
865                 870                 875                 880
ctc aag aac cct ggc gag cgt cgc tat gcg gcc gtc tcg ggc gtc tcc     2688
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser
                885                 890                 895
gag acg cgc tcg tgc tat tcc gtg ctc ctc tcc gaa gcc gag ggc cac     2736
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His
            900                 905                 910
tac gag cgc gag aac cgc atc tcg ctc gac gag gag gcg ccc aag ctc     2784
Tyr Glu Arg Glu Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu
        915                 920                 925
att gtg ctt cgc gcc gac tcc cac gag gag atc ctt ggt cgc ctc gac  2832
Ile Val Leu Arg Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp
    930                 935                 940
aag atc cgc gag cgc ttc ttg cag ccc acg ggc gcc gcc ccg cgc gag  2880
Lys Ile Arg Glu Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu
945                 950                 955                 960
tcc gag ctc aag gcg cag gcc cgc cgc atc ttc ctc gag ctc ctc ggc  2928
Ser Glu Leu Lys Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly
                965                 970                 975
gag acc ctt gcc cag gat gcc gct tct tca ggc tcg caa aag ccc ctc  2976
Glu Thr Leu Ala Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu
            980                 985                 990
gct ctc agc ctc gtc tcc acg ccc tcc aag ctc cag cgc gag gtc gag  3024
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu
        995                 1000                1005
ctc gcg gcc aag ggt atc ccg cgc tgc ctc aag atg cgc cgc gat      3069
Leu Ala Ala Lys Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp
    1010                1015                1020
tgg agc tcc cct gct ggc agc cgc tac gcg cct gag ccg ctc gcc      3114
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala
    1025                1030                1035
agc gac cgc gtc gcc ttc atg tac ggc gaa ggt cgc agc cct tac      3159
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr
    1040                1045                1050
tac ggc atc acc caa gac att cac cgc att tgg ccc gaa ctc cac      3204
Tyr Gly Ile Thr Gln Asp Ile His Arg Ile Trp Pro Glu Leu His
    1055                1060                1065
gag gtc atc aac gaa aag acg aac cgt ctc tgg gcc gaa ggc gac      3249
Glu Val Ile Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp
    1070                1075                1080
cgc tgg gtc atg ccg cgc gcc agc ttc aag tcg gag ctc gag agc      3294
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser
    1085                1090                1095
cag cag caa gag ttt gat cgc aac atg att gaa atg ttc cgt ctt      3339
Gln Gln Gln Glu Phe Asp Arg Asn Met Ile Glu Met Phe Arg Leu
    1100                1105                1110
gga atc ctc acc tca att gcc ttc acc aat ctg gcg cgc gac gtt      3384
Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu Ala Arg Asp Val
    1115                1120                1125
ctc aac atc acg ccc aag gcc gcc ttt ggc ctc agt ctt ggc gag      3429
Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu
    1130                1135                1140
att tcc atg att ttt gcc ttt tcc aag aag aac ggt ctc atc tcc      3474
Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu Ile Ser
    1145                1150                1155
gac cag ctc acc aag gat ctt cgc gag tcc gac gtg tgg aac aag      3519
Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys
    1160                1165                1170
gct ctg gcc gtt gaa ttt aat gcg ctg cgc gag gcc tgg ggc att      3564
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
    1175                1180                1185
cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg      3609
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val
    1190                1195                1200
cgc ggc acc aag cag gat atc gag gcg gcc atc gcc ccg gac agc      3654
Arg Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser
    1205                1210                1215
aag tac gtg cgc ctc acc atc atc aat gat gcc aac acc gcc ctc      3699
Lys Tyr Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu
    1220                1225                1230
att agc ggc aag ccc gac gcc tgc aag gct gcg atc gcg cgt ctc      3744
Ile Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu
    1235                1240                1245
ggt ggc aac att cct gcg ctt ccc gtg acc cag ggc atg tgc ggc      3789
Gly Gly Asn Ile Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly
    1250                1255                1260
cac tgc ccc gag gtg gga cct tat acc aag gat atc gcc aag atc      3834
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile
    1265                1270                1275
cat gcc aac ctt gag ttc ccc gtt gtc gac ggc ctt gac ctc tgg      3879
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp
    1280                1285                1290
acc aca atc aac cag aag cgc ctc gtg cca cgc gcc acg ggc gcc      3924
Thr Thr Ile Asn Gln Lys Arg Leu Val Pro Arg Ala Thr Gly Ala
    1295                1300                1305
aag gac gaa tgg gcc cct tct tcc ttt ggc gag tac gcc ggc cag      3969
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gln
    1310                1315                1320
ctc tac gag aag cag gct aac ttc ccc caa atc gtc gag acc att      4014
Leu Tyr Glu Lys Gln Ala Asn Phe Pro Gln Ile Val Glu Thr Ile
    1325                1330                1335
tac aag caa aac tac gac gtc ttt gtc gag gtt ggg ccc aac aac      4059
Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn
    1340                1345                1350
cac cgt agc acc gca gtg cgc acc acg ctt ggt ccc cag cgc aac      4104
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gln Arg Asn
    1355                1360                1365
cac ctt gct ggc gcc atc gac aag cag aac gag gat gct tgg acg      4149
His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp Ala Trp Thr
    1370                1375                1380
acc atc gtc aag ctt gtg gct tcg ctc aag gcc cac ctt gtt cct      4194
Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro
    1385                1390                1395
ggc gtc acg atc tcg ccg ctg tac cac tcc aag ctt gtg gcg gag      4239
Gly Val Thr Ile Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu
    1400                1405                1410
gct gag gct tgc tac gct gcg ctc tgc aag ggt gaa aag ccc aag      4284
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys
    1415                1420                1425
aag aac aag ttt gtg cgc aag att cag ctc aac ggt cgc ttc aac      4329
Lys Asn Lys Phe Val Arg Lys Ile Gln Leu Asn Gly Arg Phe Asn
    1430                1435                1440
agc aag gcg gac ccc atc tcc tcg gcc gat ctt gcc agc ttt ccg      4374
Ser Lys Ala Asp Pro Ile Ser Ser Ala Asp Leu Ala Ser Phe Pro
    1445                1450                1455
cct gcg gac cct gcc att gaa gcc gcc atc tcg agc cgc atc atg      4419
Pro Ala Asp Pro Ala Ile Glu Ala Ala Ile Ser Ser Arg Ile Met
    1460                1465                1470
aag cct gtc gct ccc aag ttc tac gcg cgt ctc aac att gac gag      4464
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn Ile Asp Glu
    1475                1480                1485
cag gac gag acc cga gat ccg atc ctc aac aag gac aac gcg ccg      4509
Gln Asp Glu Thr Arg Asp Pro Ile Leu Asn Lys Asp Asn Ala Pro
    1490                1495                1500
tct tct tct tct tct tct tct tct tct tct tct tct tct tct tct      4554
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
    1505                1510                1515
ccg tcg cct gct cct tcg gcc ccc gtg caa aag aag gct gct ccc      4599
Pro Ser Pro Ala Pro Ser Ala Pro Val Gln Lys Lys Ala Ala Pro
    1520                1525                1530
gcc gcg gag acc aag gct gtt gct tcg gct gac gca ctt cgc agt      4644
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser
    1535                1540                1545
gcc ctg ctc gat ctc gac agt atg ctt gcg ctg agc tct gcc agt      4689
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser
    1550                1555                1560
gcc tcc ggc aac ctt gtt gag act gcg cct agc gac gcc tcg gtc      4734
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val
    1565                1570                1575
att gtg ccg ccc tgc aac att gcg gat ctc ggc agc cgc gcc ttc      4779
Ile Val Pro Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe
    1580                1585                1590
atg aaa acg tac ggt gtt tcg gcg cct ctg tac acg ggc gcc atg      4824
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met
    1595                1600                1605
gcc aag ggc att gcc tct gcg gac ctc gtc att gcc gcc ggc cgc      4869
Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Arg
    1610                1615                1620
cag ggc atc ctt gcg tcc ttt ggc gcc ggc gga ctt ccc atg cag      4914
Gln Gly Ile Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gln
    1625                1630                1635
gtt gtg cgt gag tcc atc gaa aag att cag gcc gcc ctg ccc aat      4959
Val Val Arg Glu Ser Ile Glu Lys Ile Gln Ala Ala Leu Pro Asn
    1640                1645                1650
ggc ccg tac gct gtc aac ctt atc cat tct ccc ttt gac agc aac      5004
Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
    1655                1660                1665
ctc gaa aag ggc aat gtc gat ctc ttc ctc gag aag ggt gtc acc      5049
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr
    1670                1675                1680
ttt gtc gag gcc tcg gcc ttt atg acg ctc acc ccg cag gtc gtg      5094
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val Val
    1685                1690                1695
cgg tac cgc gcg gct ggc ctc acg cgc aac gcc gac ggc tcg gtc      5139
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val
    1700                1705                1710
aac atc cgc aac cgt atc att ggc aag gtc tcg cgc acc gag ctc      5184
Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
    1715                1720                1725
gcc gag atg ttc atg cgt cct gcg ccc gag cac ctt ctt cag aag      5229
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gln Lys
    1730                1735                1740
ctc att gct tcc ggc gag atc aac cag gag cag gcc gag ctc gcc      5274
Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu Ala
    1745                1750                1755
cgc cgt gtt ccc gtc gct gac gac atc gcg gtc gaa gct gac tcg      5319
Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
    1760                1765                1770
ggt ggc cac acc gac aac cgc ccc atc cac gtc att ctg ccc ctc      5364
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu
    1775                1780                1785
atc atc aac ctt cgc gac cgc ctt cac cgc gag tgc ggc tac ccg      5409
Ile Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro
    1790                1795                1800
gcc aac ctt cgc gtc cgt gtg ggc gcc ggc ggt ggc att ggg tgc      5454
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys
    1805                1810                1815
ccc cag gcg gcg ctg gcc acc ttc aac atg ggt gcc tcc ttt att      5499
Pro Gln Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile
    1820                1825                1830
gtc acc ggc acc gtg aac cag gtc gcc aag cag tcg ggc acg tgc      5544
Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys
    1835                1840                1845
gac aat gtg cgc aag cag ctc gcg aag gcc act tac tcg gac gta      5589
Asp Asn Val Arg Lys Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val
    1850                1855                1860
tgc atg gcc ccg gct gcc gac atg ttc gag gaa ggc gtc aag ctt      5634
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu
    1865                1870                1875
cag gtc ctc aag aag gga acc atg ttt ccc tcg cgc gcc aac aag      5679
Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys
    1880                1885                1890
ctc tac gag ctc ttt tgc aag tac gac tcg ttc gag tcc atg ccc      5724
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro
    1895                1900                1905
ccc gca gag ctt gcg cgc gtc gag aag cgc atc ttc agc cgc gcg      5769
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg Ile Phe Ser Arg Ala
    1910                1915                1920
ctc gaa gag gtc tgg gac gag acc aaa aac ttt tac att aac cgt      5814
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr Ile Asn Arg
    1925                1930                1935
ctt cac aac ccg gag aag atc cag cgc gcc gag cgc gac ccc aag      5859
Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu Arg Asp Pro Lys
    1940                1945                1950
ctc aag atg tcg ctg tgc ttt cgc tgg tac ctg agc ctg gcg agc      5904
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser
    1955                1960                1965
cgc tgg gcc aac act gga gct tcc gat cgc gtc atg gac tac cag    5949
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gln
    1970                1975                1980
gtc tgg tgc ggt cct gcc att ggt tcc ttc aac gat ttc atc aag    5994
Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile Lys
    1985                1990                1995
gga act tac ctt gat ccg gcc gtc gca aac gag tac ccg tgc gtc    6039
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
    2000                2005                2010
gtt cag att aac aag cag atc ctt cgt gga gcg tgc ttc ttg cgc    6084
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg
    2015                2020                2025
cgt ctc gaa att ctg cgc aac gca cgc ctt tcc gat ggc gct gcc    6129
Arg Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala
    2030                2035                2040
gct ctt gtg gcc agc atc gat gac aca tac gtc ccg gcc gag aag    6174
Ala Leu Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys
    2045                2050                2055
ctg taa                                                        6180
Leu
<210>4
<211>2059
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>4
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1               5                   10                  15
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
            20                  25                  30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
        35                  40                  45
Val Ile Sar Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
    50                  55                  60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65                  70                  75                  80
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
                85                  90                  95
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
            100                 105                 110
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
        115                 120                 125
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
    130                 135                 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145                 150                 155                 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
                165                 170                 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
            180                 185                 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
        195                 200                 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
    210                 215                 220
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225                 230                 235                 240
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
                245                 250                 255
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
            260                 265                 270
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
        275                 280                 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
    290                 295                 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305                 310                 315                 320
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
                325                 330                 335
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
            340                 345                 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
        355                 360                 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
    370                 375                 380
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385                 390                 395                 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
                405                 410                 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
            420                 425                 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
        435                 440                 445
Ala Cys Thr Gly His Asp Ser Ile Ser Ala Leu Ser Ala Arg Cys Gly
    450                 455                 460
Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly Met Asp Ala Thr Phe
465                 470                 475                 480
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala Ile Tyr Thr Gly
                485                 490                 495
Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly
            500                 505                 510
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His
        515                 520                 525
Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe Gln Arg Leu Arg Thr
    530                 535                 540
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln Gln Leu Leu Ala Val
545                 550                 555                 560
Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly Met Lys Lys Gly Gly
                565                 570                 575
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg
            580                 585                 590
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser
        595                 600                 605
Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn Asp Cys Gly Thr Ser
    610                 615                 620
Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Val Ser
625                 630                 635                 640
Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Ile Thr Glu Gly Asn
                645                 650                 655
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr
            660                 665                 670
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser
        675                 680                 685
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser
    690                 695                 700
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val
705                 710                 715                 720
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr
                725                 730                 735
Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala Ile Val Pro Gly Asn
            740                 745                 750
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gln Ala Arg Val Lys
        755                 760                 765
Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His
    770                 775                 780
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu
785                 790                 795                 800
Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp Asp Lys Leu Pro Arg
                805                 810                 815
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr
            820                 825                 830
Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala Leu Cys Ile Tyr Asn
        835                 840                 845
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu
    850                 855                 860
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln Thr Ser Arg Ala Trp
865                 870                 875                 880
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser
                885                 890                 895
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His
            900                 905                 910
Tyr Glu Arg Glu Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu
        915                 920                 925
Ile Val Leu Arg Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp
    930                 935                 940
Lys Ile Arg Glu Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu
945                 950                 955                 960
Ser Glu Leu Lys Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly
                965                 970                 975
Glu Thr Leu Ala Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu
            980                 985                 990
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu
        995                 1000                1005
Leu Ala Ala Lys Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp
    1010                1015                1020
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala
    1025                1030                1035
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr
    1040                1045                1050
Tyr Gly Ile Thr Gln Asp Ile His Arg Ile Trp Pro Glu Leu His
    1055                1060                1065
Glu Val Ile Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp
    1070                1075                1080
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser
    1085                1090                1095
Gln Gln Gln Glu Phe Asp Arg Asn Met Ile Glu Met Phe Arg Leu
    1100                1105                1110
Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu Ala Arg Asp Val
    1115                1120                1125
Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu
    1130                1135                1140
Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu Ile Ser
    1145                1150                1155
Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys
    1160                1165                1170
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
    1175                1180                1185
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val
    1190                1195                1200
Arg Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser
    1205                1210                1215
Lys Tyr Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu
    1220                1225                1230
Ile Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu
    1235                1240                1245
Gly Gly Asn Ile Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly
    1250                1255                1260
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile
    1265                1270                1275
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp
    1280                1285                1290
Thr Thr Ile Asn Gln Lys Arg Leu Val Pro Arg Ala Thr Gly Ala
    1295                1300                1305
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gln
    1310                1315                1320
Leu Tyr Glu Lys Gln Ala Asn Phe Pro Gln Ile Val Glu Thr Ile
    1325                1330                1335
Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn
    1340                1345                1350
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gln Arg Asn
    1355                1360                1365
His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp Ala Trp Thr
    1370                1375                1380
Thr lle Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro
    1385                1390                1395
Gly Val Thr Ile Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu
    1400                1405                1410
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys
    1415                1420                1425
Lys Asn Lys Phe Val Arg Lys Ile Gln Leu Asn Gly Arg Phe Asn
    1430                1435                1440
Ser Lys Ala Asp Pro Ile Ser Ser Ala Asp Leu Ala Ser Phe Pro
    1445                1450                1455
Pro Ala Asp Pro Ala Ile Glu Ala Ala Ile Ser Ser Arg Ile Met
    1460                1465                1470
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn Ile Asp Glu
    1475                1480                1485
Gln Asp Glu Thr Arg Asp Pro Ile Leu Asn Lys Asp Asn Ala Pro
    1490                1495                1500
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
    1505                1510                1515
Pro Ser Pro Ala Pro Ser Ala Pro Val Gln Lys Lys Ala Ala Pro
    1520                1525                1530
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser
    1535                1540                1545
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser
    1550                1555                1560
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val
    1565                1570                1575
Ile Val Pro Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe
    1580                1585                1590
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met
    1595                1600                1605
Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Arg
    1610                1615                1620
Gln Gly Ile Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gln
    1625                1630                1635
Val Val Arg Glu Ser Ile Glu Lys Ile Gln Ala Ala Leu Pro Asn
    1640                1645                1650
Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
    1655                1660                1665
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr
    1670                1675                1680
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val Val
    1685                1690                1695
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val
    1700                1705                1710
Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
    1715                1720                1725
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gln Lys
    1730                1735                1740
Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu Ala
    1745                1750                1755
Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
    1760                1765                1770
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu
    1775                1780                1785
Ile Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro
    1790                1795                1800
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys
    1805                1810                1815
Pro Gln Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile
    1820                1825                1830
Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys
    1835                1840                1845
Asp Asn Val Arg Lys Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val
    1850                1855                1860
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu
    1865                1870                1875
Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys
    1880                1885                1890
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro
    1895                1900                1905
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg Ile Phe Ser Arg Ala
    1910                1915                1920
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr Ile Asn Arg
    1925                1930                1935
Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu Arg Asp Pro Lys
    1940                1945                1950
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser
    1955                1960                1965
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gln
    1970                1975                1980
Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile Lys
    1985                1990                1995
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
    2000                2005                2010
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg
    2015                2020                2025
Arg Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala
    2030                2035                2040
Ala Leu Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys
    2045                2050                2055
Leu
<210>5
<211>4509
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(4509)
<400>5
atg gcg ctc cgt gtc aag acg aac aag aag cca tgc tgg gag atg acc    48
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                   10                  15
aag gag gag ctg acc agc ggc aag acc gag gtg ttc aac tat gag gaa    96
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
ctc ctc gag ttc gca gag ggc gac atc gcc aag gtc ttc gga ccc gag    144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
ttc gcc gtc atc gac aag tac ccg cgc cgc gtg cgc ctg ccc gcc cgc    192
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
gag tac ctg ctc gtg acc cgc gtc acc ctc atg gac gcc gag gtc aac    240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat ctc ccc gtc    288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                85                  90                  95
aac gga gag ctc tcc gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc    336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 110
gag agt ggc cag tgc gat ctc atg ctc atc tcc tac atg ggc att gac    384
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
ttc cag aac cag ggc gac cgc gtc tac cgc ctg ctc aac acc acg ctc    432
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
acc ttt tac ggc gtg gcc cac gag ggc gag acc ctc gag tac gac att      480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
cgc gtc acc ggc ttc gcc aag cgt ctc gac ggc ggc atc tcc atg ttc      528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
ttc ttc gag tac gac tgc tac gtc aac ggc cgc ctc ctc atc gag atg      576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag ctc gac gcc ggc      624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
aag ggc gtc gtc ttc acc cgc ggc gac ctc gcc gcc cgc gcc aag atc      672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
cca aag cag gac gtc tcc ccc tac gcc gtc gcc ccc tgc ctc cac aag      720
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
acc aag ctc aac gaa aag gag atg cag acc ctc gtc gac aag gac tgg      768
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
gca tcc gtc ttt ggc tcc aag aac ggc atg ccg gaa atc aac tac aaa      816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
ctc tgc gcg cgt aag atg ctc atg att gac cgc gtc acc agc att gac      864
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
cac aag ggc ggt gtc tac ggc ctc ggt cag ctc gtc ggt gaa aag atc      912
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
ctc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag      960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
gtc atg gcc gga tcc ctc gtc tcc gac ggc tgc agc cag atg ctc aag      1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
atg tac atg atc tgg ctc ggc ctc cac ctc acc acc gga ccc ttt gac      1056
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa      1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
atc tcc ccg cac aag ggc aag ctc gtc tac gtc atg gag atc aag gag      1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac      1200
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
atc att gat gtc gac ttc gaa aag ggc cag gac ttt agc ctc gac cgc      1248
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
atc agc gac tac ggc aag ggc gac ctc aac aag aag atc gtc gtc gac     1296
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
ttt aag ggc atc gct ctc aag atg cag aag cgc tcc acc aac aag aac     1344
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
ccc tcc aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc     1392
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
    450                 455                 460
ccc gag gcc tcc aag gct tcc tcc ggc gcc agc gcc agc gcc agc gcc     1440
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465                 470                 475                 480
gcc ccg gcc aag cct gcc ttc agc gcc gat gtt ctt gcg ccc aag ccc     1488
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
                485                 490                 495
gtt gcc ctt ccc gag cac atc ctc aag ggc gac gcc ctc gcc ccc aag     1536
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
            500                 505                 510
gag atg tcc tgg cac ccc atg gcc cgc atc ccg ggc aac ccg acg ccc     1584
Glu Met Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro
        515                 520                 525
tct ttt gcg ccc tcg gcc tac aag ccg cgc aac atc gcc ttt acg ccc     1632
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro
    530                 535                 540
ttc ccc ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg     1680
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro
545                 550                 555                 560
ctc acc tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc agc atg     1728
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met
                565                 570                 575
tgc ctc ggc ccc gag ttc gcc aag ttc gac gac tcg aac acc agc cgc     1776
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg
            580                 585                 590
agc ccc gct tgg gac ctc gct ctc gtc acc cgc gcc gtg tct gtg tct     1824
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser
        595                 600                 605
gac ctc aag cac gtc aac tac cgc aac atc gac ctc gac ccc tcc aag     1872
Asp Leu Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys
    610                 615                 620
ggt acc atg gtc ggc gag ttc gac tgc ccc gcg gac gcc tgg ttc tac     1920
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr
625                 630                 635                 640
aag ggc gcc tgc aac gat gcc cac atg ccg tac tcg atc ctc atg gag     1968
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu
                645                 650                 655
atc gcc ctc cag acc tcg ggt gtg ctc acc tcg gtg ctc aag gcg ccc     2016
Ile Ala Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
            660                 665                 670
ctg acc atg gag aag gac gac atc ctc ttc cgc aac ctc gac gcc aac     2064
Leu Thr Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn
        675                 680                 685
gcc gag ttc gtg cgc gcc gac ctc gac tac cgc ggc aag act atc cgc     2112
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg
    690                 695                 700
aac gtc acc aag tgc act ggc tac agc atg ctc ggc gag atg ggc gtc     2160
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val
705                 710                 715                 720
cac cgc ttc acc ttt gag ctc tac gtc gat gat gtg ctc ttt tac aag     2208
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys
                725                 730                 735
ggc tcg acc tcg ttc ggc tgg ttc gtg ccc gag gtc ttt gcc gcc cag     2256
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln
            740                 745                 750
gcc ggc ctc gac aac ggc cgc aag tcg gag ccc tgg ttc att gag aac     2304
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn
        755                 760                 765
aag gtt ccg gcc tcg cag gtc tcc tcc ttt gac gtg cgc ccc aac ggc     2352
Lys Val Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly
    770                 775                 780
agc ggc cgc acc gcc atc ttc gcc aac gcc ccc agc ggc gcc cag ctc     2400
Ser Gly Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu
785                 790                 795                 800
aac cgc cgc acg gac cag ggc cag tac ctc gac gcc gtc gac att gtc     2448
Asn Arg Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val
                805                 810                 815
tcc ggc agc ggc aag aag agc ctc ggc tac gcc cac ggt tcc aag acg     2496
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr
            820                 825                 830
gtc aac ccg aac gac tgg ttc ttc tcg tgc cac ttt tgg ttt gac tcg     2544
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser
        835                 840                 845
gtc atg ccc gga agt ctc ggt gtc gag tcc atg ttc cag ctc gtc gag     2592
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu
    850                 855                 860
gcc atc gcc gcc cac gag gat ctc gct ggc aag cac ggc att gcc aac     2640
Ala Ile Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn
865                 870                 875                 880
ccc acc ttt gtg cac gcc ccg ggc aag atc agc tgg aag tac cgc ggc     2688
Pro Thr Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly
                885                 890                 895
cag ctc acg ccc aag agc aag aag atg gac tcg gag gtc cac atc gtg     2736
Gln Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val
            900                 905                 910
tcc gtg gac gcc cac gac ggc gtt gtc gac ctc gtc gcc gac ggc ttc     2784
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe
        915                 920                 925
ctc tgg gcc gac agc ctc cgc gtc tac tcg gtg agc aac att cgc gtg     2832
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val
    930                 935                 940
cgc atc gcc tcc ggt gag gcc cct gcc gcc gcc tcc tcc gcc gcc tct     2880
Arg Ile Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser
945                 950                 955                 960
gtg ggc tcc tcg gct tcg tcc gtc gag cgc acg cgc tcg agc ccc gct     2928
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala
                965                 970                 975
gtc gcc tcc ggc ccg gcc cag acc atc gac ctc aag cag ctc aag acc   2976
Val Ala Ser Gly Pro Ala Gln Thr Ile Asp Leu Lys Gln Leu Lys Thr
            980                 985                 990
gag ctc ctc gag ctc gat gcc ccg ctc tac ctc tcg cag gac ccg acc   3024
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr
        995                 1000                1005
agc ggc cag ctc aag aag cac acc gac gtg gcc tcc ggc cag gcc       3069
Ser Gly Gln Leu Lys Lys His Thr Asp Val Ala Ser Gly Gln Ala
    1010                1015                1020
acc atc gtg cag ccc tgc acg ctc ggc gac ctc ggt gac cgc tcc       3114
Thr Ile Val Gln Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser
    1025                1030                1035
ttc atg gag acc tac ggc gtc gtc gcc ccg ctg tac acg ggc gcc       3159
Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala
    1040                1045                1050
atg gcc aag ggc att gcc tcg gcg gac ctc gtc atc gcc gcc ggc       3204
Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly
    1055                1060                1065
aag cgc aag atc ctc ggc tcc ttt ggc gcc ggc ggc ctc ccc atg       3249
Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met
    1070                1075                1080
cac cac gtg cgc gcc gcc ctc gag aag atc cag gcc gcc ctg cct       3294
His His Val Arg Ala Ala Leu Glu Lys Ile Gln Ala Ala Leu Pro
    1085                1090                1095
cag ggc ccc tac gcc gtc aac ctc atc cac tcg cct ttt gac agc       3339
Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser
    1100                1105                1110
aac ctc gag aag ggc aac gtc gat ctc ttc ctc gag aag ggc gtc       3384
Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val
    1115                1120                1125
act gtg gtg gag gcc tcg gca ttc atg acc ctc acc ccg cag gtc       3429
Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val
    1130                1135                1140
gtg cgc tac cgc gcc gcc ggc ctc tcg cgc aac gcc gac ggt tcg       3474
Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
    1145                1150                1155
gtc aac atc cgc aac cgc atc atc ggc aag gtc tcg cgc acc gag       3519
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu
    1160                1165                1170
ctc gcc gag atg ttc atc cgc ccg gcc ccg gag cac ctc ctc gag       3564
Leu Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu
    1175                1180                1185
aag ctc atc gcc tcg ggc gag atc acc cag gag cag gcc gag ctc       3609
Lys Leu Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu
    1190                1195                1200
gcg cgc cgc gtt ccc gtc gcc gac gat atc gct gtc gag gct gac       3654
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp
    1205                1210                1215
tcg ggc ggc cac acc gac aac cgc ccc atc cac gtc atc ctc ccg       3699
Ser Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro
    1220                1225                1230
ctc atc atc aac ctc cgc aac cgc ctg cac cgc gag tgc ggc tac      3744
Leu lle Ile Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr
    1235                1240                1245
ccc gcg cac ctc cgc gtc cgc gtt ggc gcc ggc ggt ggc gtc ggc      3789
Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly
    1250                1255                1260
tgc ccg cag gcc gcc gcc gcc gcg ctc acc atg ggc gcc gcc ttc      3834
Cys Pro Gln Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala Phe
    1265                1270                1275
atc gtc acc ggc act gtc aac cag gtc gcc aag cag tcc ggc acc      3879
Ile Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr
    1280                1285                1290
tgc gac aac gtg cgc aag cag ctc tcg cag gcc acc tac tcg gat      3924
Cys Asp Asn Val Arg Lys Gln Leu Ser Gln Ala Thr Tyr Ser Asp
    1295                1300                1305
atc tgc atg gcc ccg gcc gcc gac atg ttc gag gag ggc gtc aag      3969
Ile Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys
    1310                1315                1320
ctc cag gtc ctc aag aag gga acc atg ttc ccc tcg cgc gcc aac      4014
Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn
    1325                1330                1335
aag ctc tac gag ctc ttt tgc aag tac gac tcc ttc gac tcc atg      4059
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser Met
    1340                1345                1350
cct cct gcc gag ctc gag cgc atc gag aag cgt atc ttc aag cgc      4104
Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe Lys Arg
    1355                1360                1365
gca ctc cag gag gtc tgg gag gag acc aag gac ttt tac att aac      4149
Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile Asn
    1370                1375                1380
ggt ctc aag aac ccg gag aag atc cag cgc gcc gag cac gac ccc      4194
Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
    1385                1390                1395
aag ctc aag atg tcg ctc tgc ttc cgc tgg tac ctt ggt ctt gcc      4239
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala
    1400                1405                1410
agc cgc tgg gcc aac atg ggc gcc ccg gac cgc gtc atg gac tac      4284
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr
    1415                1420                1425
cag gtc tgg tgt ggc ccg gcc att ggc gcc ttc aac gac ttc atc      4329
Gln Val Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile
    1430                1435                1440
aag ggc acc tac ctc gac ccc gct gtc tcc aac gag tac ccc tgt      4374
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys
    1445                1450                1455
gtc gtc cag atc aac ctg caa atc ctc cgt ggt gcc tgc tac ctg      4419
Val Val Gln Ile Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu
    1460                1465                1470
cgc cgt ctc aac gcc ctg cgc aac gac ccg cgc att gac ctc gag      4464
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu
    1475                1480                1485
acc gag gat gct gcc ttt gtc tac gag ccc acc aac gcg ctc taa       4509
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu
    1490                1495                1500
<210>6
<211>1502
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>6
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                  10                  15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                85                  90                  95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 110
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
    450                 455                 460
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465                 470                 475                 480
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
                485                 490                 495
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
            500                 505                 510
Glu Met Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro
        515                 520                 525
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro
    530                 535                 540
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro
545                 550                 555                 560
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met
                565                 570                 575
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg
            580                 585                 590
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser
        595                 600                 605
Asp Leu Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys
    610                 615                 620
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr
625                 630                 635                 640
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu
                645                 650                 655
Ile Ala Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
            660                 665                 670
Leu Thr Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn
        675                 680                 685
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg
    690                 695                 700
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val
705                 710                 715                 720
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys
                725                 730                 735
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln
            740                 745                 750
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn
        755                 760                 765
Lys Val Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly
    770                 775                 780
Ser Gly Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu
785                 790                 795                 800
Asn Arg Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val
                805                 810                 815
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr
            820                 825                 830
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser
        835                 840                 845
Val Mer Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu
    850                 855                 860
Ala Ile Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn
865                 870                 875                 880
Pro Thr Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly
                885                 890                 895
Gln Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val
            900                 905                 910
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe
        915                 920                 925
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val
    930                 935                 940
Arg Ile Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser
945                 950                 955                 960
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala
                965                 970                 975
Val Ala Ser Gly Pro Ala Gln Thr Ile Asp Leu Lys Gln Leu Lys Thr
            980                 985                 990
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr
        995                 1000                 1005
Ser Gly Gln Leu Lys Lys His Thr Asp Val Ala Ser Gly Gln Ala
    1010                1015                1020
Thr Ile Val Gln Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser
    1025                1030                1035
Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala
    1040                1045                1050
Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly
    1055                1060                1065
Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met
    1070                1075                1080
His His Val Arg Ala Ala Leu Glu Lys Ile Gln Ala Ala Leu Pro
    1085                1090                1095
Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser
    1100                1105                1110
Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val
    1115                1120                1125
Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val
    1130                1135                1140
Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
    1145                1150                1155
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu
    1160                1165                1170
Leu Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu
    1175                1180                1185
Lys Leu Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu
    1190                1195                1200
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp
    1205                1210                1215
Ser Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro
    1220                1225                1230
Leu Ile Ile Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr
    1235                1240                1245
Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly
    1250                1255                1260
Cys Pro Gln Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala Phe
    1265                1270                1275
Ile Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr
    1280                1285                1290
Cys Asp Asn Val Arg Lys Gln Leu Ser Gln Ala Thr Tyr Ser Asp
    1295                1300                1305
Ile Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys
    1310                1315                1320
Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn
    l325                1330                1335
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser Met
    1340                1345                1350
Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe Lys Arg
    1355                1360                1365
Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile Asn
    1370                1375                1380
Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
    1385                1390                1395
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala
    1400                1405                1410
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr
    1415                1420                1425
Gln Val Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile
    1430                1435                1440
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys
    1445                1450                1455
Val Val Gln Ile Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu
    1460                1465                1470
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu
    1475                1480                1485
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu
    1490                1495                1500
<210>7
<211>1500
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>7
atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc    48
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1               5                   10                  15
att gcc atc atc ggc atg tcg gcc atc ctc ccc tgc ggc acg acc gtg    96
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
            20                  25                      30
cgc gag tcg tgg gag acc atc cgc gcc ggc atc gac tgc ctg tcg gat      144
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
        35                  40                  45
ctc ccc gag gac cgc gtc gac gtg acg gcg tac ttt gac ccc gtc aag      192
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
    50                  55                  60
acc acc aag gac aag atc tac tgc aag cgc ggt ggc ttc att ccc gag      240
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65                  70                  75                  80
tac gac ttt gac gcc cgc gag ttc gga ctc aac atg ttc cag atg gag      288
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
                85                  90                  95
gac tcg gac gca aac cag acc atc tcg ctt ctc aag gtc aag gag gcc      336
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
            100                 105                 110
ctc cag gac gcc ggc atc gac gcc ctc ggc aag gaa aag aag aac atc      384
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
        115                 120                 125
ggc tgc gtg ctc ggc att ggc ggc ggc caa aag tcc agc cac gag ttc      432
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
    130                 135                 140
tac tcg cgc ctt aat tat gtt gtc gtg gag aag gtc ctc cgc aag atg      480
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145                 150                 155                 160
ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc      528
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
                165                 170                 175
aac ttc ccc gag tgg cgc ctc gac tcc ttc cct ggc ttc ctc ggc aac      576
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
            180                 185                 190
gtc acc gcc ggt cgc tgc acc aac acc ttc aac ctc gac ggc atg aac      624
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
        195                 200                 205
tgc gtt gtc gac gcc gca tgc gcc tcg tcc ctc atc gcc gtc aag gtc      672
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
    210                 215                 220
gcc atc gac gag ctg ctc tac ggt gac tgc gac atg atg gtc acc ggt      720
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225                 230                 235                 240
gcc acc tgc acg gat aac tcc atc ggc atg tac atg gcc ttc tcc aag      768
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
                245                 250                 255
acc ccc gtg ttc tcc acg gac ccc agc gtg cgc gcc tac gac gaa aag      816
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
            260                 265                 270
aca aag ggc atg ctc atc ggc gag ggc tcc gcc atg ctc gtc ctc aag      864
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
        275                 280                 285
cgc tac gcc gac gcc gtc cgc gac ggc gat gag atc cac gct gtt att      912
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
    290                 295                 300
cgc ggc tgc gcc tcc tcc agt gat ggc aag gcc gcc ggc atc tac acg    960
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305                 310                 315                 320
ccc acc att tcg ggc cag gag gag gcc ctc cgc cgc gcc tac aac cgc    1008
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
                325                 330                 335
gcc tgt gtc gac ccg gcc acc gtc act crc gtc gag ggt cac ggc acc    1056
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
            340                 345                 350
ggt act ccc gtt ggc gac cgc atc gag ctc acc gcc ttg cgc aac ctc    1104
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
        355                 360                 365
ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc gct gtg ggc    1152
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
    370                 375                 380
agc atc aag tcc agc atc ggc cat ctc aag gcc gtc gcc ggt ctc gcc    1200
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385                 390                 395                 400
ggt atg atc aag gtc atc atg gcg ctc aag cac aag act ctc ccg ggc    1248
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
                405                 410                 415
acc atc aac gtc gac aac cca ccc aac ctc tac gac aac acg ccc atc    1296
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
            420                 425                 430
aac gag tcc tcg ctc tac att aac acc atg aac cgc ccc tgg ttc ccg    1344
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
        435                 440                 445
ccc cct ggt gtg ccc cgc cgc gcc ggc att tcg agc ttt ggc ttt ggt    1392
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
    450                 455                 460
ggc gcc aac tac cac gcc gtc ctc gag gag gcc gag ccc gag cac acg    1440
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465                 470                 475                 480
acc gcg tac cgc ctc aac aag cgc ccg cag ccc gtg ctc atg atg gcc    1488
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
                485                 490                 495
gcc acg ccc gcg                                                    1500
Ala Thr Pro Ala
            500
<210>8
<211>500
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>8
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1               5                   10                  15
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
            20                  25                  30
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
        35                  40                  45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
    50                  55                  60
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65                  70                  75                  80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
                85                  90                  95
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
            100                 105                 110
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
        115                 120                 125
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
    130                 135                 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145                 150                 155                 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
                165                 170                 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
            180                 185                 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
        195                 200                 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
    210                 215                 220
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225                 230                 235                 240
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
                245                 250                 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
            260                 265                 270
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
        275                 280                 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
    290                 295                 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305                 310                 315                 320
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
                325                 330                 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
            340                 345                 350
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
        355                 360                 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
    370                 375                 380
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385                 390                 395                 400
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
                405                 410                 415
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
            420                 425                 430
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
        435                 440                 445
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
    450                 455                 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465                 470                 475                 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
                485                 490                 495
Ala Thr Pro Ala
           500
<210>9
<211>1278
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1278)
<400>9
gat gtc acc aag gag gcc tgg cgc ctc ccc cgc gag ggc gtc agc ttc    48
Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe
1               5                   10                  15
cgc gcc aag ggc atc gcc acc aac ggc gct gtc gcc gcg ctc ttc tcc    96
Arg Ala Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser
            20                  25                  30
ggc cag ggc gcg cag tac acg cac atg ttt agc gag gtg gcc atg aac      144
Gly Gln Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn
        35                  40                  45
tgg ccc cag ttc cgc cag agc att gcc gcc atg gac gcc gcc cag tcc      192
Trp Pro Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser
    50                  55                  60
aag gtc gct gga agc gac aag gac ttt gag cgc gtc tcc cag gtc ctc      240
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu
65                  70                  75                  80
tac ccg cgc aag ccg tac gag cgt gag ccc gag cag gac cac aag aag      288
Tyr Pro Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys
                85                  90                  95
atc tcc ctc acc gcc tac tcg cag ccc tcg acc ctg gcc tgc gct ctc      336
Ile Ser Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu
            100                 105                 110
ggt gcc ttt gag atc ttc aag gag gcc ggc ttc acc ccg gac ttt gcc      384
Gly Ala Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala
        115                 120                 125
gcc ggc cat tcg ctc ggt gag ttc gcc gcc ctc tac gcc gcg ggc tgc      432
Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys
    130                 135                 140
gtc gac cgc gac gag ctc ttt gag ctt gtc tgc cgc cgc gcc cgc atc      480
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile
145                 150                 155                 160
atg ggc ggc aag gac gca ccg gcc acc ccc aag ggc tgc atg gcc gcc      528
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala
                165                 170                 175
gtc att ggc ccc aac gcc gag aac atc aag gtc cag gcc gcc aac gtc      576
Val Ile Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val
            180                 185                 190
tgg ctc ggc aac tcc aac tcg cct tcg cag acc gtc atc acc ggc tcc      624
Trp Leu Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser
        195                 200                 205
gtc gaa ggt atc cag gcc gag agc gcc cgc ctc cag aag gag ggc ttc      672
Val Glu Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe
    210                 215                 220
cgc gtc gtg cct ctt gcc tgc gag agc gcc ttc cac tcg ccc cag atg      720
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met
225                 230                 235                 240
gag aac gcc tcg tcg gcc ttc aag gac gtc atc tcc aag gtc tcc ttc      768
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe
                245                 250                 255
cgc acc ccc aag gcc gag acc aag ctc ttc agc aac gtc tct ggc gag      816
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu
            260                 265                 270
acc tac ccc acg gac gcc cgc gag atg ctt acg cag cac atg acc agc      864
Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser
        275                 280                 285
agc gtc aag ttc ctc acc cag gtc cgc aac atg cac cag gcc ggt gcg      912
Ser Val Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala
    290                 295                 300
cgc atc ttt gtc gag ttc gga ccc aag cag gtg ctc tcc aag ctt gtc      960
Arg Ile Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val
305                 310                 315                 320
tcc gag acc ctc aag gat gac ccc tcg gtt gtc acc gtc tct gtc aac    1008
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn
                325                 330                 335
ccg gcc tcg ggc acg gat tcg gac atc cag ctc cgc gac gcg gcc gtc    1056
Pro Ala Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val
            340                 345                 350
cag ctc gtt gtc gct ggc gtc aac ctt cag ggc ttt gac aag tgg gac    1104
Gln Leu Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp
        355                 360                 365
gcc ccc gat gcc acc cgc atg cag gcc atc aag aag aag cgc act acc    1152
Ala Pro Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr
    370                 375                 380
ctc cgc ctt tcg gcc gcc acc tac gtc tcg gac aag acc aag aag gtc    1200
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val
385                 390                 395                 400
cgc gac gcc gcc atg aac gat ggc cgc tgc gtc acc tac ctc aag ggc    1248
Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly
                405                 410                 415
gcc gca ccg ctc atc aag gcc ccg gag ccc                            1278
Ala Ala Pro Leu Ile Lys Ala Pro Glu Pro
            420                 425
<210>10
<211>426
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>10
Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe
1               5                   10                  15
Arg Ala Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser
            20                  25                  30
Gly Gln Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn
        35                  40                  45
Trp Pro Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser
    50                  55                  60
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu
65                  70                  75                  80
Tyr Pro Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys
                85                  90                  95
Ile Ser Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu
            100                 105                 110
Gly Ala Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala
        115                 120                 125
Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys
    130                 135                 140
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile
145                 150                 155                 160
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala
                165                 170                 175
Val Ile Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val
            180                 185                 190
Trp Leu Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser
        195                 200                 205
Val Glu Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe
    210                 215                 220
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met
225                 230                 235                 240
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe
                245                 250                 255
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu
            260                 265                 270
Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser
        275                 280                 285
Ser Val Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala
    290                 295                 300
Arg Ile Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val
305                 310                 315                 320
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn
                325                 330                 335
Pro Ala Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val
            340                 345                 350
Gln Leu Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp
        355                 360                 365
Ala Pro Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr
    370                 375                 380
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val
385                 390                 395                 400
 Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly
                405                  410                 415
Ala Ala Pro Leu Ile Lys Ala Pro Glu Pro
            420                 425
<210>11
<211>5
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>X=any amino acid
<400>11
Gly His Ser Xaa Gly
1               5
<210>12
<211>258
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(258)
<400>12
gct gtc tcg aac gag ctt ctt gag aag gcc gag act gtc gtc atg gag    48
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu
1               5                   10                  15
gtc ctc gcc gcc aag acc ggc tac gag acc gac atg atc gag gct gac    96
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ala Asp
            20                  25                  30
atg gag ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc gag    144
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
        35                  40                  45
atc ctc tcc gag gtc cag gcc atg ctc aat gtc gag gcc aag gat gtc    192
ILe Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
    50                  55                  60
gat gcc ctc agc cgc act cgc act gtt ggt gag gtt gtc aac gcc atg    240
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met
65                  70                  75                  80
aag gcc gag atc gct ggc                                            258
Lys Ala Glu Ile Ala Gly
                85
<210>13
<211>86
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>13
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu
1               5                   10                  15
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ala Asp
            20                  25                  30
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
        35                  40                  45
Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
    50                  55                  60
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met
65                  70                  75                  80
Lys Ala Glu Ile Ala Gly
                85
<210>14
<211>5
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>14
Leu Gly Ile Asp Ser
1               5
<210>15
<211>21
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>15
Ala Pro Ala Pro Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser
1               5                   10                  15
Ala Pro Ala Pro Ala
            20
<210>16
<211>3006
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<400>16
gcccccgccc cggtcaaggc tgctgcgcct gccgcccccg ttgcctcggc ccctgccccg  60
gctgtctcga acgagcttct tgagaaggcc gagactgtcg tcatggaggt cctcgccgcc  120
aagaccggct acgagaccga catgatcgag gctgacatgg agctcgagac cgagctcggc  180
attgactcca tcaagcgtgt cgagatcctc tccgaggtcc aggccatgct caatgtcgag  240
gccaaggatg tcgatgccct cagccgcact cgcactgttg gtgaggttgt caacgccatg  300
aaggccgaga tcgctggcag ctctgccccg gcgcctgctg ccgctgctcc ggctccggcc  360
aaggctgccc ctgccgccgc tgcgcctgct gtctcgaacg agcttctcga gaaggccgag  420
accgtcgtca tggaggtcct cgccgccaag actggctacg agactgacat gatcgagtcc    480
gacatggagc tcgagactga gctcggcatt gactccatca agcgtgtcga gatcctctcc    540
gaggttcagg ccatgctcaa cgtcgaggcc aaggacgtcg acgctctcag ccgcactcgc    600
actgtgggtg aggtcgtcaa cgccatgaag gctgagatcg ctggtggctc tgccccggcg    660
cctgccgccg ctgccccagg tccggctgct gccgcccctg cgcctgccgc cgccgcccct    720
gctgtctcga acgagcttct tgagaaggcc gagaccgtcg tcatggaggt cctcgccgcc    780
aagactggct acgagactga catgatcgag tccgacatgg agctcgagac cgagctcggc    840
attgactcca tcaagcgtgt cgagattctc tccgaggtcc aggccatgct caacgtcgag    900
gccaaggacg tcgacgctct cagccgcacc cgcactgttg gcgaggtcgt cgatgccatg    960
aaggccgaga tcgctggtgg ctctgccccg gcgcctgccg ccgctgctcc tgctccggct    1020
gctgccgccc ctgcgcctgc cgcccctgcg cctgctgtct cgagcgagct tctcgagaag    1080
gccgagactg tcgtcatgga ggtcctcgcc gccaagactg gctacgagac tgacatgatc    1140
gagtccgaca tggagctcga gaccgagctc ggcattgact ccatcaagcg tgtcgagatt    1200
ctctccgagg tccaggccat gctcaacgtc gaggccaagg acgtcgacgc tctcagccgc    1260
acccgcactg ttggcgaggt cgtcgatgcc atgaaggccg agatcgctgg tggctctgcc    1320
ccggcgcctg ccgccgctgc tcctgctccg gctgctgccg cccctgcgcc tgccgcccct    1380
gcgcctgccg cccctgcgcc tgctgtctcg agcgagcttc tcgagaaggc cgagactgtc    1440
gtcatggagg tcctcgccgc caagactggc tacgagactg acatgattga gtccgacatg    1500
gagctcgaga ccgagctcgg cattgactcc atcaagcgtg tcgagattct ctccgaggtt    1560
caggccatgc tcaacgtcga ggccaaggac gtcgacgctc tcagccgcac tcgcactgtt    1620
ggtgaggtcg tcgatgccat gaaggctgag atcgctggca gctccgcctc ggcgcctgcc    1680
gccgctgctc ctgctccggc tgctgccgct cctgcgcccg ctgccgccgc ccctgctgtc    1740
tcgaacgagc ttctcgagaa agccgagact gtcgtcatgg aggtcctcgc cgccaagact    1800
ggctacgaga ctgacatgat cgagtccgac atggagctcg agactgagct cggcattgac    1860
tccatcaagc gtgtcgagat cctctccgag gttcaggcca tgctcaacgt cgaggccaag    1920
gacgtcgatg ccctcagccg cacccgcact gttggcgagg ttgtcgatgc catgaaggcc    1980
gagatcgctg gtggctctgc cccggcgcct gccgccgctg cccctgctcc ggctgccgcc    2040
gcccctgctg tctcgaacga gcttctcgag aaggccgaga ctgtcgtcat ggaggtcctc    2100
gccgccaaga ctggctacga gaccgacatg atcgagtccg acatggagct cgagaccgag    2160
ctcggcattg actccatcaa gcgtgtcgag attctctccg aggttcaggc catgctcaac    2220
gtcgaggcca aggacgtcga tgctctcagc cgcactcgca ctgttggcga ggtcgtcgat    2280
gccatgaagg ctgagatcgc cggcagctcc gccccggcgc ctgccgccgc tgctcctgct    2340
ccggctgctg ccgctcctgc gcccgctgcc gctgcccctg ctgtctcgag cgagcttctc    2400
gagaaggccg agaccgtcgt catggaggtc ctcgccgcca agactggcta cgagactgac    2460
atgattgagt ccgacatgga gctcgagact gagctcggca ttgactccat caagcgtgtc  2520
gagatcctct ccgaggttca ggccatgctc aacgtcgagg ccaaggacgt cgatgccctc  2580
agccgcaccc gcactgttgg cgaggttgtc gatgccatga aggccgagat cgctggtggc  2640
tctgccccgg cgcctgccgc cgctgcccct gctccggctg ccgccgcccc tgctgtctcg  2700
aacgagcttc ttgagaaggc cgagaccgtc gtcatggagg tcctcgccgc caagactggc  2760
tacgagaccg acatgatcga gtccgacatg gagctcgaga ccgagctcgg cattgactcc  2820
atcaagcgtg tcgagattct ctccgaggtt caggccatgc tcaacgtcga ggccaaggac  2880
gtcgacgctc tcagccgcac tcgcactgtt ggcgaggtcg tcgatgccat gaaggctgag  2940
atcgctggtg gctctgcccc ggcgcctgcc gccgctgctc ctgcctcggc tggcgccgcg  3000
cctgcg                                                             3006
<210>17
<211>2133
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(2133)
<400>17
ttt ggc gct ctc ggc ggc ttc atc tcg cag cag gcg gag cgc ttc gag    48
Phe Gly Ala Leu Gly Gly Phe Ile Ser Gln Gln Ala Glu Arg Phe Glu
1               5                   l0                  15
ccc gcc gaa atc ctc ggc ttc acg ctc atg tgc gcc aag ttc gcc aag    96
Pro Ala Glu Ile Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys
            20                  25                  30
gct tcc ctc tgc acg gct gtg gct ggc ggc cgc ccg gcc ttt atc ggt    144
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe Ile Gly
        35                  40                  45
gtg gcg cgc ctt gac ggc cgc ctc gga ttc act tcg cag ggc act tct    192
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser
    50                  55                  60
gac gcg ctc aag cgt gcc cag cgt ggt gcc atc ttt ggc ctc tgc aag    240
Asp Ala Leu Lys Arg Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys
65                  70                  75                  80
acc atc ggc ctc gag tgg tcc gag tct gac gtc ttt tcc cgc ggc gtg    288
Thr Ile Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val
                85                  90                  95
gac att gct cag ggc atg cac ccc gag gat gcc gcc gtg gcg att gtg    336
Asp Ile Ala Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val
            100                 105                 110
cgc gag atg gcg tgc gct gac att cgc att cgc gag gtc ggc att ggc    384
Arg Glu Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly
        115                 120                 125
gca aac cag cag cgc tgc acg atc cgt gcc gcc aag ctc gag acc ggc    432
Ala Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
    130                 135                 140
aac ccg cag cgc cag atc gcc aag gac gac gtg ctg ctc gtt tct ggc    480
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser Gly
145                 150                 155                 160
ggc gct cgc ggc atc acg cct ctt tgc atc cgg gag atc acg cgc cag     528
Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr Arg Gln
                165                 170                 175
atc gcg ggc ggc aag tac att ctg ctt ggc cgc agc aag gtc tct gcg     576
Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys Val Ser Ala
            180                 185                 190
agc gaa ccg gca tgg tgc gct ggc atc act gac gag aag gct gtg caa     624
Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu Lys Ala Val Gln
        195                 200                 205
aag gct gct acc cag gag ctc aag cgc gcc ttt agc gct ggc gag ggc     672
Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly
    210                 215                 220
ccc aag ccc acg ccc cgc gct gtc act aag ctt gtg ggc tct gtt ctt     720
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu
225                 230                 235                 240
ggc gct cgc gag gtg cgc agc tct att gct gcg att gaa gcg ctc ggc     768
Gly Ala Arg Glu Val Arg Ser Ser Ile Ala Ala Ile Glu Ala Leu Gly
                245                 250                 255
ggc aag gcc atc tac tcg tcg tgc gac gtg aac tct gcc gcc gac gtg     816
Gly Lys Ala Ile Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val
            260                 265                 270
gcc aag gcc gtg cgc gat gcc gag tcc cag ctc ggt gcc cgc gtc tcg     864
Ala Lys Ala Val Arg Asp Ala Glu Ser Gln Leu Gly Ala Arg Val Ser
       275                 280                 285
ggc atc gtt cat gcc tcg ggc gtg ctc cgc gac cgt ctc atc gag aag     912
Gly Ile Val His Ala Ser Gly Val Leu Arg Asp Arg Leu Ile Glu Lys
    290                 295                 300
aag ctc ccc gac gag ttc gac gcc gtc ttt ggc acc aag gtc acc ggt     960
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly
305                 310                 315                 320
ctc gag aac ctc ctc gcc gcc gtc gac cgc gcc aac ctc aag cac atg     1008
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met
                325                 330                 335
gtc ctc ttc agc tcg ctc gcc ggc ttc cac ggc aac gtc ggc cag tct     1056
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser
            340                 345                 350
gac tac gcc atg gcc aac gag gcc ctt aac aag atg ggc ctc gag ctc     1104
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu
        355                 360                 365
gcc aag gac gtc tcg gtc aag tcg atc tgc ttc ggt ccc tgg gac ggt     1152
Ala Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
    370                 375                 380
ggc atg gtg acg ccg cag ctc aag aag cag ttc cag gag atg ggc gtg     1200
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly Val
385                 390                 395                 400
cag atc atc ccc cgc gag ggc ggc gct gat acc gtg gcg cgc atc gtg     1248
Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg Ile Val
                405                 410                 415
ctc ggc tcc tcg ccg gct gag atc ctt gtc ggc aac tgg cgc acc ccg     1296
Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp Arg Thr Pro
            420                 425                 430
tcc aag aag gtc ggc tcg gac acc atc acc ctg cac cgc aag att tcc     1344
Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His Arg Lys Ile Ser
        435                 440                 445
gcc aag tcc aac ccc ttc ctc gag gac cac gtc atc cag ggc cgc cgc     1392
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val Ile Gln Gly Arg Arg
    450                 455                 460
gtg ctg ccc atg acg ctg gcc att ggc tcg ctc gcg gag acc tgc ctc     1440
Val Leu Pro Met Thr Leu Ala Ile Gly Ser Leu Ala Glu Thr Cys Leu
465                 470                 475                 480
ggc ctc ttc ccc ggc tac tcg ctc tgg gcc att gac gac gcc cag ctc     1488
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala Ile Asp Asp Ala Gln Leu
                485                 490                 495
ttc aag ggt gtc act gtc gac ggc gac gtc aac tgc gag gtg acc ctc     1536
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu
            500                 505                 510
acc ccg tcg acg gcg ccc tcg ggc cgc gtc aac gtc cag gcc acg ctc     1584
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gln Ala Thr Leu
        515                 520                 525
aag acc ttt tcc agc ggc aag ctg gtc ccg gcc tac cgc gcc gtc atc     1632
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val Ile
    530                 535                 540
gtg ctc tcc aac cag ggc gcg ccc ccg gcc aac gcc acc atg cag ccg     1680
Val Leu Ser Asn Gln Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro
545                 550                 555                 560
ccc tcg ctc gat gcc gat ccg gcg ctc cag ggc tcc gtc tac gac ggc     1728
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly
                565                 570                 575
aag acc ctc ttc cac ggc ccg gcc ttc cgc ggc atc gat gac gtg ctc     1776
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu
            580                 585                 590
tcg tgc acc aag agc cag ctt gtg gcc aag tgc agc gct gtc ccc ggc     1824
Ser Cys Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly
        595                 600                 605
tcc gac gcc gct cgc ggc gag ttt gcc acg gac act gac gcc cat gac     1872
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
    610                 615                 620
ccc ttc gtg aac gac ctg gcc ttt cag gcc atg ctc gtc tgg gtg cgc     1920
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val Arg
625                 630                 635                 640
cgc acg ctc ggc cag gct gcg ctc ccc aac tcg atc cag cgc atc gtc     1968
Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg Ile Val
                645                 650                 655
cag cac cgc ccg gtc ccg cag gac aag ccc ttc tac att acc ctc cgc     2016
Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile Thr Leu Arg
            660                 665                 670
tcc aac cag tcg ggc ggt cac tcc cag cac aag cac gcc ctt cag ttc     2064
Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His Ala Leu Gln Phe
        675                 680                 685
cac aac gag cag ggc gat ctc ttc att gat gtc cag gct tcg gtc atc     2112
His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val Gln Ala Ser Val Ile
    690                 695                 700
gcc acg gac agc ctt gcc ttc                                        2133
Ala Thr Asp Ser Leu Ala Phe
705                 710
<210>18
<211>711
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>18
Phe Gly Ala Leu Gly Gly Phe Ile Ser Gln Gln Ala Glu Arg Phe Glu
1               5                   10                  15
Pro Ala Glu Ile Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys
            20                  25                  30
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe Ile Gly
        35                  40                  45
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser
    50                  55                  60
Asp Ala Leu Lys Arg Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys
65                  70                  75                  80
Thr Ile Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val
                85                  90                  95
Asp Ile Ala Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val
            100                 105                 110
Arg Glu Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly
        115                 120                 125
Ala Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
    130                 135                 140
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser Gly
145                 150                 155                 160
Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr Arg Gln
                165                 170                 175
Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys Val Ser Ala
            180                 185                 190
Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu Lys Ala Val Gln
        195                 200                 205
Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly
    210                 215                 220
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu
225                 230                 235                 240
Gly Ala Arg Glu Val Arg Ser Ser Ile Ala Ala Ile Glu Ala Leu Gly
                245                 250                 255
Gly Lys Ala Ile Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val
            260                 265                 270
Ala Lys Ala Val Arg Asp Ala Glu Ser Gln Leu Gly Ala Arg Val Ser
        275                 280                 285
Gly Ile Val His Ala Ser Gly Val Leu Arg Asp Arg Leu Ile Glu Lys
    290                 295                 300
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly
305                 310                 315                 320
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met
                325                 330                 335
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser
            340                 345                 350
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu
        355                 360                 365
Ala Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
    370                 375                 380
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly Val
385                 390                 395                 400
Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg Ile Val
                405                 410                 415
Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp Arg Thr Pro
            420                 425                 430
Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His Arg Lys Ile Ser
        435                 440                 445
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val Ile Gln Gly Arg Arg
    450                 455                 460
Val Leu Pro Met Thr Leu Ala Ile Gly Ser Leu Ala Glu Thr Cys Leu
465                 470                 475                 480
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala Ile Asp Asp Ala Gln Leu
                485                 490                 495
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu
            500                 505                 510
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gln Ala Thr Leu
        515                 520                 525
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val Ile
    530                 535                 540
Val Leu Ser Asn Gln Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro
545                 550                 555                 560
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly
                565                 570                 575
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu
            580                 585                 590
Ser Cys Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly
        595                 600                 605
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
    610                 615                 620
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val Arg
625                 630                 635                 640
Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg Ile Val
                645                 650                 655
Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile Thr Leu Arg
            660                 665                 670
Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His Ala Leu Gln Phe
        675                 680                 685
His Asn Gln Gln Gly Asp Leu Phe Ile Asp Val Gln Ala Ser Val Ile
    690                 695                 700
Ala Thr Asp Ser Leu Ala Phe
705                 710
<210>19
<211>1350
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1350)
<400>19
atg gcc gct cgg aat gtg agc gcc gcg cat gag atg cac gat gaa aag    48
Met Ala Ala Arg Asn Val Sar Ala Ala His Glu Met His Asp Glu Lys
1               5                   10                  15
cgc atc gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc      96
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
            20                  25                  30
aag gac gag ttc tgg gag gtg ctc atg aac ggc aag gtc gag tcc aag      144
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
        35                  40                  45
gtg atc agc gac aaa cga ctc ggc tcc aac tac cgc gcc gag cac tac      192
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
    50                  55                  60
aaa gca gag cgc agc aag tat gcc gac acc ttt tgc aac gaa acg tac      240
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65                  70                  75                  80
ggc acc ctt gac gag aac gag atc gac aac gag cac gaa ctc ctc ctc      288
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
                85                  90                  95
aac ctc gcc aag cag gca ctc gca gag aca tcc gtc aaa gac tcg aca      336
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
            100                 105                 110
cgc tgc ggc atc gtc agc ggc tgc ctc tcg ttc ccc atg gac aac ctc      384
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
        115                 120                 125
cag ggt gaa ctc ctc aac gtg tac caa aac cat gtc gag aaa aag ctc      432
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
    130                 135                 140
ggg gcc cgc gtc ttc aag gac gcc tcc cat tgg tcc gaa cgc gag cag      480
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145                 150                 155                 160
tcc aac aaa ccc gag gcc ggt gac cgc cgc atc ttc atg gac ccg gcc      528
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
                165                 170                 175
tcc ttc gtc gcc gaa gaa ctc aac ctc ggc gcc ctt cac tac tcc gtc      576
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
            180                 185                 190
gac gca gca tgc gcc acg gcg ctc tac gtg ctc cgc ctc gcg cag gat      624
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
        195                 200                 205
cat ctc gtc tcc ggc gcc gcc gac gtc atg ctc tgc ggt gcc acc tgc      672
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
    210                 215                 220
ctg ccg gag ccc ttt ttc atc ctt tcg ggc ttt tcc acc ttc cag gcc      720
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225                 230                 235                 240
atg ccc gtc ggc acg ggc cag aac gtg tcc atg ccg ctg cac aag gac      768
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
                245                 250                 255
agc cag ggc ctc acc ccg ggt gag ggc ggc tcc atc atg gtc ctc aag      816
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
            260                 265                 270
cgt ctc gat gat gcc atc cgc gac ggc gac cac atc tac ggc acc ctt      864
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
        275                 280                 285
ctc ggc gcc aat gtc agc aac tcc ggc aca ggt ctg ccc ctc aag ccc    912
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
    290                 295                 300
ctt ctc ccc agc gag aaa aag tgc ctc atg gac acc tac acg cgc att    960
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305                 310                 315                 320
aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gcc acc ggc    1008
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
                325                 330                 335
acg ccc cag ggt gat cgt gtg gaa atc gac gcc gtc aag gcc tgc ttt    1056
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
            340                 345                 350
gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac    1104
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
        355                 360                 365
acc ctc gtc gca gcc ggc ttt gcc ggt atg tgc aag gtc ctc ctc tcc    1152
Thr Leu ValAl a Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
    370                 375                 380
atg aag cat ggc atc atc ccg ccc acc ccg ggt atc gat gac gag acc    1200
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385                 390                 395                 400
aag atg gac cct ctc gtc gtc tcc ggt gag gcc atc cca tgg cca gag    1248
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
                405                 410                 415
acc aac ggc gag ccc aag cgc gcc ggt ctc tcg gcc ttt ggc ttt ggt    1296
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
            420                 425                 430
ggc acc aac gcc cat gcc gtc ttt gag gag cat gac ccc tcc aac gcc    1344
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
        435                 440                 445
gcc tgc                                                            1350
Ala Cys
    450
<210>20
<211>450
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>20
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1               5                   10                  15
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
            20                  25                  30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
        35                  40                  45
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
    50                  55                  60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65                  70                  75                  80
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
                85                  90                  95
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
            100                 105                 110
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
        115                 120                 125
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
    130                 135                 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145                 150                 155                 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
                165                 170                 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
            180                 185                 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
        195                 200                 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
    210                 215                 220
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225                 230                 235                 240
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
                245                 250                 255
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
            260                 265                 270
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
        275                 280                 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
    290                 295                 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305                 310                 315                 320
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
                325                 330                 335
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
            340                 345                 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
        355                 360                 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
    370                 375                 380
Met Lys His Gly Ile Ile Pro Pro Tnr Pro Gly Ile Asp Asp Glu Thr
385                 390                 395                 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
                405                 410                 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
            420                 425                 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
       435                 440                 445
Ala Cys
    450
<210>21
<211>1323
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1323)
<400>21
tcg gcc cgc tgc ggc ggt gaa agc aac atg cgc atc gcc atc act ggt    48
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly
1               5                   10                  15
atg gac gcc acc ttt ggc gct ctc aag gga ctc gac gcc ttc gag cgc    96
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg
            20                  25                  30
gcc att tac acc ggc gct cac ggt gcc atc cca ctc cca gaa aag cgc    144
Ala Ile Tyr Thr Gly Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg
        35                  40                  45
tgg cgc ttt ctc ggc aag gac aag gac ttt ctt gac ctc tgc ggc gtc    192
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val
    50                  55                  60
aag gcc acc ccg cac ggc tgc tac att gaa gat gtt gag gtc gac ttc    240
Lys Ala Thr Pro His Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe
65                  70                  75                  80
cag cgc ctc cgc acg ccc atg acc cct gaa gac atg ctc ctc cct cag    288
Gln Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln
                85                  90                  95
cag ctt ctg gcc gtc acc acc att gac cgc gcc atc ctc gac tcg gga    336
Gln Leu Leu Ala Val Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly
            100                 105                 110
atg aaa aag ggt ggc aat gtc gcc gtc ttt gtc ggc ctc ggc acc gac      384
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp
        115                 120                 125
ctc gag ctc tac cgt cac cgt gct cgc gtc gct ctc aag gag cgc gtc      432
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val
    130                 135                 140
cgc cct gaa gcc tcc aag aag ctc aat gac atg atg cag tac att aac      480
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn
145                 150                 155                 160
gac tgc ggc aca tcc aca tcg tac acc tcg tac att ggc aac ctc gtc      528
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val
                165                 170                 175
gcc acg cgc gtc tcg tcg cag tgg ggc ttc acg ggc ccc tcc ttt acg      576
Ala Thr Arg Val Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr
            180                 185                 190
atc acc gag ggc aac aac tcc gtc tac cgc tgc gcc gag ctc ggc aag      624
Ile Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys
        195                 200                 205
tac ctc ctc gag acc ggc gag gtc gat ggc gtc gtc gtt gcg ggt gtc      672
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val
    210                 215                 220
gat ctc tgc ggc agt gcc gaa aac ctt tac gtc aag tct cgc cgc ttc      720
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe
225                 230                 235                 240
aag gtg tcc acc tcc gat acc ccg cgc gcc agc ttt gac gcc gcc gcc      768
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala
                245                 250                 255
gat ggc tac ttt gtc ggc gag ggc tgc ggt gcc ttt gtg ctc aag cgt      816
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg
            260                 265                 270
gag act agc tgc acc aag gac gac cgt atc tac gct tgc atg gat gcc      864
Glu Thr Ser Cys Thr Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala
        275                 280                 285
atc gtc cct ggc aac gtc cct agc gcc tgc ttg cgc gag gcc ctc gac      912
Ile Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp
    290                 295                 300
cag gcg cgc gtc aag ccg ggc gat atc gag atg ctc gag ctc agc gcc      960
Gln Ala Arg Val Lys Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala
305                 310                 315                 320
gac tcc gcc cgc cac ctc aag gac ccg tcc gtc ctg ccc aag gag ctc      1008
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu
                325                 330                 335
act gcc gag gag gaa atc ggc ggc ctt cag acg atc ctt cgt gac gat      1056
Thr Ala Glu Glu Glu Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp
            340                 345                 350
gac aag ctc ccg cgc aac gtc gca acg ggc agt gtc aag gcc acc gtc      1104
Asp Lys Leu Pro Arg Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val
        355                 360                 365
ggt gac acc ggt tat gcc tct ggt gct gcc agc ctc atc aag gct gcg      1152
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala
    370                 375                 380
ctt tgc atc tac aac cgc tac ctg ccc agc aac ggc gac gac tgg gat      1200
Leu Cys Ile Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp
385                 390                 395                 400
gaa ccc gcc cct gag gcg ccc tgg gac agc acc ctc ttt gcg tgc cag    1248
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln
                405                 410                 415
acc tcg cgc gct tgg ctc aag aac cct ggc gag cgt cgc tat gcg gcc    1296
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala
            420                 425                 430
gtc tcg ggc gtc tcc gag acg cgc tcg                                1323
Val Ser Gly Val Ser Glu Thr Arg Ser
        435                 440
<210>22
<211>441
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>22
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly
1               5                    10                  15
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg
            20                  25                  30
Ala Ile Tyr Thr Gly Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg
        35                  40                  45
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val
    50                  55                  60
Lys Ala Thr Pro His Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe
65                  70                  75                  80
Gln Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln
                85                  90                  95
Gln Leu Leu Ala Val Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly
            100                 105                 110
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp
        115                  120                 125
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val
    130                 135                 140
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn
145                 150                 155                 160
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val
                165                 170                 175
Ala Thr Arg Val Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr
            180                 185                 190
Ile Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys
        195                 200                 205
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val
    210                 215                 220
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe
225                 230                 235                 240
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala
                245                 250                 255
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg
            260                 265                 270
Glu Thr Ser Cys Thr Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala
        275                 280                 285
Ile Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp
    290                 295                 300
Gln Ala Arg Val Lys Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala
305                 310                 315                 320
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu
                325                 330                 335
Thr Ala Glu Glu Glu Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp
            340                 345                 350
Asp Lys Leu Pro Arg Asn Va1 Ala Thr Gly Ser Val Lys Ala Thr Val
        355                 360                 365
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala
    370                 375                 380
Leu Cys Ile Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp
385                 390                 395                 400
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln
                405                 410                 415
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala
            420                 425                 430
Val Ser Gly Val Ser Glu Thr Arg Ser
        435                 440
<210>23
<211>1500
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>23
tgc tat tcc gtg ctc ctc tcc gaa gcc gag ggc cac tac gag cgc gag    48
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu
1               5                   10                  15
aac cgc atc tcg ctc gac gag gag gcg ccc aag ctc att gtg ctt cgc    96
Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu Ile Val Leu Arg
            20                  25                  30
gcc gac tcc cac gag gag atc ctt ggt cgc ctc gac aag atc cgc gag    144
Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp Lys Ile Arg Glu
        35                  40                  45
cgc ttc ttg cag ccc acg ggc gcc gcc ccg cgc gag tcc gag ctc aag    192
Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys
    50                  55                  60
gcg cag gcc cgc cgc atc ttc ctc gag ctc ctc ggc gag acc ctt gcc    240
Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala
65                  70                  75                  80
cag gat gcc gct tct tca ggc tcg caa aag ccc ctc gct ctc agc ctc    288
Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu Ala Leu Ser Leu
                85                  90                  95
gtc tcc acg ccc tcc aag ctc cag cgc gag gtc gag ctc gcg gcc aag    336
Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu Leu Ala Ala Lys
            100                 105                 110
ggt atc ccg cgc tgc ctc aag atg cgc cgc gat tgg agc tcc cct gct    384
Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala
        115                 120                 125
ggc agc cgc tac gcg cct gag ccg ctc gcc agc gac cgc gtc gcc ttc    432
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe
    130                 135                 140
atg tac ggc gaa ggt cgc agc cct tac tac ggc atc acc caa gac att    480
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly Ile Thr Gln Asp Ile
145                 150                 155                 160
cac cgc att tgg ccc gaa ctc cac gag gtc atc aac gaa aag acg aac    528
His Arg Ile Trp Pro Glu Leu His Glu Val Ile Asn Glu Lys Thr Asn
                165                 170                 175
cgt ctc tgg gcc gaa ggc gac cgc tgg gtc atg ccg cgc gcc agc ttc    576
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe
            180                 185                 190
aag tcg gag ctc gag agc cag cag caa gag ttt gat cgc aac atg att    624
Lys Ser Glu Leu Glu Ser Gln Gln Gln Glu Phe Asp Arg Asn Met Ile
       195                 200                 205
gaa atg ttc cgt ctt gga atc ctc acc tca att gcc ttc acc aat ctg    672
Glu Met Phe Arg Leu Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu
    210                 215                 220
gcg cgc gac gtt ctc aac atc acg ccc aag gcc gcc ttt ggc ctc agt    720
Ala Arg Asp Val Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser
225                 230                 235                 240
ctt ggc gag att tcc atg att ttt gcc ttt tcc aag aag aac ggt ctc    768
Leu Gly Glu Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu
                245                 250                 255
atc tcc gac cag ctc acc aag gat ctt cgc gag tcc gac gtg tgg aac    816
Ile Ser Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn
            260                 265                 270
aag gct ctg gcc gtt gaa ttt aat gcg ctg cgc gag gcc tgg ggc att    864
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
        275                 280                 285
cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg cgc    912
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val Arg
    290                 295                 300
ggc acc aag cag gat atc gag gcg gcc atc gcc ccg gac agc aag tac    960
Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser Lys Tyr
305                 310                 315                 320
gtg cgc ctc acc atc atc aat gat gcc aac acc gcc ctc att agc ggc    1008
Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu Ile Ser Gly
                325                 330                 335
aag ccc gac gcc tgc aag gct gcg atc gcg cgt ctc ggt ggc aac att    1056
Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu Gly Gly Asn Ile
            340                 345                 350
cct gcg ctt ccc gtg acc cag ggc atg tgc ggc cac tgc ccc gag gtg    1104
Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly His Cys Pro Glu Val
        355                 360                 365
gga cct tat acc aag gat atc gcc aag atc cat gcc aac ctt gag ttc    1152
Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile His Ala Asn Leu Glu Phe
    370                 375                 380
ccc gtt gtc gac ggc ctt gac ctc tgg acc aca atc aac cag aag cgc    1200
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr Ile Asn Gln Lys Arg
385                 390                 395                 400
ctc gtg cca cgc gcc acg ggc gcc aag gac gaa tgg gcc cct tct tcc    1248
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser
                405                 410                 415
ttt ggc gag tac gcc ggc cag ctc tac gag aag cag gct aac ttc ccc    1296
Phe Gly Glu Tyr Ala Gly Gln Leu Tyr Glu Lys Gln Ala Asn Phe Pro
            420                 425                 430
caa atc gtc gag acc att tac aag caa aac tac gac gtc ttt gtc gag    1344
Gl n Ile Val Glu Thr Ile Tyr Lys Gln Asn Tyr Asp ValPhe Val Glu
         435                 440                 445
gtt ggg ccc aac aac cac cgt agc acc gca gtg cgc acc acg ctt ggt    1392
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly
    450                 455                 460
ccc cag cgc aac cac ctt gct ggc gcc atc gac aag cag aac gag gat    1440
Pro Gln Arg Asn His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp
465                 470                 475                 480
gct tgg acg acc atc gtc aag ctt gtg gct tcg ctc aag gcc cac ctt    1488
Ala Trp Thr Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu
                485                 490                 495
gtt cct ggc gtc                                                    1500
Val Pro Gly Val
            500
<210>24
<211>500
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>24
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu
1               5                   10                  15
Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu Ile Val Leu Arg
            20                  25                  30
Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp Lys Ile Arg Glu
        35                  40                  45
Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys
    50                  55                  60
Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala
65                  70                  75                  80
Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu Ala Leu Ser Leu
                85                  90                  95
Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu Leu Ala Ala Lys
            100                 105                 110
Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala
        115                 120                 125
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe
    130                 135                 140
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly Ile Thr Gln Asp Ile
145                 150                 155                 160
His Arg Ile Trp Pro Glu Leu His Glu Val Ile Asn Glu Lys Thr Asn
                165                 170                 175
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe
            180                 185                 190
Lys Ser Glu Leu Glu Ser Gln Gln Gln Glu Phe Asp Arg Asn Met Ile
        195                 200                 205
Glu Met Phe Arg Leu Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu
    210                 215                 220
Ala Arg Asp Val Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser
225                 230                 235                 240
Leu Gly Glu Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu
                245                 250                 255
Ile Ser Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn
            260                 265                 270
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
        275                 280                 285
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val Arg
    290                 295                 300
Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser Lys Tyr
305                 310                 315                 320
Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu Ile Ser Gly
                325                 330                 335
Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu Gly Gly Asn Ile
            340                 345                 350
Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly His Cys Pro Glu Val
        355                 360                 365
Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile His Ala Asn Leu Glu Phe
    370                 375                 380
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr Ile Asn Gln Lys Arg
385                 390                 395                 400
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser
                405                 410                 415
Phe Gly Glu Tyr Ala Gly Gln Leu Tyr Glu Lys Gln Ala Asn Phe Pro
            420                 425                 430
Gln Ile Val Glu Thr Ile Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu
        435                 440                 445
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly
    450                 455                 460
Pro Gln Arg Asn His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp
465                 470                 475                 480
Ala Trp Thr Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu
                485                 490                 495
Val Pro Gly Val
            500
<210>25
<211>1530
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1530)
<400>25
ctg ctc gat ctc gac agt atg ctt gcg ctg agc tct gcc agt gcc tcc      48
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser
1               5                   10                  15
ggc aac ctt gtt gag act gcg cct agc gac gcc tcg gtc att gtg ccg      96
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val Ile Val Pro
            20                  25                  30
ccc tgc aac att gcg gat ctc ggc agc cgc gcc ttc atg aaa acg tac      144
Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr
        35                  40                  45
ggt gtt tcg gcg cct ctg tac acg ggc gcc atg gcc aag ggc att gcc      192
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
    50                  55                  60
tct gcg gac ctc gtc att gcc gcc ggc cgc cag ggc atc ctt gcg tcc      240
Ser Ala Asp Leu Val Ile Ala Ala Gly Arg Gln Gly Ile Leu Ala Ser
65                  70                  75                  80
ttt ggc gcc ggc gga ctt ccc atg cag gtt gtg cgt gag tcc atc gaa      288
Phe Gly Ala Gly Gly Leu Pro Met Gln Val Val Arg Glu Ser Ile Glu
                85                  90                  95
aag att cag gcc gcc ctg ccc aat ggc ccg tac gct gtc aac ctt atc      336
Lys lle Gln Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu Ile
            100                 105                 110
cat tct ccc ttt gac agc aac ctc gaa aag ggc aat gtc gat ctc ttc      384
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe
        115                 120                 125
ctc gag aag ggt gtc acc ttt gtc gag gcc tcg gcc ttt atg acg ctc      432
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu
    130                 135                 140
acc ccg cag gtc gtg cgg tac cgc gcg gct ggc ctc acg cgc aac gcc      480
Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala
145                 150                 155                 160
gac ggc tcg gtc aac atc cgc aac cgt atc att ggc aag gtc tcg cgc      528
Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg
                165                 170                 175
acc gag ctc gcc gag atg ttc atg cgt cct gcg ccc gag cac ctt ctt      576
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu
            180                 185                 190
cag aag ctc att gct tcc ggc gag atc aac cag gag cag gcc gag ctc      624
Gln Lys Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu
        195                 200                 205
gcc cgc cgt gtt ccc gtc gct gac gac atc gcg gtc gaa gct gac tcg      672
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
    210                 215                 220
ggt ggc cac acc gac aac cgc ccc atc cac gtc att ctg ccc ctc atc      720
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile
225                 230                 235                 240
atc aac ctt cgc gac cgc ctt cac cgc gag tgc ggc tac ccg gcc aac      768
Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn
                245                 250                 255
ctt cgc gtc cgt gtg ggc gcc ggc ggt ggc att ggg tgc ccc cag gcg     816
Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
            260                 265                 270
gcg ctg gcc acc ttc aac atg ggt gcc tcc ttt att gtc acc ggc acc     864
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile Val Thr Gly Thr
        275                 280                 285
gtg aac cag gtc gcc aag cag tcg ggc acg tgc gac aat gtg cgc aag     912
Va1 Asn Gln Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys
    290                 295                 300
cag ctc gcg aag gcc act tac tcg gac gta tgc atg gcc ccg gct gcc     960
Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala
305                 310                 315                 320
gac atg ttc gag gaa ggc gtc aag ctt cag gtc ctc aag aag gga acc     1008
Asp Met Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr
                325                 330                 335
atg ttt ccc tcg cgc gcc aac aag ctc tac gag ctc ttt tgc aag tac     1056
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
            340                 345                 350
gac tcg ttc gag tcc atg ccc ccc gca gag ctt gcg cgc gtc gag aag     1104
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys
        355                 360                 365
cgc atc ttc agc cgc gcg ctc gaa gag gtc tgg gac gag acc aaa aac     1152
Arg Ile Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn
    370                 375                 380
ttt tac att aac cgt ctt cac aac ccg gag aag atc cag cgc gcc gag     1200
Phe Tyr lle Asn Arg Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu
385                 390                 395                 400
cgc gac ccc aag ctc aag atg tcg ctg tgc ttt cgc tgg tac ctg agc     1248
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
                405                 410                 415
ctg gcg agc cgc tgg gcc aac act gga gct tcc gat cgc gtc atg gac     1296
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp
            420                 425                 430
tac cag gtc tgg tgc ggt cct gcc att ggt tcc ttc aac gat ttc atc     1344
Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile
        435                 440                 445
aag gga act tac ctt gat ccg gcc gtc gca aac gag tac ccg tgc gtc     1392
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
    450                 455                 460
gtt cag att aac aag cag atc ctt cgt gga gcg tgc ttc ttg cgc cgt     1440
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg Arg
465                 470                 475                 480
ctc gaa att ctg cgc aac gca cgc ctt tcc gat ggc gct gcc gct ctt     1488
Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu
                485                 490                 495
gtg gcc agc atc gat gac aca tac gtc ccg gcc gag aag ctg             1530
Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu
            500                 505                 510
<210>26
<211>510
<213>裂殖壶菌(Schizochytrium sp.)
<400>26
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser
1                5                   10                  15
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val Ile Val Pro
            20                  25                  30
Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr
        35                  40                  45
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
    50                  55                  60
Ser Ala Asp Leu Val Ile Ala Ala Gly Arg Gln Gly Ile Leu Ala Ser
65                  70                  75                  80
Phe Gly Ala Gly Gly Leu Pro Met Gln Val Val Arg Glu Ser Ile Glu
                85                  90                  95
Lys Ile Gln Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu Ile
            100                 105                 110
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe
        115                 120                 125
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu
    130                 135                 140
Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala
145                 150                 155                 160
Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg
                165                 170                 175
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu
            180                 185                 190
Gln Lys Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu
        195                 200                 205
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
    210                 215                 220
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile
225                 230                 235                 240
Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn
                245                 250                 255
Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
            260                 265                 270
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile Val Thr Gly Thr
        275                 280                 285
Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys
    290                 295                 300
Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala
305                 310                 315                 320
Asp Met Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr
                325                 330                 335
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
            340                 345                 350
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys
        355                 360                 365
Arg Ile Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn
    370                 375                 380
Phe Tyr Ile Asn Arg Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu
385                 390                 395                 400
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
                405                 410                 415
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp
            420                 425                 430
Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile
        435                 440                 445
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
    450                 455                 460
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg Arg
465                 470                 475                 480
Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu
                485                 490                 495
Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu
            500                 505                 510
<210>27
<211>1350
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1350)
<400>27
atg gcg ctc cgt gtc aag acg aac aag aag cca tgc tgg gag atg acc    48
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                   10                  15
aag gag gag ctg acc agc ggc aag acc gag gtg ttc aac tat gag gaa    96
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
ctc ctc gag ttc gca gag ggc gac atc gcc aag gtc ttc gga ccc gag    144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
ttc gcc gtc atc gac aag tac ccg cgc cgc gtg cgc ctg ccc gcc cgc    192
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
gag tac ctg ctc gtg acc cgc gtc acc ctc atg gac gcc gag gtc aac    240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat ctc ccc gtc    288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                 85                 90                  95
aac gga gag ctc tcc gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc    336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 110
gag agt ggc cag tgc gat ctc atg ctc atc tcc tac atg ggc att gac    384
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
ttc cag aac cag ggc gac cgc gtc tac cgc ctg ctc aac acc acg ctc    432
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
acc ttt tac ggc gtg gcc cac gag ggc gag acc ctc gag tac gac att    480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
cgc gtc acc ggc ttc gcc aag cgt ctc gac ggc ggc atc tcc atg ttc    528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
ttc ttc gag tac gac tgc tac gtc aac ggc cgc ctc ctc atc gag atg    576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag ctc gac gcc ggc    624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
aag ggc gtc gtc ttc acc cgc ggc gac ctc gcc gcc cgc gcc aag atc    672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
cca aag cag gac gtc tcc ccc tac gcc gtc gcc ccc tgc ctc cac aag    720
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
acc aag ctc aac gaa aag gag atg cag acc ctc gtc gac aag gac tgg    768
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
gca tcc gtc ttt ggc tcc aag aac ggc atg ccg gaa atc aac tac aaa    816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
ctc tgc gcg cgt aag atg ctc atg att gac cgc gtc acc agc att gac    864
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
cac aag ggc ggt gtc tac ggc ctc ggt cag ctc gtc ggt gaa aag atc    912
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
ctc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag    960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
gtc atg gcc gga tcc ctc gtc tcc gac ggc tgc agc cag atg ctc aag    1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
atg tac atg atc tgg ctc ggc ctc cac ctc acc acc gga ccc ttt gac    1056
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa    1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
atc tcc ccg cac aag ggc aag ctc gtc tac gtc atg gag atc aag gag    1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac    1200
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
atc att gat gtc gac ttc gaa aag ggc cag gac ttt agc ctc gac cgc    1248
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
atc agc gac tac ggc aag ggc gac ctc aac aag aag atc gtc gtc gac    1296
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
ttt aag ggc atc gct ctc aag atg cag aag cgc tcc acc aac aag aac    1344
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
ccc tcc                                                            1350
Pro Ser
    450
<210>28
<211>450
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>28
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                   10                  15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                85                  90                  95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 110
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Mal Arg Cys Arg Gly Gln
        355                 360                 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
Pro Ser
    450
<210>29
<211>1497
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1497)
<400>29
aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc ccc gag    48
Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly Pro Glu
1               5                   10                  15
gcc tcc aag gct tcc tcc ggc gcc agc gcc agc gcc agc gcc gcc ccg    96
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro
            20                  25                  30
gcc aag cct gcc ttc agc gcc gat gtt ctt gcg ccc aag ccc gtt gcc    144
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala
        35                  40                  45
ctt ccc gag cac atc ctc aag ggc gac gcc ctc gcc ccc aag gag atg    192
Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met
    50                  55                  60
tcc tgg cac ccc atg gcc cgc atc ccg ggc aac ccg acg ccc tct ttt    240
Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro Ser Phe
65                  70                  75                  80
gcg ccc tcg gcc tac aag ccg cgc aac atc gcc ttt acg ccc ttc ccc      288
Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro Phe Pro
                85                  90                  95
ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg ctc acc      336
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr
            100                 105                 110
tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc agc atg tgc ctc      384
Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu
        115                 120                 125
ggc ccc gag ttc gcc aag ttc gac gac tcg aac acc agc cgc agc ccc      432
Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro
    130                 135                 140
gct tgg gac ctc gct ctc gtc acc cgc gcc gtg tct gtg tct gac ctc      480
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu
145                 150                 155                 160
aag cac gtc aac tac cgc aac atc gac ctc gac ccc tcc aag ggt acc      528
Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys Gly Thr
                165                 170                 175
atg gtc ggc gag ttc gac tgc ccc gcg gac gcc tgg ttc tac aag ggc      576
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly
            180                 185                 190
gcc tgc aac gat gcc cac atg ccg tac tcg atc ctc atg gag atc gcc      624
Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu Ile Ala
        195                 200                 205
ctc cag acc tcg ggt gtg ctc acc tcg gtg ctc aag gcg ccc ctg acc      672
Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr
    210                 215                 220
atg gag aag gac gac atc ctc ttc cgc aac ctc gac gcc aac gcc gag      720
Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu
225                 230                 235                 240
ttc gtg cgc gcc gac ctc gac tac cgc ggc aag act atc cgc aac gtc      768
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg Asn Val
                245                 250                 255
acc aag tgc act ggc tac agc atg ctc ggc gag atg ggc gtc cac cgc      816
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg
            260                 265                 270
ttc acc ttt gag ctc tac gtc gat gat gtg ctc ttt tac aag ggc tcg      864
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser
        275                 280                 285
acc tcg ttc ggc tgg ttc gtg ccc gag gtc ttt gcc gcc cag gcc ggc      912
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln Ala Gly
    290                 295                 300
ctc gac aac ggc cgc aag tcg gag ccc tgg ttc att gag aac aag gtt      960
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn Lys Val
305                 310                 315                 320
ccg gcc tcg cag gtc tcc tcc ttt gac gtg cgc ccc aac ggc agc ggc      1008
Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly
                325                 330                 335
cgc acc gcc atc ttc gcc aac gcc ccc agc ggc gcc cag ctc aac cgc      1056
Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu Asn Arg
            340                 345                 350
cgc acg gac cag ggc cag tac ctc gac gcc gtc gac att gtc tcc ggc    1104
Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val Ser Gly
        355                 360                 365
agc ggc aag aag agc ctc ggc tac gcc cac ggt tcc aag acg gtc aac    1152
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn
    370                 375                 380
ccg aac gac tgg ttc ttc tcg tgc cac ttt tgg ttt gac tcg gtc atg    1200
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met
385                 390                 395                 400
ccc gga agt ctc ggt gtc gag tcc atg ttc cag ctc gtc gag gcc atc    1248
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu Ala Ile
                405                 410                 415
gcc gcc cac gag gat ctc gct ggc aag cac ggc att gcc aac ccc acc    1296
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn Pro Thr
            420                 425                 430
ttt gtg cac gcc ccg ggc aag atc agc tgg aag tac cgc ggc cag ctc    1344
Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly Gln Leu
        435                 440                 445
acg ccc aag agc aag aag atg gac tcg gag gtc cac atc gtg tcc gtg    1392
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val Ser Val
    450                 455                 460
gac gcc cac gac ggc gtt gtc gac ctc gtc gcc gac ggc ttc ctc tgg    1440
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp
465                 470                 475                 480
gcc gac agc ctc cgc gtc tac tcg gtg agc aac att cgc gtg cgc atc    1488
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val Arg Ile
                485                 490                 495
gcc tcc ggt                                                        1497
Ala Ser Gly
<210>30
<211>499
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>30
Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly Pro Glu
1               5                   10                  15
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro
            20                  25                  30
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala
        35                  40                  45
Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met
    50                  55                  60
Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro Ser Phe
65                  70                  75                   80
Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro Phe Pro
                    85              90                  95
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr
                100             105                 110
Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu
            115             120                 125
Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro
    130                 135                 140
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu
145                 150                 155                 160
Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys Gly Thr
               165                 170                 175
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly
            180                 185                 190
Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu Ile Ala
        195                 200                 205
Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr
    210                 215                 220
Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu
225                 230                 235                 240
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg Asn Val
                245                 250                 255
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg
            260                 265                 270
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser
        275                 280                 285
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln Ala Gly
    290                 295                 300
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn Lys Val
305                 310                 315                 320
Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly
                325                 330                 335
Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu Asn Arg
            340                 345                 350
Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val Ser Gly
        355                 360                 365
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn
    370                 375                 380
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met
385                 390                 395                 400
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu Ala Ile
                405                 410                 415
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn Pro Thr
            420                 425                 430
Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly Gln Leu
        435                 440                 445
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val Ser Val
    450                 455                 460
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp
465                 470                 475                 480
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val Arg Ile
                485                 490                 495
Ala Ser Gly
<210>31
<211>1512
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>CDS
<222>(1)..(1512)
<400>31
gcc ccg ctc tac ctc tcg cag gac ccg acc agc ggc cag ctc aag aag    48
Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr Ser Gly Gln Leu Lys Lys
1               5                   10                  15
cac acc gac gtg gcc tcc ggc cag gcc acc atc gtg cag ccc tgc acg    96
His Thr Asp Val Ala Ser Gly Gln Ala Thr Ile Val Gln Pro Cys Thr
            20                  25                  30
ctc ggc gac ctc ggt gac cgc tcc ttc atg gag acc tac ggc gtc gtc    144
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val
        35                  40                  45
gcc ccg ctg tac acg ggc gcc atg gcc aag ggc att gcc tcg gcg gac    192
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
    50                  55                  60
ctc gtc atc gcc gcc ggc aag cgc aag atc ctc ggc tcc ttt ggc gcc    240
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala
65                  70                  75                  80
ggc ggc ctc ccc atg cac cac gtg cgc gcc gcc ctc gag aag atc cag      288
Gly Gly Leu Pro Met His His ValArg Ala Ala Leu Glu Lys Ile Gln
                85                 90                  95
gcc gcc ctg cct cag ggc ccc tac gcc gtc aac ctc atc cac tcg cct      336
Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro
            100                 105                 110
ttt gac agc aac ctc gag aag ggc aac gtc gat ctc ttc ctc gag aag      384
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys
        115                 120                 125
ggc gtc act gtg gtg gag gcc tcg gca ttc atg acc ctc acc ccg cag      432
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln
    130                 135                 140
gtc gtg cgc tac cgc gcc gcc ggc ctc tcg cgc aac gcc gac ggt tcg      480
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
145                 150                 155                 160
gtc aac atc cgc aac cgc atc atc ggc aag gtc tcg cgc acc gag ctc      528
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
                165                 170                 175
gcc gag atg ttc atc cgc ccg gcc ccg gag cac ctc ctc gag aag ctc      576
Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu
            180                 185                 190
atc gcc tcg ggc gag atc acc cag gag cag gcc gag ctc gcg cgc cgc      624
Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu Ala Arg Arg
        195                 200                 205
gtt ccc gtc gcc gac gat atc gct gtc gag gct gac tcg ggc ggc cac      672
Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
    210                 215                 220
acc gac aac cgc ccc atc cac gtc atc ctc ccg ctc atc atc aac ctc      720
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu
225                 230                 235                 240
cgc aac cgc ctg cac cgc gag tgc ggc tac ccc gcg cac ctc cgc gtc      768
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val
                245                 250                 255
cgc gtt ggc gcc ggc ggt ggc gtc ggc tgc ccg cag gcc gcc gcc gcc      816
Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala
            260                 265                 270
gcg ctc acc atg ggc gcc gcc ttc atc gtc acc ggc act gtc aac cag      864
Ala Leu Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln
        275                 280                 285
gtc gcc aag cag tcc ggc acc tgc gac aac gtg cgc aag cag ctc tcg      912
Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
    290                 295                 300
cag gcc acc tac tcg gat atc tgc atg gcc ccg gcc gcc gac atg ttc      960
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met Phe
305                 310                 315                 320
gag gag ggc gtc aag ctc cag gtc ctc aag aag gga acc atg ttc ccc      1008
Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro
                325                 330                 335
tcg cgc gcc aac aag ctc tac gag ctc ttt tgc aag tac gac tcc ttc      1056
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe
            340                 345                 350
gac tcc atg cct cct gcc gag ctc gag cgc atc gag aag cgt atc ttc      1104
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe
        355                 360                 365
aag cgc gca ctc cag gag gtc tgg gag gag acc aag gac ttt tac att    1152
Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile
    370                 375                 380
aac ggt ctc aag aac ccg gag aag atc cag cgc gcc gag cac gac ccc    1200
Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
385                 390                 395                 400
aag ctc aag atg tcg ctc tgc ttc cgc tgg tac ctt ggt ctt gcc agc    1248
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser
                405                 410                 415
cgc tgg gcc aac atg ggc gcc ccg gac cgc gtc atg gac tac cag gtc    1296
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gln Val
            420                 425                 430
tgg tgt ggc ccg gcc att ggc gcc ttc aac gac ttc atc aag ggc acc    1344
Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile Lys Gly Thr
        435                 440                 445
tac ctc gac ccc gct gtc tcc aac gag tac ccc tgt gtc gtc cag atc    1392
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gln Ile
    450                 455                 460
aac ctg caa atc ctc cgt ggt gcc tgc tac ctg cgc cgt ctc aac gcc    1440
Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala
465                 470                 475                 480
ctg cgc aac gac ccg cgc att gac ctc gag acc gag gat gct gcc ttt    1488
Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe
                485                 490                 495
gtc tac gag ccc acc aac gcg ctc                                    1512
Val Tyr Glu Pro Thr Asn Ala Leu
            500
<210>32
<211>504
<212>PRT
<213>裂殖壶菌(Schizochytrium sp.)
<400>32
Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr Ser Gly Gln Leu Lys Lys
1               5                   10                  15
His Thr Asp Val Ala Ser Gly Gln Ala Thr Ile Val Gln Pro Cys Thr
            20                  25                  30
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val
        35                  40                  45
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
    50                  55                  60
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala
65                  70                  75                  80
Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys Ile Gln
                85                  90                  95
Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro
            100                 105                 110
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys
        115                 120                 125
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln
    130                 135                 140
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
145                 150                 155                 160
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
                165                 170                 175
Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu
            180                 185                 190
lle Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu Ala Arg Arg
        195                 200                 205
Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
    210                 215                 220
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu
225                 230                 235                 240
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val
                245                 250                 255
Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala
            260                 265                 270
Ala Leu Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln
        275                 280                 285
Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
    290                 295                 300
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met Phe
305                 310                 315                 320
Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro
                325                 330                 335
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe
            340                 345                 350
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe
        355                 360                 365
Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile
    370                 375                 380
Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
385                 390                 395                 400
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser
                405                 410                 415
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gln Val
            420                 425                 430
Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile Lys Gly Thr
        435                 440                 445
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gln Ile
    450                 455                 460
Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala
465                 470                 475                 480
Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe
                485                 490                 495
Val Tyr Glu Pro Thr Asn Ala Leu
            500
<210>33
<211>714
<212>DNA
<213>念珠蓝细菌(Nostoc sp.)
<400>33
atgttgcagc atacttggct accaaaaccc ccaaatttaa ccttattgtc agatgaagtt  60
catctctggc gcattcccct tgaccaacca gaatcacagc tacaggattt agccgctacc  120
ttatctagtg acgaattagc ccgtgcaaac agattttatt ttcccgaaca tcgccggcgt  180
tttactgctg gtcgtggtat tctccgcagt atcttggggg gctatttggg tgtggaacca  240
gggcaagtta aatttgatta tgaatcccgt ggtaaaccaa tattaggcga tcgctttgcc  300
gagagtggtt tattatttaa cttgtcacac tcccagaact tggccttgtg tgcagtcaat  360
tacacgcgcc aaatcggcat cgatttagaa tatctccgcc ccacatctga tttagaatcc  420
cttgccaaaa ggttcttttt accgcgagaa tatgaattat tgcgatcgct acccgatgag  480
caaaaacaaa aaattttctt tcgttactgg acttgtaaag aggcttatct taaagcaacg  540
ggtgacggca tcgctaaatt agaggaaatt gaaatagcac taactcccac agaaccagct  600
aagttacaga cagctccagc gtggagtctc ctagagctag tgccagatga taattgtgtt  660
gctgctgttg ccgtggcggg ttttggctgg cagccaaaat tctggcatta ttga        714
<210>34
<211>237
<212>PRT
<213>念珠蓝细菌(Nostoc sp.)
<400>34
Met Leu Gln His Thr Trp Leu Pro Lys Pro Pro Asn Leu Thr Leu Leu
1               5                   10                  15
Ser Asp Glu Val His Leu Trp Arg Ile Pro Leu Asp Gln Pro Glu Ser
            20                  25                  30
Gln Leu Gln Asp Leu Ala Ala Thr Leu Ser Ser Asp Glu Leu Ala Arg
        35                  40                  45
Ala Asn Arg Phe Tyr Phe Pro Glu His Arg Arg Arg Phe Thr Ala Gly
    50                  55                  60
Arg Gly Ile Leu Arg Ser Ile Leu Gly Gly Tyr Leu Gly Val Glu Pro
65                  70                  75                  80
Gly Gln Val Lys Phe Asp Tyr Glu Ser Arg Gly Lys Pro Ile Leu Gly
                85                  90                  95
Asp Arg Phe Ala Glu Ser Gly Leu Leu Phe Asn Leu Ser His Ser Gln
            100                 105                 110
Asn Leu Ala Leu Cys Ala Val Asn Tyr Thr Arg Gln Ile Gly Ile Asp
        115                 120                 125
Leu Glu Tyr Leu Arg Pro Thr Ser Asp Leu Glu Ser Leu Ala Lys Arg
    130                 135                 140
Phe Phe Leu Pro Arg Glu Tyr Glu Leu Leu Arg Ser Leu Pro Asp Glu
145                 150                 155                 160
Gln Lys Gln Lys Ile Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala Tyr
                165                 170                 175
Leu Lys Ala Thr Gly Asp Gly Ile Ala Lys Leu Glu Glu Ile Glu Ile
            180                 185                 190
Ala Leu Thr Pro Thr Glu Pro Ala Lys Leu Gln Thr Ala Pro Ala Trp
        195                 200                 205
Ser Leu Leu Glu Leu Val Pro Asp Asp Asn Cys Val Ala Ala Val Ala
    210                 215                 220
Val Ala Gly Phe Gly Trp Gln Pro Lys Phe Trp His Tyr
225                 230                 235
<210>35
<211>8733
<212>DNA
<213>人工
<220>
<223>合成的
<400>35
atggctgcta ggttgcaaga acaaaaaggt ggtgagatgg atactagaat tgctatcatt  60
ggaatgtctg ctattttgcc atgtggtact actgttagag aatcttggga aactattaga  120
gctggtattg attgtttgtc tgatttgcct gaagatagag ttgatgttac tgcttacttt  180
gatccagtta aaactactaa agataaaatc tattgtaaga gaggtggttt cattccagaa  240
tatgattttg atgctagaga atttggtttg aatatgtttc agatggaaga ttctgatgct  300
aatcaaacta tttctttgtt gaaagttaaa gaagcattgc aagatgctgg catcgatgct  360
ttgggtaaag agaagaagaa tattggttgt gttttgggta ttggtggtgg tcaaaaatct  420
tctcatgaat tttactcaag attgaattat gttgttgttg agaaggtatt gagaaaaatg  480
ggtatgccag aagaagatgt taaagttgct gttgaaaaat acaaagctaa ttttccagag  540
tggagattgg attcttttcc aggtttcttg ggaaatgtta ctgcaggaag atgtactaat  600
acttttaatc ttgatggcat gaattgtgtt gttgatgctg cttgtgcttc ttctttgatt  660
gctgttaaag ttgctattga tgaattgttg tacggtgatt gtgatatgat ggttactggt  720
gctacttgta ctgataattc tattggaatg tacatggctt tttctaaaac tccagttttc  780
tctactgatc catctgttag agcttatgat gaaaaaacta aaggaatgtt gattggtgaa  840
ggttctgcta tgttggtttt gaaaagatat gctgatgctg ttagagatgg tgatgaaatt  900
catgctgtta ttagaggttg tgcttcttct tctgatggta aagctgctgg tatctatact  960
ccaactattt ctggtcaaga agaagcattg agaagagctt ataatagagc ttgtgttgat  1020
ccagctactg ttactttggt tgaaggtcat ggtactggta ctccagttgg tgatagaatt  1080
gaattgactg ctttgagaaa tttgtttgat aaagcatatg gtgaaggtaa tactgaaaaa  1140
gttgctgttg gttctattaa atcttctatt ggtcatttga aagctgttgc tggtttggct  1200
ggaatgatta aagttatcat ggctttgaaa cataaaactt tgccaggaac tattaatgtt  1260
gataatccac caaacttgta cgataatact ccaattaacg aatcttcttt gtacattaat  1320
actatgaata gaccttggtt tccaccacca ggtgttccaa gaagagctgg tatttcttct  1380
tttggttttg gtggtgctaa ttatcatgct gttttggaag aagctgaacc agaacatact  1440
actgcttata ggttgaacaa aagaccacaa ccagttttga tgatggctgc tactccagct  1500
gctttgcaat ctttgtgtga agctcaattg aaagaatttg aagctgctat taaagaaaac  1560
gaaactgtta aaaatactgc ttatattaaa tgtgttaaat ttggtgaaca attcaaattc  1620
cctggtagta ttccagctac taatgctagg ttgggtttct tggttaaaga tgctgaagat  1680
gcttgttcta ctttgagagc tatttgtgct caatttgcta aagatgttac taaagaagca  1740
tggagattgc caagagaagg tgtttctttt agagctaaag gtattgctac taatggtgct  1800
gttgctgctt tgttttctgg tcaaggtgct caatatactc atatgttttc tgaagttgct  1860
atgaattggc cacaattcag acaatctatt gctgctatgg atgctgctca atctaaagtt  1920
gctggttctg ataaagattt tgaaagagtt tctcaagttt tgtatccaag aaaaccatac   1980
gagagagaac cagagcaaga tcataagaag atttctttga ctgcttattc tcaaccatct   2040
actttggctt gtgctttggg tgcttttgaa atttttaaag aagctggttt tactccagat   2100
tttgctgctg gtcattcttt gggtgaattt gctgctttgt acgctgctgg ttgtgttgat   2160
agagatgaat tgtttgaatt ggtttgtaga agagctagaa ttatgggtgg taaagatgct   2220
ccagctactc caaaaggttg catggctgct gttattggtc caaatgctga aaatattaaa   2280
gttcaagctg ctaatgtttg gttaggaaat tctaattctc catctcaaac tgttattact   2340
ggttctgttg aaggtattca agctgaatct gctaggttgc aaaaagaagg ttttagagtt   2400
gttccattgg cttgtgaatc tgcttttcat tctccacaga tggaaaatgc ttcttctgct   2460
tttaaagatg ttatctctaa agtttctttt agaactccaa aagctgaaac taaattgttt   2520
tctaatgttt ctggtgaaac ttatccaact gatgctagag aaatgttgac tcaacatatg   2580
acttcttctg ttaaattttt gactcaagtt agaaatatgc atcaagctgg tgctagaatt   2640
tttgttgaat tcggtccaaa acaagttttg tctaaattgg tttctgaaac tttgaaagat   2700
gatccatctg ttgttactgt ttctgttaat ccagcttctg gtactgattc tgatattcaa   2760
ttgagagatg ctgctgttca attggttgtt gctggtgtta atttgcaagg ttttgataaa   2820
tgggatgctc cagatgctac tagaatgcaa gctattaaaa aaaaaagaac tactttgaga   2880
ttgtctgctg ctacttatgt ttctgataaa actaagaaag ttagagatgc tgctatgaat   2940
gatggtagat gtgttactta cttgaaaggt gctgctccat tgattaaagc tccagaacca   3000
gttgttgatg aagctgctaa aagagaagct gaaagattgc aaaaagaatt gcaagatgct   3060
caaagacaat tggatgatgc taaaagagct gctgctgaag ctaattctaa attggctgct   3120
gctaaagaag aagctaaaac tgctgctgct tctgctaaac cagctgttga tactgctgtt   3180
gttgaaaaac atagagctat tttgaaatct atgttggctg aattggatgg ttatggttct   3240
gttgatgctt cttctttgca acaacaacaa caacaacaaa ctgctccagc tccagttaaa   3300
gctgctgctc cagctgctcc agttgcttct gctccagcac ccgcagttag caacgaactc   3360
ttagaaaaag ccgagacagt agtgatggaa gttcttgcag ctaaaacggg gtacgaaaca   3420
gatatgattg aagcagatat ggaacttgaa actgaactgg gcattgattc gattaaacgc   3480
gtggaaattc tgtcagaagt gcaagctatg ttaaatgttg aagcgaaaga tgttgatgca   3540
ctgtcacgca cacgcaccgt gggcgaagta gtgaacgcca tgaaagcaga aattgcaggc   3600
tcctcagcac ccgcgccggc cgcagcagca ccagcccccg caaaagccgc ccccgcagcg   3660
gcggctccag ccgtttcaaa cgaattactc gaaaaagcag aaaccgtagt gatggaagtc   3720
cttgccgcca aaacgggtta tgagaccgat atgatcgaaa gcgatatgga attagaaacc   3780
gaattaggga ttgatagtat taaacgcgta gaaattctgt ccgaagtaca agctatgctg   3840
aatgtagaag caaaagatgt agatgcgtta agccgcacac gcactgttgg tgaagttgtg   3900
aatgctatga aagctgaaat tgcaggaggt tcagcaccgg ccccagcagc cgcagcccca   3960
ggtccagcag cagccgcacc ggcccccgcc gccgccgcac cggcagtatc aaacgagttg   4020
ttagagaaag cggaaaccgt tgtgatggaa gtacttgccg cgaagacagg ttacgagacc   4080
gatatgatcg aaagtgacat ggaattagaa accgaattgg gcattgatag cattaaacgc   4140
gtagaaattt tatccgaagt tcaagccatg ttaaatgttg aagccaaaga tgtggatgcg   4200
ttatcccgca cgcgtaccgt cggagaagta gtggacgcta tgaaagcaga gattgcagga   4260
ggaagtgcac cggctccagc agcagcagca cccgccccag cggcagcggc gccggcaccg   4320
gccgctccgg ccccagccgt tagttcagaa ctcctcgaaa aagcagaaac tgttgtcatg   4380
gaagtattag ctgcaaaaac aggttacgag acggatatga ttgaaagcga tatggaatta   4440
gaaaccgaat taggcattga ttcaattaaa cgtgttgaaa tcttaagtga agtccaagcc   4500
atgcttaatg ttgaagccaa agatgtagat gcattatctc gcacgcgtac agtgggtgaa   4560
gttgtcgatg cgatgaaagc agaaatcgcg ggaggatcag cgccagcccc ggcagcagca   4620
gcccccgcgc ccgccgcggc cgcacctgcg ccggccgccc cagcccctgc agcaccggcc   4680
ccagcagtgt cgtcggaatt actcgaaaaa gctgaaacgg tcgttatgga agtacttgct   4740
gcaaagacgg gctatgaaac ggatatgatt gaatcggata tggaattaga aacagaactt   4800
ggtattgact ctattaaacg cgtggaaatt ctgagcgaag tacaggcaat gttaaacgta   4860
gaagccaaag atgtagacgc tttgtcacgc acacggacgg taggagaagt tgtggatgcg   4920
atgaaagctg aaattgccgg ttcaagtgct agcgcccctg ctgccgccgc ccctgcccct   4980
gccgccgcag caccggcccc ggcagccgca gctccagcag ttagtaacga attactcgaa   5040
aaagcagaaa cggtggtcat ggaagtgtta gcagcaaaaa ctggatatga aacggacatg   5100
attgaaagcg atatggaatt agaaacagaa ctgggaattg atagtattaa acgtgttgag   5160
attttatctg aggttcaagc tatgctgaat gttgaagcga aagatgtaga cgcactgtct   5220
cggacccgca cagtaggtga agtggtggac gcgatgaaag cagaaatcgc aggtggaagt   5280
gctccggccc cggcggcagc cgcacccgcg cccgcggccg cagccccagc agttagcaac   5340
gaattactcg agaaagcaga aactgtagtg atggaagtgt tagccgcaaa aacgggttat   5400
gaaacggata tgattgaaag cgatatggaa ctggaaaccg aactgggcat tgattctatt   5460
aaacgtgtcg aaatcttatc ggaagtccaa gcaatgctga acgtagaggc aaaggatgtt   5520
gatgccctgt cacgtacccg taccgtaggt gaagttgtag atgccatgaa agctgaaatc   5580
gcaggcagta gcgccccggc accagccgcc gccgcccccg cgccggcagc cgccgcaccc   5640
gcgccagccg cagctgctcc agctgtatct agtgagctgc tcgaaaaagc agaaaccgtg   5700
gttatggaag tgctcgccgc taaaacagga tatgaaaccg atatgattga aagcgatatg   5760
gaattagaaa ccgaactggg tattgatagt attaagcgtg ttgaaatttt gtcagaagtt   5820
caagctatgt tgaatgtaga agccaaagat gtagacgctt taagtcggac gcgtactgtt   5880
ggagaagtcg tagacgccat gaaagcagag attgcaggcg gaagtgcacc ggccccggca   5940
gcagcagccc cagcaccagc ggccgccgct cctgcagtgt caaacgaact tctggaaaaa   6000
gctgaaaccg tcgtcatgga agtgctggct gcaaaaactg gatatgaaac agacatgatt   6060
gaatcagata tggaactcga aaccgaactg gggattgata gcattaaacg tgtggaaatt   6120
ttatcggagg tacaagcaat gttaaatgtg gaagcaaaag atgtggatgc actgagccgt   6180
actcgtactg ttggtgaggt cgtggatgcg atgaaagcag aaattgctgg agggagtgcg   6240
cctgccccgg ccgccgccgc acccgcgtct gccggtgctg cccccgctgt caaaattgat   6300
tctgttcatg gtgctgattg tgatgatttg tctttgatgc atgctaaagt tgttgatatt   6360
agaagaccag atgaattgat tttggaaaga ccagaaaata gaccagtttt ggttgttgat   6420
gatggttctg aattgacttt ggctttggtt agagttttgg gtgcttgtgc tgttgttttg   6480
acttttgaag gtttgcaatt ggctcaaaga gctggtgctg ctgctattag acatgttttg   6540
gctaaagatt tgtctgctga atctgctgaa aaagctatta aagaagctga acaaagattt   6600
ggtgctttgg gtggttttat ctctcaacaa gctgaaagat ttgaaccagc tgaaattttg   6660
ggttttactt tgatgtgtgc taaatttgct aaagcatctt tgtgcactgc tgttgctggt   6720
ggtagaccag ctttcattgg tgttgctagg ttggatggta ggttgggttt tacttctcaa   6780
ggaacttctg atgctttgaa aagagctcaa agaggtgcta tttttggttt gtgcaagact   6840
attggtttgg aatggtctga atctgatgtt ttctcaagag gtgttgatat tgctcaaggt   6900
atgcatccag aagatgctgc tgttgctatt gttagagaaa tggcttgtgc tgatattaga   6960
attagagaag ttggtattgg tgctaatcaa caaagatgta ctattagagc tgctaaattg   7020
gaaactggaa atccacaaag acaaattgct aaagatgatg ttttgttggt ttctggtggt   7080
gctagaggaa ttactccatt gtgcattaga gaaattacta gacaaattgc tggtggaaag   7140
tatattttgt tgggtaggtc taaagtttct gcttctgaac cagcttggtg tgctggtatt   7200
actgatgaaa aagctgttca aaaagctgct actcaagaat tgaaaagagc tttttctgct   7260
ggtgaaggtc caaaaccaac tccaagagct gttactaaat tggttggttc tgttttgggt   7320
gctagagaag ttaggtcttc tattgctgct attgaagcat tgggtggaaa agctatctat   7380
tcttcttgtg atgttaattc tgctgctgat gttgctaaag ctgttagaga tgctgaatct   7440
caattgggtg ctagagtttc tggtattgtt catgcttctg gtgttttgag agataggttg   7500
attgaaaaaa aattgccaga tgaatttgat gctgtttttg gtactaaagt tactggtttg   7560
gaaaatttgt tggctgctgt tgatagagct aatttgaaac atatggtttt gttttcttct   7620
ttggctggtt ttcatggtaa tgttggtcaa tctgattatg ctatggctaa cgaagcattg   7680
aacaaaatgg gtttggaatt ggctaaagat gtttctgtta aatctatttg ttttggtcct   7740
tgggatggtg gtatggttac tccacaattg aaaaaacaat ttcaagaaat gggtgttcaa   7800
attattccaa gagaaggtgg tgctgatact gttgctagaa ttgttttggg ttcttctcca   7860
gctgaaattt tggttggtaa ttggagaact ccatctaaaa aagttggttc tgatactatt   7920
actttgcaca gaaaaatttc tgctaaatct aatccatttt tggaagatca tgtcattcaa   7980
ggtagaagag ttttgccaat gactttggct attggttctt tggctgaaac ttgtttgggt   8040
ttgtttcctg gatattcttt gtgggctatt gatgatgctc aattgtttaa aggtgttact   8100
gttgatggtg atgttaattg tgaagttact ttgactccat ctactgctcc ttctggtaga 8160
gttaatgttc aagctacttt gaaaactttt tcttctggta aattggttcc agcttataga 8220
gctgttattg ttttgtctaa tcaaggtgct ccaccagcta atgctactat gcaaccacca 8280
tctttggatg ctgatccagc tttgcaaggt tctgtttatg atggaaagac tttgtttcat 8340
ggtccagctt ttagaggtat tgatgatgtt ttgtcttgta ctaaatctca attggttgct 8400
aaatgttctg ctgttccagg ttctgatgct gctagaggtg aatttgctac tgatactgat 8460
gctcatgatc catttgttaa tgatttggct tttcaagcta tgttggtttg ggttagaaga 8520
actttgggtc aagctgcttt gccaaattct attcaaagaa ttgttcaaca cagaccagtt 8580
ccacaagata aaccatttta tattactttg agatctaatc aatctggtgg tcattctcaa 8640
cataaacatg ctttgcaatt tcataacgaa caaggtgatt tgttcattga tgttcaagca 8700
tctgttattg ctactgattc tttggctttt taa                              8733
<210>36
<211>6180
<212>DNA
<213>人工
<220>
<223>合成的
<400>36
atggctgcta gaaatgtttc tgctgctcat gaaatgcatg atgaaaaaag aattgctgtt 60
gttggtatgg ctgttcaata tgctggttgt aagactaaag atgaattttg ggaagttttg 120
atgaatggta aagttgaatc taaagttatc tctgataaaa gattgggttc taattaccga 180
gctgaacatt acaaggctga aagatccaaa tacgctgata ctttttgtaa cgaaacttat 240
ggtactttgg atgaaaacga aattgataac gaacatgaat tgttgttgaa tttggctaaa 300
caagcattgg ctgaaacttc tgttaaagat tctactagat gtggtattgt ttctggttgt 360
ttgtcttttc ctatggataa tttgcaaggt gaattgttga atgtctatca aaatcatgtt 420
gagaagaaat tgggtgctag agtttttaaa gatgcttctc attggtctga aagagaacaa 480
tctaacaaac cagaagctgg tgatagaaga attttcatgg acccagcttc ttttgttgct 540
gaagaattga atttgggtgc tttgcattat tctgttgatg ctgcttgtgc tactgcttta 600
tacgttttga gattggctca agatcatttg gtttctggtg ctgctgatgt tatgttgtgt 660
ggtgctactt gtttgccaga accattcttt atcttgtctg gtttttctac ttttcaagct 720
atgccagttg gtactggtca aaatgtttct atgccattgc ataaagattc tcaaggtttg 780
actccaggtg aaggtggttc tatcatggtt ttgaaaagat tggatgatgc tattagagat 840
ggtgatcata tctatggtac tttgttgggt gctaatgttt ctaattctgg cactggtttg 900
ccattgaaac cattgttgcc atctgaaaaa aaatgtttga tggatactta tactagaatt 960
aatgttcatc cacataaaat tcaatatgtt gaatgtcatg ctactggtac tccacaaggt 1020
gatagggttg aaattgatgc tgttaaagca tgttttgaag gaaaagttcc aagatttggt 1080
actactaaag gaaactttgg tcatactttg gttgctgctg gttttgctgg aatgtgcaaa 1140
gttttgttgt ctatgaaaca tggtatcatt ccaccaactc caggtattga tgatgaaact   1200
aagatggacc cattggttgt ttctggtgaa gctattcctt ggccagaaac taatggtgaa   1260
ccaaaaagag ctggtttgtc tgcttttggt tttggtggta ctaatgctca tgctgttttt   1320
gaagaacatg atccatctaa tgctgcttgt actggtcatg attctatttc tgctttgtct   1380
gctagatgtg gtggtgaatc taatatgaga attgctatta ctggtatgga tgctactttt   1440
ggtgctttga aaggtttgga tgcttttgaa agagccatct acactggtgc tcatggtgct   1500
attccattgc cagaaaagag atggagattt ttgggcaaag ataaagattt cttggatttg   1560
tgtggtgtta aagctactcc acatggttgt tatattgaag atgttgaagt tgattttcaa   1620
agattgagaa ctccaatgac tccagaagat atgttgttgc cacaacaatt gttggctgtt   1680
actactattg atagagctat tttggattct ggtatgaaaa aaggtggtaa tgttgctgtt   1740
tttgttggtt tgggtaccga tttggaattg tacagacata gagctagagt tgctttgaaa   1800
gaaagagtta gaccagaagc atctaaaaaa ttgaatgata tgatgcagta cattaatgat   1860
tgtggcacct ctacttctta tacttcttat attggtaatt tggttgctac tagagtttct   1920
tctcaatggg gttttactgg tccatctttt actattactg aagggaataa ctctgtttat   1980
agatgtgctg aattgggaaa gtatttgttg gaaactggtg aagttgatgg tgttgttgtt   2040
gctggtgttg atttgtgtgg ttctgctgaa aacttatacg ttaaatcaag aagattcaaa   2100
gtttctactt ctgatactcc aagagcttct tttgatgctg ctgctgatgg ttactttgtt   2160
ggtgaaggtt gtggtgcttt tgttttgaaa agagaaactt cttgtactaa agatgataga   2220
atctatgctt gcatggatgc tattgttcca ggtaatgttc catctgcttg tttgagagaa   2280
gcattggatc aagctagagt taaaccaggt gatattgaaa tgttggaatt gtctgctgat   2340
tctgctagac atttgaaaga tccatctgtt ttgccaaaag aattgactgc tgaagaagaa   2400
attggtggtt tgcaaactat tttgagagat gatgataaat tgccaagaaa tgttgctact   2460
ggttctgtta aagctactgt tggtgatact ggttatgctt ctggtgctgc ttctttgatt   2520
aaagctgctt tgtgcatcta taataggtat ttgccatcta atggtgatga ttgggatgaa   2580
ccagctccag aagctccttg ggattctact ttgtttgctt gtcaaacttc aagagcttgg   2640
ttgaaaaatc ctggagagag aagatatgct gctgtttctg gtgtttctga aactaggtct   2700
tgttattctg ttttgttgtc tgaagctgaa ggtcattatg aaagagaaaa tagaatttct   2760
ttggatgaag aagctccaaa attgattgtt ttgagagctg attctcatga agaaattttg   2820
ggtaggttgg ataaaattag agaaagattt ttgcaaccaa ctggtgctgc tccaagagaa   2880
tctgaattga aagctcaagc tagaagaatt ttcttggaat tgttgggtga aactttggct   2940
caagatgctg cttcttctgg ttctcaaaaa ccattggctt tgtctttggt ttctactcca   3000
tctaaattgc aaagagaagt tgaattggct gctaaaggta ttccaagatg tttgaaaatg   3060
agaagagatt ggtcttctcc agctggttca agatatgctc cagaaccatt ggcttctgat   3120
agagttgctt tcatgtacgg tgaaggaagg tctccatact atggaatcac tcaagatatt   3180
catagaattt ggccagaatt gcatgaagtt attaacgaaa aaactaatag gttgtgggct   3240
gaaggtgata gatgggttat gccaagagct tcttttaaat ctgaattgga atctcaacaa   3300
caagaatttg atagaaatat gattgaaatg tttaggttgg gtattttgac ttctattgct   3360
tttactaatt tggctagaga tgttttgaat attactccaa aagctgcttt tggtttgtct   3420
ttgggtgaaa tttctatgat ttttgctttt tctaaaaaaa atggtttgat ttctgatcaa   3480
ttgactaaag atttgagaga atctgatgtt tggaacaaag cattggctgt tgaattcaat   3540
gctttgagag aagcatgggg tattccacaa tctgttccaa aagatgaatt ttggcaaggt   3600
tatattgtta gaggtactaa acaagatatt gaagctgcta ttgctccaga ttccaaatac   3660
gttaggttga ctatcattaa tgatgctaat actgctttga tttctggtaa accagatgct   3720
tgtaaagctg ctattgctag gttgggtggt aatattccag ctttgccagt tactcaagga   3780
atgtgtggtc attgtccaga agttggtcca tatactaaag atattgctaa aattcatgct   3840
aatttggaat ttccagttgt tgatggtttg gatttgtgga ctactattaa tcaaaaaaga   3900
ttggttccaa gagctactgg tgctaaagat gaatgggctc catcttcttt tggtgaatat   3960
gctggtcaac tttacgaaaa acaagctaat tttccacaaa ttgttgaaac tatctacaaa   4020
caaaattatg atgtttttgt tgaggttggt ccaaacaacc ataggtctac tgctgttaga   4080
actactttgg gtccacaaag aaatcatttg gctggtgcta ttgataaaca aaacgaagat   4140
gcttggacta ctattgttaa attggttgct tctttgaaag ctcatttggt tccaggtgtt   4200
actatttctc cattgtatca ttctaaattg gttgctgaag ctgaagcatg ttatgctgct   4260
ctgtgcaaag gagaaaaacc taagaagaac aaatttgtta gaaaaattca attgaatggt   4320
aggttcaatt ctaaagctga tccaatttct tctgctgatt tggcttcttt tccaccagct   4380
gatccagcta ttgaagctgc tatttcttca agaattatga aaccagttgc tccaaaattt   4440
tatgctaggt tgaatattga tgaacaagac gaaacaagag atccaatttt gaacaaagat   4500
aatgctccat ctagttcatc tagttcctct tcatctagtt cttcatctag ttctccatct   4560
ccagctcctt ctgctccagt tcaaaaaaaa gctgctccag ctgctgaaac taaagctgtt   4620
gcttctgctg atgctttgag atctgctttg ttggatttgg attctatgtt ggctttgtct   4680
tctgcttctg cttctggtaa tttggttgaa actgctccat ctgatgcttc tgttattgtt   4740
ccaccatgta atattgctga tttgggttca agagctttta tgaaaactta tggtgtttct   4800
gctccattgt acactggtgc tatggctaaa ggtattgctt ctgctgattt ggttattgct   4860
gctggtagac aaggcatttt ggcttctttt ggtgctggtg gtttgccaat gcaagttgtt   4920
agagaatcta ttgaaaaaat tcaagctgct ttgccaaatg gtccatatgc tgttaatttg   4980
attcattctc catttgattc taatttggaa aaaggtaatg ttgatttgtt tttggaaaaa   5040
ggtgttactt ttgttgaagc atctgctttt atgactttga ctccacaagt tgttaggtac   5100
agagctgctg gtttgactag aaatgctgat ggttctgtta atattagaaa tagaattatc   5160
ggaaaggttt caagaactga attggctgaa atgtttatga gacctgcccc agaacacttg   5220
ttgcaaaaat tgattgcttc tggtgaaatt aatcaagaac aagctgaatt ggctagaaga   5280
gttccagttg ctgatgatat tgctgttgaa gctgattctg gtggtcatac tgataataga  5340
ccaattcatg ttatcttgcc attgattatt aatttgagag acagattgca tagagaatgt  5400
ggttatccag ctaatttgag agttagagtt ggtgctggtg gtggtattgg ttgtccacaa  5460
gctgctttgg ctacttttaa tatgggtgct tctttcattg ttactggcac tgttaatcaa  5520
gttgctaaac aatctggtac ttgtgataat gttagaaaac aattggctaa agctacttat  5580
tctgatgttt gcatggctcc agctgctgat atgtttgaag aaggtgttaa attgcaagtt  5640
ttgaagaaag ggacaatgtt tccatcaaga gctaataagt tatacgaatt gttttgcaag  5700
tatgattctt ttgaatctat gccaccagct gaattggcta gagttgaaaa aagaattttc  5760
tcaagagctt tggaagaagt ttgggatgaa actaaaaatt tttacattaa taggttgcac  5820
aatccagaaa aaattcaaag agctgaaaga gatccaaaat tgaaaatgtc tttgtgtttt  5880
agatggtatt tgtctttggc ttcaagatgg gctaatactg gtgcttctga tagagttatg  5940
gattatcaag tttggtgtgg tccagctatt ggttctttta atgatttcat taaaggcacc  6000
tacttggacc cagctgttgc taacgaatat ccatgcgttg ttcaaattaa caaacaaatt  6060
ttgagaggtg cttgtttcct cagaagattg gaaattttga gaaatgctag gttgtctgat  6120
ggtgctgctg ctttggttgc ttctattgat gatacttatg ttccagctga aaaattgtaa  6180
<210>37
<211>6180
<212>DNA
<213>人工
<220>
<223>合成的
<400>37
atggccgctc gcaacgtgtc tgcagcgcat gagatgcacg atgaaaagcg catcgccgtc  60
gtcggcatgg ccgtccagta cgccggatgc aaaaccaagg acgagttctg ggaggtgctc  120
atgaacggca aggtcgagtc caaggtgatc agcgacaaac gactcggctc caactaccgc  180
gccgagcact acaaagcaga gcgcagcaag tatgccgaca ccttttgcaa cgaaacgtac  240
ggcacccttg acgagaacga gatcgacaac gagcacgaac tcctcctcaa cctcgccaag  300
caggcactcg cagagacatc cgtcaaagac tcgacacgct gcggcatcgt cagcggctgc  360
ctctcgttcc ccatggacaa cctccagggt gaactcctca acgtgtacca aaaccatgtc  420
gagaaaaagc tcggggcccg cgtcttcaag gacgcctccc attggtccga acgcgagcag  480
tccaacaaac ccgaggccgg tgaccgccgc atcttcatgg acccggcctc cttcgtcgcc  540
gaagaactca acctcggcgc ccttcactac tccgtcgacg cagcatgcgc cacggcgctc  600
tacgtgctcc gcctcgcgca ggatcatctc gtctccggcg ccgccgacgt catgctctgc  660
ggtgccacct gcctgccgga gccctttttc atcctttcgg gcttttccac cttccaggcc  720
atgcccgtcg gcacgggcca gaacgtgtcc atgccgctgc acaaggacag ccagggcctc  780
accccgggtg agggcggctc catcatggtc ctcaagcgtc tcgatgatgc catccgcgac  840
ggcgaccaca tctacggcac ccttctcggc gccaatgtca gcaactccgg cacaggtctg   900
cccctcaagc cccttctccc cagcgagaaa aagtgcctca tggacaccta cacgcgcatt   960
aacgtgcacc cgcacaagat tcagtacgtc gagtgccacg ccaccggcac gccccagggt   1020
gatcgtgtgg aaatcgacgc cgtcaaggcc tgctttgaag gcaaggtccc ccgtttcggt   1080
accacaaagg gcaactttgg acacaccctc gtcgcagccg gctttgccgg tatgtgcaag   1140
gtcctcctct ccatgaagca tggcatcatc ccgcccaccc cgggtatcga tgacgagacc   1200
aagatggacc ctctcgtcgt ctccggtgag gccatcccat ggccagagac caacggcgag   1260
cccaagcgcg ccggtctctc ggcctttggc tttggtggca ccaacgccca tgccgtcttt   1320
gaggagcatg acccctccaa cgccgcctgc acgggccacg actccatttc tgcgctctcg   1380
gcccgctgcg gcggtgaaag caacatgcgc atcgccatca ctggtatgga cgccaccttt   1440
ggcgctctca agggactcga cgccttcgag cgcgccattt acaccggcgc tcacggtgcc   1500
atcccactcc cagaaaagcg ctggcgcttt ctcggcaagg acaaggactt tcttgacctc   1560
tgcggcgtca aggccacccc gcacggctgc tacattgaag atgttgaggt cgacttccag   1620
cgcctccgca cgcccatgac ccctgaagac atgctcctcc ctcagcagct tctggccgtc   1680
accaccattg accgcgccat cctcgactcg ggaatgaaaa agggtggcaa tgtcgccgtc   1740
tttgtcggcc tcggcaccga cctcgagctc taccgtcacc gtgctcgcgt cgctctcaag   1800
gagcgcgtcc gccctgaagc ctccaagaag ctcaatgaca tgatgcagta cattaacgac   1860
tgcggcacat ccacatcgta cacctcgtac attggcaacc tcgtcgccac gcgcgtctcg   1920
tcgcagtggg gcttcacggg cccctccttt acgatcaccg agggcaacaa ctccgtctac   1980
cgctgcgccg agctcggcaa gtacctcctc gagaccggcg aggtcgatgg cgtcgtcgtt   2040
gcgggtgtcg atctctgcgg cagtgccgaa aacctttacg tcaagtctcg ccgcttcaag   2100
gtgtccacct ccgatacccc gcgcgccagc tttgacgccg ccgccgatgg ctactttgtc   2160
ggcgagggct gcggtgcctt tgtgctcaag cgtgagacta gctgcaccaa ggacgaccgt   2220
atctacgctt gcatggatgc catcgtccct ggcaacgtcc ctagcgcctg cttgcgcgag   2280
gccctcgacc aggcgcgcgt caagccgggc gatatcgaga tgctcgagct cagcgccgac   2340
tccgcccgcc acctcaagga cccgtccgtc ctgcccaagg agctcactgc cgaggaggaa   2400
atcggcggcc ttcagacgat ccttcgtgac gatgacaagc tcccgcgcaa cgtcgcaacg   2460
ggcagtgtca aggccaccgt cggtgacacc ggttatgcct ctggtgctgc cagcctcatc   2520
aaggctgcgc tttgcatcta caaccgctac ctgcccagca acggcgacga ctgggatgaa   2580
cccgcccctg aggcgccctg ggacagcacc ctctttgcgt gccagacctc gcgcgcttgg   2640
ctcaagaacc ctggcgagcg tcgctatgcg gccgtctcgg gcgtctccga gacgcgctcg   2700
tgctattccg tgctcctctc cgaagccgag ggccactacg agcgcgagaa ccgcatctcg   2760
ctcgacgagg aggcgcccaa gctcattgtg cttcgcgccg actcccacga ggagatcctt   2820
ggtcgcctcg acaagatccg cgagcgcttc ttgcagccca cgggcgccgc cccgcgcgag   2880
tccgagctca aggcgcaggc ccgccgcatc ttcctcgagc tcctcggcga gacccttgcc   2940
caggatgccg cttcttcagg ctcgcaaaag cccctcgctc tcagcctcgt ctccacgccc   3000
tccaagctcc agcgcgaggt cgagctcgcg gccaagggta tcccgcgctg cctcaagatg   3060
cgccgcgatt ggagctcccc tgctggcagc cgctacgcgc ctgagccgct cgccagcgac   3120
cgcgtcgcct tcatgtacgg cgaaggtcgc agcccttact acggcatcac ccaagacatt   3180
caccgcattt ggcccgaact ccacgaggtc atcaacgaaa agacgaaccg tctctgggcc   3240
gaaggcgacc gctgggtcat gccgcgcgcc agcttcaagt cggagctcga gagccagcag   3300
caagagtttg atcgcaacat gattgaaatg ttccgtcttg gaatcctcac ctcaattgcc   3360
ttcaccaatc tggcgcgcga cgttctcaac atcacgccca aggccgcctt tggcctcagt   3420
cttggcgaga tttccatgat ttttgccttt tccaagaaga acggtctcat ctccgaccag   3480
ctcaccaagg atcttcgcga gtccgacgtg tggaacaagg ctctggccgt tgaatttaat   3540
gcgctgcgcg aggcctgggg cattccacag agtgtcccca aggacgagtt ctggcaaggc   3600
tacattgtgc gcggcaccaa gcaggatatc gaggcggcca tcgccccgga cagcaagtac   3660
gtgcgcctca ccatcatcaa tgatgccaac accgccctca ttagcggcaa gcccgacgcc   3720
tgcaaggctg cgatcgcgcg tctcggtggc aacattcctg cgcttcccgt gacccagggc   3780
atgtgcggcc actgccccga ggtgggacct tataccaagg atatcgccaa gatccatgcc   3840
aaccttgagt tccccgttgt cgacggcctt gacctctgga ccacaatcaa ccagaagcgc   3900
ctcgtgccac gcgccacggg cgccaaggac gaatgggccc cttcttcctt tggcgagtac   3960
gccggccagc tctacgagaa gcaggctaac ttcccccaaa tcgtcgagac catttacaag   4020
caaaactacg acgtctttgt cgaggttggg cccaacaacc accgtagcac cgcagtgcgc   4080
accacgcttg gtccccagcg caaccacctt gctggcgcca tcgacaagca gaacgaggat   4140
gcttggacga ccatcgtcaa gcttgtggct tcgctcaagg cccaccttgt tcctggcgtc   4200
acgatctcgc cgctgtacca ctccaagctt gtggcggagg ctgaggcttg ctacgctgcg   4260
ctctgcaagg gtgaaaagcc caagaagaac aagtttgtgc gcaagattca gctcaacggt   4320
cgcttcaaca gcaaggcgga ccccatctcc tcggccgatc ttgccagctt tccgcctgcg   4380
gaccctgcca ttgaagccgc catctcgagc cgcatcatga agccggttgc tccgaagttc   4440
tacgcgcgtc tcaacattga cgagcaggac gagacccgtg atccgatcct caacaaggac   4500
aacgcgccgt cttccagctc tagctcctct tccagctctt ccagctcttc cagcccgtcg   4560
ccagctccgt ccgccccagt gcaaaagaag gctgctccgg ccgcggagac caaggctgtt   4620
gcttcggctg acgcacttcg cagtgccctg ctcgatctcg acagtatgct tgcgctgagc   4680
tctgccagtg cctccggcaa ccttgttgag actgcgccta gcgacgcctc ggtcattgtg   4740
ccgccctgca acattgcgga tctcggcagc cgcgccttca tgaaaacgta cggtgtttcg   4800
gcgcctctgt acacgggcgc catggccaag ggcattgcct ctgcggacct cgtcattgcc   4860
gccggccgcc agggcatcct tgcgtccttt ggcgccggcg gacttcccat gcaggttgtg   4920
cgtgagtcca tcgaaaagat tcaggccgcc ctgcccaatg gcccgtacgc tgtcaacctt   4980
atccattctc cctttgacag caacctcgaa aagggcaatg tcgatctctt cctcgagaag  5040
ggtgtcacct ttgtcgaggc ctcggccttt atgacgctca ccccgcaggt cgtgcggtac  5100
cgcgcggctg gcctcacgcg caacgccgac ggctcggtca acatccgcaa ccgtatcatt  5160
ggcaaggtct cgcgcaccga gctcgccgag atgttcatgc gtcctgcgcc cgagcacctt  5220
cttcagaagc tcattgcttc cggcgagatc aaccaggagc aggccgagct cgcccgccgt  5280
gttcccgtcg ctgacgacat cgcggtcgaa gctgactcgg gtggccacac cgacaaccgc  5340
cccatccacg tcattctgcc cctcatcatc aaccttcgcg accgccttca ccgcgagtgc  5400
ggctacccgg ccaaccttcg cgtccgtgtg ggcgccggcg gtggcattgg gtgcccccag  5460
gcggcgctgg ccaccttcaa catgggtgcc tcctttattg tcaccggcac cgtgaaccag  5520
gtcgccaagc agtcgggcac gtgcgacaat gtgcgcaagc agctcgcgaa ggccacttac  5580
tcggacgtat gcatggcccc ggctgccgac atgttcgagg aaggcgtcaa gcttcaggtc  5640
ctcaagaagg gaaccatgtt tccctcgcgc gccaacaagc tctacgagct cttttgcaag  5700
tacgactcgt tcgagtccat gccccccgca gagcttgcgc gcgtcgagaa gcgcatcttc  5760
agccgcgcgc tcgaagaggt ctgggacgag accaaaaact tttacattaa ccgtcttcac  5820
aacccggaga agatccagcg cgccgagcgc gaccccaagc tcaagatgtc gctgtgcttt  5880
cgctggtacc tgagcctggc gagccgctgg gccaacactg gagcttccga tcgcgtcatg  5940
gactaccagg tctggtgcgg tcctgccatt ggttccttca acgatttcat caagggaact  6000
taccttgatc cggccgtcgc aaacgagtac ccgtgcgtcg ttcagattaa caagcagatc  6060
cttcgtggag cgtgcttctt gcgccgtctc gaaattctgc gcaacgcacg cctttccgat  6120
ggcgctgccg ctcttgtggc cagcatcgat gacacatacg tcccggccga gaagctgtaa  6180
<210>38
<211>8436
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(8433)
<400>38
atg aag gac atg gaa gat aga cgg gtc gct att gtg ggc atg tca gct    48
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1               5                   10                  15
cac ttg cct tgt ggg aca gat gtg aag gaa tca tgg cag gct att cgc    96
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
            20                  25                  30
gat gga atc gac tgt cta agt gac cta ccc gcg gat cgt ctc gac gtt    144
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
        35                  40                  45
aca gct tac tac aat ccc aac aaa gcc acg aaa gac aag atc tac tgc    192
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
    50                  55                  60
aaa cgg ggt ggc ttc atc ccg aac tat gac ttc gac ccc cgc gaa ttt    240
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65                  70                  75                  80
ggg ctc aac atg ttt caa atg gaa gac tct gat gcg aat cag aca ctt      288
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
                85                  90                  95
acc ttg ctc aaa gtc aaa caa gct ctc gaa gat gca agc ata gag cct      336
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
            100                 105                 110
ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg      384
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
        115                 120                 125
ggc caa aag gcg agt cat gag ttc tac tct cgt ctc aac tac gtt gtc      432
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
    130                 135                 140
gtt gaa aag gta ctt cgg aaa atg ggt tta cca gat gct gat gtt gaa      480
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145                 150                 155                 160
gaa gct gtg gag aaa tac aag gca aat ttt ccc gag tgg cgc cta gac      528
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
                165                 170                 175
tct ttc cct ggg ttt ctt ggg aat gta acg gct ggt cgg tgc agt aac      576
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
            180                 185                 190
acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat gct gca tgt gcc      624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
        195                 200                 205
agt tct cta att gca atc aag gtt gca gtt gaa gag cta ctc ttt ggt      672
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
    210                 215                 220
gac tgt gac acc atg att gca ggt gcc acc tgc acg gac aat tca ctt      720
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225                 230                 235                 240
ggc atg tac atg gcc ttc tct aaa acg cca gtt ttt tct act gac cca      768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
                245                 250                 255
agt gtc cgc gcg tat gat gag aaa aca aaa ggg atg cta att gga gaa      816
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
            260                 265                 270
ggt tca gca atg ttc gtt ctt aaa cgc tat gcg gat gcc gta cgt gat      864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
        275                 280                 285
ggc gac aca att cac gcg gtt ctg cgt tct tgc tct tcg tct agt gat      912
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
    290                 295                 300
gga aaa gcg gca gga att tat act cct act ata tct gga caa gaa gaa      960
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305                 310                 315                 320
gct ttg cgt cga gcg tat gcc cgt gcg ggg gta tgt cca tct acg atc      1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala G1y Val Cys Pro Ser Thr Ile
                325                 330                 335
ggg ctt gtt gag ggt cac ggg aca ggg acc cct gtt gga gat cgc att      1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
            340                 345                 350
gag tta aca gct ctg cgg aac ttg ttt gac aaa gct ttt ggt agc aag     1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
        355                 360                 365
aag gaa caa ata gca gtt ggc agc ata aag tct cag ata ggt cac ctg     1152
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
    370                 375                 380
aaa tct gtt gcc ggc ttt gcc ggc ttg gtc aaa gct gtg ctt gcg ctt     1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385                 390                 395                 400
aaa cac aaa acg ctc cca ggt tcg att aat gtc gac cag cca cct ttg     1248
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
                405                 410                 415
ttg tat gac ggt act caa att caa gac tct tct tta tat atc aac aag     1296
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
            420                 425                 430
aca aat aga cca tgg ttt acg caa aac aag ctt ccg cgt cgg gct ggt     1344
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
        435                 440                 445
gtc tca agt ttt gga ttt gga ggt gca aac tac cac gcg gtt ctg gaa     1392
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
    450                 455                 460
gaa ttc gag ccc gag cat gaa aaa cca tac cgc ctc aat act gtt gga     1440
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465                 470                 475                 480
cat cct gtc ctc ttg tac gct ccg tct gtg gaa gcc ctc aaa gta ctt     1488
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
                485                 490                 495
tgc aac gac cag ctt gcg gag ctc aca att gca ttg gaa gag gca aaa     1536
Cys Asn Asp Gln Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys
            500                 505                 510
aca cat aaa aat gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa     1584
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu
        515                 520                 525
ttt cag ctc caa gga agc tgt cct cca gaa aat ccg aga gta gga ttt     1632
Phe Gln Leu Gln Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe
    530                 535                 540
tta gca aca ctg cct act tca aat atc att gtc gcg ctt aag gca att     1680
Leu Ala Thr Leu Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile
545                 550                 555                 560
ctc gcg cag ctt gat gca aaa cca gat gcg aag aaa tgg gat ttg cct     1728
Leu Ala Gln Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro
                565                 570                 575
cat aaa aag gct ttt ggg gct acc ttc gca tcg tct tca gtg aaa ggc     1776
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly
            580                 585                 590
tct gtt gct gcg ctc ttc gca gga cag ggt acc cag tac tta aac atg     1824
Ser Val Ala Ala Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met
        595                 600                 605
ttc tct gat gtg gca atg aac tgg cca ccg ttc cgt gac agc att gtc     1872
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val
    610                 615                 620
gca atg gaa gaa gct caa act gag gta ttt gag ggc caa gtt gaa cca     1920
Ala Met Glu Glu Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro
625                 630                 635                 640
att agc aaa gtt ctg ttt cca cga gag cgc tat gca tcc gaa agt gaa     1968
Ile Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu
                645                 650                 655
cag ggg aat gaa ctt ctt tgc tta aca gag tac tct cag cca act acg     2016
Gln Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr
            660                 665                 670
ata gca gcc gca gta ggg gcc ttc gat att ttc aaa gcg gct ggc ttt     2064
Ile Ala Ala Ala Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe
        675                 680                 685
aag cca gac atg gtt gga ggg cat tca ctt ggc gaa ttt gct gct ttg     2112
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu
    690                 695                 700
tac gcg gct ggg tcc att tcg cgt gac gac ctg tac aag ctt gtg tgc     2160
Tyr Ala Ala Gly Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys
705                 710                 715                 720
aaa cgg gca aag gca atg gcg aac gct agt gac gga gct atg gca gca     2208
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala
                725                 730                 735
gtg att ggc cca gat gca cgt cta gtt acg cca caa aat agt gac gtt     2256
Val Ile Gly Pro Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val
            740                 745                 750
tat gtc gca aac ttc aac tcc gca act caa gta gtc atc agt ggc act     2304
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr
        755                 760                 765
gtt caa ggt gtg aaa gaa gag tcg aaa ttg ctc att tca aag ggg ttc     2352
Val Gln Gly Val Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe
    770                 775                 780
cgc gta ctg cca ctt aaa tgc cag ggc gcc ttc cat tct cct ttg atg     2400
Arg Val Leu Pro Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met
785                 790                 795                 800
ggg cct tct gag gat agt ttc aaa tca ctt gtg gag act tgt acc atc     2448
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile
                805                 810                 815
tcg ccg cca aaa aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa     2496
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu
            820                 825                 830
agc cca aac cca aaa cag acc ctc aag tca cac atg acg tct agc gtt     2544
Ser Pro Asn Pro Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val
        835                 840                 845
cag ttc gag gag cag att cgt aac atg tac gat gcc gga gca cgt gtt     2592
Gln Phe Glu Glu Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val
    850                 855                 860
ttt ctg gag ttt gga ccc cgc caa gtc ctt gca aag ctt atc gcg gaa     2640
Phe Leu Glu Phe Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu
865                 870                 875                 880
atg ttt ccc tcg tgt aca gct atc agc gtt aac ccc gcg agc agt ggt     2688
Met Phe Pro Ser Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly
                885                 890                 895
gac agt gac gtg caa ctc cgc ctc gcc gcc gta aaa ttc gcg gtc tcg     2736
Asp Ser Asp Val Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser
            900                 905                 910
ggt gca gcc ctt agc acc ttt gat cca tgg gag tat cgc aag cca caa     2784
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln
        915                 920                 925
gat ctt ctt att cga aaa cca cga aaa act gcc ctt gtt cta tca gca     2832
Asp Leu Leu Ile Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala
    930                 935                 940
gca aca tat gtt tcc cca aag act ctt gca gaa cgt aaa aag gct atg     2880
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met
945                 950                 955                 960
gaa gat atc aag cta gta tcc att aca cca aga gat agt atg gta tca     2928
Glu Asp Ile Lys Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser
                965                 970                 975
att gga aaa atc gcg caa gaa gta cgg aca gct aaa cag cct tta gaa     2976
Ile Gly Lys Ile Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu
            980                 985                 990
acc gaa att cga aga ctc aac aaa gaa tta gaa cat ctc aag aga gag     3024
Thr Glu Ile Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu
        995                 1000                1005
cta gca gca gcc aaa gcg agt gtc aag tct gca tca aaa agc tct         3069
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser
    1010                1015                1020
aaa gag cga tct gtc cta tca aag cac cgc gct ttg ctt caa aac         3114
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gln Asn
    1025                1030                1035
att ttg caa gac tac gat gat ctt cgt gtg gtg cca ttc gct gtt         3159
Ile Leu Gln Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val
    1040                1045                1050
cgt tct gtt gca gtg gac aac acc gcg ccg tat gct gac caa gtt         3204
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gln Val
    1055                1060                1065
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa         3249
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys
    1070                1075                1080
cgc agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg         3294
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala
    1085                1090                1095
gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca atg         3339
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met
    1100                1105                1110
atc gag atg gac atg gac ctg gag agt gag ctt ggc gtt gat agc         3384
Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
    1115                1120                1125
atc aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc         3429
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser
    1130                1135                1140
gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt         3474
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val
    1145                1150                1155
ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc caa         3519
Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln
    1160                1165                1170
ggc cag act ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tcc      3564
Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
    1175                1180                1185
gag cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt      3609
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val
    1190                1195                1200
tcg tca gca cgc ctc gct gaa gct gaa gct gcg gta ctg agc gtt      3654
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val
    1205                1210                1215
ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg gac      3699
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp
    1220                1225                1230
atg gac ctg gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg      3744
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    1235                1240                1245
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc      3789
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser
    1250                1255                1260
gac gtt gac gct ctg tca aga act aag act gtt ggc gac gtc atc      3834
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile
    1265                1270                1275
gag gcg atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg      3879
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu
    1280                1285                1290
acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta      3924
Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
    1295                1300                1305
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc      3969
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg
    1310                1315                1320
ctc gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag      4014
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys
    1325                1330                1335
aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg gag      4059
Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu
    1340                1345                1350
agc gag ctt ggc gtc gac agc atc aaa cgc gtg gag atc atg agc      4104
Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
    1355                1360                1365
gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac gtt gac gct      4149
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala
    1370                1375                1380
ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag      4194
Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys
    1385                1390                1395
ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa tcg      4239
Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser
    1400                1405                1410
atc cgt cag cca ccg gtg tcc gag cct gct gta ccg acc tca tcg      4284
Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
    1415                1420                1425
tca agc agt att gct aat gtt ttg tca gca cgc ctc gct gaa gct      4329
Ser Ser Ser Ile Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala
    1430                1435                1440
gaa gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac      4374
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp
    1445                1450                1455
agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt ggc      4419
Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly
    1460                1465                1470
gtt gat agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg      4464
Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
    1475                1480                1485
ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc      4509
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr
    1490                1495                1500
aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt      4554
Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly
    1505                1510                1515
gga ccc caa ggc cag act ttg acc gcg gaa tcg atc cgt cag cca      4599
Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro
    1520                1525                1530
ccg gtg tct gag cct gct gta ccg acc tca tcg tca agc agt att      4644
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
    1535                1540                1545
gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta      4689
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val
    1550                1555                1560
ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc      4734
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile
    1565                1570                1575
gag atg gac atg gac ctg gag agt gag ctt ggc gtc gac agc atc      4779
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile
    1580                1585                1590
aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc gtg      4824
Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
    1595                1600                1605
gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt ggc      4869
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly
    1610                1615                1620
gac gtc atc gag gcg atg aag cta gaa ctc ggt gga ccc caa ggc      4914
Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly
    1625                1630                1635
cag act ttg acc tct gaa ccg atc cat cag cca cca gtg tcc gag      4959
Gln Thr Leu Thr Ser Glu Pro Ile His Gln Pro Pro Val Ser Glu
    1640                1645                1650
cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt tct      5004
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
    1655                1660                1665
tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc      5049
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu
    1670                1675                1680
gca gac aag aca ggc tac gac agc tca atg atc gag atg gac atg      5094
Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met
    1685                1690                1695
gac ctg gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg gaa      5139
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu
    1700                1705                1710
atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac      5184
Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
    1715                1720                1725
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag      5229
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu
    1730                1735                1740
gcg atg aag atg gaa ctc ggt gga ccc caa ggc cag act ttg acc      5274
Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr
    1745                1750                1755
gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta ccg      5319
Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro
    1760                1765                1770
acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc      5364
Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
    1775                1780                1785
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca      5409
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr
    1790                1795                1800
ggc tac gac agc tca atg atc gag atg gac atg gac ctg gag agc      5454
Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser
    1805                1810                1815
gag ctt ggc gtt gat agc atc aaa cgc gtg gag atc atg agc gag      5499
Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu
    1820                1825                1830
gtt caa gcg ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg      5544
Val Gln Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
    1835                1840                1845
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag atg      5589
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Met
    1850                1855                1860
gaa ctc ggt gga ccc caa ggc cag act ttg acc gca gaa tcg atc      5634
Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile
    1865                1870                1875
cgt gag cca ccg gtg tct gag cct gct gta ccg acc tca tcg tca      5679
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser
    1880                1885                1890
agt agt atc gct aat gtt tct tca gct cgc ctc gct gaa gct gaa      5724
Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
    1895                1900                1905
gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc      5769
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser
    1910                1915                1920
tca atg atc gag atg gac atg gac ctg gag agt gag ctt ggc gtc      5814
Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val
    1925                1930                1935
gac agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg ttg      5859
Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu
    1940                1945                1950
ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag      5904
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
    1955                1960                1965
act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctt ggg gaa      5949
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Glu
    1970                1975                1980
tca tca agt att gag act ctc aat tgt acc gag gtt gag cac acg      5994
Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr
    1985                1990                1995
agc tac aaa agt gtc aag gct tca ggg tgt gag aat gta gat acc      6039
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr
    2000                2005                2010
cgt ttc gct aag gtt gta caa atc tcg ctt cct agc aag ctg aaa      6084
Arg Phe Ala Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys
    2015                2020                2025
tcc act gtg tcg cac gat cga cct gta att gtt gta gat gat gga      6129
Ser Thr Val Ser His Asp Arg Pro Val Ile Val Val Asp Asp Gly
    2030                2035                2040
acg ccc tta acc acg gag ctt tgt aaa att ctt ggg ggt aat att      6174
Thr Pro Leu Thr Thr Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile
    2045                2050                2055
gtg gtt ctc tct tat caa ggg aag ccc gct ggt cca cgg gga gtc      6219
Val Val Leu Ser Tyr Gln Gly Lys Pro Ala Gly Pro Arg Gly Val
    2060                2065                2070
gag gtg cca gat ctt tcc gag gaa gcc cta att caa gct ctt gca      6264
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu Ile Gln Ala Leu Ala
    2075                2080                2085
ttg att cgg tct aca tat gga gtt cca att ggt ttt att tgt cag      6309
Leu Ile Arg Ser Thr Tyr Gly Val Pro Ile Gly Phe Ile Cys Gln
    2090                2095                2100
caa gtg tct aat gtg agc acc aag gca cag ctt tgt tgg gca ctc      6354
Gln Val Ser Asn Val Ser Thr Lys Ala Gln Leu Cys Trp Ala Leu
    2105                2110                2115
ctc gca gcg aag cat ctc aag aag gat ttg aat gct gtc tta ccc      6399
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro
    2120                2125                2130
gat tca aga tcc ttc ttc gtc gga gtt gta cgc ttg aac ggg aaa      6444
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys
    2135                2140                2145
ctt gga act ttc gaa aac atc agc gac ttc tct aaa ttt gat ttg      6489
Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys Phe Asp Leu
    2150                2155                2160
acg aaa gcc cta gat tac gga cag cgt ggt tct ctc tta ggc ctg      6534
Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu Gly Leu
    2165                2170                2175
tgc aag tca cta gac tta gaa tgg gaa cag gtg ttt tgc cgt gga      6579
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg Gly
    2180                2185                2190
ata gat ctt gcg tgt gat ctt atg cca ctc cag gcc gca agg ata      6624
Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
    2195                2200                2205
ctc aga aat gag ctt cag tgt ccc aat atg cgc ctt cgc gag gtt       6669
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val
    2210                2215                2220
ggg tac gat att tct ggc gcc agg tac acc att tca acc gat gac       6714
Gly Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp
    2225                2230                2235
ctg cta tgt gga ccc tcg aag gct aaa gta gag gcc gca gac ttg       6759
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu
    2240                2245                2250
ttt ctt gtg aca ggt ggc gca cga ggt att aca cct cat tgt gtt       6804
Phe Leu Val Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val
    2255                2260                2265
cgt gag att gca agt cga tcc ccc gga acc aca ttt gtg ctg gtt       6849
Arg Glu Ile Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val
    2270                2275                2280
gga aga agc gaa atg tcc gac gag cct gac tgg gct gtt ggc cac       6894
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His
    2285                2290                2295
tac aat aaa gac ctg gac caa agc aca atg aaa cac ttg aaa gca       6939
Tyr Asn Lys Asp Leu Asp Gln Ser Thr Met Lys His Leu Lys Ala
    2300                2305                2310
acg cat gct gct gga ggg gta aaa cct acg cct aaa gca cat cgt       6984
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg
    2315                2320                2325
gca ctt gtg aac agg gtc act ggc tca cgg gag gta cga gaa tct       7029
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser
    2330                2335                2340
ctt aga gca atc cag gag gca ggg gca aat gtc gaa tat atc gcc       7074
Leu Arg Ala Ile Gln Glu Ala Gly Ala Asn Val Glu Tyr Ile Ala
    2345                2350                2355
tgt gat gtt tcg gat gaa aac aag gtc cgc caa ctt gtg caa aga       7119
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gln Leu Val Gln Arg
    2360                2365                2370
gtg gag caa aag tat ggc tgt gaa ata act ggg att tgg cat gca       7164
Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly Ile Trp His Ala
    2375                2380                2385
agc ggg gtt ctt cgt gac aaa ctt gtc gag caa aag act aca gac       7209
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys Thr Thr Asp
    2390                2395                2400
gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ctt gta aac       7254
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn
    2405                2410                2415
atc gtg tca caa gtc aat atg tct aag cta cga cac ttc atc ctc       7299
Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile Leu
    2420                2425                2430
ttc agt tct ttg gct gga ttt cat ggg aac aag ggc caa acg gat       7344
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
    2435                2440                2445
tat gca att gct aat gaa gcc ttg aac aaa atc gcg cat act ctc       7389
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu
    2450                2455                2460
tca gcg ttt ttg ccc aaa ctg aat gca aag gtg cta gac ttc ggt      7434
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly
    2465                2470                2475
ccg tgg gta ggt tca gga atg gta acc gaa aca ctt gag aag cat      7479
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His
    2480                2485                2490
ttt aaa gct atg ggg gtt cag act att cct ctc gag cca gga gca      7524
Phe Lys Ala Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala
    2495                2500                2505
cgg act gtt gcg caa atc att ttg gca agt tcg cca ccg caa tog      7569
Arg Thr Val Ala Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser
    2510                2515                2520
ctt ttg ggg aac tgg ggc ttt cca gcc acc aaa ccg cta caa cgc      7614
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg
    2525                2530                2535
tct aat gta gtc acg ggc aca ctc tct ccg gaa gag ata gaa ttc      7659
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu Ile Glu Phe
    2540                2545                2550
atc gca gac cac aaa att caa ggc cgc aag gtg ctt ccc atg atg      7704
Ile Ala Asp His Lys Ile Gln Gly Arg Lys Val Leu Pro Met Met
    2555                2560                2565
gct gca atc ggg ttc atg gcc tct att gcg gaa gga ctc tac ccg      7749
Ala Ala Ile Gly Phe Met Ala Ser Ile Ala Glu Gly Leu Tyr Pro
    2570                2575                2580
ggg tac aat ctg caa ggc gtg gaa aat gct cag ctc ttt caa ggc      7794
Gly Tyr Asn Leu Gln Gly Val Glu Asn Ala Gln Leu Phe Gln Gly
    2585                2590                2595
ttg act atc aac caa gag aca aaa ttt caa atc act ctc att gag      7839
Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln Ile Thr Leu Ile Glu
    2600                2605                2610
gag cac aac tct gag gaa aac ctg gat gtc ctg aca tcc ctt ggt      7884
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr Ser Leu Gly
    2615                2620                2625
gta atg ttg gaa agc ggg aag gtg ctt ccc gct tac cga tgt gtt      7929
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val
    2630                2635                2640
gta tgc ttg aat aca acc cag cag cag ccc aag cta tct cca aaa      7974
Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser Pro Lys
    2645                2650                2655
att ctt aac ttg gaa gtt gac cot gca tgc gag gtt aac ccc tat      8019
Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr
    2660                2665                2670
gat gga aag tcg ttg ttc cac ggt ccg ctt ttg caa ttc gtt caa      8064
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
    2675                2680                2685
caa gtg ttg cac tca agt acc aaa ggc ctc gtt gcc aag tgc cgc      8109
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg
    2690                2695                2700
gcg ctt cca atc aaa gaa gcc atc cga ggg cca ttt atc aag caa      8154
Ala Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln
    2705                2710                2715
aca ctc cat gat cca att cta gac gac gtc att ttt cag cta atg 8199
Thr Leu His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met
    2720                2725                2730
ctc gtg tgg tgt cgt aat gct cta gga agt gca tcg cta ccc aac 8244
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn
    2735                2740                2745
aga att gaa aag atg tca tac ttt ggg aat gtc tca gaa ggt agc 8289
Arg Ile Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser
    2750                2755                2760
act ttc ttt gcc tca gtt aca cct gtg gga cca aga gta cca aag 8334
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys
    2765                2770                2775
gat ccc gtg atc aaa atg cag ttt ctt ctc caa gat gaa tcc ggc 8379
Asp Pro Val Ile Lys Met Gln Phe Leu Leu Gln Asp Glu Ser Gly
    2780                2785                2790
aac aca ttt tca tcg ggg gag ggc tcg gtt gtg ctt agt gac gaa 8424
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu
    2795                2800                2805
ctc gtc ttt tga                                             8436
Leu Val Phe
    2810
<210>39
<211>2811
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>39
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1               5                   10                  15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
            20                  25                  30
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
        35                  40                  45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
    50                  55                  60
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65                  70                  75                  80
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
                85                  90                  95
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
            100                 105                 110
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
        115                 120                 125
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
    130                 135                 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145                 150                 155                 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
                165                 170                 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
            180                 185                 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
        195                 200                 205
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
    210                 215                 220
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225                 230                 235                 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
                245                 250                 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
           260                 265                 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
        275                 280                 285
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
    290                 295                 300
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305                 310                 315                 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
                325                 330                 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
            340                 345                 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
        355                 360                 365
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
    370                 375                 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385                 390                 395                 400
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
                405                 410                 415
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
            420                 425                 430
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
        435                 440                 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
    450                 455                 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465                 470                 475                 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
                485                 490                 495
Cys Asn Asp Gln Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys
            500                 505                 510
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu
        515                 520                 525
Phe Gln Leu Gln Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe
    530                 535                 540
Leu Ala Thr Leu Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile
545                 550                 555                 560
Leu Ala Gln Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro
                565                 570                 575
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly
            580                 585                 590
Ser Val Ala Ala Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met
        595                 600                 605
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val
    610                 615                 620
Ala Met Glu Glu Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro
625                 630                 635                 640
Ile Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu
                645                 650                 655
Gln Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr
            660                 665                 670
Ile Ala Ala Ala Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe
       675                 680                 685
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu
    690                 695                 700
Tyr Ala Ala Gly Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys
705                 710                 715                 720
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala
                725                 730                 735
Val Ile Gly Pro Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val
            740                 745                 750
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr
        755                 760                 765
Val Gln Gly Val Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe
    770                 775                 780
Arg Val Leu Pro Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met
785                 790                 795                 800
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile
                805                 810                 815
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu
            820                 825                 830
Ser Pro Asn Pro Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val
        835                 840                 845
Gln Phe Glu Glu Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val
    850                 855                 860
Phe Leu Glu Phe Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu
865                 870                 875                 880
Met Phe Pro Ser Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly
                885                 890                 895
Asp Ser Asp Val Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser
            900                 905                 910
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln
        915                 920                 925
Asp Leu Leu Ile Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala
    930                 935                 940
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met
945                 950                 955                 960
Glu Asp Ile Lys Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser
                965                 970                 975
Ile Gly Lys Ile Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu
            980                 985                 990
Thr Glu Ile Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu
        995                 1000                1005
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser
    1010                1015                1020
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gln Asn
    1025                1030                1035
Ile Leu Gln Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val
    1040                1045                1050
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gln Val
    1055                1060                1065
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys
    1070                1075                1080
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala
    1085                1090                1095
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met
    1100                1105                1110
Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
    1115                1120                1125
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser
    1130                1135                1140
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val
    1145                1150                1155
Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln
    1160                1165                1170
Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
    1175                1180                1185
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val
    1190                1195                1200
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val
    1205                1210                1215
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp
    1220                1225                1230
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    1235                1240                1245
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser
    1250                1255                1260
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile
    1265                1270                1275
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu
    1280                1285                1290
Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
    1295                1300                1305
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg
    1310                1315                1320
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys
    1325                1330                1335
Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu
    1340                1345                1350
Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
    1355                1360                1365
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala
    1370                1375                1380
Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys
    1385                1390                1395
Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser
    1400                1405                1410
Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
    1415                1420                1425
Ser Ser Ser Ile Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala
    1430                1435                1440
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp
    1445                1450                1455
Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly
    1460                1465                1470
Val Asp Ser lle Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
    1475                1480                1485
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr
    1490                1495                1500
Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly
    1505                1510                1515
Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro
    1520                1525                1530
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
    1535                1540                1545
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val
    1550                1555                1560
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile
    1565                1570                1575
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile
    1580                1585                1590
Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
    1595                1600                1605
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly
    1610                1615                1620
Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly
    1625                1630                1635
Gln Thr Leu Thr Ser Glu Pro Ile His Gln Pro Pro Val Ser Glu
    1640                1645                1650
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
    1655                1660                1665
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu
    1670                1675                1680
Ala Asp Lys Thr Gly Tyr Asp Sar Ser Met Ile Glu Met Asp Met
    1685                1690                1695
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu
    1700                1705                1710
Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
    1715                1720                1725
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu
    1730                1735                1740
Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr
    1745                1750                1755
Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro
    1760                1765                1770
Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
    1775                1780                1785
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr
    1790                1795                1800
Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser
    1805                1810                1815
Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu
    1820                1825                1830
Val Gln Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
    1835                1840                1845
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Met
    1850                1855                1860
Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile
    1865                1870                1875
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser
    1880                1885                1890
Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
    1895                1900                1905
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser
    1910                1915                1920
Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val
    1925                1930                1935
Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu
    1940                1945                1950
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
    1955                1960                1965
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Glu
    1970                1975                1980
Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr
    1985                1990                1995
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr
    2000                2005                2010
Arg Phe Ala Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys
    2015                2020                2025
Ser Thr Val Ser His Asp Arg Pro Val Ile Val Val Asp Asp Gly
    2030                2035                2040
Thr Pro Leu Thr Thr Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile
    2045                2050                2055
Val Val Leu Ser Tyr Gln Gly Lys Pro Ala Gly Pro Arg Gly Val
    2060                2065                2070
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu Ile Gln Ala Leu Ala
    2075                2080                2085
Leu Ile Arg Ser Thr Tyr Gly Val Pro Ile Gly Phe Ile Cys Gln
    2090                2095                2100
Gln Val Ser Asn Val Ser Thr Lys Ala Gln Leu Cys Trp Ala Leu
    2105                2110                2115
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro
    2120                2125                2130
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys
    2135                2140                2145
Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys Phe Asp Leu
    2150                2155                2160
Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu Gly Leu
    2165                2170                2175
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg Gly
    2180                2185                2190
Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
    2195                2200                2205
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val
    2210                2215                2220
Gly Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp
    2225                2230                2235
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu
    2240                2245                2250
Phe Leu Val Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val
    2255                2260                2265
Arg Glu Ile Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val
    2270                2275                2280
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His
    2285                2290                2295
Tyr Asn Lys Asp Leu Asp Gln Ser Thr Met Lys His Leu Lys Ala
    2300                2305                2310
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg
    2315                2320                2325
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser
    2330                2335                2340
Leu Arg Ala Ile Gln Glu Ala Gly Ala Asn Val Glu Tyr Ile Ala
    2345                2350                2355
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gln Leu Val Gln Arg
    2360                2365                2370
Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly Ile Trp His Ala
    2375                2380                2385
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys Thr Thr Asp
    2390                2395                2400
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn
    2405                2410                2415
Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile Leu
    2420                2425                2430
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
    2435                2440                2445
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu
    2450                2455                2460
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly
    2465                2470                2475
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His
    2480                2485                2490
Phe Lys Ala Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala
    2495                2500                2505
Arg Thr Val Ala Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser
    2510                2515                2520
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg
    2525                2530                2535
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu Ile Glu Phe
    2540                2545                2550
Ile Ala Asp His Lys Ile Gln Gly Arg Lys Val Leu Pro Met Met
    2555                2560                2565
Ala Ala Ile Gly Phe Met Ala Ser Ile Ala Glu Gly Leu Tyr Pro
    2570                2575                2580
Gly Tyr Asn Leu Gln Gly Val Glu Asn Ala Gln Leu Phe Gln Gly
    2585                2590                2595
Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln Ile Thr Leu Ile Glu
    2600                2605                2610
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr Ser Leu Gly
    2615                2620                2625
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val
    2630                2635                2640
Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser Pro Lys
    2645                2650                2655
Ile Leu Aan Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr
    2660                2665                2670
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
    2675                2680                2685
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg
    2690                2695                2700
Ala Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln
    2705                2710                2715
Thr Leu His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met
    2720                2725                2730
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn
    2735                2740                2745
Arg Ile Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser
    2750                2755                2760
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys
    2765                2770                2775
Asp Pro Val Ile Lys Met Gln Phe Leu Leu Gln Asp Glu Ser Gly
    2780                2785                2790
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu
    2795                2800                2805
Leu Val Phe
    2810
<210>40
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>40
atg aag gac atg gaa gat aga cgg gtc gct att gtg ggc atg tca gct    48
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1               5                   10                  15
cac ttg cct tgt ggg aca gat gtg aag gaa tca tgg cag gct att cgc    96
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
            20                  25                  30
gat gga atc gac tgt cta agt gac cta ccc gcg gat cgt ctc gac gtt    144
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
        35                  40                  45
aca gct tac tac aat ccc aac aaa gcc acg aaa gac aag atc tac tgc    192
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
    50                  55                  60
aaa cgg ggt ggc ttc atc ccg aac tat gac ttc gac ccc cgc gaa ttt    240
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65                  70                  75                  80
ggg ctc aac atg ttt caa atg gaa gac tct gat gcg aat cag aca ctt    288
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
                85                  90                  95
acc ttg ctc aaa gtc aaa caa gct ctc gaa gat gca agc ata gag cct    336
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
            100                 105                 110
ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg    384
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
        115                 120                 125
ggc caa aag gcg agt cat gag ttc tac tct cgt ctc aac tac gtt gtc    432
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
    130                 135                 140
gtt gaa aag gta ctt cgg aaa atg ggt tta cca gat gct gat gtt gaa    480
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145                 150                 155                 160
gaa gct gtg gag aaa tac aag gca aat ttt ccc gag tgg cgc cta gac    528
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
                165                 170                 175
tct ttc cct ggg ttt ctt ggg aat gta acg gct ggt cgg tgc agt aac     576
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
            180                 185                 190
acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat gct gca tgt gcc     624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
        195                 200                 205
agt tct cta att gca atc aag gtt gca gtt gaa gag cta ctc ttt ggt     672
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
    210                 215                 220
gac tgt gac acc atg att gca ggt gcc acc tgc acg gac aat tca ctt     720
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225                 230                 235                 240
ggc atg tac atg gcc ttc tct aaa acg cca gtt ttt tct act gac cca     768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
                245                 250                 255
agt gtc cgc gcg tat gat gag aaa aca aaa ggg atg cta att gga gaa     816
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
            260                 265                 270
ggt tca gca atg ttc gtt ctt aaa cgc tat gcg gat gcc gta cgt gat     864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
        275                 280                 285
ggc gac aca att cac gcg gtt ctg cgt tct tgc tct tcg tct agt gat     912
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
    290                 295                 300
gga aaa gcg gca gga att tat act cct act ata tct gga caa gaa gaa     960
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305                 310                 315                 320
gct ttg cgt cga gcg tat gcc cgt gcg ggg gta tgt cca tct acg atc     1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
                325                 330                 335
ggg ctt gtt gag ggt cac ggg aca ggg acc cct gtt gga gat cgc att     1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
            340                 345                 350
gag tta aca gct ctg cgg aac ttg ttt gac aaa gct ttt ggt agc aag     1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
        355                 360                 365
aag gaa caa ata gca gtt ggc agc ata aag tct cag ata ggt cac ctg     1152
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
    370                 375                 380
aaa tct gtt gcc ggc ttt gcc ggc ttg gtc aaa gct gtg ctt gcg ctt     1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385                 390                 395                 400
aaa cac aaa acg ctc cca ggt tcg att aat gtc gac cag cca cot ttg     1248
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
                405                 410                 415
ttg tat gac ggt act caa att caa gac tct tct tta tat atc aac aag     1296
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
            420                 425                 430
aca aat aga cca tgg ttt acg caa aac aag ctt ccg cgt cgg gct ggt     1344
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
        435                 440                 445
gtc tca agt ttt gga ttt gga ggt gca aac tac cac gcg gtt ctg gaa     1392
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
    450                 455                 460
gaa ttc gag ccc gag cat gaa aaa cca tac cgc ctc aat act gtt gga    1440
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465                 470                 475                 480
cat cct gtc ctc ttg tac gct ccg tct gtg gaa gcc ctc aaa gta ctt    1488
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
                485                 490                 495
tgc aac gac cag                                                    1500
Cys Asn Asp Gln
            500
<210>41
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>41
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1               5                   10                  15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
            20                  25                  30
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
        35                  40                  45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
    50                  55                  60
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65                  70                  75                  80
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
                85                  90                  95
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
            100                 105                 110
Phc Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
        115                 120                 125
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
    130                 135                 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145                 150                 155                 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
                165                 170                 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
            180                 185                 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
        195                 200                 205
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
    210                 215                 220
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225                 230                 235                 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
                245                 250                 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
            260                 265                 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
        275                 280                 285
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
    290                 295                 300
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305                 310                 315                 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
                325                 330                 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
            340                 345                 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
        355                 360                 365
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
    370                 375                 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385                 390                 395                 400
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
                405                 410                 415
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
            420                 425                 430
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
        435                 440                 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
    450                 455                 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465                 470                 475                 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
                485                 490                 495
Cys Asn Asp Gln
            500
<210>42
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>42
ctt gcg gag ctc aca att gca ttg gaa gag gca aaa aca cat aaa aat    48
Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys Thr His Lys Asn
1               5                   10                  15
gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa ttt cag ctc caa    96
Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu Phe Gln Leu Gln
            20                  25                  30
gga agc tgt cct cca gaa aat ccg aga gta gga ttt tta gca aca ctg    144
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu
        35                  40                  45
cct act tca aat atc att gtc gcg ctt aag gca att ctc gcg cag ctt    192
Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile Leu Ala Gln Leu
    50                  55                  60
gat gca aaa cca gat gcg aag aaa tgg gat ttg cct cat aaa aag gct    240
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala
65                  70                  75                  80
ttt ggg gct acc ttc gca tcg tct tca gtg aaa ggc tct gtt gct gcg    288
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala
                85                  90                  95
ctc ttc gca gga cag ggt acc cag tac tta aac atg ttc tct gat gtg    336
Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met Phe Ser Asp Val
            100                 105                 110
gca atg aac tgg cca ccg ttc cgt gac agc att gtc gca atg gaa gaa    384
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val Ala Met Glu Glu
        115                 120                 125
gct caa act gag gta ttt gag ggc caa gtt gaa cca att agc aaa gtt    432
Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro Ile Ser Lys Val
    130                 135                 140
ctg ttt cca cga gag cgc tat gca tcc gaa agt gaa cag ggg aat gaa    480
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gln Gly Asn Glu
145                 150                 155                 160
ctt ctt tgc tta aca gag tac tct cag cca act acg ata gca gcc gca    528
Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr Ile Ala Ala Ala
                165                 170                 175
gta ggg gcc ttc gat att ttc aaa gcg gct ggc ttt aag cca gac atg    576
Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe Lys Pro Asp Met
            180                 185                 190
gtt gga ggg cat tca ctt ggc gaa ttt gct gct ttg tac gcg gct ggg     624
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly
        195                 200                 205
tcc att tcg cgt gac gac ctg tac aag ctt gtg tgc aaa cgg gca aag     672
Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys
    210                 215                 220
gca atg gcg aac gct agt gac gga gct atg gca gca gtg att ggc cca     720
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val Ile Gly Pro
225                 230                 235                 240
gat gca cgt cta gtt acg cca caa aat agt gac gtt tat gtc gca aac     768
Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val Tyr Val Ala Asn
                245                 250                 255
ttc aac tcc gca act caa gta gtc atc agt ggc act gtt caa ggt gtg     816
Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr Val Gln Gly Val
            260                 265                 270
aaa gaa gag tcg aaa ttg ctc att tca aag ggg ttc cgc gta ctg cca     864
Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe Arg Val Leu Pro
        275                 280                 285
ctt aaa tgc cag ggc gcc ttc cat tct cct ttg atg ggg cct tct gag     912
Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu
    290                 295                 300
gat agt ttc aaa tca ctt gtg gag act tgt acc atc tcg ccg cca aaa     960
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile Ser Pro Pro Lys
305                 310                 315                 320
aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa agc cca aac cca     1008
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro
                325                 330                 335
aaa cag acc ctc aag tca cac atg acg tct agc gtt cag ttc gag gag     1056
Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val Gln Phe Glu Glu
            340                 345                 350
cag att cgt aac atg tac gat gcc gga gca cgt gtt ttt ctg gag ttt     1104
Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe
        355                 360                 365
gga ccc cgc caa gtc ctt gca aag ctt atc gcg gaa atg ttt ccc tcg     1152
Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu Met Phe Pro Ser
    370                 375                 380
tgt aca gct atc agc gtt aac ccc gcg agc agt ggt gac agt gac gtg     1200
Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val
385                 390                 395                 400
caa ctc cgc ctc gcc gcc gta aaa ttc gcg gtc tcg ggt gca gcc ctt     1248
Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu
                405                 410                 415
agc acc ttt gat cca tgg gag tat cgc aag cca caa gat ctt ctt att     1296
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln Asp Leu Leu Ile
            420                 425                 430
cga aaa cca cga aaa act gcc ctt gtt cta tca gca gca aca tat gtt     1344
Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala Ala Thr Tyr Val
        435                 440                 445
tcc cca aag act ctt gca gaa cgt aaa aag gct atg gaa gat atc aag     1392
Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met Glu Asp Ile Lys
    450                 455                 460
cta gta tcc att aca cca aga gat agt atg gta tca att gga aaa atc    1440
Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser Ile Gly Lys Ile
465                 470                 475                 480
gcg caa gaa gta cgg aca gct aaa cag cct tta gaa acc gaa att cga    1488
Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu Thr Glu Ile Arg
                485                 490                 495
aga ctc aac aaa                                                    1500
Arg Leu Asn Lys
            500
<210>43
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>43
Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys Thr His Lys Asn
1               5                   10                  15
Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu Phe Gln Leu Gln
            20                  25                  30
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu
        35                  40                  45
Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile Leu Ala Gln Leu
    50                  55                  60
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala
65                  70                  75                  80
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala
                85                  90                  95
Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met Phe Ser Asp Val
            100                 105                 110
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val Ala Met Glu Glu
        115                 120                 125
Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro Ile Ser Lys Val
    130                 135                 140
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gln Gly Asn Glu
145                 150                 155                 160
Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr Ile Ala Ala Ala
                165                 170                 175
Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe Lys Pro Asp Met
            180                 185                 190
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly
        195                 200                 205
Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys
    210                 215                 220
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val Ile Gly Pro
225                 230                 235                 240
Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val Tyr Val Ala Asn
                245                 250                 255
Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr Val Gln Gly Val
            260                 265                 270
Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe Arg Val Leu Pro
        275                 280                 285
Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu
    290                 295                 300
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile Ser Pro Pro Lys
305                 310                 315                 320
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro
                325                 330                 335
Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val Gln Phe Glu Glu
            340                 345                 350
Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe
        355                 360                 365
Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu Met Phe Pro Ser
    370                 375                 380
Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val
385                 390                 395                 400
Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu
                405                 410                 415
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln Asp Leu Leu Ile
            420                 425                 430
Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala Ala Thr Tyr Val
        435                 440                 445
Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met Glu Asp Ile Lys
    450                 455                 460
Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser Ile Gly Lys Ile
465                 470                 475                 480
Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu Thr Glu Ile Arg
                485                 490                 495
Arg Leu Asn Lys
            500
<210>44
<211>351
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(351)
<400>44
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa cgc    48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1               5                   10                  15
agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg    96
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
            20                  25                  30
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg    144
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
        35                  40                  45
gac atg gac ctg gag agt gag ctt ggc gtt gat agc atc aaa cgc gtg    192
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    50                  55                  60
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac    240
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65                  70                  75                  80
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg    288
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
                85                  90                  95
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa    336
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
            100                 105                 110
tcg atc cgt cag cca                                                351
Ser Ile Arg Gln Pro
        115
<210>45
<211>117
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>45
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1               5                   10                  15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
            20                  25                  30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
        35                  40                  45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    50                  55                  60
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65                  70                  75                  80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
                85                  90                  95
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
            100                 105                 110
Ser Ile Arg Gln Pro
        115
<210>46
<211>5
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>MISC_FEATURE
<222>(1)..(5)
<223>Xaa=any amino acid
<400>46
Leu Gly Xaa Asp Ser
1               5
<210>47
<211>2790
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(2790)
<400>47
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa cgc    48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1               5                   10                  15
agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg    96
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
            20                  25                  30
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg    144
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
        35                  40                  45
gac atg gac ctg gag agt gag ctt ggc gtt gat agc atc aaa cgc gtg    192
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    50                  55                  60
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac      240
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65                  70                  75                  80
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg      288
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
                85                  90                  95
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa      336
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
            100                 105                 110
tcg atc cgt cag cca ccg gtg tcc gag cct gct gta ccg acc tca tcg      384
Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
        115                 120                 125
tca agc agt att gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa      432
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
    130                 135                 140
gct gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca      480
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
145                 150                 155                 160
atg atc gag atg gac atg gac ctg gag agc gag ctt ggc gtt gat agc      528
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
                165                 170                 175
atc aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc gtg      576
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
            180                 185                 190
gaa gtc tcc gac gtt gac gct ctg tca aga act aag act gtt ggc gac      624
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
        195                 200                 205
gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc caa ggc cag act      672
Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr
    210                 215                 220
ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta      720
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
225                 230                 235                 240
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc      768
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
                245                 250                 255
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca ggc      816
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
            260                 265                 270
tac gac agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt      864
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
        275                 280                 285
ggc gtc gac agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg      912
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
    290                 295                 300
ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag      960
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
305                 310                 315                 320
act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc      1008
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro
                325                 330                 335
caa ggc cag act ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tcc     1056
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
            340                 345                 350
gag cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt ttg     1104
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Leu
        355                 360                 365
tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc gca     1152
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
    370                 375                 380
gac aag aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg     1200
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
385                 390                 395                 400
gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg gag atc atg agc     1248
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
                405                 410                 415
gag gtt caa acg ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg     1296
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
            420                 425                 430
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa     1344
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
        435                 440                 445
ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa tcg atc cgt cag     1392
Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln
    450                 455                 460
cca ccg gtg tct gag cct gct gta ccg acc tca tcg tca agc agt att     1440
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
465                 470                 475                 480
gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg     1488
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
                485                 490                 495
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg     1536
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
            500                 505                 510
gac atg gac ctg gag agt gag ctt ggc gtc gac agc atc aaa cgc gtg     1584
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
        515                 520                 525
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac     1632
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
    530                 535                 540
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg     1680
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
545                 550                 555                 560
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc tct gaa     1728
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ser Glu
                565                 570                 575
ccg atc cat cag cca cca gtg tcc gag cct gct gta ccg acc tca tcg     1776
Pro Ile His Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
            580                 585                 590
tca agc agt att gct aat gtt tct tca gca cgc ctc gct gaa gct gaa     1824
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
        595                 600                 605
gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca     1872
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
    610                 615                 620
atg atc gag atg gac atg gac ctg gag agc gag ctt ggc gtt gat agc     1920
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
625                 630                 635                 640
atc aaa cgc gtg gaa atc atg agc gag gtt caa acg ctg ctc agc gtg     1968
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
                645                 650                 655
gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt ggc gac     2016
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
            660                 665                 670
gtc atc gag gcg atg aag atg gaa ctc ggt gga ccc caa ggc cag act     2064
Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr
        675                 680                 685
ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta     2112
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
    690                 695                 700
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc     2160
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
705                 710                 715                 720
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca ggc     2208
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
                725                 730                 735
tac gac agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt     2256
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
            740                 745                 750
ggc gtt gat agc atc aaa cgc gtg gag atc atg agc gag gtt caa gcg     2304
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Ala
       755                 760                 765
ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag     2352
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
    770                 775                 780
act gtt ggc gac gtc atc gag gcg atg aag atg gaa ctc ggt gga ccc     2400
Thr Val Gly Asp Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro
785                 790                 795                 800
caa ggc cag act ttg acc gca gaa tcg atc cgt gag cca ccg gtg tct     2448
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Glu Pro Pro Val Ser
                805                 810                 815
gag cct gct gta ccg acc tca tcg tca agt agt atc gct aat gtt tct     2496
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
            820                 825                 830
tca gct cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc gca     2544
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
        835                 840                 845
gac aag aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg     2592
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
    850                 855                 860
gag agt gag ctt ggc gtc gac agc atc aaa cgc gtg gag atc atg agc     2640
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
865                 870                 875                 880
gag gtt caa acg ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg     2688
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
                885                 890                 895
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa    2736
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
            900                 905                 910
ctt ggg gaa tca tca agt att gag act ctc aat tgt acc gag gtt gag    2784
Leu Gly Glu Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu
        915                 920                 925
cac acg                                                            2790
His Thr
    930
<210>48
<211>930
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1               5                   10                  15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
            20                  25                  30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
        35                  40                  45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
    50                  55                  60
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65                  70                  75                  80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
                85                  90                  95
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
            100                 105                 110
Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
        115                 120                 125
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
    130                 135                 140
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
145                 150                 155                 160
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
                165                 170                 175
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
             180                 185                 190
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
        195                 200                 205
Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr
    210                 215                 220
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
225                 230                 235                 240
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
                245                 250                 255
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
            260                 265                 270
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
        275                 280                 285
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
    290                 295                 300
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
305                 310                 315                 320
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro
                325                 330                 335
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
            340                 345                 350
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Leu
        355                 360                 365
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
    370                 375                 380
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
385                 390                 395                 400
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
                405                 410                 415
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
            420                 425                 430
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
        435                 440                 445
Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln
    450                 455                 460
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
465                 470                 475                 480
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
                485                 490                 495
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
            500                 505                 510
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
        515                 520                 525
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
    530                 535                 540
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
545                 550                 555                 560
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ser Glu
                565                 570                 575
Pro Ile His Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
            580                 585                 590
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
        595                 600                 605
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
    610                 615                 620
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
625                 630                 635                 640
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
                645                 650                 655
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
            660                 665                 670
Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr
        675                 680                 685
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
    690                 695                 700
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
705                 710                 715                 720
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
                725                 730                 735
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
            740                 745                 750
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Ala
        755                 760                 765
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
    770                 775                 780
Thr Val Gly Asp Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro
785                 790                 795                 800
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Glu Pro Pro Val Ser
                805                 810                 815
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
            820                 825                 830
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
        835                 840                 845
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
    850                 855                 860
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
865                 870                 875                 880
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
                885                 890                 895
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
            900                 905                 910
Leu Gly Glu Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu
        915                 920                 925
His Thr
    930
<210>49
<211>2433
<212>DNA
<213>破囊壶菌(Thraustochytri um sp.)
<220>
<22l>CDS
<222>(1)..(2433)
<400>49
aaa agt gtc aag gct tca ggg tgt gag aat gta gat acc cgt ttc gct    48
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala
1               5                   10                  15
aag gtt gta caa atc tcg ctt cct agc aag ctg aaa tcc act gtg tcg    96
Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser
            20                  25                  30
cac gat cga cct gta att gtt gta gat gat gga acg ccc tta acc acg      144
His Asp Arg Pro Val Ile Val Val Asp Asp Gly Thr Pro Leu Thr Thr
        35                  40                  45
gag ctt tgt aaa att ctt ggg ggt aat att gtg gtt ctc tct tat caa      192
Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile Val Val Leu Ser Tyr Gln
    50                  55                  60
ggg aag ccc gct ggt cca cgg gga gtc gag gtg cca gat ctt tcc gag      240
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu
65                  70                  75                  80
gaa gcc cta att caa gct ctt gca ttg att cgg tct aca tat gga gtt      288
Glu Ala Leu Ile Gln Ala Leu Ala Leu Ile Arg Ser Thr Tyr Gly Val
                85                  90                  95
cca att ggt ttt att tgt cag caa gtg tct aat gtg agc acc aag gca      336
Pro Ile Gly Phe Ile Cys Gln Gln Val Ser Asn Val Ser Thr Lys Ala
            100                 105                 110
cag ctt tgt tgg gca ctc ctc gca gcg aag cat ctc aag aag gat ttg      384
Gln Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu
        115                 120                 125
aat gct gtc tta ccc gat tca aga tcc ttc ttc gtc gga gtt gta cgc      432
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg
    130                 135                 140
ttg aac ggg aaa ctt gga act ttc gaa aac atc agc gac ttc tct aaa      480
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys
145                 150                 155                 160
ttt gat ttg acg aaa gcc cta gat tac gga cag cgt ggt tct ctc tta      528
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu
                165                 170                 175
ggc ctg tgc aag tca cta gac tta gaa tgg gaa cag gtg ttt tgc cgt      576
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg
            180                 185                 190
gga ata gat ctt gcg tgt gat ctt atg cca ctc cag gcc gca agg ata      624
Gly Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
       195                  200                 205
ctc aga aat gag ctt cag tgt ccc aat atg cgc ctt cgc gag gtt ggg      672
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val Gly
    210                 215                 220
tac gat att tct ggc gcc agg tac acc att tca acc gat gac ctg cta      720
Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp Leu Leu
225                 230                 235                 240
tgt gga ccc tcg aag gct aaa gta gag gcc gca gac ttg ttt ctt gtg      768
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val
                245                 250                 255
aca ggt ggc gca cga ggt att aca cct cat tgt gtt cgt gag att gca      816
Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val Arg Glu Ile Ala
            260                 265                 270
agt cga tcc ccc gga acc aca ttt gtg ctg gtt gga aga agc gaa atg      864
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met
        275                 280                 285
tcc gac gag cct gac tgg gct gtt ggc cac tac aat aaa gac ctg gac      912
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp
    290                 295                 300
caa agc aca atg aaa cac ttg aaa gca acg cat gct gct gga ggg gta     960
Gln Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val
305                 310                 315                 320
aaa cct acg cct aaa gca cat cgt gca ctt gtg aac agg gtc act ggc     1008
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly
                325                 330                 335
tca cgg gag gta cga gaa tct ctt aga gca atc cag gag gca ggg gca     1056
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala Ile Gln Glu Ala Gly Ala
            340                 345                 350
aat gtc gaa tat atc gcc tgt gat gtt tcg gat gaa aac aag gtc cgc     1104
Asn Val Glu Tyr Ile Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg
        355                 360                 365
caa ctt gtg caa aga gtg gag caa aag tat ggc tgt gaa ata act ggg     1152
Gln Leu Val Gln Arg Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly
    370                 375                 380
att tgg cat gca agc ggg gtt ctt cgt gac aaa ctt gtc gag caa aag     1200
Ilc Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu ValGlu Gln Lys
385                 390                 395                 400
act aca gac gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ctt     1248
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu
                405                 410                 415
gta aac atc gtg tca caa gtc aat atg tct aag cta cga cac ttc atc     1296
Val Asn Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile
            420                 425                 430
ctc ttc agt tct ttg gct gga ttt cat ggg aac aag ggc caa acg gat     1344
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
        435                 440                 445
tat gca att gct aat gaa gcc ttg aac aaa atc gcg cat act ctc tca     1392
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu Ser
    450                 455                 460
gcg ttt ttg ccc aaa ctg aat gca aag gtg cta gac ttc ggt ccg tgg     1440
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp
465                 470                 475                 480
gta ggt tca gga atg gta acc gaa aca ctt gag aag cat ttt aaa gct     1488
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala
                485                 490                 495
atg ggg gtt cag act att cct ctc gag cca gga gca cgg act gtt gcg     1536
Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala Arg Thr Val Ala
            500                 505                 510
caa ate att ttg gca agt tcg cca ccg caa tcg ctt ttg ggg aac tgg     1584
Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser Leu Leu Gly Asn Trp
        515                 520                 525
ggc ttt cca gcc acc aaa ccg cta caa cgc tct aat gta gtc acg ggc     1632
Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg Ser Asn Val Val Thr Gly
    530                 535                 540
aca ctc tct ccg gaa gag ata gaa ttc atc gca gac cac aaa att caa     1680
Thr Leu Ser Pro Glu Glu Ile Glu Phe Ile Ala Asp His Lys Ile Gln
545                 550                 555                 560
ggc cgc aag gtg ctt ccc atg atg gct gca atc ggg ttc atg gcc tct     1728
Gly Arg Lys Val Leu Pro Met Met Ala Ala Ile Gly Phe Met Ala Ser
                565                 570                 575
att gcg gaa gga ctc tac ccg ggg tac aat ctg caa ggc gtg gaa aat     1776
Ile Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gln Gly Val Glu Asn
            580                 585                 590
gct cag ctc ttt caa ggc ttg act atc aac caa gag aca aaa ttt caa    1824
Ala Gln Leu Phe Gln Gly Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln
        595                 600                 605
atc act ctc att gag gag cac aac tct gag gaa aac ctg gat gtc ctg    1872
Ile Thr Leu Ile Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu
    610                 615                 620
aca tcc ctt ggt gta atg ttg gaa agc ggg aag gtg ctt ccc gct tac    1920
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr
625                 630                 635                 640
cga tgt gtt gta tgc ttg aat aca acc cag cag cag ccc aag cta tct    1968
Arg Cys Val Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser
                645                 650                 655
cca aaa att ctt aac ttg gaa gtt gac cct gca tgc gag gtt aac ccc    2016
Pro Lys Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro
            660                 665                 670
tat gat gga aag tcg ttg ttc cac ggt ccg ctt ttg caa ttc gtt caa    2064
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
        675                 680                 685
caa gtg ttg cac tca agt acc aaa ggc ctc gtt gcc aag tgc cgc gcg    2112
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala
    690                 695                 700
ctt cca atc aaa gaa gcc atc cga ggg cca ttt atc aag caa aca ctc    2160
Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln Thr Leu
705                 710                 71                  720
cat gat cca att cta gac gac gtc att ttt cag cta atg ctc gtg tgg    2208
His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met Leu Val Trp
                725                 730                 735
tgt cgt aat gct cta gga agt gca tcg cta ccc aac aga att gaa aag    2256
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg Ile Glu Lys
            740                 745                 750
atg tca tac ttt ggg aat gtc tca gaa ggt agc act ttc ttt gcc tca    2304
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser
        755                 760                 765
gtt aca cct gtg gga cca aga gta cca aag gat ccc gtg atc aaa atg    2352
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val Ile Lys Met
    770                 775                 780
cag ttt ctt ctc caa gat gaa tcc ggc aac aca ttt tca tcg ggg gag    2400
Gln Phe Leu Leu Gln Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu
785                 790                 795                 800
ggc tcg gtt gtg ctt agt gac gaa ctc gtc ttt                        2433
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe
                805                 810
<210>50
<211>811
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>50
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala
1               5                   10                  15
Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser
            20                  25                  30
His Asp Arg Pro Val Ile Val Val Asp Asp Gly Thr Pro Leu Thr Thr
        35                  40                  45
Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile Val Val Leu Ser Tyr Gln
    50                  55                  60
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu
65                  70                  75                  80
Glu Ala Leu Ile Gln Ala Leu Ala Leu IIe Arg Ser Thr Tyr Gly Val
                85                  90                  95
Pro Ile Gly Phe Ile Cys Gln Gln Val Ser Asn Val Ser Thr Lys Ala
            100                 105                 110
Gln Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu
        115                 120                 125
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg
    130                 135                 140
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys
145                 150                 155                 160
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu
                165                 170                 175
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg
            180                 185                 190
Gly Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
        195                 200                 205
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val Gly
    210                 215                 220
Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp Leu Leu
225                 230                 235                 240
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val
                245                 250                 255
Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val Arg Glu Ile Ala
            260                 265                 270
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met
        275                 280                 285
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp
    290                 295                 300
Gln Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val
305                 310                 315                 320
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly
                325                 330                 335
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala Ile Gln Glu Ala Gly Ala
           340                 345                 350
Asn Val Glu Tyr Ile Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg
        355                 360                 365
Gln Leu Val Gln Arg Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly
    370                 375                 380
Ile Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys
385                 390                 395                 400
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu
                405                 410                 415
Val Asn Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile
            420                 425                 430
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
        435                 440                 445
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu Ser
    450                 455                 460
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp
465                 470                 475                 480
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala
                485                 490                 495
Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala Arg Thr Val Ala
            500                 505                 510
Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser Leu Leu Gly Asn Trp
        515                 520                 525
Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg Ser Asn Val Val Thr Gly
    530                 535                 540
Thr Leu Ser Pro Glu Glu Ile Glu Phe Ile Ala Asp His Lys Ile Gln
545                 550                 555                 560
Gly Arg Lys Val Leu Pro Met Met Ala Ala Ile Gly Phe Met Ala Ser
                565                 570                 575
Ile Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gln Gly Val Glu Asn
            580                 585                 590
Ala Gln Leu Phe Gln Gly Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln
        595                 600                 605
Ile Thr Leu Ile Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu
    610                 615                 620
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr
625                 630                 635                 640
Arg Cys Val Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser
                645                 650                 655
Pro Lys Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro
            660                 665                 670
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
        675                 680                 685
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala
    690                 695                 700
Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln Thr Leu
705                 710                 715                 720
His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met Leu Val Trp
                725                 730                 735
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg Ile Glu Lys
            740                 745                 750
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser
        755                 760                 765
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val Ile Lys Met
    770                 775                 780
Gln Phe Leu Leu Gln Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu
785                 790                 795                 800
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe
                805                 810
<210>51
<211>5808
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(5805)
<220>
<221>misc_feature
<222>(1)..(5808)
<223>n=actorg
<400>51
atg caa ctt cct cca gcg cat tct gcc gat gag aat cgc atc gcg gtc      48
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1               5                   10                  15
gtg ggc atg gcc gtc aaa tat gcg ggc tgt gac aat aaa gaa gag ttt      96
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
            20                  25                  30
tgg aag act ttg atg aat ggt agt atc aat acc aag tcg att tcg gca      144
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
        35                  40                  45
gca agg ttg ggc agc aat aag cgt gac gaa cac tat gtt cct gaa cga      192
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
    50                  55                  60
tcg aaa tat gca gat acg ttc tgt aac gaa agg tac ggt tgt atc cag      240
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65                  70                  75                  80
caa ggt acg gat aat gag cat gac ctc ctc cta ggt ctt gct caa gaa      288
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
                85                  90                  95
gct ctc gct gac gct gcc ggg cgg atg gag aaa caa cct tcg gag gcg      336
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
            100                 105                 110
ttc gat ctg gaa aat act ggc atc gtg agt ggg tgc tta tct ttt cca      384
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
        115                 120                 125
atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa agc cat gtg      432
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
    130                 135                 140
gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg      480
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145                 150                 155                 160
tct gag cga cag aaa tct acg aaa gca cat gca ggg gac aag cgc cgg      528
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
                165                 170                 175
ttc att gac cca gct tct ttt gta gct gat aaa ctg aac cta ggc cca      576
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
            180                 185                 190
cta cat tat gcg atc gat gca gca tgc gct tct gca ttg tac gtg tta      624
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
        195                 200                 205
aaa tta gct caa gac cac ctt gtt tca ggt gcc gtt gat atg atg tta      672
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
    210                 215                 220
tgt gga gcg acg tgc ttc cca gaa cca ttc ttc atc ttg tct ggg ttc      720
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225                 230                 235                 240
tcg act ttt caa gcg atg cct gnt ggg gca gat gga gtc tca cta cct      768
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
                245                 250                 255
ctc cat aaa acg agt gct ggg ctc act cca ggt gaa ggg ggg tcc att      816
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
            260                 265                 270
atg gtg ctc aag cga ctg aaa gac gct atc aga gat gga aat cac att      864
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
        275                 280                 285
tat ggt gtg ctc ctt gaa gca aat tta agt aac gca ggt tgt ggg ctt      912
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
    290                 295                 300
cca ctc agc ccg cac tta ccg agc gaa gaa tca tgt att cgt gat acc      960
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305                 310                 315                 320
tac cgc cgt gct gga gtt gct gca gat caa agt att cag tat att gag      1008
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
                325                 330                 335
tgc cac gct acg gga acc cct cga ggg gat gtc gtg gaa att gag gcg      1056
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
            340                 345                 350
gtt gaa aga gtt ttc aag aaa aac gtt cca cgc tta ggc tcg acg aaa      1104
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
        355                 360                 365
gga aat ttt ggt cac tcg tta gtt gcg gct ggt ttc gca ggt atg gca      1152
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
    370                 375                 380
aag ctt ctt ctt gca atg gaa cat gga gtg att cct ccc aca cca ggt      1200
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385                 390                 395                 400
ctt gat gct tcg aac cag gca agt gag cac gtt gtg aca aag gct atc      1248
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
                405                 410                 415
act tgg cct gag aca cat ggg gct cca aaa cga gct ggc ctt tca gca      1296
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
            420                 425                 430
ttt gga ttt ggt ggg act aat gcg cat gca ctc ttc gaa gag ttt aat      1344
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
        435                 440                 445
gcc gag ggc ata agt tat cgc cct gga aag cct cca gtc gaa tcg aat      1392
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
    450                 455                 460
acc cgt cct tcc gtc gta ata act ggg atg gac tgt acc ttt ggg agc      1440
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465                 470                 475                 480
ctt gaa ggg att gat gcg ttc gag act gcc ctg tac gag ggg cgt gac      1488
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
                485                 490                 495
gca gct cgt gac tta ccc gcc aaa cgt tgg agg ttc cta ggt gag gac      1536
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp
            500                 505                 510
ttg gag ttt ctc cga gcc atc agg ctc aag gaa aag cct agg ggt tgt     1584
Leu Glu Phe Leu Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys
        515                 520                 525
ttt gtg gag agt gtt gac gtt aac ttt aga cgg ctg aaa acg ccc ttg     1632
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu
    530                 535                 540
aca cca gaa gat atg ttg cgg ccc caa caa ctc ttg gcg gtt tct acg     1680
Thr Pro Glu Asp Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr
545                 550                 555                 560
atg gac cga gca att atc gat gca ggt cta aag aag ggc caa cat gta     1728
Met Asp Arg Ala Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val
                565                 570                 575
gca gtt ctt gtt ggc cta gga act gac ctg gaa ctt tac cgt cat cga     1776
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg
            580                 585                 590
gca aga gtc gcg ctt aaa gag gtt ttg cac ccg agc tta aag tca gac     1824
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp
        595                 600                 605
act gca att ctc cag aaa ata atg caa tat gtg aat gat gca gga act     1872
Thr Ala Ile Leu Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr
    610                 615                 620
tcg act tca tac aca tct tac att gga aac ctc gtt gcc acg cgt att     1920
Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile
625                 630                 635                 640
tcg tct cag tgg gga ttc aca ggg ccg tcc ttt act gtc aca gaa gga     1968
Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly
                645                 650                 655
aat aat tcc gtg tac aga tgt gca caa cta gcc aaa gat atg ctt cag     2016
Asn Asn Ser Val Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln
            660                 665                 670
gtt aac cga gtt gat gct gtc gtc atc gca ggc gtt gat ctc aac gga     2064
Val Asn Arg Val Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly
        675                 680                 685
agc gcc gaa agt ttt ttt gtc cga gca aat cgt caa aag ata tcc aag     2112
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys
    690                 695                 700
cta agt cat cca tgt gca agc ttc gac aga gat gca gat gga ttt ttc     2160
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe
705                 710                 715                 720
gca ggt gag ggc tgt ggt gcc cta gtt ttc aag agg tta gaa gac tgt     2208
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys
                725                 730                 735
gct cct cag gaa aaa att tat gct agt ata gac tct atc gca ata gat     2256
Ala Pro Gln Glu Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp
            740                 745                 750
aaa gag cct act agc tca gct gtg aaa gct gtc tac caa agt gat tcg     2304
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser
        755                 760                 765
agt ctc tcc gat att gag ctg tta gaa atc agt gga gac tcc aaa cgg     2352
Ser Leu Ser Asp Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg
    770                 775                 780
ttt gca gca ttc gaa ggc gct gtg gaa att caa tca agt gtg gaa gcc     2400
Phe Ala Ala Phe Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala
785                 790                 795                 800
cag cta aaa gga ctt tcc aaa gtc ctt gaa cct gca aaa ggc caa ggc     2448
Gln Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly
                805                 810                 815
gta gcg gtg gga agt act cga gca acc gtt ggg gat ata ggg tat gct     2496
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala
            820                 825                 830
aca gga gcg gca agc ctg att aaa act gca ctc tgc tta tat aat cgc     2544
Thr Gly Ala Ala Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg
        835                 840                 845
tac ctt ccg gca tta gca aac tgg agt ggc cca tgt gaa cag tcc gcc     2592
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala
    850                 855                 860
tgg ggc tca aac atg ttc gtt tgc cat gaa aca cgg ccg tgg atg aaa     2640
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys
865                 870                 875                 880
aac cag aat gaa aag aga tgt gcc ctc att tct gga aca gat cca tct     2688
Asn Gln Asn Glu Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser
                885                 890                 895
cat aca tgc ttt tcc ctc gta cta tcg gat act ggg tgt tat gaa gag     2736
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu
            900                 905                 910
cac aat cga acg tgc ttt gat gtg caa gcg cca cag cta gtt ctg ata     2784
His Asn Arg Thr Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile
        915                 920                 925
cac gga ttc gat gga aaa act att gtg cgg cga ctt gaa gga tat ctc     2832
His Gly Phe Asp Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu
    930                 935                 940
ctt gaa ctt gtt gaa ggg cat gca agc cct tca gag tat ttc cac aaa     2880
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys
945                 950                 955                 960
ctg att gga caa agt cta ctt gag aac tcg aaa gaa agt aaa ctc aca     2928
Leu Ile Gly Gln Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr
                965                 970                 975
ctt tcg ctt gtg tgc aat ccg aac cag ctc caa aag gag ctc atg ctt     2976
Leu Ser Leu Val Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu
            980                 985                 990
gct atc aaa gga gta caa cga agc atg tta aca ggg aag gat tgg gtc     3024
Ala Ile Lys Gly Val Gln Arg Ser Met Leu Thr Gly Lys Asp Trp Val
        995                 1000                1005
agt cca tca gga agt tgt ttt gcc cca aat ccg tta tca agc gca         3069
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala
    1010                1015                1020
aaa gtg gca ttc atg tac gga gaa ggc cga agc ccg tac tgt ggt         3114
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly
    1025                1030                1035
gta ggc ttg ggt cta cat cgt ttg tgg ccc ggt ctc cat gaa aat         3159
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn
    1040                1045                1050
gtg aac aat aag aca gtc gat tta tgg acg gaa gga gat ggt tgg         3204
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp
    1055                1060                1065
tta tat cct cga acg ttg aca cga gaa gag cat aca aaa gcc atc      3249
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala Ile
    1070                1075                1080
gaa tct ttc aac gca aat caa att gaa atg ttt cgc gct ggg att      3294
Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala Gly Ile
    1085                1090                1095
ttc atc tca atg tgt cag aca gac tat gtc atg aat gtt ctc ggt      3339
Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu Gly
    1100                1105                1110
gtc cag cct aag gcc gga ttt ggg ctg agc ttg gga gaa att tca      3384
Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
    1115                1120                1125
atg ctc ttt gcg atg tca aag gag aac tgc agg cag tca cag gaa      3429
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu
    1130                1135                1140
atg acc aat cgt ttg cgc ggt tct cca gtg tgg tct aac gag ctt      3474
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu
    1145                1150                1155
gct atc aac ttc aat gca att cgc aag tta tgg aaa atc ccc cga      3519
Ala Ile Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg
    1160                1165                1170
gga gct ccc tta gaa tcc ttt tgg caa gga tac ttg gtt cac ggc      3564
Gly Ala Pro Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly
    1175                1180                1185
aca aga gaa gaa gta gag cat gct att ggt ctt tct gag cct tat      3609
Thr Arg Glu Glu Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr
    1190                1195                1200
gta cgt ctg ctt att gtg aac gat tca agg agt gcc ttg att gct      3654
Val Arg Leu Leu Ile Val Asn Asp Ser Arg Ser Ala Leu Ile Ala
    1205                1210                1215
gga aaa cca gac gcc tgt cag gca gta atc agt aga cta aac tcc      3699
Gly Lys Pro Asp Ala Cys Gln Ala Val Ile Ser Arg Leu Asn Ser
    1220                1225                1230
aag ttc cct tct ctg ccg gta aag caa gga atg att ggt cat tgc      3744
Lys Phe Pro Ser Leu Pro Val Lys Gln Gly Met Ile Gly His Cys
    1235                1240                1245
cca gaa gtt cgt gcg ttc atc aaa gat att ggg tac atc cat gaa      3789
Pro Glu Val Arg Ala Phe Ile Lys Asp Ile Gly Tyr Ile His Glu
    1250                1255                1260
aca ctc cga att tcc aat gac tat tcg gat tgt cag ctt ttc tca      3834
Thr Leu Arg Ile Ser Asn Asp Tyr Ser Asp Cys Gln Leu Phe Ser
    1265                1270                1275
gcg gta acc aag ggc gca ctt gac agc tcc aca atg gaa atc aaa      3879
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu Ile Lys
    1280                1285                1290
cac ttt gtg gga gag gtc tac tcc cgg atc gca gac ttt cct caa      3924
His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala Asp Phe Pro Gln
    1295                1300                1305
atc gtc aac acg gtg cat tcg gct ggt tat gac gta ttt ctt gag      3969
Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu
    1310                1315                1320
ctt ggc tgt gat gct tct aga tct gca gca gtt caa aac att ctt      4014
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn Ile Leu
    1325                1330                1335
ggt ggt caa gga aag ttc ttg tct aca gct att gac aaa aaa gga      4059
Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys Gly
    1340                1345                1350
cac tcc gcc tgg tca caa gta ctt cgg gct acc gca tca tta gct      4104
His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
    1355                1360                1365
gca cat cga gta ccg gga atc tca att ttg gat ttg ttt cac cca      4149
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro
    1370                1375                1380
aat ttc cga gaa atg tgc tgt aca atg gca acc aca cct aaa gtg      4194
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val
    1385                1390                1395
gaa gat aag ttc ctg cgc acg att caa atc aat ggt cgg ttt gaa      4239
Glu Asp Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu
    1400                1405                1410
aaa gaa atg att cac cta gaa gat aca aca tta agt tgc tta ccc      4284
Lys Glu Met Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro
    1415                1420                1425
gct cca agt gaa gca aat atc gca gct att caa tct cgg tca att      4329
Ala Pro Ser Glu Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile
    1430                1435                1440
cga tct gct gcg gcg cgt tct gga caa tcc cat gat tgt gca tcc      4374
Arg Ser Ala Ala Ala Arg Ser Gly Gln Ser His Asp Cys Ala Ser
    1445                1450                1455
cat agc cat gaa gaa aat aag gat tca tgc cct gaa aag ctg aag      4419
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys
    1460                1465                1470
ctt gat tct gtg tcc gtc gcc ata aat ttc gac aat gat gac cgc      4464
Leu Asp Ser Val Ser Val Ala Ile Asn Phe Asp Asn Asp Asp Arg
    1475                1480                1485
att cag ctt ggg cac gcg ggt ttt cgg gag atg tac aat aca aga      4509
Ile Gln Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg
    1490                1495                1500
tat agc ttg tac aca ggg gcg atg gca aag gga att gca tct gca      4554
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala
    1505                1510                1515
gat ctt gtc att gcc gct ggg aaa gag ggc atc cta gct tcc tat      4599
Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser Tyr
    1520                1525                1530
gga gct gga gga cta cct ctt gct act gtt cga aag gga ata gac      4644
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
    1535                1540                1545
aaa att caa caa gcc ttg cca agt ggc cca tat gct gta aat ctt      4689
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu
    1550                1555                1560
att cac tct ccc ttt gac ggc aac ttg gag cag gga aac gtc gat      4734
Ile His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp
    1565                1570                1575
ttg ttc ttg gaa aag aac gtc cgc gtg gcg gaa tgt tcc gcg ttt      4779
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe
    1580                1585                1590
aca acg cta aca gtg cca gta gta cac tat cgt gct gca ggg ctt      4824
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu
    1595                1600                1605
gtt cgg cgc caa gat gga agc att ttg atc aag aac cga atc att      4869
Val Arg Arg Gln Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile
    1610                1615                1620
gct aaa gta tct agg aca gaa ctc gct gag atg ttc ctt cgt ccg      4914
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro
    1625                1630                1635
gca cct caa atc atc ctc gaa aaa ctg gta gca gca gaa atc att      4959
Ala Pro Gln Ile Ile Leu Glu Lys Leu Val Ala Ala Glu Ile Ile
    1640                1645                1650
tca tct gac caa gcg cgt atg gca gcc aaa gtt ccc atg gcg gac      5004
Ser Ser Asp Gln Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp
    1655                1660                1665
gac atc gca gtc gaa gcc gac tct ggt ggg cac acg gat aat cgg      5049
Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
    1670                1675                1680
cct atg cac gtc att ttg ccc ctg ata att caa ctc cgc aat act      5094
Pro Met His Val Ile Leu Pro Leu Ile Ile Gln Leu Arg Asn Thr
    1685                1690                1695
ata ctt gca gag tat ggc tgt gcc acg gct ttt cgt acc cgt ata      5139
Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg Ile
    1700                1705                1710
ggc gct gga gga ggc att ggt tgt cct tca gcg gcc ctc gca gcc      5184
Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala Ala Leu Ala Ala
    1715                1720                1725
ttt gat atg ggt gcg agt ttt gtc gtg act gga agc ata aat caa      5229
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser Ile Asn Gln
    1730                1735                1740
att tgc cgc gag gca ggg act tgc gat act gtt cgg gag cta ctt      5274
Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu
    1745                1750                1755
gcc aac tca agc tac tcg gac gtg acg atg gcg cca gca gca gac      5319
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp
    1760                1765                1770
atg ttt gac caa ggt gtg aaa ctc caa gtc tta aaa cga gga acg      5364
Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
    1775                1780                1785
atg ttt cca agc aga gca aat aaa ctc cgg aag ctc ttt gtg aac      5409
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn
    1790                1795                1800
tac gaa tct cta gaa aca ctc ccg tcg aaa gag ttg aaa tac ctg      5454
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu
    1805                1810                1815
gaa aac atc ata ttc aag caa gca gta gac cag gtg tgg gag gaa      5499
Glu Asn Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu
    1820                1825                1830
aca aag cgc ttt tac tgt gaa aaa ctg aac aat cca gat aaa att      5544
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile
    1835                1840                1845
gca agg gcc atg aaa gat cct aaa ttg aag atg tcg ctt tgc ttt      5589
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe
    1850                1855                1860
cgg tgg tat ctc tcc aag agc tct ggg tgg gcc aac gca gga att      5634
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile
    1865                1870                1875
aaa tct cgt gca ctc gac tac cag atc tgg tgt ggc ccg gca atg      5679
Lys Ser Arg Ala Leu Asp Tyr Gln Ile Trp Cys Gly Pro Ala Met
    1880                1885                1890
ggc tcg ttc aac aat ttc gcc agc ggc aca tcc ctc gat tgg aaa      5724
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys
    1895                1900                1905
gtg act ggg gtt ttc cct ggc gtt gcg gaa gta aac atg gcc att      5769
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala Ile
    1910                1915                1920
tta gat ggc gcg cga gaa cta gct gct aaa cga aat taa              5808
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn
    1925                1930                1935
<210>52
<211>1935
<212>PRT
<213>破囊菌(Thraustochytrium sp.)
<220>
<221>misc_feature
<222>(248)..(248)
<223>The ’Xaa’at location 248stands for Asp,Gly,Ala,or Val.
<400>52
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1               5                   10                  15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
            20                  25                  30
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
        35                  40                  45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
    5                  055                  60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65                  70                  75                  80
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
                85                  90                  95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
            100                 105                 110
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
        115                 120                 125
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
    130                 135                 140
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145                 150                 155                 160
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
                165                 170                 175
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
            180                 185                 190
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
        195                 200                 205
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
    210                 215                 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225                 230                 235                 240
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
                245                 250                 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
            260                 265                 270
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
        275                 280                 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
    290                 295                 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305                 310                 315                 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
                325                 330                 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
            340                 345                 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
        355                 360                 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
    370                 375                 380
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385                 390                 395                 400
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
                405                 410                 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
            420                 425                 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
        435                 440                 445
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
    450                 455                 460
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465                 470                 475                 480
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
                485                 490                 495
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp
            500                 505                 510
Leu Glu Phe Leu Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys
        515                 520                 525
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu
    530                 535                 540
Thr Pro Glu Asp Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr
545                 550                 555                 560
Met Asp Arg Ala Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val
                565                 570                 575
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg
            580                 585                 590
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp
        595                 600                 605
Thr Ala Ile Leu Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr
    610                 615                 620
Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile
625                 630                 635                 640
Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly
                645                 650                 655
Asn Asn Ser Val Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln
            660                 665                 670
Val Asn Arg Val Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly
        675                 680                 685
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys
    690                 695                 700
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe
705                 710                 715                 720
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys
                725                 730                 735
Ala Pro Gln Glu Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp
            740                 745                 750
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser
        755                 760                 765
Ser Leu Ser Asp Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg
    770                 775                 780
Phe Ala Ala Phe Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala
785                 790                 795                 800
Gln Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly
                805                 810                 815
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala
            820                 825                 830
Thr Gly Ala Ala Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg
        835                 840                 845
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala
    850                 855                 860
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys
865                 870                 875                 880
Asn Gln Asn Glu Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser
                885                 890                 895
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu
            900                 905                 910
His Asn Arg Thr Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile
        915                 920                 925
His Gly Phe Asp Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu
    930                 935                 940
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys
945                 950                 955                 960
Leu Ile Gly Gln Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr
                965                 970                 975
Leu Ser Leu Val Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu
            980                 985                 990
Ala Ile Lys Gly Val Gln Arg Ser Met Leu Thr Gly Lys Asp Trp Val
        995                 1000                1005
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala
    1010                1015                1020
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly
    1025                1030                1035
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn
    1040                1045                1050
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp
    1055                1060                1065
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala Ile
    1070                1075                1080
Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala Gly Ile
    1085                1090                1095
Phc Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu Gly
    1100                1105                1110
Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
    1115                1120                1125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu
    1130                1135                1140
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu
    1145                1150                1155
Ala Ile Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg
    1160                1165                1170
Gly Ala Pro Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly
    1175                1180                1185
Thr Arg Glu Glu Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr
    1190                1195                1200
Val Arg Leu Leu Ile Val Asn Asp Ser Arg Ser Ala Leu Ile Ala
    1205                1210                1215
Gly Lys Pro Asp Ala Cys Gln Ala Val Ile Ser Arg Leu Asn Ser
    1220                1225                1230
Lys Phe Pro Ser Leu Pro Val Lys Gln Gly Met Ile Gly His Cys
    1235                1240                1245
Pro Glu Val Arg Ala Phe Ile Lys Asp Ile Gly Tyr Ile His Glu
    1250                1255                1260
Thr Leu Arg Ile Ser Asn Asp Tyr Ser Asp Cys Gln Leu Phe Ser
    1265                1270                1275
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu Ile Lys
    1280                1285                1290
His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala Asp Phe Pro Gln
    1295                1300                1305
Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu
    1310                1315                1320
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn Ile Leu
    1325                1330                1335
Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys Gly
    1340                1345                1350
His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
    1355                1360                1365
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro
    1370                1375                1380
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val
    1385                1390                1395
Glu Asp Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu
    1400                1405                1410
Lys Glu Met Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro
    1415                1420                1425
Ala Pro Ser Glu Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile
    1430                1435                1440
Arg Ser Ala Ala Ala Arg Ser Gly Gln Ser His Asp Cys Ala Ser
    1445                1450                1455
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys
    1460                1465                1470
Leu Asp Ser Val Ser Val Ala Ile Asn Phe Asp Asn Asp Asp Arg
    1475                1480                1485
Ile Gln Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg
    1490                1495                1500
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala
    1505                1510                1515
Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser Tyr
    1520                1525                1530
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
    1535                1540                1545
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu
    1550                1555                1560
Ile His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp
    1565                1570                1575
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe
    1580                1585                1590
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu
    1595                1600                1605
Val Arg Arg Gln Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile
    1610                1615                1620
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro
    1625                1630                1635
Ala Pro Gln Ile Ile Leu Glu Lys Leu Val Ala Ala Glu Ile Ile
    1640                1645                1650
Ser Ser Asp Gln Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp
    1655                1660                1665
Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
    1670                1675                1680
Pro Met His Val Ile Leu Pro Leu Ile Ile Gln Leu Arg Asn Thr
    1685                1690                1695
Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg Ile
    1700                1705                1710
Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala Ala Leu Ala Ala
    1715                1720                1725
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser Ile Asn Gln
    1730                1735                1740
Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu
    1745                1750                1755
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp
    1760                1765                1770
Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
    1775                1780                1785
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn
    1790                1795                1800
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu
    1805                1810                1815
Glu Asn Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu
    1820                1825                1830
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile
    1835                1840                1845
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe
    1850                1855                1860
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile
    1865                1870                1875
Lys Ser Arg Ala Leu Asp Tyr Gln Ile Trp Cys Gly Pro Ala Met
    1880                1885                1890
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys
    1895                1900                1905
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala Ile
    1910                1915                1920
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn
    1925                1930                1935
<210>53
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<220>
<221>misc_feature
<222>(1)..(1500)
<223>n=actorg
<400>53
atg caa ctt cct cca gcg cat tct gcc gat gag aat cgc atc gcg gtc    48
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1               5                   10                  15
gtg ggc atg gcc gtc aaa tat gcg ggc tgt gac aat aaa gaa gag ttt    96
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
            20                  25                  30
tgg aag act ttg atg aat ggt agt atc aat acc aag tcg att tcg gca    144
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
        35                  40                  45
gca agg ttg ggc agc aat aag cgt gac gaa cac tat gtt cct gaa cga    192
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
    50                  55                  60
tcg aaa tat gca gat acg ttc tgt aac gaa agg tac ggt tgt atc cag    240
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65                  70                  75                  80
caa ggt acg gat aat gag cat gac ctc ctc cta ggt ctt gct caa gaa    288
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
                85                  90                  95
gct ctc gct gac gct gcc ggg cgg atg gag aaa caa cct tcg gag gcg    336
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
            100                 105                 110
ttc gat ctg gaa aat act ggc atc gtg agt ggg tgc tta tct ttt cca    384
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
        115                 120                 125
atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa agc cat gtg    432
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
    130                 135                 140
gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg    480
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145                 150                 155                 160
tct gag cga cag aaa tct acg aaa gca cat gca ggg gac aag cgc cgg    528
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
                165                 170                 175
ttc att gac cca gct tct ttt gta gct gat aaa ctg aac cta ggc cca    576
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
            180                 185                 190
cta cat tat gcg atc gat gca gca tgc gct tct gca ttg tac gtg tta    624
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
        195                 200                 205
aaa tta gct caa gac cac ctt gtt tca ggt gcc gtt gat atg atg tta    672
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
    210                 215                 220
tgt gga gcg acg tgc ttc cca gaa cca ttc ttc atc ttg tct ggg ttc    720
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225                 230                 235                 240
tcg act ttt caa gcg atg cct gnt ggg gca gat gga gtc tca cta cct    768
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
                245                 250                 255
ctc cat aaa acg agt gct ggg ctc act cca ggt gaa ggg ggg tcc att    816
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
            260                 265                 270
atg gtg ctc aag cga ctg aaa gac gct atc aga gat gga aat cac att    864
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
        275                 280                 285
tat ggt gtg ctc ctt gaa gca aat tta agt aac gca ggt tgt ggg ctt    912
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
    290                 295                 300
cca ctc agc ccg cac tta ccg agc gaa gaa tca tgt att cgt gat acc    960
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305                 310                 315                 320
tac cgc cgt gct gga gtt gct gca gat caa agt att cag tat att gag    1008
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
                325                 330                 335
tgc cac gct acg gga acc cct cga ggg gat gtc gtg gaa att gag gcg    1056
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
            340                 345                 350
gtt gaa aga gtt ttc aag aaa aac gtt cca cgc tta ggc tcg acg aaa    1104
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
        355                 360                 365
gga aat ttt ggt cac tcg tta gtt gcg gct ggt ttc gca ggt atg gca    1152
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
    370                 375                 380
aag ctt ctt ctt gca atg gaa cat gga gtg att cct ccc aca cca ggt    1200
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385                 390                 395                 400
ctt gat gct tcg aac cag gca agt gag cac gtt gtg aca aag gct atc    1248
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
                405                 410                 415
act tgg cct gag aca cat ggg gct cca aaa cga gct ggc ctt tca gca    1296
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
            420                 425                 430
ttt gga ttt ggt ggg act aat gcg cat gca ctc ttc gaa gag ttt aat    1344
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
        435                 440                 445
gcc gag ggc ata agt tat cgc cct gga aag cct cca gtc gaa tcg aat    1392
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
    450                 455                 460
acc cgt cct tcc gtc gta ata act ggg atg gac tgt acc ttt ggg agc    1440
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465                 470                 475                 480
ctt gaa ggg att gat gcg ttc gag act gcc ctg tac gag ggg cgt gac    1488
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
                485                 490                 495
gca gct cgt gac                                                    1500
Ala Ala Arg Asp
            500
<210>54
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>misc_feature
<222>(248)..(248)
<223>The ’Xaa’at location 248stands for Asp,Gly,Ala,or Val.
<400>54
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1               5                   10                  15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
            20                  25                  30
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
        35                  40                  45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
    50                  55                  60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65                  70                  75                  80
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
                85                  90                  95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
            100                 105                 110
Phc Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
        115                 120                 125
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
    130                 135                 140
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145                 150                 155                 160
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
                165                 170                 175
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
            180                 185                 190
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
        195                 200                 205
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
    210                 215                 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225                 230                 235                 240
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
                245                 250                 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
            260                 265                 270
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
        275                 280                 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
    290                 295                 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305                 310                 315                 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
                325                 330                 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
            340                 345                 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
        355                 360                 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
    370                 375                 380
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385                 390                 395                 400
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
                405                 410                 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
            420                 425                 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
        435                 440                 445
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
    450                 455                 460
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465                 470                 475                 480
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
                485                 490                 495
Ala Ala Arg Asp
            500
<210>55
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>55
tta ccc gcc aaa cgt tgg agg ttc cta ggt gag gac ttg gag ttt ctc    48
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu
1               5                   10                  15
cga gcc atc agg ctc aag gaa aag cct agg ggt tgt ttt gtg gag agt    96
Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser
            20                  25                  30
gtt gac gtt aac ttt aga cgg ctg aaa acg ccc ttg aca cca gaa gat    144
Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu Thr Pro Glu Asp
        35                  40                  45
atg ttg cgg ccc caa caa ctc ttg gcg gtt tct acg atg gac cga gca    192
Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr Met Asp Arg Ala
    50                  55                  60
att atc gat gca ggt cta aag aag ggc caa cat gta gca gtt ctt gtt    240
Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val Ala Val Leu Val
65                  70                  75                  80
ggc cta gga act gac ctg gaa ctt tac cgt cat cga gca aga gtc gcg    288
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala
                85                  90                  95
ctt aaa gag gtt ttg cac ccg agc tta aag tca gac act gca att ctc    336
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala Ile Leu
            100                 105                 110
cag aaa ata atg caa tat gtg aat gat gca gga act tcg act tca tac    384
Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr
        115                 120                 125
aca tct tac att gga aac ctc gtt gcc acg cgt att tcg tct cag tgg    432
Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile Ser Ser Gln Trp
    130                 135                 140
gga ttc aca ggg ccg tcc ttt act gtc aca gaa gga aat aat tcc gtg    480
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val
145                 150                 155                 160
tac aga tgt gca caa cta gcc aaa gat atg ctt cag gtt aac cga gtt    528
Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln Val Asn Arg Val
                165                 170                 175
gat gct gtc gtc atc gca ggc gtt gat ctc aac gga agc gcc gaa agt    576
Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser
            180                 185                 190
ttt ttt gtc cga gca aat cgt caa aag ata tcc aag cta agt cat cca    624
Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys Leu Ser His Pro
        195                 200                 205
tgt gca agc ttc gac aga gat gca gat gga ttt ttc gca ggt gag ggc    672
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly
    210                 215                 220
tgt ggt gcc cta gtt ttc aag agg tta gaa gac tgt gct cct cag gaa    720
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gln Glu
225                 230                 235                 240
aaa att tat gct agt ata gac tct atc gca ata gat aaa gag cct act     768
Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp Lys Glu Pro Thr
                245                 250                 255
agc tca gct gtg aaa gct gtc tac caa agt gat tcg agt ctc tcc gat     816
Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser Ser Leu Ser Asp
            260                 265                 270
att gag ctg tta gaa atc agt gga gac tcc aaa cgg ttt gca gca ttc     864
Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe
        275                 280                 285
gaa ggc gct gtg gaa att caa tca agt gtg gaa gcc cag cta aaa gga     912
Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala Gln Leu Lys Gly
    290                 295                 300
ctt tcc aaa gtc ctt gaa cct gca aaa ggc caa ggc gta gcg gtg gga     960
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly Val Ala Val Gly
305                 310                 315                 320
agt act cga gca acc gtt ggg gat ata ggg tat gct aca gga gcg gca     1008
Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala Thr Gly Ala Ala
                325                 330                 335
agc ctg att aaa act gca ctc tgc tta tat aat cgc tac ctt ccg gca     1056
Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala
            340                 345                 350
tta gca aac tgg agt ggc cca tgt gaa cag tcc gcc tgg ggc tca aac     1104
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala Trp Gly Ser Asn
        355                 360                 365
atg ttc gtt tgc cat gaa aca cgg ccg tgg atg aaa aac cag aat gaa     1152
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gln Asn Glu
    370                 375                 380
aag aga tgt gcc ctc att tct gga aca gat cca tct cat aca tgc ttt     1200
Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser His Thr Cys Phe
385                 390                 395                 400
tcc ctc gta cta tcg gat act ggg tgt tat gaa gag cac aat cga acg     1248
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr
                405                 410                 415
tgc ttt gat gtg caa gcg cca cag cta gtt ctg ata cac gga ttc gat     1296
Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile His Gly Phe Asp
            420                 425                 430
gga aaa act att gtg cgg cga ctt gaa gga tat ctc ctt gaa ctt gtt     1344
Gly Lys Thr lle Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val
        435                 440                 445
gaa ggg cat gca agc cct tca gag tat ttc cac aaa ctg att gga caa     1392
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu Ile Gly Gln
    450                 455                 460
agt cta ctt gag aac tcg aaa gaa agt aaa ctc aca ctt tcg ctt gtg     1440
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val
465                 470                 475                 480
tgc aat ccg aac cag ctc caa aag gag ctc atg ctt gct atc aaa gga     1488
Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu Ala Ile Lys Gly
                485                 490                 495
gta caa cga agc                                                     1500
Val Gln Arg Ser
            500
<210>56
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>56
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu
1               5                   10                  15
Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser
            20                  25                  30
Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu Thr Pro Glu Asp
        35                  40                  45
Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr Met Asp Arg Ala
    50                  55                  60
Ile lle Asp Ala Gly Leu Lys Lys Gly Gln His Val Ala Val Leu Val
65                  70                  75                  80
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala
                85                  90                  95
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala Ile Leu
            100                 105                 110
Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr
        115                 120                 125
Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile Ser Ser Gln Trp
    130                 135                 140
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val
145                 150                 155                 160
Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln Val Asn Arg Val
                165                 170                 175
Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser
            180                 185                 190
Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys Leu Ser His Pro
        195                 200                 205
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly
    210                 215                 220
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gln Glu
225                 230                 235                 240
Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp Lys Glu Pro Thr
                245                 250                 255
Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser Ser Leu Ser Asp
            260                 265                 270
Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe
        275                 280                 285
Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala Gln Leu Lys Gly
    290                 295                 300
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly Val Ala Val Gly
305                 310                 315                 320
Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala Thr Gly Ala Ala
                325                 330                 335
Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala
            340                 345                 350
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala Trp Gly Ser Asn
        355                 360                 365
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gln Asn Glu
    370                 375                 380
Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser His Thr Cys Phe
385                 390                 395                 400
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr
                405                 410                 415
Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile His Gly Phe Asp
            420                 425                 430
Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val
        435                 440                 445
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu Ile Gly Gln
    450                 455                 460
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val
465                 470                 475                 480
Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu Ala Ile Lys Gly
                485                 490                 495
Val Gln Arg Ser
            500
<210>57
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>57
atg tta aca ggg aag gat tgg gtc agt cea tca gga agt tgt ttt gcc    48
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala
1               5                   10                  15
cca aat ccg tta tca agc gca aaa gtg gca ttc atg tac gga gaa ggc    96
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly
            20                  25                  30
cga agc ccg tac tgt ggt gta ggc ttg ggt cta cat cgt ttg tgg ccc    144
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro
        35                  40                  45
ggt ctc cat gaa aat gtg aac aat aag aca gtc gat tta tgg acg gaa    192
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu
    50                  55                  60
gga gat ggt tgg tta tat cct cga acg ttg aca cga gaa gag cat aca    240
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr
65                  70                  75                  80
aaa gcc atc gaa tct ttc aac gca aat caa att gaa atg ttt cgc gct    288
Lys Ala Ile Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala
                85                  90                  95
ggg att ttc atc tca atg tgt cag aca gac tat gtc atg aat gtt ctc    336
Gly Ile Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu
            100                 105                 110
ggt gtc cag cct aag gcc gga ttt ggg ctg agc ttg gga gaa att tca    384
Gly Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
        115                 120                 125
atg ctc ttt gcg atg tca aag gag aac tgc agg cag tca cag gaa atg    432
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu Met
    130                 135                 140
acc aat cgt ttg cgc ggt tct cca gtg tgg tct aac gag ctt gct atc    480
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala Ile
145                 150                 155                 160
aac ttc aat gca att cgc aag tta tgg aaa atc ccc cga gga gct ccc    528
Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg Gly Ala Pro
                165                 170                 175
tta gaa tcc ttt tgg caa gga tac ttg gtt cac ggc aca aga gaa gaa    576
Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly Thr Arg Glu Glu
            180                 185                 190
gta gag cat gct att ggt ctt tct gag cct tat gta cgt ctg ctt att    624
Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu Ile
        195                 200                 205
gtg aac gat tca agg agt gcc ttg att gct gga aaa cca gac gcc tgt    672
Val Asn Asp Ser Arg Ser Ala Leu Ile Ala Gly Lys Pro Asp Ala Cys
    210                 215                 220
cag gca gta atc agt aga cta aac tcc aag ttc cct tct ctg ccg gta    720
Gln Ala Val Ile Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val
225                 230                 235                 240
aag caa gga atg att ggt cat tgc cca gaa gtt cgt gcg ttc atc aaa    768
Lys Gln Gly Met Ile Gly His Cys Pro Glu Val Arg Ala Phe Ile Lys
                245                 250                 255
gat att ggg tac atc cat gaa aca ctc cga att tcc aat gac tat tcg     816
Asp lle Gly Tyr Ile His Glu Thr Leu Arg Ile Ser Asn Asp Tyr Ser
            260                 265                 270
gat tgt cag ctt ttc tca gcg gta acc aag ggc gca ctt gac agc tcc     864
Asp Cys Gln Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser
        275                 280                 285
aca atg gaa atc aaa cac ttt gtg gga gag gtc tac tcc cgg atc gca     912
Thr Met Glu Ile Lys His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala
    290                 295                 300
gac ttt cct caa atc gtc aac acg gtg cat tcg gct ggt tat gac gta     960
Asp Phe Pro Gln Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val
305                 310                 315                 320
ttt ctt gag ctt ggc tgt gat gct tct aga tct gca gca gtt caa aac     1008
Phe Leu Glu Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn
                325                 330                 335
att ctt ggt ggt caa gga aag ttc ttg tct aca gct att gac aaa aaa     1056
Ile Leu Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys
            340                 345                 350
gga cac tcc gcc tgg tca caa gta ctt cgg gct acc gca tca tta gct     1104
Gly His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
        355                 360                 365
gca cat cga gta ccg gga atc tca att ttg gat ttg ttt cac cca aat     1152
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro Asn
    370                 375                 380
ttc cga gaa atg tgc tgt aca atg gca acc aca cct aaa gtg gaa gat     1200
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp
385                 390                 395                 400
aag ttc ctg cgc acg att caa atc aat ggt cgg ttt gaa aaa gaa atg     1248
Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu Lys Glu Met
                405                 410                 415
att cac cta gaa gat aca aca tta agt tgc tta ccc gct cca agt gaa     1296
Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu
            420                 425                 430
gca aat atc gca gct att caa tct cgg tca att cga tct gct gcg gcg     1344
Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile Arg Ser Ala Ala Ala
        435                 440                 445
cgt tct gga caa tcc cat gat tgt gca tcc cat agc cat gaa gaa aat     1392
Arg Ser Gly Gln Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn
    450                 455                 460
aag gat tca tgc cct gaa aag ctg aag ctt gat tct gtg tcc gtc gcc     1440
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala
465                 470                 475                 480
ata aat ttc gac aat gat gac cgc att cag ctt ggg cac gcg ggt ttt     1488
Ile Asn Phe Asp Asn Asp Asp Arg Ile Gln Leu Gly His Ala Gly Phe
                485                 490                 495
cgg gag atg tac                                                     1500
Arg Glu Met Tyr
            500
<210>58
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>58
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala
1               5                   10                  15
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly
            20                  25                  30
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro
        35                  40                  45
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu
    50                  55                  60
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr
65                  70                  75                  80
Lys Ala Ile Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala
                85                  90                  95
Gly Ile Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu
            100                 105                 110
Gly Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
        115                 120                 125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu Met
    130                 135                 140
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala Ile
145                 150                 155                 160
Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg Gly Ala Pro
                165                 170                 175
Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly Thr Arg Glu Glu
            180                 185                 190
Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu Ile
        195                 200                 205
Val Asn Asp Ser Arg Ser Ala Leu Ile Ala Gly Lys Pro Asp Ala Cys
    210                 215                 220
Gln Ala Val Ile Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val
225                 230                 235                 240
Lys Gln Gly Met Ile Gly His Cys Pro Glu Val Arg Ala Phe Ile Lys
Asp Ile Gly Tyr Ile His Glu Thr Leu Arg Ile Ser Asn Asp Tyr Ser
            260                 265                 270
Asp Cys Gln Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser
        275                 280                 285
Thr Met Glu Ile Lys His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala
    290                 295                 300
Asp Phe Pro Gln Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val
305                 310                 315                 320
Phe Leu Glu Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn
                325                 330                 335
Ile Leu Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys
            340                 345                 350
Gly His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
        355                 360                 365
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro Asn
    370                 375                 380
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp
385                 390                 395                 400
Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu Lys Glu Met
                405                 410                 415
Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu
            420                 425                 430
Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile Arg Ser Ala Ala Ala
        435                 440                 445
Arg Ser Gly Gln Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn
    450                 455                 460
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala
465                 470                 475                 480
Ilc Asn Phe Asp Asn Asp Asp Arg Ile Gln Leu Gly His Ala Gly Phe
                485                 490                 495
Arg Glu Met Tyr
            500
<210>59
<211>1305
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1305)
<400>59
aat aca aga tat agc ttg tac aca ggg gcg atg gca aag gga att gca      48
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
1               5                   10                  15
tct gca gat ctt gtc att gcc gct ggg aaa gag ggc atc cta gct tcc      96
Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser
            20                  25                  30
tat gga gct gga gga cta cct ctt gct act gtt cga aag gga ata gac      144
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
        35                  40                  45
aaa att caa caa gcc ttg cca agt ggc cca tat gct gta aat ctt att      192
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu Ile
    50                  55                  60
cac tct ccc ttt gac ggc aac ttg gag cag gga aac gtc gat ttg ttc      240
His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp Leu Phe
65                  70                  75                  80
ttg gaa aag aac gtc cgc gtg gcg gaa tgt tcc gcg ttt aca acg cta      288
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu
                85                  90                  95
aca gtg cca gta gta cac tat cgt gct gca ggg ctt gtt cgg cgc caa      336
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gln
            100                 105                 110
gat gga agc att ttg atc aag aac cga atc att gct aaa gta tct agg      384
Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile Ala Lys Val Ser Arg
        115                 120                 125
aca gaa ctc gct gag atg ttc ctt cgt cog gca cct caa atc atc ctc      432
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gln Ile Ile Leu
    130                 135                 140
gaa aaa ctg gta gca gca gaa atc att tca tct gac caa gcg cgt atg      480
Glu Lys Leu Val Ala Ala Glu Ile Ile Ser Ser Asp Gln Ala Arg Met
145                 150                 155                 160
gca gcc aaa gtt ccc atg gcg gac gac atc gca gtc gaa gcc gac tct      528
Ala Ala Lys Val Pro Met Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
                165                 170                 175
ggt ggg cac acg gat aat cgg cct atg cac gtc att ttg ccc ctg ata      576
Gly Gly His Thr Asp Asn Arg Pro Met His Val Ile Leu Pro Leu Ile
            180                 185                 190
att caa ctc cgc aat act ata ctt gca gag tat ggc tgt gcc acg gct      624
Ile Gln Leu Arg Asn Thr Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala
        195                 200                 205
ttt cgt acc cgt ata ggc gct gga gga ggc att ggt tgt cct tca gcg      672
Phe Arg Thr Arg Ile Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala
    210                 215                 220
gcc ctc gca gcc ttt gat atg ggt gcg agt ttt gtc gtg act gga agc      720
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser
225                 230                 235                 240
ata aat caa att tgc cgc gag gca ggg act tgc gat act gtt cgg gag      768
Ile Asn Gln Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu
                245                 250                 255
cta ctt gcc aac tca agc tac tcg gac gtg acg atg gcg cca gca gca    816
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala
            260                 265                 270
gac atg ttt gac caa ggt gtg aaa ctc caa gtc tta aaa cga gga acg    864
Asp Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
        275                 280                 285
atg ttt cca agc aga gca aat aaa ctc cgg aag ctc ttt gtg aac tac    912
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr
    290                 295                 300
gaa tct cta gaa aca ctc ccg tcg aaa gag ttg aaa tac ctg gaa aac    960
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn
305                 310                 315                 320
atc ata ttc aag caa gca gta gac cag gtg tgg gag gaa aca aag cgc    1008
Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu Thr Lys Arg
                325                 330                 335
ttt tac tgt gaa aaa ctg aac aat cca gat aaa att gca agg gcc atg    1056
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile Ala Arg Ala Met
            340                 345                 350
aaa gat cct aaa ttg aag atg tcg ctt tgc ttt cgg tgg tat ctc tcc    1104
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
        355                 360                 365
aag agc tct ggg tgg gcc aac gca gga att aaa tct cgt gca ctc gac    1152
Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile Lys Ser Arg Ala Leu Asp
    370                 375                 380
tac cag atc tgg tgt ggc ccg gca atg ggc tcg ttc aac aat ttc gcc    1200
Tyr Gln Ile Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala
385                 390                 395                 400
agc ggc aca tcc ctc gat tgg aaa gtg act ggg gtt ttc cct ggc gtt    1248
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val
                405                 410                 415
gcg gaa gta aac atg gcc att tta gat ggc gcg cga gaa cta gct gct    1296
Ala Glu Val Asn Met Ala Ile Leu Asp Gly Ala Arg Glu Leu Ala Ala
            420                 425                 430
aaa cga aat                                                        1305
Lys Arg Asn
        435
<210>60
<211>435
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>60
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
1              5                   10                  15
Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser
            20                  25                  30
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
        35                  40                  45
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu Ile
    50                  55                  60
His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp Leu Phe
65                  70                  75                  80
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu
                85                  90                  95
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gln
            100                 105                 110
Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile Ala Lys Val Ser Arg
        115                 120                 125
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gln Ile Ile Leu
    130                 135                 140
Glu Lys Leu Val Ala Ala Glu Ile Ile Ser Ser Asp Gln Ala Arg Met
145                 150                 155                 160
Ala Ala Lys Val Pro Met Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
                165                 170                 175
Gly Gly His Thr Asp Asn Arg Pro Met His Val Ile Leu Pro Leu Ile
            180                 185                 190
Ile Gln Leu Arg Asn Thr Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala
        195                 200                 205
Phe Arg Thr Arg Ile Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala
    210                 215                 220
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser
225                 230                 235                 240
Ile Asn Gln Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu
                245                 250                 255
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala
            260                 265                 270
Asp Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
        275                 280                 285
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr
    290                 295                 300
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn
305                 310                 315                 320
Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu Thr Lys Arg
                325                 330                 335
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile Ala Arg Ala Met
            340                 345                 350
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
        355                 360                 365
Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile Lys Ser Arg Ala Leu Asp
    370                 375                 380
Tyr Gln Ile Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala
385                 390                 395                 400
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val
                405                 410                 415
Ala Glu Val Asn Met Ala Ile Leu Asp Gly Ala Arg Glu Leu Ala Ala
            420                 425                 430
Lys Arg Asn
        435
<210>61
<211>4410
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(4410)
<400>61
atg ggc ccg cga gtg gcg tca ggc aag gtg ccg gct tgg gag atg agc    48
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1               5                   10                  15
aag tcc gag ctg tgt gat gac cgc acg gta gtc ttt gac tat gag gag    96
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
            20                  25                  30
ctg ctg gag ttc gct gag ggc gat atc agt aag gtt ttt ggg ccg gag    144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
        35                  40                  45
ttc aaa gtg gtg gac ggg ttt agg cgc agg gtg agg ttg ccc gct cga    192
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
gag tac ctg ctg gtg acc cgg gtt acg ctg atg gat gcc gag gtg ggc    240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65                  70                  75                  80
aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg    288
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
                85                  90                  95
aac gga gag ctc tcg gaa ggg gga gat gtg ccg tgg gct gtg ttg gtg    336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
            100                 105                 110
gaa gcc ggg cag tgc gac ttg ctg cta att tct tac atg ggc atc gat     384
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
ttc cag tgc aaa gga gag cgg gtc tac cgg ctg ctg aac acc acc ttg     432
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
acg ttt ttt ggc gtc gcg aaa gaa ggg gaa acg ctt gtg tac gat att     480
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145                 150                 155                 160
cgc gtc acg ggt ttc gcc aag agg ccg gac gga gat atc tcc atg ttc     528
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
                165                 170                 175
ttt ttc gaa tat gat tgc tac tgc aat ggc aag ctt ctc atc gaa atg     576
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
            180                 185                 190
cga gat ggc tct gca ggc ttc ttc acg gac gaa gag ctc gct gcc ggc     624
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
        195                 200                 205
aaa gga gtg gtc gtc act cgt gca cag caa aac atg cgg gac aaa att     672
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
    210                 215                 220
gta cgg cag tcc att gag cct ttt gca ctg gcg gct tgc acg cac aaa     720
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225                 230                 235                 240
acg act ctg aac gag agt gac atg cag tcc ctt gtg gag cga aac tgg     768
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
                245                 250                 255
gca aac gtt ttt ggc acc agt aac aag atg gcg gag ctc aac tat aaa     816
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
            260                 265                 270
att tgc gcc agg aaa atg ctc atg atc gac agg gtt acc cac att gac     864
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
        275                 280                 285
cac cac ggt ggg gcg tat ggc ctc gga cta ctt gtt gga gag aag atc     912
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
    290                 295                 300
ttg gat cga aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa     960
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305                 310                 315                 320
gtc atg gca ggg tca ctg gtc agc gat ggt tgc agc cag ctc tta aaa     1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
                325                 330                 335
ctc tat atg atc tgg ctt ggc ctc cac ctg aaa atg gag gaa ttt gat     1056
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
            340                 345                 350
ttt ctc cca gtt agc ggc cac aaa aac aag gtg cga tgc agg gga caa     1104
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
att tca ccg cat aaa ggc aag ctt gtc tac gtc atg gaa atc aaa aag     1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
    370                 375                 380
atg ggt tac gat caa gca tct gga agc cca tac gcc atc gcg gac gtt     1200
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385                 390                 395                 400
gat atc att gac gtc aac gaa gag ctg ggt caa agt ttt gac atc aac     1248
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
                405                 410                 415
gac ctt gcg agc tac gga aaa ggt gac ctg agc aaa aaa atc gtg gtt     1296
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
            420                 425                 430
gac ttc aaa gga att gct ttg cag ctc aaa ggc cgc gct ttt tca cgc     1344
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
        435                 440                 445
atg agt tcc agc tcg tcc ttg aac gaa gga tgg caa tgt gtt cca aaa     1392
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
    450                 455                 460
cca agc cag aga atg gaa cac gaa cag ccc cct gct cac tgc ctt gca     1440
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465                 470                 475                 480
agc gac ccc gaa gcc cct tca act gtg acc tgg cac cca atg tca aag     1488
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
                485                 490                 495
ctt cct ggc aac cct acg ccg ttc ttc tcc cct tca tct tac cct ccg     1536
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro
            500                 505                 510
agg gca att tgc ttc atc cct ttc ccg ggc aat ccc ctt gac aac aac     1584
Arg Ala Ile Cys Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn
        515                 520                 525
tgc aag gct gga gaa atg ccc ctg aac tgg tac aac atg tca gag ttc     1632
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe
    530                 535                 540
atg tgt ggc aag gtt tct aac tgc ttg ggc cca gaa ttc gca cgc ttt     1680
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe
545                 550                 555                 560
gac aag tcg aac acc agc cgg agc cct gct ttt gac ttg gct ctg gtg     1728
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val
                565                 570                 575
acc cga gtt gtt gaa gtc aca aac atg gaa cac ggc aag ttt cta aac     1776
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn
            580                 585                 590
gtt gat tgc aat cca agc aaa ggc aca atg gtg ggg gag ttt gac tgt     1824
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys
        595                 600                 605
ccc caa gac gcg tgg ttc ttt gat ggt tcg tgc aac gac ggc cat atg     1872
Pro Gln Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met
    610                 615                 620
ccg tat tcc att atc atg gaa atc gga ctg caa acc tca ggt gtt ctc     1920
Pro Tyr Ser Ile Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu
625                 630                 635                 640
acc tcg gtg ttg aag gca ccg ctg act atg gac aag gat gac att ctc     1968
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu
                645                 650                 655
ttt cga aac ctc gat gca agt gct gaa atg gtg cgt cca gac gtg gat     2016
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp
            660                 665                 670
gtt cgc ggc aaa acg att cga aac gtg acc aag tgt acc ggc tat gca     2064
Val Arg Gly Lys Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala
        675                 680                 685
atg ttg gga aag atg ggg att cac cgg ttc acg ttt gag ttg agc gtt     2112
Met Leu Gly Lys Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val
    690                 695                 700
gac ggc gtg gta ttt tat aaa gga tcc act tcc ttt gga tgg ttc act     2160
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr
705                 710                 715                 720
ccc gag gtg ttt gct cag caa gct gga ctc gac aac ggg aaa aag acg     2208
Pro Glu Val Phe Ala Gln Gln Ala G1y Leu Asp Asn Gly Lys Lys Thr
                725                 730                 735
gag ccc tgg tgc aag act aac aac acc tcg gtt cga aga gtt gaa atc     2256
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile
            740                 745                 750
gca tcc gcc aaa gga aaa gag cag ctg act gag aag ctt ccc gac gca     2304
Ala Ser Ala Lys Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala
        755                 760                 765
act aat gct caa gtt ctt cgg cgt tca gag cag tgt gaa tac ctc gat     2352
Thr Asn Ala Gln Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp
    770                 775                 780
tac ctc aat att gcc cct gac tct ggg ctg cat ggg aag ggc tac gcc     2400
Tyr Leu Asn Ile Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala
785                 790                 795                 800
cac gga cac aaa gac gtt aac ccg caa gac tgg ttc ttc tct tgc cac     2448
His Gly His Lys Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His
                805                 810                 815
ttt tgg ttc gat cct gta atg cca gga tct tta gga att gaa tca atg     2496
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met
            820                 825                 830
ttc cag ctt atc gag gcc ttt gcg gtg gac caa aac att cct gga gag     2544
Phe Gln Leu lle Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu
        835                 840                 845
tac aac gta tcc aat ccg acc ttt gcc cat gca cca ggc aaa acg gcg     2592
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala
    850                 855                 860
tgg aaa tac cga ggc cag ctc aca cca aag aac cgt gcg atg gac tgc     2640
Trp Lys Tyr Arg Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys
865                 870                 875                 880
gag gtg cat atc gtt tca att acc gcc tcc ccc gag aac ggg ggc tac     2688
Glu Val His Ile Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr
                885                 890                 895
gtt gac atc gtg gcc gat gga gcg ctt tgg gta gat gga ctt cgc gtg     2736
Val Asp Ile Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val
            900                 905                 910
tac gaa gcc aaa gag ctt cga gtt cgt gtc gtt tcg gca aaa cct caa     2784
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln
        915                 920                 925
gca att ccg gat gta caa caa cag cca cct agc gca aag gcg gac ccg     2832
Ala Ile Pro Asp Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro
    930                 935                 940
ggg aaa aca gga gtt gca ctt tcg ccc act cag cta cgc gac gtc ctg   2880
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu
945                 950                 955                 960
ctt gaa gtg gac aat cca ttg tat ctt ggt gta gag aac tcc aat ttg   2928
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu
                965                 970                 975
gtg cag ttt gag tcg aaa cct gca act tct tca cgt atc gtt tcg atc   2976
Val Gln Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile
            980                 985                 990
aaa ccg tgc tcg att agt gac ctt ggc gat aag tct ttt atg gaa acg   3024
Lys Pro Cys Ser Ile Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr
        995                 1000                1005
tac aac gtg tca gca cct ctg tat act gga gca atg gcc aag ggc       3069
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly
    1010                1015                1020
att gca tcc gcc gac ttg gtc att gct gct ggg aaa cgc aag ata       3114
Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Arg Lys Ile
    1025                1030                1035
ctt gga tcg ttt ggt gcg gga ggg ctg cct att tcc ata gtc cgt       3159
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Ile Ser Ile Val Arg
    1040                1045                1050
gaa gca ctg gag aaa att caa caa cac ctg ccc cac ggc ccc tac       3204
Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro His Gly Pro Tyr
    1055                1060                1065
gct gtt aac ctc att cac tcg cct ttc gac agc aac ttg gaa aag       3249
Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn Leu Glu Lys
    1070                1075                1080
ggc aac gtt gac ctc ttt ctc gag atg ggc gtg aca gtg gta gaa       3294
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu
    1085                1090                1095
tgc agc gcg ttc atg gaa ctc acg gcc cag gtt gtc cgg tac cgc       3339
Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr Arg
    1100                1105                1110
gcg tct ggt cta agc aaa agt gcg gac ggt tcg att cgc att gct       3384
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
    1115                1120                1125
cac cgt att att ggc aag gtt tcc aga acc gag ctg gca gaa atg       3429
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met
    1130                1135                1140
ttt att cgt cca gca cca cag cac ctc ctc caa aaa ctc gta gcc       3474
Phe Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala
    1145                1150                1155
tcc ggc gag ctg aca gct gag caa gcc gag ctt gca aca cag gtt       3519
Ser Gly Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val
    1160                1165                1170
ccg gtg gcg gat gac att gcg gtc gaa gcc gac tcg ggg ggg cat       3564
Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
    1175                1180                1185
acc gac aac agg cct att cac gtc att ctt cct cta atc atc aac       3609
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn
    1190                1195                1200
cta cgc aac cgt ttg cat aaa gag ctt gac tac cct tcg cat ctc      3654
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu
    1205                1210                1215
cgg gta cgt gtg ggt gct ggt ggt ggt att gga tgt cct caa gcc      3699
Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
    1220                1225                1230
gct ctt gca gca ttt caa atg ggg gca gcg ttt tta atc act gga      3744
Ala Leu Ala Ala Phe Gln Met Gly Ala Ala Phe Leu Ile Thr Gly
    1235                1240                1245
acg gtg aac cag ctt gct cgt gaa agt ggc act tgt gac aac gtc      3789
Thr Val Asn Gln Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val
    1250                1255                1260
cgg tta cag ctc tca aag gcc acg tat agc gac gtg tgt atg gct      3834
Arg Leu Gln Leu Ser Lys Ala Thr Tyr Ser Asp Val Cys Met Ala
    1265                1270                1275
cct gct gcc gat atg ttt gac caa ggc gtg gag ctg caa gta ttg      3879
Pro Ala Ala Asp Met Phe Asp Gln Gly Val Glu Leu Gln Val Leu
    1280                1285                1290
aag aaa ggc acg ctg ttc cca agt cgt gct aag aag ctg tac gag      3924
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys Leu Tyr Glu
    1295                1300                1305
ctg ttc tgc aag tat gac tcg ttt gag gca atg ccg gct gaa gaa      3969
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala Glu Glu
    1310                1315                1320
ttg caa cgg gtt gaa aag cgg att ttt caa aag tcg ctt gct gaa      4014
Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu Ala Glu
    1325                1330                1335
gtt tgg cag gag acc agt gac ttt tac att cat cgt atc aag aac      4059
Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys Asn
    1340                1345                1350
cct gag aaa atc aat cgt gct gca agc gat ggc aaa ctg aaa atg      4104
Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
    1355                1360                1365
tcg ctt tgc ttt cgc tgg tac ctt ggg ctt tcc tca ttt tgg gcc      4149
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala
    1370                1375                1380
aac tct ggg gca caa gat cgc gtc atg gac tat caa att tgg tgt      4194
Asn Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys
    1385                1390                1395
ggc cct gct att ggc gct ttc aat gat ttt acc aag ggc acg tac      4239
Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr
    1400                1405                1410
ctt gac gtg act gtt gca aag agt tac cct tgt gtg gca cag atc      4284
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile
    1415                1420                1425
aat ttg caa att ttg caa gga gct gcg tat ctg aaa cgc ctt ggt      4329
Asn Leu Gln Ile Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly
    1430                1435                1440
gtc att cgt ttt gac cgc atg ctg ctg cag gcc gtc gat atc gac      4374
Val Ile Arg Phe Asp Arg Met Leu Leu Gln Ala Val Asp Ile Asp
    1445                1450                1455
gat cct gta ttt act tac gtg ccg acc cag cca ctt                  4410
Asp Pro Val Phe Thr Tyr Val Pro Thr Gln Pro Leu
    1460                1465                1470
<210>62
<211>1470
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>62
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1               5                   10                  15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
            20                  25                  30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
        35                  40                  45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65                  70                  75                  80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
                85                  90                  95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
            100                 105                 110
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145                 150                 155                 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
                165                 170                 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
            180                 185                 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
        195                 200                 205
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225                 230                 235                 240
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
                245                 250                 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
            260                 265                 270
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
        275                 280                 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
    290                 295                 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305                 310                 315                 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
                325                 330                 335
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
            340                 345                 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
    370                 375                 380
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385                 390                 395                 400
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
                405                 410                 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
            420                 425                 430
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
        435                 440                 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
    450                 455                 460
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465                 470                 475                 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
                485                 490                 495
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro
            500                 505                 510
Arg Ala Ile Cys Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn
        515                 520                 525
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe
    530                 535                 540
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe
545                 550                 555                 560
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val
                565                 570                 575
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn
            580                 585                 590
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys
        595                 600                 605
Pro Gln Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met
    610                 615                 620
Pro Tyr Ser Ile Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu
625                 630                 635                 640
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu
                645                 650                 655
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp
            660                 665                 670
Val Arg Gly Lys Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala
        675                 680                 685
Met Leu Gly Lys Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val
    690                 695                 700
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr
705                 710                 715                 720
Pro Glu Val Phe Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr
                725                 730                 735
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile
            740                 745                 750
Ala Ser Ala Lys Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala
        755                 760                 765
Thr Asn Ala Gln Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp
    770                 775                 780
Tyr Leu Asn Ile Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala
785                 790                 795                 800
His Gly His Lys Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His
                805                 810                 815
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met
            820                 825                 830
Phe Gln Leu Ile Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu
        835                 840                 845
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala
    850                 855                 860
Trp Lys Tyr Arg Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys
865                 870                 875                 880
Glu Val His Ile Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr
                885                 890                 895
Val Asp Ile Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val
            900                 905                 910
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln
        915                 920                 925
Ala Ile Pro Asp Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro
    930                 935                 940
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu
945                 950                 955                 960
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu
                965                 970                 975
Val Gln Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile
            980                 985                 990
Lys Pro Cys Ser Ile Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr
        995                 1000                1005
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly
    1010                1011                1020
Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Arg Lys Ile
    1025                1030                1035
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Ile Ser Ile Val Arg
    1040                1045                1050
Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro His Gly Pro Tyr
    1055                1060                1065
Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn Leu Glu Lys
    1070                1075                1080
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu
    1085                1090                1095
Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr Arg
    1100                1105                1110
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
    1115                1120                1125
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met
    1130                1135                1140
Phe Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala
    1145                1150                1155
Ser Gly Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val
    1160                1165                1170
Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
    1175                1180                1185
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn
    1190                1195                1200
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu
    1205                1210                1215
Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
    1220                1225                1230
Ala Leu Ala Ala Phe Gln Met Gly Ala Ala Phe Leu Ile Thr Gly
    1235                1240                1245
Thr Val Asn Gln Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val
    1250                1255                1260
Arg Leu Gln Leu Ser Lys Ala Thr Tyr Ser Asp Val Cys Met Ala
    1265                1270                1275
Pro Ala Ala Asp Met Phe Asp Gln Gly Val Glu Leu Gln Val Leu
    1280                1285                1290
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys Leu Tyr Glu
    1295                1300                1305
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala Glu Glu
    1310                1315                1320
Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu Ala Glu
    1325                1330                1335
Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys Asn
    1340                1345                1350
Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
    1355                1360                1365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala
    1370                1375                1380
Asn Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys
    1385                1390                1395
Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr
    1400                1405                1410
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile
    1415                1420                1425
Asn Leu Gln Ile Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly
    1430                1435                1440
Val Ile Arg Phe Asp Arg Met Leu Leu Gln Ala Val Asp Ile Asp
    1445                1450                1455
Asp Pro Val Phe Thr Tyr Val Pro Thr Gln Pro Leu
    1460                1465                1470
<210>63
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>63
atg ggc ccg cga gtg gcg tca ggc aag gtg ccg gct tgg gag atg agc    48
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1               5                   10                  15
aag tcc gag ctg tgt gat gac cgc acg gta gtc ttt gac tat gag gag    96
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
            20                  25                  30
ctg ctg gag ttc gct gag ggc gat atc agt aag gtt ttt ggg ccg gag    144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
        35                  40                  45
ttc aaa gtg gtg gac ggg ttt agg cgc agg gtg agg ttg ccc gct cga    192
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
gag tac ctg ctg gtg acc cgg gtt acg ctg atg gat gcc gag gtg ggc      240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65                  70                  75                  80
aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg      288
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
                85                  90                  95
aac gga gag ctc tcg gaa ggg gga gat gtg ccg tgg gct gtg ttg gtg      336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
            100                 105                 110
gaa gcc ggg cag tgc gac ttg ctg cta att tct tac atg ggc atc gat      384
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
ttc cag tgc aaa gga gag cgg gtc tac cgg ctg ctg aac acc acc ttg      432
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
acg ttt ttt ggc gtc gcg aaa gaa ggg gaa acg ctt gtg tac gat att      480
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145                 150                 155                 160
cgc gtc acg ggt ttc gcc aag agg ccg gac gga gat atc tcc atg ttc      528
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
                165                 170                 175
ttt ttc gaa tat gat tgc tac tgc aat ggc aag ctt ctc atc gaa atg      576
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
            180                 185                 190
cga gat ggc tct gca ggc ttc ttc acg gac gaa gag ctc gct gcc ggc      624
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
        195                 200                 205
aaa gga gtg gtc gtc act cgt gca cag caa aac atg cgg gac aaa att      672
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
    210                 215                 220
gta cgg cag tcc att gag cct ttt gca ctg gcg gct tgc acg cac aaa      720
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225                 230                 235                 240
acg act ctg aac gag agt gac atg cag tcc ctt gtg gag cga aac tgg      768
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
                245                 250                 255
gca aac gtt ttt ggc acc agt aac aag atg gcg gag ctc aac tat aaa      816
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
            260                 265                 270
att tgc gcc agg aaa atg ctc atg atc gac agg gtt acc cac att gac      864
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
        275                 280                 285
cac cac ggt ggg gcg tat ggc ctc gga cta ctt gtt gga gag aag atc      912
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
    290                 295                 300
ttg gat cga aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa      960
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305                 310                 315                 320
gtc atg gca ggg tca ctg gtc agc gat ggt tgc agc cag ctc tta aaa      1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
                325                 330                 335
ctc tat atg atc tgg ctt ggc ctc cac ctg aaa atg gag gaa ttt gat    1056
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
            340                 345                 350
ttt ctc cca gtt agc ggc cac aaa aac aag gtg cga tgc agg gga caa    1104
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
att tca ccg cat aaa ggc aag ctt gtc tac gtc atg gaa atc aaa aag    1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
    370                 375                 380
atg ggt tac gat caa gca tct gga agc cca tac gcc atc gcg gac gtt    1200
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385                 390                 395                 400
gat atc att gac gtc aac gaa gag ctg ggt caa agt ttt gac atc aac    1248
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
                405                 410                 415
gac ctt gcg agc tac gga aaa ggt gac ctg agc aaa aaa atc gtg gtt    1296
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
            420                 425                 430
gac ttc aaa gga att gct ttg cag ctc aaa ggc cgc gct ttt tca cgc    1344
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
        435                 440                 445
atg agt tcc agc tcg tcc ttg aac gaa gga tgg caa tgt gtt cca aaa    1392
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
    450                 455                 460
cca agc cag aga atg gaa cac gaa cag ccc cct gct cac tgc ctt gca    1440
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465                 470                 475                 480
agc gac ccc gaa gcc cct tca act gtg acc tgg cac cca atg tca aag    1488
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
                485                 490                 495
ctt cct ggc aac                                                    1500
Leu Pro Gly Asn
            500
<210>64
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>64
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1               5                   10                  15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
            20                  25                  30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
        35                  40                  45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65                  70                  75                  80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
                85                  90                  95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
            100                 105                 110
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145                 150                 155                 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
                165                 170                 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
            180                 185                 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
        195                 200                 205
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
    210                 215                 220
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225                 230                 235                 240
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
                245                 250                 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
            260                 265                 270
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
        275                 280                 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
    290                 295                 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305                 310                 315                 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
                325                 330                 335
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
            340                 345                 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
    370                 375                 380
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385                 390                 395                 400
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
                405                 410                 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
            420                 425                 430
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
        435                 440                 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
    450                 455                 460
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465                 470                 475                 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
                485                 490                 495
Leu Pro Gly Asn
            500
<210>65
<211>1500
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1500)
<400>65
cct acg ccg ttc ttc tcc cct tca tct tac cct ccg agg gca att tgc    48
Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys
1               5                   10                  15
ttc atc cct ttc ccg ggc aat ccc ctt gac aac aac tgc aag gct gga    96
Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly
            20                  25                  30
gaa atg ccc ctg aac tgg tac aac atg tca gag ttc atg tgt ggc aag    144
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys
        35                  40                  45
gtt tct aac tgc ttg ggc cca gaa ttc gca cgc ttt gac aag tcg aac    192
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn
    50                  55                  60
acc agc cgg agc cct gct ttt gac ttg gct ctg gtg acc cga gtt gtt      240
Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val
65                  70                  75                  80
gaa gtc aca aac atg gaa cac ggc aag ttt cta aac gtt gat tgc aat      288
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn
                85                  90                  95
cca agc aaa ggc aca atg gtg ggg gag ttt gac tgt ccc caa gac gcg      336
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala
            100                 105                 110
tgg ttc ttt gat ggt tcg tgc aac gac ggc cat atg ccg tat tcc att      384
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile
        115                 120                 125
atc atg gaa atc gga ctg caa acc tca ggt gtt ctc acc tcg gtg ttg      432
Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu
    130                 135                 140
aag gca ccg ctg act atg gac aag gat gac att ctc ttt cga aac ctc      480
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu
145                 150                 155                 160
gat gca agt gct gaa atg gtg cgt cca gac gtg gat gtt cgc ggc aaa      528
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys
                165                 170                 175
acg att cga aac gtg acc aag tgt acc ggc tat gca atg ttg gga aag      576
Thr lle Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys
            180                 185                 190
atg ggg att cac cgg ttc acg ttt gag ttg agc gtt gac ggc gtg gta      624
Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val
        195                 200                 205
ttt tat aaa gga tcc act tcc ttt gga tgg ttc act ccc gag gtg ttt      672
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe
    210                 215                 220
gct cag caa gct gga ctc gac aac ggg aaa aag acg gag ccc tgg tgc      720
Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys
225                 230                 235                 240
aag act aac aac acc tcg gtt cga aga gtt gaa atc gca tcc gcc aaa      768
Lys Thr Asn Asn Thr Ser Va1 Arg Arg Val Glu Ile Ala Ser Ala Lys
                245                 250                 255
gga aaa gag cag ctg act gag aag ctt ccc gac gca act aat gct caa      816
Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln
            260                 265                 270
gtt ctt cgg cgt tca gag cag tgt gaa tac ctc gat tac ctc aat att      864
Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile
        275                 280                 285
gcc cct gac tct ggg ctg cat ggg aag ggc tac gcc cac gga cac aaa      912
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys
    290                 295                 300
gac gtt aac ccg caa gac tgg ttc ttc tct tgc cac ttt tgg ttc gat      960
Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp
305                 310                 315                 320
cct gta atg cca gga tct tta gga att gaa tca atg ttc cag ctt atc      1008
Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile
                325                 330                 335
gag gcc ttt gcg gtg gac caa aac att cct gga gag tac aac gta tcc    1056
Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser
            340                 345                 350
aat ccg acc ttt gcc cat gca cca ggc aaa acg gcg tgg aaa tac cga    1104
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg
        355                 360                 365
ggc cag ctc aca cca aag aac cgt gcg atg gac tgc gag gtg cat atc    1152
Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile
    370                 375                 380
gtt tca att acc gcc tcc ccc gag aac ggg ggc tac gtt gac atc gtg    1200
Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val
385                 390                 395                 400
gcc gat gga gcg ctt tgg gta gat gga ctt cgc gtg tac gaa gcc aaa    1248
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys
                405                 410                 415
gag ctt cga gtt cgt gtc gtt tcg gca aaa cct caa gca att ccg gat    1296
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp
            420                 425                 430
gta caa caa cag cca cct agc gca aag gcg gac ccg ggg aaa aca gga    1344
Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly
        435                 440                 445
gtt gca ctt tcg ccc act cag cta cgc gac gtc ctg ctt gaa gtg gac    1392
Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp
    450                 455                 460
aat cca ttg tat ctt ggt gta gag aac tcc aat ttg gtg cag ttt gag    1440
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu
465                 470                 475                 480
tcg aaa cct gca act tct tca cgt atc gtt tcg atc aaa ccg tgc tcg    1488
Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser
                485                 490                 495
att agt gac ctt                                                    1500
Ile Ser Asp Leu
            500
<210>66
<211>500
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>66
Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys
1               5                   10                  15
Phe Ilc Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly
            20                  25                  30
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys
        35                  40                  45
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn
    50                  55                  60
Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val
65                  70                  75                  80
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn
                85                  90                  95
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala
            100                 105                 110
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile
        115                 120                 125
Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu
    130                 135                 140
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu
145                 150                 155                 160
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys
                165                 170                 175
Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys
            180                 185                 190
Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val
        195                 200                 205
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe
    210                 215                 220
Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys
225                 230                 235                 240
Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile Ala Ser Ala Lys
                245                 250                 255
Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln
            260                 265                 270
Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile
        275                 280                 285
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys
    290                 295                 300
Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp
305                 310                 315                 320
Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile
                325                 330                 335
Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser
            340                 345                 350
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg
        355                 360                 365
Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile
    370                 375                 380
Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val
385                 390                 395                 400
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys
                405                 410                 415
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp
            420                 425                 430
Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly
        435                 440                 445
Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp
    450                 455                 460
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu
465                 470                 475                 480
Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser
                485                 490                 495
Ile Ser Asp Leu
            500
<210>67
<211>1410
<212>DNA
<213>破囊壶菌(Thraustochytrium sp.)
<220>
<221>CDS
<222>(1)..(1410)
<400>67
ggc gat aag tct ttt atg gaa acg tac aac gtg tca gca cct ctg tat    48
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr
1               5                   10                  15
act gga gca atg gcc aag ggc att gca tcc gcc gac ttg gtc att gct    96
Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala
            20                  25                  30
gct ggg aaa cgc aag ata ctt gga tcg ttt ggt gcg gga ggg ctg cct    144
Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro
        35                  40                  45
att tcc ata gtc cgt gaa gca ctg gag aaa att caa caa cac ctg ccc    192
Ile Ser Ile Val Arg Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro
    50                  55                  60
cac ggc ccc tac gct gtt aac ctc att cac tcg cct ttc gac agc aac    240
His Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
65                  70                  75                  80
ttg gaa aag ggc aac gtt gac ctc ttt ctc gag atg ggc gtg aca gtg    288
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val
                85                  90                  95
gta gaa tgc agc gcg ttc atg gaa ctc acg gcc cag gtt gtc cgg tac    336
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr
            100                 105                 110
cgc gcg tct ggt cta agc aaa agt gcg gac ggt tcg att cgc att gct    384
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
        115                 120                 125
cac cgt att att ggc aag gtt tcc aga acc gag ctg gca gaa atg ttt    432
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe
    130                 135                 140
att cgt cca gca cca cag cac ctc ctc caa aaa ctc gta gcc tcc ggc    480
Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala Ser Gly
145                 150                 155                 160
gag ctg aca gct gag caa gcc gag ctt gca aca cag gtt ccg gtg gcg    528
Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val Pro Val Ala
                165                 170                 175
gat gac att gcg gtc gaa gcc gac tcg ggg ggg cat acc gac aac agg    576
Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
            180                 185                 190
cct att cac gtc att ctt cct cta atc atc aac cta cgc aac cgt ttg    624
Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
        195                 200                 205
cat aaa gag ctt gac tac cct tcg cat ctc cgg gta cgt gtg ggt gct    672
His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala
    210                 215                 220
ggt ggt ggt att gga tgt cct caa gcc gct ctt gca gca ttt caa atg    720
Gly Gly Gly Ile Gly Cys Pro Gln Ala Ala Leu Ala Ala Phe Gln Met
225                 230                 235                 240
ggg gca gcg ttt tta atc act gga acg gtg aac cag ctt gct cgt gaa    768
Gly Ala Ala Phe Leu Ile Thr Gly Thr Val Asn Gln Leu Ala Arg Glu
                245                 250                 255
agt ggc act tgt gac aac gtc cgg tta cag ctc tca aag gcc acg tat    816
Scr Gly Thr Cys Asp Asn Val Arg Leu Gln Leu Ser Lys Ala Thr Tyr
            260                 265                 270
agc gac gtg tgt atg gct cct gct gcc gat atg ttt gac caa ggc gtg    864
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gln Gly Val
        275                 280                 285
gag ctg caa gta ttg aag aaa ggc acg ctg ttc cca agt cgt gct aag    912
Glu Leu Gln Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys
    290                 295                 300
aag ctg tac gag ctg ttc tgc aag tat gac tcg ttt gag gca atg ccg    960
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro
305                 310                 315                 320
gct gaa gaa ttg caa cgg gtt gaa aag cgg att ttt caa aag tcg ctt    1008
Ala Glu Glu Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu
                325                 330                 335
gct gaa gtt tgg cag gag acc agt gac ttt tac att cat cgt atc aag    1056
Ala Glu Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys
            340                 345                 350
aac cct gag aaa atc aat cgt gct gca agc gat ggc aaa ctg aaa atg    1104
Asn Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
        355                 360                 365
tcg ctt tgc ttt cgc tgg tac ctt ggg ctt tcc tca ttt tgg gcc aac    1152
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn
    370                 375                 380
tct ggg gca caa gat cgc gtc atg gac tat caa att tgg tgt ggc cct    1200
Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys Gly Pro
385                 390                 395                 400
gct att ggc gct ttc aat gat ttt acc aag ggc acg tac ctt gac gtg    1248
Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val
                405                 410                 415
act gtt gca aag agt tac cct tgt gtg gca cag atc aat ttg caa att    1296
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile Asn Leu Gln Ile
            420                 425                 430
ttg caa gga gct gcg tat ctg aaa cgc ctt ggt gtc att cgt ttt gac    1344
Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val Ile Arg Phe Asp
        435                 440                 445
cgc atg ctg ctg cag gcc gtc gat atc gac gat cct gta ttt act tac    1392
Arg Met Leu Leu Gln Ala Val Asp Ile Asp Asp Pro Val Phe Thr Tyr
    450                 455                 460
gtg ccg acc cag cca ctt                                            1410
Val Pro Thr Gln Pro Leu
465                 470
<210>68
<211>470
<212>PRT
<213>破囊壶菌(Thraustochytrium sp.)
<400>68
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr
1               5                   10                  15
Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala
            20                  25                  30
Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro
        35                  40                  45
Ile Ser Ile Val Arg Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro
    50                  55                  60
His Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
65                  70                  75                  80
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val
                85                  90                  95
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr
            100                 105                 110
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
        115                 120                 125
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe
    130                 135                 140
Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala Ser Gly
145                 150                 155                 160
Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val Pro Val Ala
                165                 170                 175
Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
            180                 185                 190
Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
        195                 200                 205
His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala
    210                 215                 220
Gly Gly Gly Ile Gly Cys Pro Gln Ala Ala Leu Ala Ala Phe Gln Met
225                 230                 235                 240
Gly Ala Ala Phe Leu Ile Thr Gly Thr Val Asn Gln Leu Ala Arg Glu
                245                 250                 255
Ser Gly Thr Cys Asp Asn Val Arg Leu Gln Leu Ser Lys Ala Thr Tyr
            260                 265                 270
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gln Gly Val
        275                 280                 285
Glu Leu Gln Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys
    290                 295                 300
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro
305                 310                 315                 320
Ala Glu Glu Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu
                325                 330                 335
Ala Glu Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys
            340                 345                 350
Asn Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
        355                 360                 365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn
    370                 375                 380
Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys Gly Pro
385                 390                 395                 400
Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val
                405                 410                 415
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile Asn Leu Gln Ile
            420                 425                 430
Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val Ile Arg Phe Asp
        435                 440                 445
Arg Met Leu Leu Gln Ala Val Asp Ile Asp Asp Pro Val Phe Thr Tyr
    450                 455                 460
Val Pro Thr Gln Pro Leu
465                 470
<210>69
<211>6180
<212>DNA
<213>人工
<220>
<223>合成的
<400>69
atggccgctc gcaacgtgag cgccgcgcat gagatgcacg atgaaaagcg catcgccgtc  60
gtcggcatgg ccgtccagta cgccggatgc aaaaccaagg acgagttctg ggaggtgctc  120
atgaacggca aggtcgagtc caaggtgatc agcgacaaac gactcggctc caactaccgc  180
gccgagcact acaaagcaga gcgcagcaag tatgccgaca ccttttgcaa cgaaacgtac  240
ggcacccttg acgagaacga gatcgacaac gagcacgaac tcctcctcaa cctcgccaag  300
caggcactcg cagagacatc cgtcaaagac tcgacacgct gcggcatcgt cagcggctgc  360
ctctcgttcc ccatggacaa cctccagggt gaactcctca acgtgtacca aaaccatgtc  420
gagaaaaagc tcggggcccg cgtcttcaag gacgcctccc attggtccga acgcgagcag  480
tccaacaaac ccgaggccgg tgaccgccgc atcttcatgg acccggcctc cttcgtcgcc  540
gaagaactca acctcggcgc ccttcactac tccgtcgacg cagcatgcgc cacggcgctc  600
tacgtgctcc gcctcgcgca ggatcatctc gtctccggcg ccgccgacgt catgctctgc  660
ggtgccacct gcctgccgga gccctttttc atcctttcgg gcttttccac cttccaggcc  720
atgcccgtcg gcacgggcca gaacgtgtcc atgccgctgc acaaggacag ccagggcctc  780
accccgggtg agggcggctc catcatggtc ctcaagcgtc tcgatgatgc catccgcgac  840
ggcgaccaca tctacggcac ccttctcggc gccaatgtca gcaactccgg cacaggtctg  900
cccctcaagc cccttctccc cagcgagaaa aagtgcctca tggacaccta cacgcgcatt  960
aacgtgcacc cgcacaagat tcagtacgtc gagtgccacg ccaccggcac gccccagggt  1020
gatcgtgtgg aaatcgacgc cgtcaaggcc tgctttgaag gcaaggtccc ccgtttcggt  1080
accacaaagg gcaactttgg acacaccctc gtcgcagccg gctttgccgg tatgtgcaag   1140
gtcctcctct ccatgaagca tggcatcatc ccgcccaccc cgggtatcga tgacgagacc   1200
aagatggacc ctctcgtcgt ctccggtgag gccatcccat ggccagagac caacggcgag   1260
cccaagcgcg ccggtctctc ggcctttggc tttggtggca ccaacgccca tgccgtcttt   1320
gaggagcatg acccctccaa cgccgcctgc acgggccacg actccatttc tgcgctctcg   1380
gcccgctgcg gcggtgaaag caacatgcgc atcgccatca ctggtatgga cgccaccttt   1440
ggcgctctca agggactcga cgccttcgag cgcgccattt acaccggcgc tcacggtgcc   1500
atcccactcc cagaaaagcg ctggcgcttt ctcggcaagg acaaggactt tcttgacctc   1560
tgcggcgtca aggccacccc gcacggctgc tacattgaag atgttgaggt cgacttccag   1620
cgcctccgca cgcccatgac ccctgaagac atgctcctcc ctcagcagct tctggccgtc   1680
accaccattg accgcgccat cctcgactcg ggaatgaaaa agggtggcaa tgtcgccgtc   1740
tttgtcggcc tcggcaccga cctcgagctc taccgtcacc gtgctcgcgt cgctctcaag   1800
gagcgcgtcc gccctgaagc ctccaagaag ctcaatgaca tgatgcagta cattaacgac   1860
tgcggcacat ccacatcgta cacctcgtac attggcaacc tcgtcgccac gcgcgtctcg   1920
tcgcagtggg gcttcacggg cccctccttt acgatcaccg agggcaacaa ctccgtctac   1980
cgctgcgccg agctcggcaa gtacctcctc gagaccggcg aggtcgatgg cgtcgtcgtt   2040
gcgggtgtcg atctctgcgg cagtgccgaa aacctttacg tcaagtctcg ccgcttcaag   2100
gtgtccacct ccgatacccc gcgcgccagc tttgacgccg ccgccgatgg ctactttgtc   2160
ggcgagggct gcggtgcctt tgtgctcaag cgtgagacta gctgcaccaa ggacgaccgt   2220
atctacgctt gcatggatgc catcgtccct ggcaacgtcc ctagcgcctg cttgcgcgag   2280
gccctcgacc aggcgcgcgt caagccgggc gatatcgaga tgctcgagct cagcgccgac   2340
tccgcccgcc acctcaagga cccgtccgtc ctgcccaagg agctcactgc cgaggaggaa   2400
atcggcggcc ttcagacgat ccttcgtgac gatgacaagc tcccgcgcaa cgtcgcaacg   2460
ggcagtgtca aggccaccgt cggtgacacc ggttatgcct ctggtgctgc cagcctcatc   2520
aaggctgcgc tttgcatcta caaccgctac ctgcccagca acggcgacga ctgggatgaa   2580
cccgcccctg aggcgccctg ggacagcacc ctctttgcgt gccagacctc gcgcgcttgg   2640
ctcaagaacc ctggcgagcg tcgctatgcg gccgtctcgg gcgtctccga gacgcgctcg   2700
tgctattccg tgctcctctc cgaagccgag ggccactacg agcgcgagaa ccgcatctcg   2760
ctcgacgagg aggcgcccaa gctcattgtg cttcgcgccg actcccacga ggagatcctt   2820
ggtcgcctcg acaagatccg cgagcgcttc ttgcagccca cgggcgccgc cccgcgcgag   2880
tccgagctca aggcgcaggc ccgccgcatc ttcctcgagc tcctcggcga gacccttgcc   2940
caggatgccg cttcttcagg ctcgcaaaag cccctcgctc tcagcctcgt ctccacgccc   3000
tccaagctcc agcgcgaggt cgagctcgcg gccaagggta tcccgcgctg cctcaagatg   3060
cgccgcgatt ggagctcccc tgctggcagc cgctacgcgc ctgagccgct cgccagcgac   3120
cgcgtcgcct tcatgtacgg cgaaggtcgc agcccttact acggcatcac ccaagacatt   3180
caccgcattt ggcccgaact ccacgaggtc atcaacgaaa agacgaaccg tctctgggcc   3240
gaaggcgacc gctgggtcat gccgcgcgcc agcttcaagt cggagctcga gagccagcag   3300
caagagtttg atcgcaacat gattgaaatg ttccgtcttg gaatcctcac ctcaattgcc   3360
ttcaccaatc tggcgcgcga cgttctcaac atcacgccca aggccgcctt tggcctcagt   3420
cttggcgaga tttccatgat ttttgccttt tccaagaaga acggtctcat ctccgaccag   3480
ctcaccaagg atcttcgcga gtccgacgtg tggaacaagg ctctggccgt tgaatttaat   3540
gcgctgcgcg aggcctgggg cattccacag agtgtcccca aggacgagtt ctggcaaggc   3600
tacattgtgc gcggcaccaa gcaggatatc gaggcggcca tcgccccgga cagcaagtac   3660
gtgcgcctca ccatcatcaa tgatgccaac accgccctca ttagcggcaa gcccgacgcc   3720
tgcaaggctg cgatcgcgcg tctcggtggc aacattcctg cgcttcccgt gacccagggc   3780
atgtgcggcc actgccccga ggtgggacct tataccaagg atatcgccaa gatccatgcc   3840
aaccttgagt tccccgttgt cgacggcctt gacctctgga ccacaatcaa ccagaagcgc   3900
ctcgtgccac gcgccacggg cgccaaggac gaatgggccc cttcttcctt tggcgagtac   3960
gccggccagc tctacgagaa gcaggctaac ttcccccaaa tcgtcgagac catttacaag   4020
caaaactacg acgtctttgt cgaggttggg cccaacaacc accgtagcac cgcagtgcgc   4080
accacgcttg gtccccagcg caaccacctt gctggcgcca tcgacaagca gaacgaggat   4140
gcttggacga ccatcgtcaa gcttgtggct tcgctcaagg cccaccttgt tcctggcgtc   4200
acgatctcgc cgctgtacca ctccaagctt gtggcggagg ctgaggcttg ctacgctgcg   4260
ctctgcaagg gtgaaaagcc caagaagaac aagtttgtgc gcaagattca gctcaacggt   4320
cgcttcaaca gcaaggcgga ccccatctcc tcggccgatc ttgccagctt tccgcctgcg   4380
gaccctgcca ttgaagccgc catctcgagc cgcatcatga agccggttgc tccgaagttc   4440
tacgcgcgtc tcaacattga cgagcaggac gagacccgtg atccgatcct caacaaggac   4500
aacgcgccgt cttccagctc tagctcctct tccagctctt ccagctcttc cagcccgtcg   4560
ccagctccgt ccgccccagt gcaaaagaag gctgctccgg ccgcggagac caaggctgtt   4620
gcttcggctg acgcacttcg cagtgccctg ctcgatctcg acagtatgct tgcgctgagc   4680
tctgccagtg cctccggcaa ccttgttgag actgcgccta gcgacgcctc ggtcattgtg   4740
ccgccctgca acattgcgga tctcggcagc cgcgccttca tgaaaacgta cggtgtttcg   4800
gcgcctctgt acacgggcgc catggccaag ggcattgcct ctgcggacct cgtcattgcc   4860
gccggccgcc agggcatcct tgcgtccttt ggcgccggcg gacttcccat gcaggttgtg   4920
cgtgagtcca tcgaaaagat tcaggccgcc ctgcccaatg gcccgtacgc tgtcaacctt   4980
atccattctc cctttgacag caacctcgaa aagggcaatg tcgatctctt cctcgagaag   5040
ggtgtcacct ttgtcgaggc ctcggccttt atgacgctca ccccgcaggt cgtgcggtac   5100
cgcgcggctg gcctcacgcg caacgccgac ggctcggtca acatccgcaa ccgtatcatt   5160
ggcaaggtct cgcgcaccga gctcgccgag atgttcatgc gtcctgcgcc cgagcacctt   5220
cttcagaagc tcattgcttc cggcgagatc aaccaggagc aggccgagct cgcccgccgt  5280
gttcccgtcg ctgacgacat cgcggtcgaa gctgactcgg gtggccacac cgacaaccgc  5340
cccatccacg tcattctgcc cctcatcatc aaccttcgcg accgccttca ccgcgagtgc  5400
ggctacccgg ccaaccttcg cgtccgtgtg ggcgccggcg gtggcattgg gtgcccccag  5460
gcggcgctgg ccaccttcaa catgggtgcc tcctttattg tcaccggcac cgtgaaccag  5520
gtcgccaagc agtcgggcac gtgcgacaat gtgcgcaagc agctcgcgaa ggccacttac  5580
tcggacgtat gcatggcccc ggctgccgac atgttcgagg aaggcgtcaa gcttcaggtc  5640
ctcaagaagg gaaccatgtt tccctcgcgc gccaacaagc tctacgagct cttttgcaag  5700
tacgactcgt tcgagtccat gccccccgca gagcttgcgc gcgtcgagaa gcgcatcttc  5760
agccgcgcgc tcgaagaggt ctgggacgag accaaaaact tttacattaa ccgtcttcac  5820
aacccggaga agatccagcg cgccgagcgc gaccccaagc tcaagatgtc gctgtgcttt  5880
cgctggtacc tgagcctggc gagccgctgg gccaacactg gagcttccga tcgcgtcatg  5940
gactaccagg tctggtgcgg tcctgccatt ggttccttca acgatttcat caagggaact  6000
taccttgatc cggccgtcgc aaacgagtac ccgtgcgtcg ttcagattaa caagcagatc  6060
cttcgtggag cgtgcttctt gcgccgtctc gaaattctgc gcaacgcacg cctttccgat  6120
ggcgctgccg ctcttgtggc cagcatcgat gacacatacg tcccggccga gaagctgtaa  6180
<210>70
<211>8394
<212>DNA
<213>人工
<220>
<223>合成的
<220>
<221>misc_feature
<222>(227)..(227)
<220>
<221>misc_feature
<222>(227)..(227)
<223>n is a,c,g,或t
<400>70
ccgcgaatca agaaggtagg cgcgctgcga ggcgcggcgg cggagcggag cgagggagag  60
ggagagggag agagagggag ggagacgtcg ccgcggcggg gcctggcctg gcctggtttg  120
gcttggtcag cgcggccttg tccgagcgtg cagctggagt tgggtggatt catttggatt  180
ttcttttgtt tttgtttttc tctctttccc ggaaagtgtt ggccggncgg tgttctttgt  240
tttgatttct tcaaaagttt tggtggttgg ttctctctct tggctctctg tcaggcggtc  300
cggtccacgc cccggcctct cctctcctct cctctcctct cctctccgtg cgtatacgta  360
cgtacgtttg tatacgtaca tacatcccgc ccgccgtgcc ggcgagggtt tgctcagcct  420
ggagcaatgc gatgcgatgc gatgcgatgc gacgcgacgc gacgcgagtc actggttcgc  480
gctgtggctg tggcttgctt gcttacttgc tttcgagctc tcccgctttc ttctttcctt    540
ctcacgccac caccaacgaa agaagatcgg ccccggcacg ccgctgagaa gggctggcgg    600
cgatgacggc acgcgcgccc gctgccacgt tggcgctcgc tgctgctgct gctgctgctg    660
ctgctgctgc tgctgctgct gctgctgctt ctgcgcgcag gctttgccac gaggccggcg    720
tgctggccgc tgccgcttcc agtccgcgtg gagagatcga atgagagata aactggatgg    780
attcatcgag ggatgaatga acgatggttg gatgcctttt tcctttttca ggtccacagc    840
gggaagcagg agcgcgtgaa tctgccgcca tccgcatacg tctgcatcgc atcgcatcgc    900
atgcacgcat cgctcgccgg gagccacaga cgggcgacag ggcggccagc cagccaggca    960
gccagccagg caggcaccag agggccagag agcgcgcctc acgcacgcgc cgcagtgcgc    1020
gcatcgctcg cagtgcagac cttgattccc cgcgcggatc tccgcgagcc cgaaacgaag    1080
agcgccgtac gggcccatcc tagcgtcgcc tcgcaccgca tcgcatcgca tcgcgttccc    1140
tagagagtag tactcgacga aggcaccatt tccgcgctcc tcttcggcgc gatcgaggcc    1200
cccggcgccg cgacgatcgc ggcggccgcg gcgctggcgg cggccctggc gctcgcgctg    1260
gcggccgccg cgggcgtctg gccctggcgc gcgcgggcgc cgcaggagga gcggcagcgg    1320
ctgctcgccg ccagagaagg agcgcgccgg gcccggggag ggacggggag gagaaggaga    1380
aggcgcgcaa ggcggccccg aaagagaaga ccctggactt gaacgcgaag aagaagaaga    1440
aggagaagaa gttgaagaag aagaagaaga aggagaggaa gttgaagaag acgaggagca    1500
ggcgcgttcc aaggcgcgtt ctcttccgga ggcgcgttcc agctgcggcg gcggggcggg    1560
ctgcggggcg ggcgcgggcg cgggtgcggg cagaggggac gcgcgcgcgg aggcggaggg    1620
ggccgagcgg gagcccctgc tgctgcgggg cgcccgggcc gcaggtgtgg cgcgcgcgac    1680
gacggaggcg acgacgccag cggccgcgac gacaaggccg gcggcgtcgg cgggcggaag    1740
gccccgcgcg gagcaggggc gggagcagga caaggcgcag gagcaggagc agggccggga    1800
gcgggagcgg gagcgggcgg cggagcccga ggcagaaccc aatcgagatc cagagcgagc    1860
agaggccggc cgcgagcccg agcccgcgcc gcagatcact agtaccgctg cggaatcaca    1920
gcagcagcag cagcagcagc agcagcagca gcagcagcag cagccacgag agggagataa    1980
agaaaaagcg gcagagacga tgggtccccg tgttgcttcc ggtaaggttc cggcctggga    2040
gatgtcgaag tcggagctct gcgatgaccg cacggtcgtg tttgattacg aggagctcct    2100
tgagttcgcc gagggtgaca tctccaaggt gttcggtccg gagtttaaag tcgttgacgg    2160
ctttcgtcgc cgcgtccgcc tccccgcgcg tgagtacctc cttgtcaccc gcgtcacgct    2220
tatggacgcc gaggtgggta actttcgcgt gggcgctcgc atggttactg agtacgacgt    2280
tccggtcaac ggcgagctgt ctgagggcgg cgacgtgccc tgggccgttc ttgtcgaggc    2340
cggccagtgc gacctcctcc tcatctcgta catgggcatc gacttccagt gcaagggaga    2400
gcgcgtctac cgcctcctca acaccaccct tacgttcttc ggcgtcgcca aggagggcga    2460
gactctcgtg tacgacatcc gcgtcactgg tttcgccaag cgccctgacg gcgacatctc    2520
gatgttcttc tttgagtacg actgctactg caacggtaag ctcctcatcg agatgcgcga    2580
tggttctgcc ggctttttca ctgatgagga gctcgctgcc ggcaagggcg tcgtcgtcac   2640
gcgtgcccag caaaacatgc gcgacaagat cgtccgtcag tccatcgagc cgtttgcgct   2700
cgccgcctgc actcacaaga cgaccctcaa cgagtccgac atgcagtccc tcgtcgagcg   2760
caactgggcg aacgtgttcg gcaccagcaa caagatggcc gagctcaact acaagatttg   2820
cgcccgcaag atgctcatga tcgaccgcgt gacccacatc gaccatcatg gcggcgctta   2880
cggcctcggc ctccttgtcg gcgaaaagat cctcgatcgt aaccattggt acttcccctg   2940
ccactttgtg aatgaccaag ttatggccgg ctcccttgtc tctgacggct gttcgcagct   3000
gcttaagctt tacatgatct ggctcggcct ccacctcaag atggaggagt tcgattttct   3060
ccccgtcagc ggccacaaga acaaggtccg ctgccgcgga cagatttcgc cccacaaggg   3120
taagctcgtc tacgtgatgg agattaagaa gatgggctac gaccaggctt cgggcagccc   3180
ctacgccatt gcggacgttg atatcattga tgtcaacgag gagctcggcc agtcgtttga   3240
catcaacgat ctcgcgtcgt acggtaaggg cgacctctcg aagaagattg ttgtcgattt   3300
caaaggtatc gctctccagc tgaaaggccg cgccttctcc cgcatgtcct cctcgtcctc   3360
cctcaacgag ggctggcagt gcgtgcccaa gccgtcgcag cgcatggagc acgagcaacc   3420
ccctgcccat tgcctcgcct ccgatccgga ggcccctagc acggtgacgt ggcaccccat   3480
gagcaagctc cccggcaacc ccaccccctt cttttctccc tcgtcgtatc cgccccgtgc   3540
tatctgcttc atcccttttc cgggcaaccc gctcgacaac aactgcaagg ccggcgagat   3600
gcccctcaac tggtacaaca tgagcgaatt catgtgcggt aaggtcagca actgcctcgg   3660
cccggagttc gcccgctttg acaagagcaa cacctcccgc tcccccgcct tcgaccttgc   3720
gctcgtcacg cgcgtcgtcg aggtcaccaa catggagcac ggcaagttcc tcaacgtcga   3780
ctgtaaccct tcgaagggca cgatggtggg agagttcgac tgcccgcagg acgcctggtt   3840
ctttgacggc tcctgcaatg acggtcatat gccgtactcc atcatcatgg agatcggcct   3900
tcagacgtct ggtgtcctca cgtcggtgct caaggctcct ctcacgatgg acaaggacga   3960
catcctcttt cgcaaccttg atgcctcggc tgagatggtg cgccctgacg tcgatgtccg   4020
cggcaagacc atccgcaacg tgaccaagtg taccggctac gccatgcttg gtaagatggg   4080
tatccatcgc tttacctttg agctctccgt ggacggcgtc gtcttttaca agggcagcac   4140
cagcttcggc tggtttacgc cggaagtgtt tgcccagcag gccggtctgg acaacggcaa   4200
gaagaccgag ccctggtgca agaccaacaa cacctccgtc cgccgcgtcg agatcgccag   4260
cgctaagggt aaggagcagc tcacggagaa gctccctgat gctaccaacg cccaggttct   4320
ccgccgctcc gagcagtgcg agtacctcga ctacctcaac atcgcccccg actccggcct   4380
tcacggcaag ggttacgcgc acggccacaa ggacgtcaac ccccaggact ggtttttctc   4440
gtgccacttc tggttcgacc cggtgatgcc cggctcgctt ggcattgagt ccatgttcca   4500
gctcatcgaa gcctttgctg tcgaccagaa tatccctggc gagtacaatg tttcgaaccc   4560
gacctttgcc catgcccccg gtaagaccgc ttggaagtat cgcggccagc tcactcccaa   4620
gaaccgcgct atggactgcg aggtccacat cgtcagcatc acggcgagcc cggagaacgg   4680
cggctacgtc gacatcgtcg ccgacggcgc cctttgggtc gatggcctcc gcgtttacga   4740
ggccaaggag ctccgtgtcc gcgtcgtcag cgccaagccg caagctatcc cggatgtcca   4800
gcagcagcct ccctcggcta aggccgaccc tggcaagacc ggtgtcgccc tcagccccac   4860
ccagctccgc gatgtcctcc tggaggtcga caaccctctg tacctcggtg tcgagaactc   4920
caaccttgtc cagttcgaaa gcaagccggc gacgtcctcc cgcatcgtgt ccattaagcc   4980
gtgttctatc tccgacctcg gcgacaagtc tttcatggag acttacaacg tgtctgcgcc   5040
tctttacacc ggcgcgatgg ccaagggtat tgccagcgct gacctcgtca tcgccgctgg   5100
caagcgtaag atcctcggtt cgttcggtgc cggtggcctc ccgatctcca tcgttcgcga   5160
ggcccttgag aagatccagc agcacctccc ccacggccct tacgccgtca accttatcca   5220
ctccccgttc gactcgaacc tggagaaggg caatgtcgac ctttttcttg aaatgggtgt   5280
caccgtcgtc gagtgctcgg ctttcatgga gctcacggct caggtcgttc gctaccgcgc   5340
ttccggcctc tccaagagcg cggacggcag catccgcatc gcgcaccgca tcatcggcaa   5400
ggtgagccgc actgagcttg ccgagatgtt catccgtcct gcccctcagc accttctcca   5460
gaagctggtc gccagcggcg agctcaccgc cgaacaggcc gagcttgcca cgcaagtccc   5520
ggtcgccgat gacatcgcgg tcgaggccga ttcgggcggt cacaccgaca accgcccgat   5580
ccacgtgatt ctccccctta ttatcaacct ccgcaaccgc cttcacaagg agctcgacta   5640
cccctcgcac ctgcgcgtgc gcgtgggagc cggcggtggt atcggctgcc ctcaggcggc   5700
cctggcggcc tttcagatgg gcgctgcttt cctgattacc ggcaccgtca accagctcgc   5760
ccgtgagtcg ggcacctgcg acaacgtccg ccttcagctc tccaaggcca cctacagcga   5820
cgtgtgcatg gcccctgccg cggacatgtt tgaccagggc gtggagcttc aggtgctcaa   5880
gaagggcacg ctgttcccca gccgcgccaa gaagctctac gagctcttct gcaagtacga   5940
ctccttcgag gccatgccgg ccgaggagct tcagcgtgtc gagaagcgca tctttcagaa   6000
gtcgctggcc gaggtttggc aggagacttc ggatttctac attcaccgca ttaagaaccc   6060
tgagaagatc aatcgcgctg ccagcgacgg taaactcaag atgtcgcttt gcttccgctg   6120
gtatcttggc ctctcgtcgt tctgggccaa ctccggtgcc caggaccgcg tcatggacta   6180
ccagatttgg tgcggtcccg cgatcggagc cttcaacgat tttaccaagg gcacctacct   6240
cgacgtcacg gttgccaagt cttacccgtg cgttgcccag atcaacctcc aaatccttca   6300
gggtgcggct tacctcaagc gcctcggtgt gatccgcttc gaccgcatgc tcctccaggc   6360
ggtcgacatc gatgacccgg ttttcacgta cgtccccacc cagcccctct aagaaagtga   6420
accttgtcct aacccgacag cgaatggcgg gagggggcgg gctaaaagat cgtattacat   6480
agtatttttc ccctactctt tgtgtttgtc tttttttttt tttgaacgca ttcaagccac   6540
ttgtctbggt ttacttgttt gttygcttgc ttgcttgctt gcttgcctgc ttcttggtca   6600
gacggcccaa aaaagggaaa aaattcattc atggcacaga taagaaaaag aaaargtttg   6660
tcgaccaccg tcatcagaaa gcaagagaag agaaacactc gcgctcacat tctcgctcgc   6720
gtaagaatct tagccacgca tacgaagtaa tttgtccatc tggcgaatct ttacatgagc  6780
gttttcaagc tggagcgtga gatcatacct ttcttgatcg taatgttcca accttgcata  6840
ggcctcgttg cgatccgcta gcaatgcgtc gtactcccgt tgcarctgcg ccatcgcctc  6900
attgtgacgt gagttcagat tcttctcgag accttcgagc gctgctaatt tcgcctgacg  6960
ctccttcttt tgtgcttcca tgacacgccg cttcaccgtg cgttccactt cttcctcaga  7020
catgcccttg gctgcctcga cctgctcggt aagcttcgtc gtaatctcct cgatctcgga  7080
attcttcttg ccctccatcc actcggcacc atacttggca gcctgttcaa cacgctcatt  7140
gaaaaacttt tcattctctt ccagctccgc aacccgcgct cgaagctcat tcacttccgc  7200
caccacggct tcggcatcga gcgccgaatc agtcgccgaa ctttccgaaa gatacaccac  7260
ggcccctccg ctgctgctgc gcagcgtcat catcagtcgc gtgttatckt cgcgcagatt  7320
ctccacctgc tccgtaagca gcttcacggt ggcctcttga ttctgagggc tcacgtcgtg  7380
gattagcgct tgcagctctt gcagctccgt cagcttggaa gagctcgtaa tcatggcttt  7440
gcacttgtcc agacgtcgca gagcgttcga gagccgcttc gcgttatctg ccatggacgc  7500
ttctgcgctc gcggcctccc tgacgacagt ctcttgcagt ttcactagat catgtccaat  7560
cagcttgcgg tgcagctctc caatcacgtt ctgcatcttg tttgtgtgtc cgggccgcgc  7620
ctcgtcttgc gatttgcgaa tttcctcctc gagctcgcgt tcgagctcca rggcgccttt  7680
aagtagctcg aagtcagccg ccgttagccc cagctccgtc gccgcgttca gacagtcggt  7740
tagcttgatt cgattccgct tttccatggc aagtttaaga tcctggccca gctgcacctc  7800
ctgcgccttg cgcatcatgc gcggttccgc ctggcgcaaa agcttcgagt cgtatcctgc  7860
ctgccatgcc agcgcaatgg cacgcacgag cgacttgagt tgccmactat tcatcgccga  7920
gatgagcagc attttgatct gcatgaacac ctcgtcagag tcgtcatcct ctgcctcctc  7980
cagctctgcg ggcgagcgac gctctccttg cagatgaagc gagggccgca ggcctccgaa  8040
gagcacctct tgcgcgagat cctcctccgt cgtcgccctc cgcaggatyg cggycgtgtc  8100
cgccatcttg ccgccacagc agcttttgst cgctctgcac cttcaatttc tggtgccgct  8160
ggtgccgctg gtgccgcttg tgctggtgct ggtgctggtg ctggtgctgg tgccttgtgc  8220
tggtgctgcc acagacaccg ccgctcctgc tgctgctctt ccggccccct cgccgccgcc  8280
gcgagccccc gccgcgcgcc gtgcctgggc tctccgcgct ctccgcgggc tcctcggcct  8340
cggcctcgcc gtccgcgacg acgtctgcgc ggccgatggt gcggatctgc tcta        8394
<210>71
<211>12495
<212>DNA
<213>人工
<220>
<223>合成的
<400>71
cgactgcgag ggctcttgcg tcatccgcct gatgcggccg ccggccggaa gaggccgccc  60
cgcagcctcc ccggtgcggg gccgcgccgg gatgcctcgc ctgcgtcccc agcgatgcga    120
ggcggcgacg tctgtgctgc cgtcaggtcc tgtgcgaggt cccactgtta atattaagta    180
cgtaccgcac aggacccgga gtagcgcggc gcggggacga cctccgacgc ggccggaaga    240
cggcgcccac agcacgcgct cgggttcgcg ggcggcggcc gcgcgaagtg cgtaagcaga    300
cggcgcgcgg tccggctgcg ggggaagaag gtgtggaagg tgcgggggga acccgtggcc    360
gcctacgtgt gcctgcgacg gaggcgcggc ggcgcccggc acctaggaac tgtctaagag    420
ggcttacaac ggacagcccg tcacaggcgc agaggcggcg gcggcgggtc tttccttctc    480
tcccggcaga aagagaggga gggagagaga gagaaagcct gaatgtggct gcgatggaga    540
cttgggcagc gataatgact tggtgggctg aagattactc tcagcattgc tgcgcgctta    600
gcattcttgc ggcattggcc aggtcggcgt cgggtttcgc ttgcggcgac gaccgagggt    660
cgttggatcg cgcggcagat tagacaggca gctgggacgc acgcacgcac gcacgaacga    720
acaaacaaac gagagaacgt gcgtacgggc ctgctggccg cggatgcaga aaagtgaatg    780
gaattttcca ctacagccag cgagccctgt cagccagcta gctgcagctt gagcggagcg    840
gcggctgttg ctgcgtctct tgaacttgaa ttcgaatgga tgtatgtact tgcttgcctc    900
ttgatgctgc gttgacttgt ggatgatgtt caaagtggca ggcacaccac ctaaaatcaa    960
aaaatgtaaa ggcgcggcgc agaaccgtgc atctgccgag gagcgcgtgc accgctgccg    1020
tgcgtgcggt gcgtgcgtgc tcgcctgcat ccgcgtcgcc ggcaaggtct ctgtgctgta    1080
tctatcgctc gcattcgaat cgctcgcgcc ttctgctccg acgtgcccta aaacatagag    1140
tccatcatta ggctagtgat actctatgtg acttgcttcc ttcctggaga ggaagaatga    1200
ataccgtatg gtatcaggta tgaagaaaac caacctcgcg cctccggacc caccgccgcg    1260
cggccagcca gatccgcgcg gccagctcgt ccatgccagc ctcgggaggt atccatcccc    1320
tccgcgccgg cagctgtcgg tctctcgcca tcgcctgtgc cgctcgaaga agtttcagca    1380
acctctccgt cctgcgccat ggcaccatct tatcttctcc gcgtcccact cttctctccc    1440
aaagcctgca cctcaaaggc gaggccgggc caggccgcag ccgcgccacg agaagcccca    1500
tcacgccgcc tcgcacgcgg ccgcgcgcgt ctgcgcgaga cggcgctgtt attttctttt    1560
cttttctttt cttttcttct ctcctccccg ctctcctcgc ttcctgcgcg ccgctgcggg    1620
ggcgaaggaa gacagggggg ctcgggagga agaggaggcg agggaaggaa ggagggcggc    1680
gacggcatcg ccagacgacg acggcggcgg cgggggacgc ggggcgcgcg tccccccgtg    1740
cgtggcagca tgatgcatgc gatgcgcgcg atgcgtgcgg cgcgaggagg cgaggcccga    1800
tgggcggagg cgagcggggt ggatacgggc ggcggcgggc gggagcggga ggcaggcaga    1860
ccccgaaccc cgagggtaaa actacacaaa cagacagaca gcctgcggct gcctggcaac    1920
aagactcacg cacgcacgca cgcaccgatc ggtcgagcga gcgagcgctt gatcgaacgg    1980
acgtgagaac cagcaaggaa gcagcagcag cagcagcagc agcaacagct cgagagagag    2040
aaaatgaagg atatggagga tcgccgcgtc gccattgtcg gtatgtcggc ccatctcccc    2100
tgcggcaccg acgtgaagga gtcgtggcag gccattcgtg atggtatcga ttgcctgtct    2160
gacctccccg ccgaccgcct cgacgtcacg gcgtactaca accccaacaa ggccactaag   2220
gataagattt actgcaagcg cggtggcttt attcccaact acgattttga tcctcgcgag   2280
tttggcctta acatgttcca gatggaggac tccgacgcca accagactct cactcttctg   2340
aaggtcaagc aggccctgga ggacgcttcc attgagccct ttaccaagga gaagaagaac   2400
atcggctgcg tcctcggaat cggcggtggc cagaaggcca gccacgagtt ttactctcgc   2460
ctcaactacg ttgtcgtcga gaaggtcctc cgcaagatgg gcctccctga tgccgacgtt   2520
gaggaggccg tggagaagta caaggccaat tttcctgagt ggcgcctcga cagcttccct   2580
ggcttcctcg gcaacgtcac tgctggccgc tgctccaaca cctttaacat ggagggtatg   2640
aactgcgtgg tggacgccgc ctgcgcctcc tccctcatcg ccattaaggt ggcggtggag   2700
gagctcctct tcggcgactg cgacaccatg attgccggtg ccacctgcac ggataactcg   2760
ctcggcatgt acatggcttt ttccaagacg ccggtgttca gcaccgaccc ctccgtccgc   2820
gcctacgatg aaaagactaa gggcatgctt atcggcgagg gctccgccat gttcgtgctc   2880
aagcgctacg ccgacgcggt ccgtgatggc gacactatcc acgccgttct ccgtagctgc   2940
tcgtccagca gcgacggcaa ggccgctgga atttacacgc ctacgatctc gggccaggag   3000
gaggccctcc gccgtgccta cgcccgcgct ggcgtctgcc cctcgaccat cggcctcgtt   3060
gagggtcacg gcaccggcac gccggtcggc gaccgcatcg agctcactgc cctccgcaat   3120
ctcttcgaca aggcttttgg ctccaagaag gaacaaatcg ctgtcggttc catcaagtct   3180
cagatcggcc acctcaagag cgtggccggc tttgctggcc tggtcaaggc ggtcctggcc   3240
ctcaagcaca agacgctccc tggctcgatt aacgtggacc agcctcccct cctttacgac   3300
ggcacgcaga tccaggactc gtccctgtac attaacaaga ctaaccgccc ctggtttacc   3360
caaaacaagc tccctcgccg tgcgggtgtc agctccttcg gttttggtgg cgccaactac   3420
cacgccgtcc tcgaagagtt tgagcccgag cacgagaagc cttaccgcct caacacggtc   3480
ggccaccccg tcctcctcta cgcccccagc gtcgaggccc tcaaggtcct ttgcaacgac   3540
cagctcgccg aactcaccat cgcgcttgag gaggccaaga cccacaagaa cgtggacaag   3600
gtttgcggtt acaagtttat cgacgagttc cagctccagg gtagctgccc tcctgagaac   3660
ccccgcgtcg gctttctcgc cactctcccg acgtccaaca tcatcgtcgc tctcaaggcg   3720
atcctcgctc agctcgatgc caagcctgac gccaagaagt gggacctccc gcacaagaag   3780
gctttcggtg ctaccttcgc ctcgtcgtcg gtcaagggct cggttgccgc gctgttcgcc   3840
ggccagggca ctcagtacct caacatgttt tccgatgtcg cgatgaactg gccccctttc   3900
cgcgattcga tcgtggccat ggaggaggcc cagaccgagg tgttcgaggg ccaggttgaa   3960
cccatttcga aggtcctctt tccgcgcgag cgttacgcct cggagtcgga gcagggcaac   4020
gagctgctct gcctcaccga gtactcgcag cccactacaa ttgccgccgc tgtcggcgcc   4080
tttgacatct tcaaggcggc tggctttaag cccgatatgg tcggaggcca ctcccttggc   4140
gagtttgctg ccctgtacgc cgctggctcg atctctcgcg atgacctcta caagctcgtc   4200
tgcaagcgtg ccaaggcgat ggcgaacgcg agcgatggag ccatggccgc tgtgatcggt   4260
cccgatgctc gcctcgtcac tcctcagaac tccgacgtct acgtcgccaa tttcaatagc   4320
gcgacgcagg tcgtcatcag cggcacggtg cagggcgtca aagaggagag caagctcctt   4380
attagcaagg gttttcgcgt cctgcctctg aagtgccagg gcgccttcca ctccccgctc   4440
atgggacctt ccgaggactc cttcaagtcg ctcgttgaga cttgtactat ctccccgcct   4500
aagaacgtca agttcttttg caacgtgagc ggcaaggagt cgcctaatcc gaagcagact   4560
ctcaagtctc acatgaccag ctccgtccag tttgaggagc agatccgcaa catgtacgat   4620
gccggtgccc gtgtctttct ggagtttggc cctcgccagg tgctcgccaa gctcatcgcc   4680
gagatgttcc cctcgtgcac cgccatctcg gtcaacccgg cctcctcggg cgactcggac   4740
gtccagctcc gcctcgcggc cgtcaagttt gcggtgtccg gcgctgccct ctcgacgttt   4800
gacccctggg agtaccgcaa gccccaggac ctccttatcc gcaagccccg caagaccgcg   4860
ctcgtcctct ctgctgccac gtacgtttcg cctaagaccc tcgccgagcg caagaaggcc   4920
atggaggaca tcaagctcgt gtcgatcacc cctcgcgact cgatggtttc gattggtaag   4980
atcgctcaag aggtccgcac tgctaagcag cccctcgaaa ccgagattcg ccgcctcaac   5040
aaggagctcg aacacctcaa gcgcgagctc gcggctgcca aagcttcggt caagtctgcc   5100
tccaagtcct ctaaggagcg cagcgtcctc tccaagcacc gcgccctcct ccagaacatc   5160
ctccaagact acgacgacct ccgcgtcgtc cccttcgccg tccgctcggt cgccgtggac   5220
aacaccgcgc cgtacgccga ccaggtcagc acccctgcct cggagcgtag cgcgtcgccc   5280
cttttcgaga agcgttcctc cgtttcgtcg gctcgcctgg ccgaggcgga ggccgccgtc   5340
ctctctgtgc tcgccgacaa gacgggctac gacagctcga tgatcgagat ggacatggac   5400
ctggagagcg agcttggcgt ggactccatc aagcgcgtcg agatcatgtc cgaggtccag   5460
actcttctct cggtcgaggt cagcgatgtt gacgctctca gccgcaccaa aacggtcggc   5520
gacgtgatcg aggctatgaa gctcgaactt ggcggacccc aaggccagac cctcaccgcc   5580
gagtcgatcc gtcagcctcc cgtgtcggag cccgccgtcc cgacgtcctc ctcttcctcc   5640
atcgctaacg tctcttctgc tcgcctcgcc gaggctgaag ctgctgttct ttctgtcctc   5700
gccgacaaga ccggctacga ctcgtccatg attgagatgg acatggacct cgaaagcgag   5760
ctcggcgtcg acagcattaa gcgcgtcgag atcatgtccg aggtgcagac ccttctcagc   5820
gtggaggttt cggacgtcga tgccctctcc cgcactaaga ccgtcggcga tgtcatcgag   5880
gccatgaagc tcgaactcgg cggtcctcag ggtcaaacgc tgaccgccga gtcgattcgc   5940
cagccccctg tttccgagcc ggccgtgccg acgtcgtcgt cgagctcgat cgccaacgtt   6000
tccagcgccc gcctcgccga ggccgaagcc gccgtcctct ccgtcctcgc ggacaagacc   6060
ggttacgact cctcgatgat tgaaatggac atggatcttg agtctgagct tggcgtcgat   6120
tccatcaagc gcgttgagat catgtcggaa gtgcaaactc tcctttctgt tgaagtctct   6180
gatgtcgatg ctctcagccg cacgaaaacc gtcggtgacg tcatcgaggc catgaagctc   6240
gaactcggtg gccctcaggg ccagaccctc accgccgagt ccatccgtca accgcccgtg   6300
tccgagcccg ccgtcccgac ctcctcgtcg agctcgattg cgaacgttct ctcggcgcgt   6360
ctcgcggagg ccgaggccgc ggtcctctcg gtcctcgccg acaagacggg ctacgactcc   6420
agcatgatcg agatggacat ggacctcgaa tctgagctcg gcgtcgacag cattaagcgc   6480
gtcgagatta tgagcgaggt ccagaccctc ctctccgtgg aggtttcgga cgtggacgcg   6540
ctctcgcgta ccaagaccgt tggcgacgtt attgaggcca tgaaactcga actcggtggc   6600
cctcagggac agaccctcac tgccgagtcg attcgccagc ctccggtttc tgagcctgct   6660
gttcctacgt cctcttcttc ttctattgct aatgtcagct cggcgcgcct cgcggaggcc   6720
gaggctgccg tgctctcggt tctcgcggac aagaccggct atgactcgtc catgattgag   6780
atggatatgg atcttgagtc cgagctgggc gtcgatagca tcaagcgtgt ggaaatcatg   6840
tccgaagtcc agaccctcct ctcggtcgag gtcagcgatg tcgacgccct ctcgcgcacc   6900
aagaccgtcg gcgatgtcat cgaggccatg aaacttgagc tcggcggacc tcagggacag   6960
accctcacgt ccgagccgat ccaccagccg cccgtgagcg agccggccgt cccgacttcg   7020
agctcctcgt ccatcgccaa tgtctctagc gctcgcctcg ccgaggccga ggccgccgtg   7080
ctgtccgtcc tcgccgataa gaccggatat gactccagca tgatcgagat ggacatggac   7140
cttgagtccg agctgggtgt tgattctatt aagcgtgttg agattatgtc ggaggtgcag   7200
acccttctct cggtcgaagt ctctgatgtc gatgccctct ctcgtaccaa gactgtcggc   7260
gacgtcatcg aggctatgaa gatggagctc ggcggacccc agggccagac tcttaccgcc   7320
gaatctatcc gccagccgcc tgtcagcgag cctgccgtcc ctacctcctc gtcctcgtcg   7380
attgccaacg tttcttctgc ccgtcttgcc gaggccgagg cggccgtcct ctcggtcctc   7440
gcggacaaga ccggttatga ttcgtcgatg attgagatgg acatggacct tgagtcggag   7500
ctcggagtcg acagcatcaa gcgcgtcgag atcatgtcgg aggtccaggc tctcctctcc   7560
gtcgaggtta gcgatgtcga cgccctctcg cgcaccaaga ccgttggcga tgttattgag   7620
gccatgaaaa tggagctcgg tggtccgcag ggccagaccc tcactgccga gtcgattcgc   7680
gagccgccgg tttccgagcc ggccgtgccc acgagcagct cgtcgagcat cgctaacgtc   7740
agctcggccc gccttgccga ggccgaggct gctgtcctct ccgtgctcgc cgataagact   7800
ggttatgact cgtccatgat tgagatggac atggacctgg agtccgagct cggcgtggac   7860
tcgatcaagc gcgttgagat catgtctgag gtgcagaccc tgctttccgt cgaggtgagc   7920
gacgtcgatg ccctgtcgcg taccaagact gtgggtgacg tcatcgaggc gatgaagctg   7980
gagctcggag agtcgagctc gattgagact cttaattgca ccgaggtcga gcacacgtcc   8040
tacaagagcg tcaaggccag cggatgcgag aacgtggaca cccgtttcgc caaagtggtc   8100
cagatcagcc tcccgtccaa gcttaagagc accgtcagcc atgaccgccc ggtcattgtt   8160
gtggatgacg gcaccccgct taccacggag ctctgcaaga ttctcggtgg caacattgtc   8220
gttctcagct accagggcaa gcctgccggc cctcgtggcg tcgaggttcc cgacctctcg   8280
gaggaggccc tcatccaggc gctcgccctc attcgctcga cctacggcgt ccccattggt   8340
ttcatctgcc agcaggtttc caacgtcagc accaaggccc agctctgctg ggcgctgctg   8400
gccgctaagc acctcaagaa ggacctcaat gccgtcctcc ctgactcccg ctcgtttttc   8460
gtgggcgttg tccgcctcaa cggcaagctg ggcacctttg agaacatttc cgactttagc   8520
aagttcgatc tcactaaggc gctcgactac ggccagcgcg gctccctcct cggcctgtgc   8580
aagagcctcg atcttgagtg ggagcaggtt ttctgccgcg gcatcgacct ggcctgcgac   8640
ctcatgcctc tccaagccgc gcgtatcctc cgcaacgagc tccagtgccc gaacatgcgc   8700
ctgcgcgagg tcggctacga tatctcgggc gctcgctaca ccatctccac cgacgacctt   8760
ctttgcggcc ctagcaaggc caaggtcgaa gcggcggacc tctttcttgt cacgggtggt   8820
gcccgcggta tcactcccca ctgcgtccgc gagatcgcct cgcgtagccc cggcacgacg   8880
tttgttctcg tcggccgctc cgagatgagc gacgagcccg actgggccgt gggtcactac   8940
aacaaggatc tcgaccagtc cacgatgaag cacctgaagg ccacgcatgc tgccggaggc   9000
gtgaagccga ctcccaaggc gcaccgcgcc cttgtcaacc gtgtcaccgg ctcgcgcgag   9060
gtccgcgaga gcctgcgcgc cattcaggag gcgggtgcga acgttgagta catcgcctgc   9120
gacgtcagcg acgagaacaa ggtgcgccag ctcgtccagc gcgtggagca gaagtacggt   9180
tgcgagatta cgggcatctg gcacgcctcg ggtgttctcc gcgacaagct cgtggagcaa   9240
aagaccacgg acgacttcga ggccgtgttt ggcactaagg tcacgggcct cgtgaacatc   9300
gtcagccagg tcaacatgtc caagctgcgc catttcatcc tcttctcctc gctcgcgggc   9360
tttcacggca acaagggcca gaccgactac gccatcgcca acgaggccct caacaagatc   9420
gcccacaccc tttccgcctt tctccccaag ctcaacgcga aggtcctcga ctttggcccg   9480
tgggtcggct ccggcatggt cacggagact cttgagaagc actttaaggc catgggcgtc   9540
cagaccatcc ccctcgaacc gggtgcccgc accgtggccc agatcatcct cgccagctct   9600
ccgccccagt ccctcctcgg taactggggc ttccccgcca cgaaacccct tcagcgctcc   9660
aacgtggtca ccggcaccct ctcgccggag gagatcgaat ttatcgccga tcacaagatc   9720
cagggccgca aggttctccc gatgatggcc gccatcggct tcatggcgtc gatcgccgag   9780
ggcctctacc ctggctacaa ccttcagggc gttgagaacg ctcagctttt tcagggcctc   9840
accatcaacc aggaaaccaa gttccagatc acgctcatcg aggagcacaa ctccgaggag   9900
aacctcgacg tcctcaccag cctcggtgtc atgctcgaaa gcggcaaggt gcttcccgcc   9960
taccgttgcg tcgtctgcct caacactacc cagcagcagc ccaagctcag ccccaagatc   10020
ctcaacctgg aggttgaccc cgcctgcgag gtcaacccct acgacggcaa gtccctcttt   10080
cacggcccgc tcctccaatt tgtccagcag gtcctccact cgtcgacgaa aggcctcgtg   10140
gcgaagtgcc gtgccctgcc gattaaggag gccatccgtg gcccgttcat caagcagacg   10200
ctccacgacc cgatcctcga cgacgtcatc tttcagctca tgctcgtgtg gtgccgcaac   10260
gccctcggct cggcctccct cccgaaccgc attgagaaga tgagctactt cggtaatgtg   10320
tcggagggca gcactttctt cgccagcgtt acccccgtcg gcccccgtgt cccgaaggat   10380
cccgtgatca agatgcagtt tctcctccag gacgagtccg gcaacacctt ttcgtccggc   10440
gagggcagcg tcgtcctcag cgatgagctc gtgttctaaa tctaaactag tgaatcgcga  10500
caagttgtct ttttgttact ctacgtactg ctctttctaa ttttacgacg tatgcttctg  10560
ctcttgacga cgacaaccat ggcaataaaa gtaaggcaag aaagtgagtg cgtgctcgct  10620
cacaaggtct aggccgaaac gaggcgcctt aggattggtt gtctccgtcg taagtcatga  10680
cggagcgtag gacaccgacg gcctgccgcg caaatatacg aaccgctgca caattctttt  10740
cgttgagaac aacctcgaac ggcctgcctt gctgagctgc cgacacggtg gaaggaagca  10800
tagcggccaa tcgaggggat gctattaatt aggcttggcg ctgctgccgc cgtgcctgaa  10860
gatgtgcgca agcgtggcaa caccgtccac cttgccatta aagtcatgca ctccaaatac  10920
ctcgaacaga gcctctcgca tgtttggcca agcaccttcg agagagtctg gactctcact  10980
ccttcctcac cgttgtcgcc attctcagcg agctcatgca atcaccagga cggagagacg  11040
gccagctgct tttctgcttt ccattgttat tagagaaacg cttctcgctc tcatcgtctt  11100
agtagacatt ccgatggctt cgttcgccaa tttgtcacct aagtaagcta gagtgttaag  11160
tctaaatgcc tttgacccgc gtacggcgtc acgtagatgc ctgtccttgc cagcaaacgc  11220
tagttcgcgg tgtgcgtaat ttggcccgca ttatgctggc tctcaaaatc aaccgccacc  11280
actcgcggct gcacgatgat tttcgtgcac tcatgacatg agaaatgtga tactcaaact  11340
agtatagacc tcctactcct actgctgctt ttctcgtcag agctgtctcc ggaaaagttg  11400
acaagttgtt ggccttcttc ttctctgcta gtaagtagat catcatggat gagacgatga  11460
tgataatgat gatgatgata gcgaagagct tttgggactc gagcttgagc tgatgtggct  11520
tattttatta ctcaaaaacc aatgcaccgt tgcgagctct cgagagtgga gcaaagttgc  11580
aacagcgcac acacaaagaa cacatagaaa tagacatcaa aaatagtact tttacaatcc  11640
agccgaggca gcgcgaaaag tcagcatctg cgaactgcca caaaagccgt agatcaagtt  11700
ttgacacaac gctcatgcac gtctacgtgc tcgcgcatat aggaaaacaa atcacatcga  11760
gagattccca ctcaggtcgt gcgtggcctt ttgggcatac tcttgccgcg cagcagccca  11820
caacgcctca tcttctccca taccaaggtc aaaggatggt tgtattttgt cgtgaagttg  11880
gggcggcatt ttctctaaaa gcattgatgc aatagatttc gggctgtagc gcgcggaaaa  11940
atgcatgagc agaagcgtat cgacgcgatc aaacaagcct cgatgaccga acgctgcaag  12000
ttggtcaaca tgaatatggc cgtggtcttc ggccttggaa atgtcgccat cgaaaaaggt  12060
cacctccacg cagagcgtct ttgcacggag aaagggagat tcagggtccc gttccaaagc  12120
agcagcgacc gtgtcgcccg tgtaagcaaa gtcgacaacc tcgtgtatga cgtagtcctc  12180
aggctttggt ggcgaggtct tgaagcgagt gcgctttgtc gcaacgggga gctccgcaag  12240
ttccggacgt aactcctttt tgatattaat gaccgcatat cctacagaag gcacacgatg  12300
ctcggttgca aggactgcaa cgcgcgtatt cccgttcaac tctacgctgt cgccggggtt  12360
gacgcccgtg atcttcatat tgaaggggtc ctgggtgtcg tcaacatctc ctcctccgtc  12420
gagggcttgc atcgctcgcc ctgcactgcg aaaatcctcc acagcctccg caggcatgta  12480
gacgcgcgtc tcctt                                                     12495
<210>72
<211>8647
<212>DNA
<213>人工
<220>
<223>合成的
<400>72
ctatactggt gctcttcggt gctgatttag ctcgacttgg gtccacacca ctgcccctct    60
actgtgaatg gatcaatgga cgcacgacgg gccgacgaaa gtgcgcgagt gaggtaacct    120
aagcaacggc ggtcttcaga ggggacgcac gccctccgtc gcagtcagtc cagacaggca    180
gaaaagcgtc ttagggacca cgcacgcacg cacgcacgca cgcacgcccg cacgcacgct    240
ccctccctcg cgtgcctatt tttttaggct tccttccgca cgggcctacc tctcgctccc    300
tcgcctcgcc gcaccaggcg gcagcagcga tacctgccgg tgccgcctcc gtcacgcgct    360
cagccgcagc tcagcccagc cgcgagctag ggtttgttcg tcctgaattg tttgatttga    420
tttgatttga tttgatccga tccgatccga tctgatctga tttgctttgc tttgctttgt    480
ctccctcccg gcgcggacca agcgtccgtc tgcgcgccgc agcttccctt cttctcccag    540
ccctccttct gctcccgcct ctcgcgcaag cacgcagctt cgccgccgca tccggtcggt    600
cggtcggtcg atcgacccgc ctgccgctgc tgctgtggcc gggcttttct ccatcggcga    660
ctctttcttc tccatacgtc ctactacgta catacatact gccggcttcc tcctcttcca    720
gcgcggcgac ggcggcaggc tgcgacgtcg tcgccgccgc gggcgccgcg cgcgccgccg    780
ccgccgcccg cgtcgcaggg cctcgtcgcc gccgccgctc cgctccgctc cgaggccgcg    840
agagggccgc ggcggcgcga tggatggatg gatggatgga tggatggatg gattttgttg    900
atcgatggcg gcgcatgggc ggagatgagc gaggacgagc gcgcgagcgc ggcagccgga    960
ttcgcagggc ctcgctcgcc tcgcgcccgc tgccgcgccc gccttgcgag cctgcgccgc    1020
gagcgagcga gcgagcgagc ggggctttct ttgtctcgcg cgccgcttgg cctcgtgtgt    1080
cttgtgcttg cgtagcgggc gccgcggtgg aagatggctc attcaatcga cccattcacg    1140
cacgcactcc ggcgcgcaga gaaggccgag gaggagcagc aagcaaacca aaagctctcg    1200
cgctcgcggt ctcgggctcg agcggtctcg gagagagagt cttgcggcga ccaccggcag    1260
cagcagcagc agcagcagcg ctgtcgagca cgagcacgag cacgagcacg agcacgagca    1320
ttcgagcaag aggacagaca cggttgtcag cgcctagctc gctcgataca gaaagaggcg    1380
ggttgggcgt aaaaaaaaag gagcacgcaa gccgccagcc agccagctag ctagccagcc    1440
tgcctgccaa aatgcagctc ccgcccgctc actccgctga tgagaaccgc attgccgtgg    1500
tcggcatggc cgtgaagtac gctggctgcg acaacaagga ggaattctgg aaaaccctca    1560
tgaacggttc gattaacacc aaaagcatta gcgcggctcg ccttggctcg aacaagcgcg    1620
acgagcacta cgtcccggag cgcagcaagt acgccgacac gttctgcaac gagcgttacg    1680
gctgcatcca gcagggcacg gataacgagc acgacctcct cctcggcctc gcccaggagg    1740
ccctcgccga tgctgccggc cgtatggaga agcagccgtc ggaggccttc gatcttgaga   1800
ataccggcat cgtgtcgggc tgcctgagct ttccgatgga taacctccag ggcgagctcc   1860
tcaacctcta ccagtcccac gtcgagaagc agcttccccc gtctgctctc gtggaggccg   1920
tcaagctctg gagcgagcgc cagaagtcca ctaaggccca cgcgggcgac aagcgccgct   1980
ttatcgatcc ggcgtctttc gtcgccgaca agctgaacct cggccccctc cactacgcca   2040
tcgacgccgc ctgcgcctcg gcgctctacg tgctgaagct cgcccaggac cacctcgtca   2100
gcggcgctgt cgatatgatg ctctgcggcg ccacttgttt cccggagccg ttcttcatcc   2160
tctcgggctt cagcaccttc caagccatgc cggtcggtgc ggacggcgtg tcgctccccc   2220
tccacaagac ctcggctggc ctcacccccg gtgagggcgg ctccatcatg gttctcaagc   2280
gcctcaagga cgccatccgc gacggcaacc acatctacgg cgtgctcctt gaggccaacc   2340
tctcgaacgc cggatgcggc ctcccgctct cgccgcacct cccttccgag gagtcgtgca   2400
ttcgcgacac ctatcgccgc gctggcgtcg ctgccgacca gagcatccag tacatcgagt   2460
gccacgccac cggcaccccg cgtggcgacg tcgtcgagat cgaggctgtc gagcgcgtct   2520
ttaagaagaa tgtgccccgc cttggttcta ccaagggcaa cttcggccac tccctcgtcg   2580
ctgccggctt cgcgggtatg gcgaagctgc tcctcgctat ggagcacggc gtcatcccgc   2640
ccacccctgg cctggacgcc agcaatcagg cttccgagca cgtcgtcact aaggcgatta   2700
cctggccgga aacccacggc gctcctaagc gcgccggcct ctccgccttc ggctttggcg   2760
gcacgaacgc gcatgccctt tttgaggagt tcaatgccga gggcatttcc taccgccccg   2820
gtaagcctcc ggtcgagtcg aacacccgcc cctctgtggt catcactggc atggactgca   2880
cgtttggcag cctggaggga atcgacgcct ttgagactgc cctctacgag ggccgtgatg   2940
ccgcccgtga tcttcctgcc aagcgttggc gcttcctcgg cgaggatctg gagtttctcc   3000
gcgccatccg cctgaaggag aagccccgtg gctgctttgt tgagtccgtt gacgtgaact   3060
ttcgccgcct caagacccct ctcaccccgg aggatatgct ccgcccgcag cagctcctcg   3120
ctgtctccac tatggaccgc gcgatcatcg acgccggcct caagaagggc cagcatgtcg   3180
ccgtcctcgt cggcctcggc accgatctgg agctttaccg ccaccgtgcc cgtgtggccc   3240
tcaaggaggt gctccacccc tcgctgaaga gcgacaccgc catcctccag aagatcatgc   3300
agtacgtcaa cgacgcgggc acctcgacct cctacacctc gtacatcggc aacctcgtcg   3360
ccacccgtat cagctcgcag tggggcttta ccggcccgag ctttactgtc acggagggta   3420
acaacagcgt ctaccgttgc gcccagctcg ctaaggacat gctgcaagtc aaccgcgtcg   3480
atgccgtcgt cattgccggt gtggacctga acggctccgc cgagagcttc ttcgtccgcg   3540
ctaaccgtca aaagatcagc aagctttccc acccgtgcgc cagcttcgac cgcgacgccg   3600
acggcttctt tgccggcgaa ggctgcggcg ctctcgtgtt caagcgcctt gaggactgcg   3660
cccctcagga gaagatttac gcttccatcg acagcatcgc catcgacaag gagcctacct   3720
cctcggccgt caaggctgtc taccagtccg actcctccct ctccgacatc gagcttcttg   3780
agatcagcgg cgactccaag cgttttgcgg ccttcgaggg cgctgtcgag atccagtcct   3840
ctgtggaggc gcagctcaag ggcctttcca aggttcttga gcccgccaag ggccaaggcg   3900
tcgccgttgg ctcgacccgc gccactgtcg gtgatatcgg ctacgccact ggcgcggctt   3960
cgctcatcaa gacggccctg tgcctctaca accgttacct gcctgccctc gccaactgga   4020
gcggcccctg cgaacagagc gcctggggta gcaacatgtt cgtctgccac gagactcgtc   4080
cttggatgaa gaaccagaac gagaagcgct gcgcgctcat ctcgggcacg gacccgtccc   4140
acacctgctt cagcctcgtg ctctccgata ctggttgcta cgaggagcac aaccgcacgt   4200
gctttgacgt gcaggccccg cagctcgttc tcattcatgg ttttgatggc aagaccattg   4260
tgcgccgcct tgagggctat ctccttgagc ttgtcgaggg ccatgcctcg ccgtccgagt   4320
actttcacaa gctcatcggc cagagcctcc ttgagaactc caaggagtcg aagctcacgc   4380
tctcgctcgt ctgcaacccc aaccaactcc agaaggagct catgctcgcc atcaagggtg   4440
tgcagcgctc tatgctgacg ggtaaggact gggtttcccc ctcgggctct tgctttgctc   4500
cgaaccctct ctcgtccgcc aaggtcgctt tcatgtacgg cgaaggccgc tccccctact   4560
gcggtgtggg ccttggcctc caccgcctct ggcctggcct ccacgaaaac gtgaacaaca   4620
agacggtgga cctctggacg gagggcgacg gttggctcta cccgcgcacc ctcactcgtg   4680
aggagcacac taaggccatc gagtcgttta acgctaacca gatcgagatg ttccgtgccg   4740
gtatctttat ctccatgtgc cagacggact acgtgatgaa cgtcctcggc gtgcagccca   4800
aggccggctt tggcctctcg ctcggcgaga tcagcatgct cttcgccatg tccaaggaga   4860
actgccgcca gagccaggag atgaccaacc gccttcgtgg cagccccgtc tggtcgaacg   4920
agcttgccat taacttcaat gcgatccgta agctctggaa gattccccgc ggtgccccgc   4980
ttgagtcctt ctggcagggc tacctcgtcc acggcacccg cgaggaggtc gagcacgcca   5040
tcggcctcag cgagccctac gtccgcctgc ttatcgtgaa tgacagccgc tcggccctta   5100
tcgcgggtaa gcctgacgcc tgccaggccg tgatctcgcg cctcaactcg aagttccctt   5160
ctctccctgt gaagcagggc atgatcggcc actgcccgga ggtgcgcgcc ttcatcaagg   5220
acattggtta catccacgag actctccgta tctctaacga ttactcggac tgccagctct   5280
tttcggccgt caccaagggt gcccttgact cgtctactat ggagatcaag cacttcgtcg   5340
gtgaggtcta cagccgcatt gccgattttc cccagattgt caacacggtg cactcggccg   5400
gctacgacgt gtttctcgaa ctcggctgcg acgcctcccg cagcgccgct gttcagaaca   5460
tcctcggcgg tcagggcaag tttctgtcta ctgccattga caagaagggt cactctgcct   5520
ggtcgcaggt tctccgcgct accgcctcgc tcgctgccca ccgcgtgccc ggcatctcga   5580
tcctcgatct ctttcacccg aatttccgcg agatgtgctg cacgatggct acgaccccca   5640
aggtggagga caagtttctc cgcaccatcc agattaacgg ccgtttcgag aaggagatga   5700
tccacctcga agataccact ctctcctgcc ttcccgcgcc ttcggaggcc aacattgccg   5760
ccattcagtc gcgctcgatt cgcagcgctg cggcccgtag cggccagtcg cacgactgcg   5820
cgtcccacag ccatgaggag aataaggact cctgcccgga gaagctcaaa cttgactcgg   5880
tcagcgtcgc gatcaacttt gacaacgacg accgtattca gctcggccac gcgggttttc   5940
gcgagatgta caacacccgc tactcgctct acacgggcgc tatggctaaa ggcatcgctt   6000
cggccgacct cgtcatcgct gcgggcaagg agggtatcct cgccagctac ggtgctggcg   6060
gcctcccgct cgccaccgtc cgcaagggta tcgacaagat ccagcaggcg ctccccagcg   6120
gtccttacgc cgtcaacctc atccactccc cgtttgacgg caacctggag cagggcaacg   6180
tcgacctctt tctcgaaaag aacgtccgcg tcgccgagtg ttctgccttt acgaccctca   6240
ccgtgcccgt cgtccattat cgcgccgctg gcctcgttcg ccgccaggac ggctcgatcc   6300
tcattaagaa ccgcatcatc gccaaggtca gccgcaccga gctcgctgag atgttcctcc   6360
gccctgcgcc gcagattatc ctcgaaaagc tggtcgccgc cgagatcatc tccagcgatc   6420
aggcgcgtat ggccgcgaag gtgccgatgg ccgacgacat cgccgtcgag gccgacagcg   6480
gcggccacac ggacaaccgc ccgatgcatg ttattctccc cctcattatc cagctccgca   6540
acaccattct cgcggagtac ggctgcgcta ctgcctttcg cacgcgtatt ggcgctggtg   6600
gcggcatcgg ttgcccgagc gccgctctcg ccgccttcga catgggtgcc tctttcgtcg   6660
tcaccggctc catcaatcag atttgccgcg aggcgggcac ctgcgacacg gttcgcgagc   6720
tcctcgccaa ctcgtcgtac agcgatgtca cgatggctcc tgccgccgac atgttcgatc   6780
agggcgtgaa gctccaagtc ctcaagcgcg gcaccatgtt cccctcgcgc gctaacaagc   6840
ttcgcaagct ctttgtgaac tacgagtccc tcgaaactct cccctccaag gagctcaagt   6900
accttgagaa cattattttc aagcaggctg tggaccaggt gtgggaggag actaagcgct   6960
tctactgcga gaagctgaac aaccccgaca agatcgctcg cgctatgaag gaccccaagc   7020
tcaagatgtc gctctgcttc cgctggtatc tcagcaagtc gtcgggctgg gccaacgccg   7080
gcatcaagtc tcgcgccctc gactaccaaa tctggtgcgg acccgcgatg ggcagcttta   7140
acaacttcgc ctccggcacg agcctcgact ggaaagtgac cggtgtcttt cccggcgtcg   7200
ccgaggtgaa catggccatc ctcgatggcg cccgcgagct cgctgccaag cgcaactaag   7260
taagctctca tatatgttag ttgcgtgaga ccgacacgaa gataatatca catacgcttt   7320
tgtttgttct ttcaattatt tgtctgtgct tcatgttgct cctcagtatc tagctggcgg   7380
ctcttatctt cttttaaaat atctggacaa ggacaaaaac aagaataaag gcgagaagat   7440
gtgaatttca tttcgacttg agaactcgaa gagcattgat gcggttagta tatgggtatt   7500
ttccagacac ttttcatcat catcatcatc atcatcatta tgaagaagta gtagctgata   7560
aagtagactc actgtttgca gcgagaacca ggccctttcg gtccgtaacc ttggtgaaaa   7620
atcgaggagc gatcatgcct tgtgcgtcgc cggggctaag aatgaccccg ttgtctgatt   7680
cgaaaaattt gatgccagcc tcggcagctg cagcagcagc gtctacatac acgaagtacg   7740
tcacaaggac ttgcgcatcc cgctgatcac acccgtctcc gaggacggaa gcccgtgagc   7800
aaagtgaatg tgattccgtt tcattcgcga caaacccttg tcctggatct gagcccaggc   7860
agaagtattt gttccgtgca agcacgtctc aatgcttgct ggatcgagtg gacgcaacaa   7920
actcgtctct ttgacaactg acatggagtg tccctgattc gcacgaatca accagcttcc 7980
gtccgtgtcc tggcgcaacg tgaaccgctg cttgtcgttg tctcgcacga cagcctcaat 8040
gtccgaaaag gagatcccct tgaagcgctt gagcttgccc tgtagctcag ccagacgaac 8100
aaatccatct tcgcgcactt cgagaccctc ctgaacggcc gagtgccgca gcacacggct 8160
tagcatgtgc gaaagcttct tgttatgcgc cttggctttt gaaggcagcg ttggcgcgct 8220
gcgagagtgt ttacttggtt gcgcagcttc actatcacga gcagcacttc gtttattcat 8280
ttccatgttg tttgcaggtt cagtggtagc cccatccggc acgggccaga gcaccctgtg 8340
agagcgccgt tcctcgaccc tgaggaaaag ctccgtaggt atggctcctg tatcgcccag 8400
accaggggta agtaggacgc cattgcttga ttggaacatt tccaagcccg catcatgtgc 8460
gcgcgcggta tcgaggaaga tgagcacctc tgcggagccg cgaaagccac tgagcactcc 8520
gtcctgacca ggaagtcccg aggcaaaatg aatgtgattt cggcccatgc ggcggaggcc 8580
ctggcgttgg attgcaggcc agtggcgaag atacgttccg tgaatacaca gcggaagcaa 8640
tgagaga                                                           8647
<210>73
<211>4479
<212>DNA
<213>人工
<220>
<223>合成的
<220>
<221>CDS
<222>(1)..(4479)
<400>73
atg gcg ctc cgt gtc aag acg aac aag aag cca tgc tgg gag atg acc   48
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                   10                  15
aag gag gag ctg acc agc ggc aag acc gag gtg ttc aac tat gag gaa   96
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
ctc ctc gag ttc gca gag ggc gac atc gcc aag gtc ttc gga ccc gag   144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
ttc gcc gtc atc gac aag tac ccg cgc cgc gtg cgc ctg ccc gcc cgc   192
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
gag tac ctg ctc gtg acc cgc gtc acc ctc atg gac gcc gag gtc aac   240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat ctc ccc gtc   288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                85                  90                  95
aac gga gag ctc tcc gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc   336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 110
gag agt ggc cag tgc gat ctc atg ctc atc tcc tac atg ggc att gac      384
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
ttc cag aac cag ggc gac cgc gtc tac cgc ctg ctc aac acc acg ctc      432
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
acc ttt tac ggc gtg gcc cac gag ggc gag acc ctc gag tac gac att      480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
cgc gtc acc ggc ttc gcc aag cgt ctc gac ggc ggc atc tcc atg ttc      528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
ttc ttc gag tac gac tgc tac gtc aac ggc cgc ctc ctc atc gag atg      576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag ctc gac gcc ggc      624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
aag ggc gtc gtc ttc acc cgc ggc gac ctc gcc gcc cgc gcc aag atc      672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
cca aag cag gac gtc tcc ccc tac gcc gtc gcc ccc tgc ctc cac aag      720
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
acc aag ctc aac gaa aag gag atg cag acc ctc gtc gac aag gac tgg      768
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
gca tcc gtc ttt ggc tcc aag aac ggc atg ccg gaa atc aac tac aaa      816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
ctc tgc gcg cgt aag atg ctc atg att gac cgc gtc acc agc att gac      864
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
cac aag ggc ggt gtc tac ggc ctc ggt cag ctc gtc ggt gaa aag atc      912
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
ctc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag      960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
gtc atg gcc gga tcc ctc gtc tcc gac ggc tgc agc cag atg ctc aag      1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
atg tac atg atc tgg ctc ggc ctc cac ctc acc acc gga ccc ttt gac      1056
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa      1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
atc tcc ccg cac aag ggc aag ctc gtc tac gtc atg gag atc aag gag      1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac      1200
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
atc att gat gtc gac ttc gaa aag ggc cag gac ttt agc ctc gac cgc     1248
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
atc agc gac tac ggc aag ggc gac ctc aac aag aag atc gtc gtc gac     1296
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
ttt aag ggc atc gct ctc aag atg cag aag cgc tcc acc aac aag aac     1344
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
ccc tcc aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc     1392
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
    450                 455                 460
ccc gag gcc tcc aag gct tcc tcc ggc gcc agc gcc agc gcc agc gcc     1440
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465                 470                 475                 480
gcc ccg gcc aag cct gcc ttc agc gcc gat gtt ctt gcg ccc aag ccc     1488
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
                485                 490                 495
gtt gcc ctt ccc gag cac atc ctc aag ggc gac gcc ctc gcc ccc aag     1536
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
            500                 505                 510
gag atg tcc tgg cac ccc atg tca aag ctt cct ggc aac cct acg ccg     1584
Glu Met Ser Trp His Pro Met Ser Lys Leu Pro Gly Asn Pro Thr Pro
        515                 520                 525
ttc ttc tcc cct tca tct tac cct ccg agg gca att tgc ttc atc cct     1632
Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys Phe Ile Pro
    530                 535                 540
ttc ccg ggc aat ccc ctt gac aac aac tgc aag gct gga gaa atg ccc     1680
Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly Glu Met Pro
545                 550                 555                 560
ctg aac tgg tac aac atg tca gag ttc atg tgt ggc aag gtt tct aac     1728
Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys Val Ser Asn
                565                 570                 575
tgc ttg ggc cca gaa ttc gca cgc ttt gac aag tcg aac acc agc cgg     1776
Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn Thr Ser Arg
            580                 585                 590
agc cct gct ttt gac ttg gct ctg gtg acc cga gtt gtt gaa gtc aca     1824
Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val Glu Val Thr
        595                 600                 605
aac atg gaa cac ggc aag ttt cta aac gtt gat tgc aat cca agc aaa     1872
Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn Pro Ser Lys
    610                 615                 620
ggc aca atg gtg ggg gag ttt gac tgt ccc caa gac gcg tgg ttc ttt     1920
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala Trp Phe Phe
625                 630                 635                 640
gat ggt tcg tgc aac gac ggc cat atg ccg tat tcc att atc atg gaa     1968
Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile Ile Met Glu
                645                 650                 655
atc gga ctg caa acc tca ggt gtt ctc acc tcg gtg ttg aag gca ccg     2016
Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
            660                 665                 670
ctg act atg gac aag gat gac att ctc ttt cga aac ctc gat gca agt     2064
Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Ser
        675                 680                 685
gct gaa atg gtg cgt cca gac gtg gat gtt cgc ggc aaa acg att cga     2112
Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys Thr Ile Arg
    690                 695                 700
aac gtg acc aag tgt acc ggc tat gca atg ttg gga aag atg ggg att     2160
Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys Met Gly Ile
705                 710                 715                 720
cac cgg ttc acg ttt gag ttg agc gtt gac ggc gtg gta ttt tat aaa     2208
His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val Phe Tyr Lys
                725                 730                 735
gga tcc act tcc ttt gga tgg ttc act ccc gag gtg ttt gct cag caa     2256
Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe Ala Gln Gln
            740                 745                 750
gct gga ctc gac aac ggg aaa aag acg gag ccc tgg tgc aag act aac     2304
Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys Lys Thr Asn
        755                 760                 765
aac acc tcg gtt cga aga gtt gaa atc gca tcc gcc aaa gga aaa gag     2352
Asn Thr Ser Val Arg Arg Val Glu Ile Ala Ser Ala Lys Gly Lys Glu
    770                 775                 780
cag ctg act gag aag ctt ccc gac gca act aat gct caa gtt ctt cgg     2400
Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln Val Leu Arg
785                 790                 795                 800
cgt tca gag cag tgt gaa tac ctc gat tac ctc aat att gcc cct gac     2448
Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile Ala Pro Asp
                805                 810                 815
tct ggg ctg cat ggg aag ggc tac gcc cac gga cac aaa gac gtt aac     2496
Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys Asp Val Asn
            820                 825                 830
ccg caa gac tgg ttc ttc tct tgc cac ttt tgg ttc gat cct gta atg     2544
Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Pro Val Met
        835                 840                 845
cca gga tct tta gga att gaa tca atg ttc cag ctt atc gag gcc ttt     2592
Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile Glu Ala Phe
    850                 855                 860
gcg gtg gac caa aac att cct gga gag tac aac gta tcc aat ccg acc     2640
Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser Asn Pro Thr
865                 870                 875                 880
ttt gcc cat gca cca ggc aaa acg gcg tgg aaa tac cga ggc cag ctc     2688
Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg Gly Gln Leu
                885                 890                 895
aca cca aag aac cgt gcg atg gac tgc gag gtg cat atc gtt tca att     2736
Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile Val Ser Ile
            900                 905                 910
acc gcc tcc ccc gag aac ggg ggc tac gtt gac atc gtg gcc gat gga     2784
Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val Ala Asp Gly
        915                 920                 925
gcg ctt tgg gta gat gga ctt cgc gtg tac gaa gcc aaa gag ctt cga     2832
Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys Glu Leu Arg
    930                 935                 940
gtt cgt gtc gtt tcg gca aaa cct caa gca att ccg gat gta caa caa     2880
Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp Val Gln Gln
945                 950                 955                 960
cag cca cct agc gca aag gcg gac ccg ggg aaa aca gga gtt gca ctt     2928
Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly Val Ala Leu
                965                 970                 975
tcg ccc act cag cta cgc gac gtc ctg ctt gaa gtg gac aat cca ttg     2976
Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp Asn Pro Leu
            980                 985                 990
tat ctt ggt gta gag aac tcc aat ttg gtg cag ttt gag tcg aaa cct     3024
Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu Ser Lys Pro
        995                 1000                1005
gca act tct tca cgt atc gtt tcg atc aaa ccg tgc tcg att agt         3069
Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser Ile Ser
    1010                1015                1020
gac ctt ggc gat aag tct ttt atg gaa acg tac aac gtg tca gca         3114
Asp Leu Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala
    1025                1030                1035
cct ctg tat act ggc gcc atg gcc aag ggc att gcc tcg gcg gac         3159
Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
    1040                1045                1050
ctc gtc atc gcc gcc ggc aag cgc aag atc ctc ggc tcc ttt ggc         3204
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly
    1055                1060                1065
gcc ggc ggc ctc ccc atg cac cac gtg cgc gcc gcc ctc gag aag         3249
Ala Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys
    1070                1075                1080
atc cag gcc gcc ctg cct cag ggc ccc tac gcc gtc aac ctc atc         3294
Ile Gln Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile
    1085                1090                1095
cac tcg cct ttt gac agc aac ctc gag aag ggc aac gtc gat ctc         3339
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu
    1100                1105                1110
ttc ctc gag aag ggc gtc act gtg gtg gag gcc tcg gca ttc atg         3384
Phe Leu Glu Lys Gly Val Thr Val Val Glu Ala Ser Ala Phe Met
    1115                1120                1125
acc ctc acc ccg cag gtc gtg cgc tac cgc gcc gcc ggc ctc tcg         3429
Thr Leu Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Ser
    1130                1135                1140
cgc aac gcc gac ggt tcg gtc aac atc cgc aac cgc atc atc ggc         3474
Arg Asn Ala Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly
    1145                1150                1155
aag gtc tcg cgc acc gag ctc gcc gag atg ttc atc cgc ccg gcc         3519
Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Ile Arg Pro Ala
    1160                1165                1170
ccg gag cac ctc ctc gag aag ctc atc gcc tcg ggc gag atc acc         3564
Pro Glu His Leu Leu Glu Lys Leu Ile Ala Ser Gly Glu Ile Thr
    1175                1180                1185
cag gag cag gcc gag ctc gcg cgc cgc gtt ccc gtc gcc gac gat         3609
Gln Glu Gln Ala Glu Leu Ala Arg Arg Val Pro Val AlaAsp Asp
    1190                1195                1200
atc gct gtc gag gct gac tcg ggc ggc cac acc gac aac cgc ccc      3654
Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg Pro
    1205                1210                1215
atc cac gtc atc ctc ccg ctc atc atc aac ctc cgc aac cgc ctg      3699
Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
    1220                1225                1230
cac cgc gag tgc ggc tac ccc gcg cac ctc cgc gtc cgc gtt ggc      3744
His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val Arg Val Gly
    1235                1240                1245
gcc gga ggt ggc gtc ggc tgc ccg cag gcc gcc gcc gcc gcg ctc      3789
Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala Ala Leu
    1250                1255                1260
acc atg ggc gcc gcc ttc atc gtc acc ggc act gtc aac cag gtc      3834
Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln Val
    1265                1270                1275
gcc aag cag tcc ggc acc tgc gac aac gtg cgc aag cag ctc tcg      3879
Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
    1280                1285                1290
cag gcc acc tac tcg gat atc tgc atg gcc ccg gcc gcc gac atg      3924
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met
    1295                1300                1305
ttc gag gag ggc gtc aag ctc cag gtc ctc aag aag gga acc atg      3969
Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met
    1310                1315                1320
ttc ccc tcg cgc gcc aac aag ctc tac gag ctc ttt tgc aag tac      4014
Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
    1325                1330                1335
gac tcc ttc gac tcc atg cct cct gcc gag ctc gag cgc atc gag      4059
Asp Ser Phe Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu
    1340                1345                1350
aag cgt atc ttc aag cgc gca ctc cag gag gtc tgg gag gag acc      4104
Lys Arg Ile Phe Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr
    1355                1360                1365
aag gac ttt tac att aac ggt ctc aag aac ccg gag aag atc cag      4149
Lys Asp Phe Tyr Ile Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln
    1370                1375                1380
cgc gcc gag cac gac ccc aag ctc aag atg tcg ctc tgc ttc cgc      4194
Arg Ala Glu His Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg
    1385                1390                1395
tgg tac ctt ggt ctt gcc agc cgc tgg gcc aac atg ggc gcc ccg      4239
Trp Tyr Leu Gly Leu Ala Ser Arg Trp Ala Asn Met Gly Ala Pro
    1400                1405                1410
gac cgc gtc atg gac tac cag gtc tgg tgt ggc ccg gcc att ggc      4284
Asp Arg Val Met Asp Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly
    1415                1420                1425
gcc ttc aac gac ttc atc aag ggc acc tac ctc gac ccc gct gtc      4329
Ala Phe Asn Asp Phe Ile Lys Gly Thr Tyr Leu Asp Pro Ala Val
    1430                1435                1440
tcc aac gag tac ccc tgt gtc gtc cag atc aac ctg caa atc ctc      4374
Ser Asn Glu Tyr Pro Cys Val Val Gln Ile Asn Leu Gln Ile Leu
    1445                1450                1455
cgt ggt gcc tgc tac ctg cgc cgt ctc aac gcc ctg cgc aac gac      4419
Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala Leu Arg Asn Asp
    1460                1465                1470
ccg cgc att gac ctc gag acc gag gat gct gcc ttt gtc tac gag    4464
Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe Val Tyr Glu
    1475                1480                1485
ccc acc aac gcg ctc                                            4479
Pro Thr Asn Ala Leu
    1490
<210>74
<211>1493
<212>PRT
<213>人工
<220>
<223>合成的构建体
<400>74
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1               5                   10                  15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
            20                  25                  30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
        35                  40                  45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
    50                  55                  60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65                  70                  75                  80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
                85                  90                  95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
            100                 105                 ll0
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
        115                 120                 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
    130                 135                 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145                 150                 155                 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
                165                 170                 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
            180                 185                 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
        195                 200                 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
    210                 215                 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225                 230                 235                 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
                245                 250                 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
            260                 265                 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
        275                 280                 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
    290                 295                 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305                 310                 315                 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
                325                 330                 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
            340                 345                 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
        355                 360                 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
    370                 375                 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385                 390                 395                 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
                405                 410                 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
            420                 425                 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
        435                 440                 445
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
    450                 455                 460
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465                 470                 475                 480
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
                485                 490                 495
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
            500                 505                 510
Glu Met Ser Trp His Pro Met Ser Lys Leu Pro Gly Asn Pro Thr Pro
        515                 520                 525
Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys Phe Ile Pro
    530                 535                 540
Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly Glu Met Pro
545                 550                 555                 560
Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys Val Ser Asn
                565                 570                 575
Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn Thr Ser Arg
            580                 585                 590
Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val Glu Val Thr
        595                 600                 605
Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn Pro Ser Lys
    610                 615                 620
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala Trp Phe Phe
625                 630                 635                 640
Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile Ile Met Glu
                645                 650                 655
Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
            660                 665                 670
Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Ser
        675                 680                 685
Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys Thr Ile Arg
    690                 695                 700
Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys Met Gly Ile
705                 710                 715                 720
His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val Phe Tyr Lys
                725                 730                 735
Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe Ala Gln Gln
            740                 745                 750
Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys Lys Thr Asn
        755                 760                 765
Asn Thr Ser Val Arg Arg Val Glu Ile Ala Ser Ala Lys Gly Lys Glu
    770                 775                 780
Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln Val Leu Arg
785                 790                 795                 800
Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile Ala Pro Asp
                805                 810                 815
Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys Asp Val Asn
            820                 825                 830
Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Pro Val Met
        835                 840                 845
Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile Glu Ala Phe
    850                 855                 860
Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser Asn Pro Thr
865                 870                 875                 880
Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg Gly Gln Leu
                885                 890                 895
Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile Val Ser Ile
            900                 905                 910
Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val Ala Asp Gly
        915                 920                 925
Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys Glu Leu Arg
    930                 935                 940
Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp Val Gln Gln
945                 950                 955                 960
Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly Val Ala Leu
                965                 970                 975
Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp Asn Pro Leu
            980                 985                 990
Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu Ser Lys Pro
        995                 1000                1005
Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser Ile Ser
    1010                1015                1020
Asp Leu Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala
    1025                1030                1035
Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
    1040                1045                1050
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly
    1055                1060                1065
Ala Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys
    1070                1075                1080
Ile Gln Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile
    1085                1090                1095
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu
    1100                1105                1110
Phe Leu Glu Lys Gly Val Thr Val Val Glu Ala Ser Ala Phe Met
    1115                1120                1125
Thr Leu Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Ser
    1130                1135                1140
Arg Asn Ala Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly
    1145                1150                1155
Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Ile Arg Pro Ala
    1160                1165                1170
Pro Glu His Leu Leu Glu Lys Leu Ile Ala Ser Gly Glu Ile Thr
    1175                1180                1185
Gln Glu Gln Ala Glu Leu Ala Arg Arg Val Pro Val Ala Asp Asp
    1190                1195                1200
Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg Pro
    1205                1210                1215
Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
    1220                1225                1230
His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val Arg Val Gly
    1235                1240                1245
Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala Ala Leu
    1250                1255                1260
Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln Val
    1265                1270                1275
Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
    1280                1285                1290
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met
    1295                1300                1305
Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met
    1310                1315                1320
Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
    1325                1330                1335
Asp Ser Phe Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu
    1340                1345                1350
Lys Arg Ile Phe Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr
    1355                1360                1365
Lys Asp Phe Tyr Ile Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln
    1370                1375                1380
Arg Ala Glu His Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg
    1385                1390                1395
Trp Tyr Leu Gly Leu Ala Ser Arg Trp Ala Asn Met Gly Ala Pro
    1400                1405                1410
Asp Arg Val Met Asp Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly
    1415                1420                1425
Ala Phe Asn Asp Phe Ile Lys Gly Thr Tyr Leu Asp Pro Ala Val
    1430                1435                1440
Ser Asn Glu Tyr Pro Cys Val Val Gln Ile Asn Leu Gln Ile Leu
    1445                1450                1455
Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala Leu Arg Asn Asp
    1460                1465                1470
Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe Val Tyr Glu
    1475                1480                1485
Pro Thr Asn Ala Leu
    1490
<210>75
<211>4479
<212>DNA
<213>人工
<220>
<223>合成的
<400>75
atggcgctcc gtgtcaagac gaacaagaag ccatgctggg agatgaccaa ggaggagctg    60
accagcggca agaccgaggt gttcaactat gaggaactcc tcgagttcgc agagggcgac    120
atcgccaagg tcttcggacc cgagttcgcc gtcatcgaca agtacccgcg ccgcgtgcgc    180
ctgcccgccc gcgagtacct gctcgtgacc cgcgtcaccc tcatggacgc cgaggtcaac    240
aactaccgcg tcggcgcccg catggtcacc gagtacgatc tccccgtcaa cggagagctc    300
tccgagggcg gagactgccc ctgggccgtc ctggtcgaga gtggccagtg cgatctcatg    360
ctcatctcct acatgggcat tgacttccag aaccagggcg accgcgtcta ccgcctgctc    420
aacaccacgc tcacctttta cggcgtggcc cacgagggcg agaccctcga gtacgacatt    480
cgcgtcaccg gcttcgccaa gcgtctcgac ggcggcatct ccatgttctt cttcgagtac    540
gactgctacg tcaacggccg cctcctcatc gagatgcgcg atggctgcgc cggcttcttc    600
accaacgagg agctcgacgc cggcaagggc gtcgtcttca cccgcggcga cctcgccgcc    660
cgcgccaaga tcccaaagca ggacgtctcc ccctacgccg tcgccccctg cctccacaag    720
accaagctca acgaaaagga gatgcagacc ctcgtcgaca aggactgggc atccgtcttt    780
ggctccaaga acggcatgcc ggaaatcaac tacaaactct gcgcgcgtaa gatgctcatg    840
attgaccgcg tcaccagcat tgaccacaag ggcggtgtct acggcctcgg tcagctcgtc    900
ggtgaaaaga tcctcgagcg cgaccactgg tactttccct gccactttgt caaggatcag    960
gtcatggccg gatccctcgt ctccgacggc tgcagccaga tgctcaagat gtacatgatc    1020
tggctcggcc tccacctcac caccggaccc tttgacttcc gcccggtcaa cggccacccc    1080
aacaaggtcc gctgccgcgg ccaaatctcc ccgcacaagg gcaagctcgt ctacgtcatg    1140
gagatcaagg agatgggctt cgacgaggac aacgacccgt acgccattgc cgacgtcaac    1200
atcattgatg tcgacttcga aaagggccag gactttagcc tcgaccgcat cagcgactac    1260
ggcaagggcg acctcaacaa gaagatcgtc gtcgacttta agggcatcgc tctcaagatg    1320
cagaagcgct ccaccaacaa gaacccctcc aaggttcagc ccgtctttgc caacggcgcc    1380
gccactgtcg gccccgaggc ctccaaggct tcctccggcg ccagcgccag cgccagcgcc    1440
gccccggcca agcctgcctt cagcgccgat gttcttgcgc ccaagcccgt tgcccttccc    1500
gagcacatcc tcaagggcga cgccctcgcc cccaaggaga tgtcctggca ccccatgagc    1560
aagctccccg gcaaccccac ccccttcttt tctccctcgt cgtatccgcc ccgtgctatc    1620
tgcttcatcc cttttccggg caacccgctc gacaacaact gcaaggccgg cgagatgccc    1680
ctcaactggt acaacatgag cgaattcatg tgcggtaagg tcagcaactg cctcggcccg    1740
gagttcgccc gctttgacaa gagcaacacc tcccgctccc ccgccttcga ccttgcgctc    1800
gtcacgcgcg tcgtcgaggt caccaacatg gagcacggca agttcctcaa cgtcgactgt    1860
aacccttcga agggcacgat ggtgggagag ttcgactgcc cgcaggacgc ctggttcttt    1920
gacggctcct gcaatgacgg tcatatgccg tactccatca tcatggagat cggccttcag    1980
acgtctggtg tcctcacgtc ggtgctcaag gctcctctca cgatggacaa ggacgacatc    2040
ctctttcgca accttgatgc ctcggctgag atggtgcgcc ctgacgtcga tgtccgcggc   2100
aagaccatcc gcaacgtgac caagtgtacc ggctacgcca tgcttggtaa gatgggtatc   2160
catcgcttta cctttgagct ctccgtggac ggcgtcgtct tttacaaggg cagcaccagc   2220
ttcggctggt ttacgccgga agtgtttgcc cagcaggccg gtctggacaa cggcaagaag   2280
accgagccct ggtgcaagac caacaacacc tccgtccgcc gcgtcgagat cgccagcgct   2340
aagggtaagg agcagctcac ggagaagctc cctgatgcta ccaacgccca ggttctccgc   2400
cgctccgagc agtgcgagta cctcgactac ctcaacatcg cccccgactc cggccttcac   2460
ggcaagggtt acgcgcacgg ccacaaggac gtcaaccccc aggactggtt tttctcgtgc   2520
cacttctggt tcgacccggt gatgcccggc tcgcttggca ttgagtccat gttccagctc   2580
atcgaagcct ttgctgtcga ccagaatatc cctggcgagt acaatgtttc gaacccgacc   2640
tttgcccatg cccccggtaa gaccgcttgg aagtatcgcg gccagctcac tcccaagaac   2700
cgcgctatgg actgcgaggt ccacatcgtc agcatcacgg cgagcccgga gaacggcggc   2760
tacgtcgaca tcgtcgccga cggcgccctt tgggtcgatg gcctccgcgt ttacgaggcc   2820
aaggagctcc gtgtccgcgt cgtcagcgcc aagccgcaag ctatcccgga tgtccagcag   2880
cagcctccct cggctaaggc cgaccctggc aagaccggtg tcgccctcag ccccacccag   2940
ctccgcgatg tcctcctgga ggtcgacaac cctctgtacc tcggtgtcga gaactccaac   3000
cttgtccagt tcgaaagcaa gccggcgacg tcctcccgca tcgtgtccat taagccgtgt   3060
tctatctccg acctcggcga caagtctttc atggagactt acaacgtgtc tgcgcctctg   3120
tatactggcg ccatggccaa gggcattgcc tcggcggacc tcgtcatcgc cgccggcaag   3180
cgcaagatcc tcggctcctt tggcgccggc ggcctcccca tgcaccacgt gcgcgccgcc   3240
ctcgagaaga tccaggccgc cctgcctcag ggcccctacg ccgtcaacct catccactcg   3300
ccttttgaca gcaacctcga gaagggcaac gtcgatctct tcctcgagaa gggcgtcact   3360
gtggtggagg cctcggcatt catgaccctc accccgcagg tcgtgcgcta ccgcgccgcc   3420
ggcctctcgc gcaacgccga cggttcggtc aacatccgca accgcatcat cggcaaggtc   3480
tcgcgcaccg agctcgccga gatgttcatc cgcccggccc cggagcacct cctcgagaag   3540
ctcatcgcct cgggcgagat cacccaggag caggccgagc tcgcgcgccg cgttcccgtc   3600
gccgacgata tcgctgtcga ggctgactcg ggcggccaca ccgacaaccg ccccatccac   3660
gtcatcctcc cgctcatcat caacctccgc aaccgcctgc accgcgagtg cggctacccc   3720
gcgcacctcc gcgtccgcgt tggcgccgga ggtggcgtcg gctgcccgca ggccgccgcc   3780
gccgcgctca ccatgggcgc cgccttcatc gtcaccggca ctgtcaacca ggtcgccaag   3840
cagtccggca cctgcgacaa cgtgcgcaag cagctctcgc aggccaccta ctcggatatc   3900
tgcatggccc cggccgccga catgttcgag gagggcgtca agctccaggt cctcaagaag   3960
ggaaccatgt tcccctcgcg cgccaacaag ctctacgagc tcttttgcaa gtacgactcc   4020
ttcgactcca tgcctcctgc cgagctcgag cgcatcgaga agcgtatctt caagcgcgca   4080
ctccaggagg tctgggagga gaccaaggac ttttacatta acggtctcaa gaacccggag   4140
aagatccagc gcgccgagca cgaccccaag ctcaagatgt cgctctgctt ccgctggtac 4200
cttggtcttg ccagccgctg ggccaacatg ggcgccccgg accgcgtcat ggactaccag 4260
gtctggtgtg gcccggccat tggcgccttc aacgacttca tcaagggcac ctacctcgac 4320
cccgctgtct ccaacgagta cccctgtgtc gtccagatca acctgcaaat cctccgtggt 4380
gcctgctacc tgcgccgtct caacgccctg cgcaacgacc cgcgcattga cctcgagacc 4440
gaggatgctg cctttgtcta cgagcccacc aacgcgctc                        4479
<210>76
<211>4200
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<400>76
tttctctctc tcgagctgtt gctgctgctg ctgctgctgc tgcttccttg ctggttctca 60
cgtccgttcg atcaagcgct cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120
cttgttgcca ggcagccgca ggctgtctgt ctgtttgtgt agttttaccc tcggggttcg 180
gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240
ccatcgggcc tcgcctcctc gcgccgcacg catcgcgcgc atcgcatgca tcatgctgcc 300
acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc tggcgatgcc 360
gtcgccgccc tccttccttc cctcgcctcc tcttcctccc gagcccccct gtcttccttc 420
gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480
aagaaaagaa aataacagcg ccgtctcgcg cagacgcgcg cggccgcgtg cgaggcggcg 540
tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctcgcctttg aggtgcaggc 600
tttgggagag aagagtggga cgcggagaag ataagatggt gccatggcgc aggacggaga 660
ggttgctgaa acttcttcga gcggcacagg cgatggcgag agaccgacag ctgccggcgc 720
ggaggggatg gatacctccc gaggctggca tggacgagct ggccgcgcgg atctggctgg 780
ccgcgcggcg gtgggtccgg aggcgcgagg ttggttttct tcatacctga taccatacgg 840
tattcattct tcctctccag gaaggaagca agtcacatag agtatcacta gcctaatgat 900
ggactctatg ttttagggca cgtcggagca gaaggcgcga gcgattcgaa tgcgagcgat 960
agatacagca cagagacctt gccggcgacg cggatgcagg cgagcacgca cgcaccgcac 1020
gcacggcagc ggtgcacgcg ctcctcggca gatgcacggt tctgcgccgc gcctttacat 1080
tttttgattt taggtggtgt gcctgccact ttgaacatca tccacaagtc aacgcagcat 1140
caagaggcaa gcaagtacat acatccattc gaattcaagt tcaagagacg cagcaacagc 1200
cgccgctccg ctcaagctgc agctagctgg ctgacagggc tcgctggctg tagtggaaaa 1260
ttccattcac ttttctgcat ccgcggccag caggcccgta cgcacgttct ctcgtttgtt 1320
tgttcgttcg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gcgcgatcca 1380
acgaccctcg gtcgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa 1440
tgctaagcgc gcagcaatgc tgagagtaat cttcagccca ccaagtcatt atcgctgccc 1500
aagtctccat cgcagccaca ttcaggcttt ctctctctct ccctccctct ctttctgccg   1560
ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccgttgtaa   1620
gccctcttag acagttccta ggtgccgggc gccgccgcgc ctccgtcgca ggcacacgta   1680
ggcggccacg ggttcccccc gcaccttcca caccttcttc ccccgcagcc ggaccgcgcg   1740
ccgtctgctt acgcacttcg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg   1800
ccgtcttccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt   1860
acgtacttaa tattaacagt gggacctcgc acaggacctg acggcagcac agacgtcgcc   1920
gcctcgcatc gctggggacg caggcgaggc atcccggcgc ggccccgcac cggggaggct   1980
gcggggcggc ctcttccggc cggcggccgc atcaggcgga tgacgcaaga gccctcgcag   2040
tcgctcgctc gcgggagcgc agcgcggcgc cagcgtggcc aagctcccgc cccttctggc   2100
tggctgcatg cctgcctgcc tgcctgcctg cgtgcgtgcg tgcgtgcgtg ccttcgtgcg   2160
tgcctgcctt cgtgcgtgcg tgcgtgagtg cggcggaaga gggatcatgc gaggatcaat   2220
cacccgccgc acctcgactt ttgaagaagc cgcgatgcga tgcgatgcga tgcgatgcga   2280
cgcgataccg tgcgaggcta cgaagcgagt ctggccggcc gtcatacaac gcacgttttc   2340
gagaaggagg gctggcggag gcgtgcatgc cggcgaccat tgcgaacgcg gcgtctcgtg   2400
gctggcgaag gtgcctggag gatctaacga tcgctgctat gatgctatag ctgtgctgat   2460
ccccggtcca ttccaccacg tctgtgcctg ccgcctgacc tgcgcttggc tttccttcaa   2520
gttctcctcc gccgggcctt caggaccgag acgagacctg cagctgcagc tagactcgcg   2580
ctcgctcgcg gaggattcgc cggccgccgg gccggacggg actcgcgagg tcacacggcc   2640
gccggcgatc gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg   2700
ccgcctccgt attgtggatt cgttagttgg ttgttggttg atttgttgat taattttttt   2760
gttcgtaggc ttggttatag ctaatagttt agtttatact ggtgctcttc ggtgctgatt   2820
tagctcgact tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga   2880
cgggccgacg aaagtgcgcg agtgaggtaa cctaagcaac ggcggtcttc agaggggacg   2940
cacgccctcc gtcgcagtca gtccagacag gcagaaaagc gtcttaggga ccacgcacgc   3000
acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct atttttttag   3060
gcttccttcc gcacgggcct acctctcgct ccctcgcctc gccgcaccag gcggcagcag   3120
cgatacctgc cggtgccgcc tccgtcacgc gctcagccgc agctcagccc agccgcgagc   3180
tagggtttgt tcgtcctgaa ttgtttgatt tgatttgatt tgatttgatc cgatccgatc   3240
cgatctgatc tgatttgctt tgctttgctt tgtctccctc ccggcgcgga ccaagcgtcc   3300
gtctgcgcgc cgcagcttcc cttcttctcc cagccctcct tctgctcccg cctctcgcgc   3360
aagcacgcag cttcgccgcc gcatccggtc ggtcggtcgg tcgatcgacc cgcctgccgc   3420
tgctgctgtg gccgggcttt tctccatcgg cgactctttc ttctccatac gtcctactac   3480
gtacatacat actgccggct tcctcctctt ccagcgcggc gacggcggca ggctgcgacg   3540
tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca gggcctcgtc  3600
gccgccgccg ctccgctccg ctccgaggcc gcgagagggc cgcggcggcg cgatggatgg  3660
atggatggat ggatggatgg atggattttg ttgatcgatg gcggcgcatg ggcggagatg  3720
agcgaggacg agcgcgcgag cgcggcagcc ggattcgcag ggcctcgctc gcctcgcgcc  3780
cgctgccgcg cccgccttgc gagcctgcgc cgcgagcgag cgagcgagcg agcggggctt  3840
tctttgtctc gcgcgccgct tggcctcgtg tgtcttgtgc ttgcgtagcg ggcgccgcgg  3900
tggaagatgg ctcattcaat cgacccattc acgcacgcac tccggcgcgc agagaaggcc  3960
gaggaggagc agcaagcaaa ccaaaagctc tcgcgctcgc ggtctcgggc tcgagcggtc  4020
tcggagagag agtcttgcgg cgaccaccgg cagcagcagc agcagcagca gcgctgtcga  4080
gcacgagcac gagcacgagc acgagcacga gcattcgagc aagaggacag acacggttgt  4140
cagcgcctag ctcgctcgat acagaaagag gcgggttggg cgtaaaaaaa aaggagcacg  4200
<210>77
<211>3886
<212>DNA
<213>裂殖壶菌(Schizochytrium sp.)
<220>
<221>misc_feature
<222>(2115)..(2115)
<223>n=a,c,g,或t
<400>77
gatcttgatt gccaagctct ggattgtcga ttccgatgaa tcgagctctt tgttgtcgag  60
ctctggcttg ccgagctttc agaaatagac aaaattgccg agttcctgat tgcggggctc  120
tcgattgcca aggtctggtg gattctcgaa ctctcgattg tcaaaatctt ggtcgtctcg  180
tcggattctt tcctgatttg ttttgtcaag accttgagat tgtgcaaaac cttgatcgtt  240
gacaaaccct tgatcgacag cagcctttca tcacgctcag ctcttgtcat tgattatatt  300
ccccctgaca gccaacacct tgatgcaggg tctcaacctt gatttttgga ggccatcatc  360
agcatcacgc cccggcactc accctcaaca ttcgacagcc aacgcttttt tttcttcgac  420
taggatctga gaataaaagc aggtcaccac gaccgtaggc caacgcgaca accatggaaa  480
taaagtgaca acgaacgact tgcaagttta aatgtaaaga gcagcaattg cccgcccaca  540
gacaaatgaa agcaggcgcc gagtcttatt tgaggaggtg ggcctgtggc aatgggcgaa  600
agaaaatcaa ggacaaggag agcaggttac gtaccggtat actggtatac gtacatggat  660
ggttcttggc aagttgacgg gatgtgtgcg agtgaccgtg gtagttaacg aaagagccgc  720
aagggcaagg aaagcaagag aatgcagact tttccacagg atggatgggt ccgcagcttg  780
ccgcatgatg aaacgctgta tttcacctgg cacgtggtgg cgcacgcgcc cacatatgat  840
cgcggcggcg ggtgtattat acattttccc cctcaggtct actgccatcc ctccatgcgt  900
cgctcgtgcg aacgacgcaa gcctttcgca tcgtgcagcc tctttctggt aaggcaagag  960
ctaaacccaa acctaaacga aagaacattt ttacctctct ctctctccca ttggtcgcgt  1020
gcgctccgcc gctcgctcct cctcctgcca gtgtcgcgcc ctaacttccc ccctccctcc   1080
ctccctccct ccctccctct ctcctgccac cgcccctctc tccgcgctgc gtgcggtgct   1140
gccctggacc aatggcatgc tgctgcacgc tcggcggatg acgcaagccg cttcgcaatt   1200
tccggatcag atctcggcgg ggcgtgcgcc gcggggtcac tgcggacctg ccgcggcccc   1260
tgcttctttc acatccatca tgtcctccaa acctccgcct cctccacgca cgtacgcacg   1320
cccgctcgca cgcgcgcact gccgctgcga aagcaagcgc ccgcccgccg cccggcgacg   1380
ggaaggcggc cgcggtctcc ctccgcggtt gcctcgctcc cgcgcggggc tgggcgggca   1440
gcagaaggcg ggtggcggcg gcggcttccg tcttcgtcag cggcctacgt cggcggcggc   1500
gcgcgagact acgcatgccc ttgcgtcatg cgctcgcagg tagccgccgc gggcctagcg   1560
tttccgctgg cgccgcgcct aagcccccgg cgcgcacggt attgccgcga taccgtacgg   1620
ccaagaccgc cgcagacgtc ggccctctcg cggccagcca gccagcagcg cagcggagga   1680
agagcgcgca ggcgcggcgg gagggcggcc gcggagcagc gcagagcggg gcggagcagc   1740
gcggagcaga acgggcagac tcggagcggg cagggcgggc agagctttgg ggtttaagga   1800
ccgggttacc ggcgaagtga gcggctgcgg ggagcggctg tgggaggggt gagtacgcaa   1860
gcacgatgcg agcgagagag agacgctgcc gcgaatcaag aaggtaggcg cgctgcgagg   1920
cgcggcggcg gagcggagcg agggagaggg agagggagag agagggaggg agacgtcgcc   1980
gcggcggggc ctggcctggc ctggtttggc ttggtcagcg cggccttgtc cgagcgtgca   2040
gctggagttg ggtggattca tttggatttt cttttgtttt tgtttttctc tctttcccgg   2100
aaagtgttgg ccggncggtg ttctttgttt tgatttcttc aaaagttttg gtggttggtt   2160
ctctctcttg gctctctgtc aggcggtccg gtccacgccc cggcctctcc tctcctctcc   2220
tctcctctcc tctccgtgcg tatacgtacg tacgtttgta tacgtacata catcccgccc   2280
gccgtgccgg cgagggtttg ctcagcctgg agcaatgcga tgcgatgcga tgcgatgcga   2340
cgcgacgcga cgcgagtcac tggttcgcgc tgtggctgtg gcttgcttgc ttacttgctt   2400
tcgagctctc ccgctttctt ctttccttct cacgccacca ccaacgaaag aagatcggcc   2460
ccggcacgcc gctgagaagg gctggcggcg atgacggcac gcgcgcccgc tgccacgttg   2520
gcgctcgctg ctgctgctgc tgctgctgct gctgctgctg ctgctgctgc tgctgcttct   2580
gcgcgcaggc tttgccacga ggccggcgtg ctggccgctg ccgcttccag tccgcgtgga   2640
gagatcgaat gagagataaa ctggatggat tcatcgaggg atgaatgaac gatggttgga   2700
tgcctttttc ctttttcagg tccacagcgg gaagcaggag cgcgtgaatc tgccgccatc   2760
cgcatacgtc tgcatcgcat cgcatcgcat gcacgcatcg ctcgccggga gccacagacg   2820
ggcgacaggg cggccagcca gccaggcagc cagccaggca ggcaccagag ggccagagag   2880
cgcgcctcac gcacgcgccg cagtgcgcgc atcgctcgca gtgcagacct tgattccccg   2940
cgcggatctc cgcgagcccg aaacgaagag cgccgtacgg gcccatccta gcgtcgcctc   3000
gcaccgcatc gcatcgcatc gcgttcccta gagagtagta ctcgacgaag gcaccatttc   3060
cgcgctcctc ttcggcgcga tcgaggcccc cggcgccgcg acgatcgcgg cggccgcggc   3120
gctggcggcg gccctggcgc tcgcgctggc ggccgccgcg ggcgtctggc cctggcgcgc  3180
gcgggcgccg caggaggagc ggcagcggct gctcgccgcc agagaagagc gcgccgggcc  3240
cggggaggga cggggaggag aaggagaagg cgcgcaaggc ggccccgaaa gagaagaccc  3300
tggacttgaa cgcgaagaag aagaagaagg agaagaagtt gaagaagaag aagaagaagg  3360
agaggaagtt gaagaagacg aggagcaggc gcgttccaag gcgcgttctc ttccggaggc  3420
gcgttccagc tgcggcggcg gggcgggctg cggggcgggc gcgggcgcgg gtgcgggcag  3480
aggggacgcg cgcgcggagg cggagggggc cgagcgggag cccctgctgc tgcggggcgc  3540
ccgggccgca ggtgtggcgc gcgcgacgac ggaggcgacg acgccagcgg ccgcgacgac  3600
aaggccggcg gcgtcggcgg gcggaaggcc ccgcgcggag caggggcggg agcaggacaa  3660
ggcgcaggag caggagcagg gccgggagcg ggagcgggag cgggcggcgg agcccgaggc  3720
agaacccaat cgagatccag agcgagcaga ggccggccgc gagcccgagc ccgcgccgca  3780
gatcactagt accgctgcgg aatcacagca gcagcagcag cagcagcagc agcagcagca  3840
gcagcagcag ccacgagagg gagataaaga aaaagcggca gagacg                 3886
<210>78
<211>20
<212>DNA
<213>人工
<220>
<223>合成的
<400>78
catatggcgc tccgtgtcaa                                              20
<210>79
<211>35
<212>DNA
<213>人工
<220>
<223>合成的
<400>79
gccaggaagc tttgacatgg ggtgccagga catct                             35
<210>80
<211>37
<212>DNA
<213>人工
<220>
<223>合成的
<400>80
tcctggcacc ccatgtcaaa gcttcctggc aacccta                           37
<210>81
<211>20
<212>DNA
<213>人工
<220>
<223>合成的
<400>81
agtatacaga ggtgctgaca                                                 20
<210>82
<211>28
<212>DNA
<213>人工
<220>
<223>合成的
<400>82
gcaccccatg agcaagctcc ccggcaac                                        28
<210>83
<211>28
<212>DNA
<213>人工
<220>
<223>合成的
<400>83
gtatacagag gcgcagacac gttgtaag                                        28
<210>84
<211>28
<212>DNA
<213>人工
<220>
<223>合成的
<400>84
ctgcagccag atgctcaaga tgtacatg                                        28
<210>85
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>85
ggagcttgct catggggtgc caggacatct c                                    31
<210>86
<211>10
<212>DNA
<213>人工
<220>
<223>合成的
<400>86
ggatccatgg                                                            10
<210>87
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>87
aagcttgtgc agtcaagtgc gcaaaaccat g                                    31
<210>88
<211>15
<212>DNA
<213>人工
<220>
<223>合成的
<400>88
taacccgggt ctaga                                                      15
<210>89
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>89
gactgctagc ttaagcaagg attttcttaa c                                    31
<210>90
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>90
gactggatcc tcctgatgcg gtattttctc c                                    31
<210>91
<211>12
<212>DNA
<213>人工
<220>
<223>合成的
<400>91
ctaggcggcc gc                                                         12
<210>92
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>92
gactactagt ctaagaaacc attattatca t                                    31
<210>93
<211>31
<212>DNA
<213>人工
<220>
<223>合成的
<400>93
gactggatcc agctttaaat aatcggtgtc a                                    31
<210>94
<211>46
<212>DNA
<213>人工
<220>
<223>合成的
<400>94
gactggatcc gccaccatgt tgcagcatac ttggctacca aaaccc                    46
<210>95
<211>35
<212>DNA
<213>人工
<220>
<223>合成的
<400>95
gacttctaga tcaataatgc cagaattttg gctgc                                35

Claims (39)

1.一种嵌合多不饱和脂肪酸聚酮合酶系统,其中来自裂殖壶菌属(Schizochytrium)的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域被替换为来自破囊壶菌属(Thraustochytrium)的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域,从而产生嵌合多不饱和脂肪酸聚酮合酶系统,该系统与所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统相比,产生不同的ω-3多不饱和脂肪酸对ω-6多不饱和脂肪酸比例。
2.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中包含来自所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域的蛋白质被替换为包含来自所述破囊壶菌属的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域的同源蛋白质。
3.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的OrfC被来自不同的破囊壶菌的OrfC替换。
4.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的OrfC被替换为来自破囊壶菌23B的OrfC。
5.权利要求4的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自破囊壶菌23B的OrfC是由针对裂殖壶菌属密码子用法优化过的核酸序列编码的。
6.权利要求5的嵌合多不饱和脂肪酸聚酮合酶系统,其中核酸序列包括SEQ ID NO:70。
7.权利要求4的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的OrfA被替换为来自破囊壶菌23B的OrfA。
8.权利要求7的嵌合多不饱和脂肪酸聚酮合酶系统,其中所述来自破囊壶菌23B的OrfA是由针对裂殖壶菌属密码子用法优化过的核酸序列编码的。
9.权利要求8的嵌合多不饱和脂肪酸聚酮合酶系统,其中所述核酸序列包含SEQ ID NO:71。
10.权利要求4的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的OrfB被替换为来自破囊壶菌23B的OrfB。
11.权利要求10的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自破囊壶菌23B的OrfB是由针对裂殖壶菌属密码子用法优化过的核酸序列编码的。
12.权利要求11的嵌合多不饱和脂肪酸聚酮合酶系统,其中该核酸序列包含SEQ ID NO:72。
13.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中来自裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的OrfC的FabA样β-羟酰-ACP脱水酶2域被来自破囊壶菌23B的FabA样β-羟酰-ACP脱水酶2域替换。
14.权利要求13的嵌合多不饱和脂肪酸聚酮合酶系统,其中包含所述来自破囊壶菌23B的FabA样β-羟酰-ACP脱水酶2域的核酸序列包含SEQID NO:73。
15.权利要求13的嵌合多不饱和脂肪酸聚酮合酶系统,其中所述来自破囊壶菌23B的FabA样β-羟酰-ACP脱水酶2域是由针对裂殖壶菌属密码子用法优化过的核酸序列编码的。
16.权利要求15的嵌合多不饱和脂肪酸聚酮合酶系统,其中包含所述来自破囊壶菌23B的FabA样β-羟酰-ACP脱水酶2域的核酸序列包含SEQID NO:75。
17.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统包含这样的蛋白质,所述蛋白质包含SEQ IDNO:74的氨基酸序列。
18.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统包含SEQ ID NO:2、SEQ ID NO:4和SEQ IDNO:74。
19.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统包含SEQ ID NO:39、SEQ ID NO:4和SEQ IDNO:62。
20.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统包含SEQ ID NO:39、SEQ ID NO:4和SEQ IDNO:74。
21.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统由如下核酸分子编码,所述核酸分子包含SEQ IDNO:1、SEQ ID NO:3和SEQ ID NO:70。
22.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统由如下核酸分子编码,所述核酸分子包含SEQ IDNO:1、SEQ ID NO:3和SEQ ID NO:73。
23.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统由如下核酸分子编码,所述核酸分子包含SEQ IDNO:1、SEQ ID NO:3和SEQ ID NO:75。
24.权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统,其中该嵌合多不饱和脂肪酸聚酮合酶系统由如下核酸分子编码,所述核酸分子包含SEQ IDNO:71、SEQ ID NO:3和SEQ ID NO:70。
25.一种用于改变由裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统产生的多不饱和脂肪酸的ω-3对ω-6比例的方法,所述方法包括在生物体中表达权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统。
26.权利要求25的方法,其中所述生物体是微生物。
27.权利要求26的方法,其中所述微生物是裂殖壶菌属。
28.权利要求26的方法,其中所述微生物是酵母。
29.权利要求25的方法,其中该嵌合多不饱和脂肪酸聚酮合酶系统是由植物表达的。
30.一种经过遗传修饰的微生物,其包含权利要求1的嵌合多不饱和脂肪酸聚酮合酶系统。
31.一种经过遗传修饰的微生物,其包含权利要求17的嵌合多不饱和脂肪酸聚酮合酶系统。
32.一种经过遗传修饰的微生物,其包含权利要求18的嵌合多不饱和脂肪酸聚酮合酶系统。
33.一种经过遗传修饰的微生物,其包含权利要求19的嵌合多不饱和脂肪酸聚酮合酶系统。
34.一种经过遗传修饰的微生物,其包含权利要求20的嵌合多不饱和脂肪酸聚酮合酶系统。
35.一种经过遗传修饰的微生物,其包含权利要求21的嵌合多不饱和脂肪酸聚酮合酶系统。
36.一种经过遗传修饰的微生物,其包含权利要求22的嵌合多不饱和脂肪酸聚酮合酶系统。
37.一种经过遗传修饰的微生物,其包含权利要求23的嵌合多不饱和脂肪酸聚酮合酶系统。
38.一种经过遗传修饰的微生物,其包含权利要求24的嵌合多不饱和脂肪酸聚酮合酶系统。
39.一种用于增加裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的多不饱和脂肪酸产生以及改变裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统产生的多不饱和脂肪酸的ω-3对ω-6比例的方法,所述方法包括在生物体中表达嵌合多不饱和脂肪酸聚酮合酶系统,其中来自裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域被替换为来自破囊壶菌属的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域,从而产生嵌合多不饱和脂肪酸聚酮合酶系统,该系统与所述裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统相比,产生不同的ω-3多不饱和脂肪酸对ω-6多不饱和脂肪酸比例,并且其中来自所述破囊壶菌属的多不饱和脂肪酸聚酮合酶系统的FabA样β-羟酰-ACP脱水酶2域是针对该裂殖壶菌属的多不饱和脂肪酸聚酮合酶系统所来源的生物体的密码子用法优化过的。
CN200880024785.9A 2007-05-16 2008-05-16 嵌合pufa聚酮合酶系统及其用途 Expired - Fee Related CN101849014B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/749,686 US8003772B2 (en) 1999-01-14 2007-05-16 Chimeric PUFA polyketide synthase systems and uses thereof
US11/749,686 2007-05-16
PCT/US2008/063835 WO2008144473A2 (en) 2007-05-16 2008-05-16 Chimeric pufa polyketide synthase systems and uses thereof

Publications (2)

Publication Number Publication Date
CN101849014A CN101849014A (zh) 2010-09-29
CN101849014B true CN101849014B (zh) 2015-08-19

Family

ID=40122412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880024785.9A Expired - Fee Related CN101849014B (zh) 2007-05-16 2008-05-16 嵌合pufa聚酮合酶系统及其用途

Country Status (13)

Country Link
US (3) US8003772B2 (zh)
EP (1) EP2160470B1 (zh)
JP (1) JP5551584B2 (zh)
KR (1) KR101539470B1 (zh)
CN (1) CN101849014B (zh)
AU (1) AU2008254837B2 (zh)
BR (1) BRPI0810302A2 (zh)
CA (1) CA2687523C (zh)
ES (1) ES2467918T3 (zh)
HK (1) HK1143403A1 (zh)
IL (1) IL202131A (zh)
MX (1) MX2009012395A (zh)
WO (1) WO2008144473A2 (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566583B1 (en) * 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
US7211418B2 (en) * 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US8003772B2 (en) * 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
US7247461B2 (en) * 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) * 1999-01-14 2007-10-18 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
TWI377253B (en) 2001-04-16 2012-11-21 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
WO2005103253A1 (en) 2004-04-22 2005-11-03 Commonwealth Scientific And Industrial Research Organisation Synthesis of long-chain polyunsaturated fatty acids by recombinant cells
CN102559364B (zh) 2004-04-22 2016-08-17 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
US20070220634A1 (en) * 2006-03-15 2007-09-20 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
BRPI0716075A2 (pt) 2006-08-29 2013-08-06 Commw Scient Ind Res Org sÍntese de Ácidos graxos
EP2282769A4 (en) 2008-04-29 2012-04-25 Abbott Lab DUAL VARIABLE DOMAIN IMMUNOGLOBULINS AND ITS USES
RU2010153580A (ru) 2008-06-03 2012-07-20 Эбботт Лэборетриз (Us) Иммуноглобулины с двумя вариабельными доменами и их применение
NO2358882T3 (zh) 2008-11-18 2017-12-23
WO2010107709A1 (en) * 2009-03-16 2010-09-23 Martek Biosciences Corporation Protein production in microorganisms of the phylum labyrinthulomycota
EP2408797B1 (en) * 2009-03-19 2017-03-15 DSM IP Assets B.V. Polyunsaturated fatty acid synthase nucleic acid molecules and polypeptides, compositions, and methods of making and uses thereof
US8207363B2 (en) 2009-03-19 2012-06-26 Martek Biosciences Corporation Thraustochytrids, fatty acid compositions, and methods of making and uses thereof
WO2011037207A1 (ja) 2009-09-24 2011-03-31 国立大学法人九州大学 ストラメノパイルの形質転換方法
CA2785867C (en) * 2009-12-28 2018-03-27 Dsm Ip Assets B.V. Production of hemagglutinin-neuraminidase protein in microalgae
WO2011090730A1 (en) * 2009-12-28 2011-07-28 Martek Biosciences Corporation Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof
PE20121685A1 (es) 2009-12-28 2012-12-28 Merial Ltd Antigeno ndv recombinante y usos del mismo
CN107858297A (zh) 2009-12-28 2018-03-30 Dsm Ip资产公司 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途
CA2785971C (en) * 2009-12-28 2019-02-12 Dsm Ip Assets B.V. Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof
MY160121A (en) * 2010-01-19 2017-02-28 Dsm Ip Assets Bv Eicosapentaenoic acid-producing microorganisms, fatty acid compositions, and methods of making and uses thereof
EP2544716B1 (en) 2010-03-12 2020-01-01 Boehringer Ingelheim Animal Health USA Inc. Foot and mouth disease virus recombinant vaccines and uses thereof
TW201144442A (en) * 2010-05-17 2011-12-16 Dow Agrosciences Llc Production of DHA and other LC-PUFAs in plants
US11236351B2 (en) * 2010-05-17 2022-02-01 Dow Agrosciences Llc Production of DHA and other LC PUFAs in plants
UY33492A (es) 2010-07-09 2012-01-31 Abbott Lab Inmunoglobulinas con dominio variable dual y usos de las mismas
CA2807014A1 (en) 2010-08-03 2012-02-09 Abbvie Inc. Dual variable domain immunoglobulins and uses thereof
PT2683824T (pt) * 2011-03-07 2018-06-07 Dsm Nutritional Products Ag Modificação de microorganismos thraustochytrid
EP2734197A4 (en) 2011-07-21 2014-12-17 Dsm Ip Assets Bv FATTY ACID COMPOSITIONS
TW201307553A (zh) 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
PL2861059T3 (pl) 2012-06-15 2017-10-31 Commw Scient Ind Res Org Wytwarzanie długołańcuchowych wielonienasyconych kwasów tłuszczowych w komórkach roślinnych
TW201525136A (zh) * 2013-11-26 2015-07-01 Dow Agrosciences Llc 利用破囊壺菌PUFA合成酶於油籽作物中生成ω-3長鏈多不飽和脂肪酸
NZ721036A (en) 2013-12-18 2023-07-28 Grains Res & Dev Corp Lipid comprising long chain polyunsaturated fatty acids
SG11201610596PA (en) 2014-06-27 2017-01-27 Commw Scient Ind Res Org Lipid comprising docosapentaenoic acid
EP3265567B1 (en) 2015-03-02 2020-07-29 Conagen Inc. Regulatory elements from labyrinthulomycetes microorganisms
EP3268457A4 (en) * 2015-03-12 2018-10-24 Synthetic Genomics, Inc. Microorganisms for fatty acid production using elongase and desaturase enzymes
WO2017161005A1 (en) 2016-03-16 2017-09-21 Synthetic Genomics, Inc. Production of proteins in labyrinthulomycetes
ES2930078T3 (es) 2016-05-12 2022-12-07 Dsm Ip Assets Bv Método para incrementar la producción de ácidos grasos poliinsaturados omega-3 en microalgas
EP3484994A4 (en) 2016-07-13 2020-01-22 DSM IP Assets B.V. CRISPR-CAS-SYSTEM FOR AN ALGENE CELL
US10633454B2 (en) 2016-11-01 2020-04-28 Conagen Inc. Expression of modified glycoproteins and glycopeptides
CN106947706B (zh) * 2017-05-10 2020-07-07 南京工业大学 一株裂殖壶菌菌株、其构建方法及应用
BR112021002299A2 (pt) * 2018-08-10 2021-05-04 Kyowa Hakko Bio Co., Ltd micro-organismo produzindo ácido graxo poli-insaturado e método para produzir ácido graxo poli-insaturado
EP3835410A4 (en) * 2018-08-10 2022-05-18 Kyowa Hakko Bio Co., Ltd. EICOSAPENTAIC ACID PRODUCING MICROORGANISM AND PROCESS FOR PRODUCTION OF EICOSAPENTAIC ACID
WO2023144707A1 (en) 2022-01-25 2023-08-03 Dsm Ip Assets B.V. Media refinement and nutrient feeding approaches to increase polyunsaturated fatty acid production

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5246841A (en) * 1986-12-26 1993-09-21 Sagami Chemical Research Center Microbial process for production of eicosapentaenoic acid
US5130242A (en) * 1988-09-07 1992-07-14 Phycotech, Inc. Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids
US5340742A (en) * 1988-09-07 1994-08-23 Omegatech Inc. Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids
US5639790A (en) * 1991-05-21 1997-06-17 Calgene, Inc. Plant medium-chain thioesterases
US5798259A (en) * 1992-05-15 1998-08-25 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
WO1993023545A1 (en) 1992-05-15 1993-11-25 Sagami Chemical Research Center Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid
US5683898A (en) * 1992-05-15 1997-11-04 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
US5310242A (en) * 1992-09-28 1994-05-10 Golder Kimberly A Portable infant seat
DE4323727A1 (de) * 1993-07-15 1995-03-09 Boehringer Mannheim Gmbh Verfahren zur Identifizierung von menschlichen und tierischen Zellen mit der Fähigkeit zu unbegrenzter Proliferation oder zur Tumorbildung
US5672491A (en) * 1993-09-20 1997-09-30 The Leland Stanford Junior University Recombinant production of novel polyketides
WO1996021735A1 (fr) 1995-01-13 1996-07-18 Sagami Chemical Research Center Genes codant un groupe d'enzymes de biosynthese pour l'acide icosapentaenoique (epa) et procede d'obtention dudit acide
US6582941B1 (en) 1995-04-17 2003-06-24 Japan As Represented By Director-General Of Agency Of Industrial Science And Technology Microorganisms capable of producing highly unsaturated fatty acids and process for producing highly unsaturated fatty acids by using the microorganisms
US6033883A (en) * 1996-12-18 2000-03-07 Kosan Biosciences, Inc. Production of polyketides in bacteria and yeast
WO1998044917A1 (en) 1997-03-27 1998-10-15 Bristol-Myers Squibb Company Use of docosahexanoic acid and arachidonic acid enhancing the growth of preterm infants
IL132148A0 (en) 1997-04-11 2001-03-19 Calgene Llc Methods and compositions for synthesis of long chain polyunsaturated fatty acids in plants
US6566583B1 (en) 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
JP2002510205A (ja) * 1997-06-04 2002-04-02 カルジーン エルエルシー ポリケチド様合成遺伝子を植物内で発現させることによる多不飽和脂肪酸の製造
US6677145B2 (en) * 1998-09-02 2004-01-13 Abbott Laboratories Elongase genes and uses thereof
US20070244192A1 (en) * 1999-01-14 2007-10-18 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
US7211418B2 (en) * 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US8003772B2 (en) * 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
US7271315B2 (en) * 1999-01-14 2007-09-18 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US7247461B2 (en) * 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
ATE338132T1 (de) * 2000-06-08 2006-09-15 Univ Miami Fettsäure-elongase-3-ketoacyl-coa-synthase- polypeptide
US20040010817A1 (en) * 2000-07-21 2004-01-15 Washington State University Research Foundation Plant acyl-CoA synthetases
DE60141760D1 (de) * 2000-09-28 2010-05-20 Bioriginal Food & Science Corp Fad4, fad5, fad5-2, and fad6, mitglieder der fettsäuredesaturasefamilie und ihre verwendungen
TWI426126B (zh) 2001-04-16 2014-02-11 Dsm Ip Assets Bv 多不飽和脂肪酸(pufa)聚乙醯合成酶系統及其用途(二)
TWI377253B (en) * 2001-04-16 2012-11-21 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
US20040005672A1 (en) * 2002-02-22 2004-01-08 Santi Daniel V. Heterologous production of polyketides
GB2385852A (en) * 2002-02-27 2003-09-03 Rothamsted Ex Station Delta 6-desaturases from Primulaceae
ES2388490T3 (es) * 2002-03-16 2012-10-15 The University Of York Desaturasas
US20040172682A1 (en) 2003-02-12 2004-09-02 Kinney Anthony J. Production of very long chain polyunsaturated fatty acids in oilseed plants
AU2004225485B2 (en) 2003-03-26 2008-08-21 Dsm Ip Assets B.V. PUFA polyketide synthase systems and uses thereof
WO2004087902A2 (de) 2003-03-31 2004-10-14 University Of Bristol Neue pflanzliche acyltransferasen spezifisch für langkettige mehrfach ungesättigte fettsäuren
US7125672B2 (en) * 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US7208590B2 (en) * 2003-07-15 2007-04-24 Abbott Laboratories Genes involved in polyketide synthase pathways and uses thereof
DE102004017370A1 (de) 2004-04-08 2005-10-27 Nutrinova Nutrition Specialties & Food Ingredients Gmbh PUFA-PKS Gene aus Ulkenia
DE102004060340A1 (de) 2004-07-16 2006-02-09 Basf Plant Science Gmbh Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen
US8362319B2 (en) 2004-09-20 2013-01-29 Basf Plant Science Gmbh Arabidopsis genes encoding proteins involved in sugar and lipid metabolism and methods of use
WO2006135866A2 (en) * 2005-06-10 2006-12-21 Martek Biosciences Corporation Pufa polyketide synthase systems and uses thereof
US20070220634A1 (en) * 2006-03-15 2007-09-20 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
EP2408797B1 (en) 2009-03-19 2017-03-15 DSM IP Assets B.V. Polyunsaturated fatty acid synthase nucleic acid molecules and polypeptides, compositions, and methods of making and uses thereof

Also Published As

Publication number Publication date
EP2160470A2 (en) 2010-03-10
AU2008254837B2 (en) 2013-09-12
WO2008144473A2 (en) 2008-11-27
IL202131A (en) 2013-09-30
US8309796B2 (en) 2012-11-13
BRPI0810302A2 (pt) 2020-10-06
CA2687523A1 (en) 2008-11-27
US8003772B2 (en) 2011-08-23
WO2008144473A3 (en) 2009-01-15
EP2160470A4 (en) 2012-02-22
MX2009012395A (es) 2010-02-10
KR101539470B1 (ko) 2015-07-24
AU2008254837A1 (en) 2008-11-27
CN101849014A (zh) 2010-09-29
US20120021470A1 (en) 2012-01-26
EP2160470B1 (en) 2014-03-05
US20080022422A1 (en) 2008-01-24
CA2687523C (en) 2016-09-13
US8859855B2 (en) 2014-10-14
HK1143403A1 (en) 2010-12-31
IL202131A0 (en) 2010-06-16
KR20100020963A (ko) 2010-02-23
JP2010527244A (ja) 2010-08-12
US20130143281A1 (en) 2013-06-06
ES2467918T3 (es) 2014-06-13
JP5551584B2 (ja) 2014-07-16

Similar Documents

Publication Publication Date Title
CN101849014B (zh) 嵌合pufa聚酮合酶系统及其用途
US7897844B2 (en) PUFA polyketide synthase systems and uses thereof
KR101506347B1 (ko) 다불포화 지방산을 함유하는 식물 종자 오일
US7271315B2 (en) PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) Plant seed oils containing polyunsaturated fatty acids
CN101473038B (zh) 含有多不饱和脂肪酸的植物种子油
US20080005811A1 (en) Pufa polyketide synthase systems and uses thereof
US20020194641A1 (en) PUFA polyketide synthase systems and uses thereof
CN101892249A (zh) Pufa聚酮化合物合酶系统及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DSM IP ASSET LLP

Free format text: FORMER OWNER: MARTEK BIOSCIENCES BOULDER CORP.

Effective date: 20121116

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20121116

Address after: Holland Heerlen

Applicant after: DSM IP Asset Company

Address before: American Maryland

Applicant before: Martek Biosciences Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150819

Termination date: 20210516