款冬叶不同发育阶段的转录组学分析
款冬TussilagofarfaraL.为菊科款冬属多年生草本植物,在我国主要分布于东北、华北、华东、西北等地。款冬花具有润肺下气、止咳化痰等功效,主要用于治疗支气管炎、咳嗽、哮喘等疾病[1]。款冬叶在欧洲也是一种广泛使用的止咳化痰传统草药。款冬花中含有三萜、倍半萜、黄酮、苯丙素、生物碱等化学成分[2],而对款冬叶的系统化学成分研究目前未见报道。课题组曾经采用代谢组学的指纹轮廓分析技术对款冬花和叶进行了比较[3-4],结果显示款冬叶和花具有相似的化学成分,其中苯丙素类在款冬叶中含量较高,而且苯丙素类成分与款冬花的镇咳祛痰作用密切相关[5]。 近年来随着第二代高通量测序技术(nextgenerationsequencing,NGS)的不断发展,药用植物功能基因组学研究工作也不断涌现新思路和新方法。由于高通量转录组测序技术能够确定基因序列和转录本,在没有参考基因时,可以对某一物种的转录组和基因组进行细致全面的分析,为基因组图谱尚未完成或数据信息匮乏的物种的基因组和转录组研究提供技术支持[6]。目前,这种技术已广泛应用于丹参[7]、人参[8]、金银花[9]和黄芪[10]等。本研究拟在前期对款冬叶化学初步研究的基础上,采用转录组测序的方法对不同时期款冬叶进行分析。通过款冬叶中基因表达的动态变化,对款冬叶中苯丙素类成分的合成积累规律进行分析,为款冬叶中苯丙素类成分的生物合成、代谢途径、调控机制,以及资源利用研究奠定基础。 1材料与方法 1.1材料 分别于年5月21日、年7月23日,年9月23日和年10月20日在山西沁县采集款冬植物新鲜叶片,样品经山西大学秦雪梅教授鉴定为菊科植物款冬TussilagofarfaraL.的叶。4个不同时期的款冬叶样品分别标记为Ⅰ、Ⅱ、Ⅲ、Ⅳ期,以铝箔纸包裹液氮速冻后于?80℃保存。临用前随机选取同时期样本6株混合,液氮研磨后用于RNA提取,标本保存于山西大学中医药现代研究中心。Trizol(Takara公司),DEPC处理水[(生工生物工程(上海)股份有限公司]。 1.2总RNA的提取与分离及转录组测序 款冬叶总RNA的提取方法采用Trizol法。将上述不同时期的款冬叶样本随机选取6株混合,用液氮研磨成粉末后将Trizol加到款冬叶中,再加入20%氯仿,涡旋15s,室温静置15min。r/min下离心10min(4℃)后取上清。上清液转移至另一离心管,加入异丙醇沉淀RNA,室温静置10min。r/min离心10min,弃上清,加入75%乙醇洗涤1~2次,涡旋震荡4℃,r/min离心5min。自然干燥10min,加入DEPC处理水,移液枪吹打几次后对其浓度定量,达到进行RNA-seq实验的标准后,进行下一步操作。 通过化学试剂和高温的方法,使mRNA片段化。将所获得的片段化mRNA逆转录合成为cDNA,并进行PCR扩增,即可得到cDNA文库。之后,通过荧光分光光度计以及Picogreen对cDNA文库进行定量,检测后使用IlluminaHiSeq×bp和NextSeq×bp(Illumina,美国)测序平台进行测序。 1.3转录组数据组装及Unigenes功能注释 通过对原始测序数据进行统计和质量评估,去除含有接头污染的序列。对经过上述步骤处理得到的数据进行质量控制,即可得到高质量序列碱基数(cleandata)。使用Trinity软件[11]进行denovo拼接得到contigs,transcripts和Unigenes。通过BLAST软件(version2.2.30+)对聚类得到的Unigenes进行基因功能注释。基因功能注释所用到的数据库包括NR(NCBInon-redundantproteinsequences)、GO(geneontology)、KEGG(kyotoencyclopediaofgenesandgenome)、eggNOG(evolutionarygenealogyofgenes:Non-supervisedorthologousgroups)和Swiss-Prot。通过GO数据库和eggNOG数据库对款冬叶中的基因进行功能分类,通过KEGG数据库分析基因可能参与的生物学通路。 1.4Unigenes结构分析 采用Varscan(version2.3.7)程序获取cSNP位点。为了保证后续分析质量,对cSNP按测序深度≥8、突变碱基测序深度≥2、碱基质量≥20、P≤0.01等条件进一步筛选。 1.5差异表达分析及苯丙素类生物合成预测 通过数字基因表达谱(digitalgeneexpressionprofiling,DGE)对款冬叶不同发育时期的差异表达基因进行两两比较(Ⅱ/Ⅰ、Ⅲ/Ⅱ、Ⅳ/Ⅲ),表达量的高低通过样品标准化后的ReadsPerKilobaseperMillionmappedreads(RPKM)值来比较。根据表达量倍数差异(>2倍)和差异表达显著性(P<0.05)筛选出差异表达显著的非重复序列基因。 2结果 2.1款冬叶转录组测序结果与数据组装 对原始数据进行除杂处理之后,获得了4个不同时期款冬叶的reads片段,数目分别为、、、,分别包含了、、、个核苷酸序列信息;将经过质量控制后得到的高质量序列进行denovo拼接。结果显示,拼接得到的总Unigene片段达到条,平均长度为.bp,最长的Unigene片段为bp,N50为bp。在拼接得到的条Unigenes片段中,长度在~bp的片段最多,达条,其次是长度在~bp和~bp左右的片段,分别为条和条(图1)。 2.2基因功能注释 2.2.1基因功能注释对聚类得到的Unigenes进行基因功能注释(表1),所有Unigenes均能在NR数据库中得到注释;能在GO数据库得到注释的有个,占总数的60.11%;能在KEGG数据库注释的有个,占总数的12.13%;能在eggNOG数据库注释的有个,占总数的97.03%;能在Swiss-Prot数据库中得到注释的有个,占总数的76.54%。 2.2.2GO分类GO是一个国际标准化的基因功能分类体系,可以提供一套动态更新的标准词汇表(controlledvocabulary)来全面描述生物体中基因和基因产物的属性。本研究将不同生长时期款冬叶转录组获得的Unigenes与GO功能数据库进行比对分析,发现有个Unigenes与数据库中的基因具有相似性,得到了它们的注释和分类。款冬叶转录组中的Unigenes根据GO功能数据库大致分为生物过程、细胞组分和分子功能3个大类53个分支(图2)。通过对每一类的Unigenes数量进行统计分析,发现在生物过程这一大类中,代谢过程涉及的Unigenes有个,占总体的15.23%,是该类别中数目最多、占比最大的一类,其次是细胞过程中有个Unigenes,占总体的12.62%;在细胞组分这一大类中,涉及细胞部分的Unigenes最多,达条,占总体的9.52%,其次是细胞内,涉及Unigenes条,占总体的8.78%;在分子功能这一大类中,参与黏合功能的Unigenes最多,达条,其次是结构分子活性,涉及Unigenes为条。 2.2.3KEGG代谢途径分类根据KEGG数据库,将款冬叶转录组中的数据分成6大类42种代谢通路,6大类分别为代谢、遗传信息处理、环境信息处理、细胞过程、生物系统和人类疾病,42小类包括碳水化合物代谢、脂质代谢、核苷酸代谢、萜类化合物和聚酮化合物的代谢、其他次生代谢物的生物合成、基因转录、基因翻译、细胞生长和死亡等,共涉及Unigenes条。代谢这一类别分配了条,人类疾病分配了条,遗传信息处理分配了条,生物系统分配了条,细胞过程分配了条,以及有条Unigenes分配到了环境信息处理(图3)。 在被分配到代谢这一大类的Unigenes中,有条分配到了碳水化合物代谢,数目最多;其次是信号转导,分配了条;氨基酸代谢有条;萜类(包括了单萜、二萜、三萜、倍半萜)涉及的基因有65条,苯丙素类涉及的基因共有64条,黄酮类涉及的基因有15条,共涉及的基因条。2.2.4eggNOG功能分类将款冬叶转录组的Unigenes片段与eggNOG数据库进行比对,发现共有条Unigenes与eggNOG数据库中的基因具有相似性。根据功能将款冬叶转录组中的Unigenes大致分为26类,并对每一类的基因数量进行统计。结果显示,Unigenes的eggNOG功能种类比较全面,涉及到大多数的生命活动,所含基因数目最多的是一般功能预测,有条基因被划分到一般功能预测,其次是功能未知(9条),翻译后修饰、蛋白质转换、伴侣(0条),信号转导机制(条),翻译、核糖体结构和生物合成(条),碳水化合物转运和代谢(条),能量生产和转换(条)等,各基因的表达丰度见表2。 2.2.5cSNP分析SNP(singlenucleotidepolymorphisms)是指在基因组上由单个核苷酸变异形成的遗传标记,SNP发生的变换有转换和颠换2种,且SNP是指变异频率大于1%的单核苷酸变异。cSNP(codingSNP)表示蛋白编码区域的SNP。本研究中总cSNP的数量为个,T/G和T/C发生频率最高,分别为32%和31.6%,其他4种单核苷酸变异A/G、A/T、A/C、C/G发生频率均在15%以下,分别为9%、12.5%、5.8%和9%(图4)。 2.3款冬叶中苯丙素类化合物的差异分析和生物合成预测 将所获得的不同生长时期的款冬叶的DEG原始数据按II/I、III/II、IV/III分组并进行滤过、拼接,可以得到总contig数条,总transcript数条,非重复序列基因条。不同时期的款冬叶的两两比较结果表明:(1)II/I:显著基因共有条,上调1条,下调条;(2)III/II:显著基因共有2条,上调条,下调条;(3)IV/III:显著基因共有条,上调条,下调条。图5-A为不同生长时期款冬叶上调基因与下调基因的分布情况。II/I中差异表达基因上调的数目明显高于Ⅲ/Ⅱ、Ⅳ/Ⅲ,下调的基因数目则低于Ⅲ/Ⅱ、Ⅳ/Ⅲ,表明款冬花在Ⅱ期的基因表达数目最高,原因在于此时叶子的生长最为旺盛,生命活动最为剧烈。当Ⅲ期与Ⅱ期比较时,Ⅲ期的下调基因多于上调基因,当Ⅳ期与Ⅲ期比较时,Ⅳ期下调基因数目多于上调基因,说明从Ⅲ期开始款冬叶的基因表达逐渐减弱。 为了从整体上了解差异表达基因在款冬叶不同生长阶段的表达情况,将Ⅱ/Ⅰ、Ⅲ/Ⅱ、Ⅳ/Ⅲ的全部差异表达的基因通过Cluster3.0进行基因与样品间的聚类分析。从图5-B可以看出,在Ⅰ、Ⅱ、Ⅲ、Ⅳ期款冬叶样品中的差异表达基因主要分为高表达(红色)与低表达(绿色)基因2类,从Ⅰ期到Ⅳ期,款冬叶中差异表达基因有明显波动(上调或下调);根据各个阶段基因表达量高低,可以看出,Ⅰ、Ⅱ、Ⅲ期聚为一类,Ⅳ期另归一类;Ⅳ期的低表达基因与另外3期明显不同,Ⅲ期的高表达基因最多。 由KEGG注释结果可知,与苯丙素类成分生物合成相关的酶包括:苯丙氨酸解氨酶(phenylalanineammonia-lyase,PAL)、β-葡萄糖苷酶(beta-glucosidase,bgIX)、肉桂醇脱氢酶(cinnamyl-alcoholdehydrogenase,CAD)、4-香豆酸辅酶A连接酶(4-coumarateCoAligase,4CL)、莽草酸羟基肉桂酰转移酶(hydroxycinnamoyl-transferase,HCT)、咖啡酸-O-甲基转移酶(caffeicacid3-O-methyltransferase,COMT)、过氧化物酶(peroxidase,PER)。 为分析上述酶的基因表达情况,通过比较RPKM(ReadsPerKilobasesperMillionreads)的值来分析上述限速酶在不同生长发育阶段的表达量。如图6所示,PAL、4CL、HCT、CCoAOMT的表达量呈现先增高后减少的趋势,即这些基因在叶片生长发育的过程中表达量不断增多,9月达到最大。CAD的表达量在款冬叶发育过程中虽然有波动,但5、9、10月的表达量差异不大,仅在7月最低。COMT的表达量在款冬叶的生长发育过程中呈波动性变化,在10月表达量达到最高。bgIX的表达量随款冬叶的生长呈逐渐下降的趋势。根据上述基因表达量的变化趋势可以推测款冬叶中苯丙素类成分可能在9月份的合成量最多。 3讨论 本研究采用转录组测序技术对不同生长时期款冬叶中苯丙素类成分生物合成相关基因的表达进行了比较。通过转录组测序技术共获得个的Unigenes,个Unigenes可在NR、Swiss-Prot、eggNOG、GO、KEGG等数据库中得到共同注释。KEGG分析结果显示,涉及萜类、黄酮类和苯丙素类的基因共有条,其中萜类65条,苯丙素类64条,黄酮15条。对参与苯丙素类生物合成相关基因进行动态分析比较,关键酶PAL、4CL、HCT、CCoAOMT等在9月的表达量最高,提示苯丙素类成分在9月的生物合成量可能最高。 款冬植物在中国和欧洲都是用于止咳化痰的药用植物,我国传统中医药使用的药用部位是花蕾,而欧洲使用的是叶。课题组前期已对款冬花进行了比较转录组分析[6]。前期研究显示款冬叶与花蕾有相似的成分[12],但苯丙素类成分在叶中含量更高,而款冬酮等倍半萜成分在花蕾中含量较高。苯丙素类在高等植物体内均由莽草酸途径而来,莽草酸衍生的苯丙氨酸在苯丙氨酸解氨酶(PAL)催化下转化为反式肉桂酸,从而将代谢流引向苯丙素类次生代谢途径[13]。前期研究提示,苯丙素类成分与款冬花的止咳化痰作用密切相关,本研究所揭示的苯丙素类在款冬叶中的动态积累规律为款冬叶资源的合理利用提供了科学依据。以款冬酮为代表的倍半萜类是款冬植物的专属性成分,然而这类成分的生物合成途径以及所涉及的关键酶目前尚不清楚,难以对其在款冬叶中的动态积累规律进行分析。此外,由于款冬叶中以苯丙素类成分为主,而款冬酮等倍半萜类成分在叶中含量较低,因此本研究将苯丙素类作为款冬叶的研究重点,下一步将对款冬叶中苯丙素类成分的含量动态变化进行化学分析。 参考文献(略) 来源:聂佳慧,张福生,田栋,郭冬,雷振宏,秦雪梅,李震宇.款冬叶不同发育阶段的转录组学分析[J].中草药,,49(13):-. 预览时标签不可点收录于话题#个上一篇下一篇 |
转载请注明地址:http://www.sumumm.com/kxstz/5262.html
- 上一篇文章: 一张慢性咽炎根治方,3年的咽炎,中药3副
- 下一篇文章: 没有了