小麦DUF760基因家族的全基因组鉴定与表达分析
Genome-Wide Identification and Expression Analysis of DUF760 Gene Family in Wheat
DOI: 10.12677/ojns.2024.123059, PDF, HTML, XML, 下载: 66  浏览: 103 
作者: 李 政, 徐鹏亮, 刘震宇, 范永胜, 吴 涛, 胡 宁, 蒋 雯, 朱 坤:新乡市农业科学院,河南 新乡
关键词: 小麦DUF760基因全基因组分析基因表达Wheat DUF760 Gene Whole Genome Analysis Gene Expression
摘要: 为了探索DUF760基因家族在小麦生长发育中的潜在功能,对小麦DUF760基因家族进行了全基因组鉴定、蛋白特性分析、启动子顺式作用元件分析和表达模式分析。通过生物信息学技术,在小麦基因组中共鉴定到16个TaDUF760家族成员,进化树分析将其分为Group I和Group II两个亚家族,两者基因结构和motif分布存在不同的特征。通过分析启动子顺式作用元件,推测TaDUF760基因的表达受干旱、低温、光照等因素调控。对小麦转录组数据分析显示,部分TaDUF760基因在小麦各个组织中均表达,TaDUF760-6、TaDUF760-7、TaDUF760-9针对干旱和热胁迫时的反应更为强烈。本研究明确了小麦TaDUF760基因家族成员及其表达模式,为小麦功能基因的挖掘提供了理论依据。
Abstract: In order to explore the potential functions of the DUF760 gene family in wheat growth and development, whole genome identification, protein characteristic analysis, promoter cis acting element analysis, and expression pattern analysis were conducted on the wheat DUF760 gene family. Through bioinformatics technology, a total of 16 TaDUF760 family members were identified in the wheat genome. Evolutionary tree analysis divided them into two subfamilies, Group I and Group II, with different gene structures and motif distributions. By analyzing the cis acting elements of the promoter, it is speculated that the expression of TaDUF760 gene is regulated by factors such as drought, low temperature, and light. Analysis of wheat transcriptome data shows that some TaDUF760 genes are expressed in various tissues of wheat, with TaDUF760-6, TaDUF760-7, and TaDUF760-9 exhibiting stronger responses to drought and heat stress. This study clarified the members and expression patterns of the TaDUF760 gene family in wheat, providing a theoretical basis for the exploration of functional genes in wheat.
文章引用:李政, 徐鹏亮, 刘震宇, 范永胜, 吴涛, 胡宁, 蒋雯, 朱坤. 小麦DUF760基因家族的全基因组鉴定与表达分析[J]. 自然科学, 2024, 12(3): 510-518. https://doi.org/10.12677/ojns.2024.123059

1. 引言

小麦是我国主要的粮食作物,小麦高产、优质、抗病、广适是育种家所追求的重要目标,为了能够提高育种效率,缩短育种年限,加大对相关重要性状基因的功能研究迫在眉睫。未知功能结构域蛋白(DUF, domains of unknown function)是一大类功能尚未被表征的蛋白 [1] 。在Pfam 35.0版本中,目前已收录19,632个蛋白家族,其中DUFs家族占比高达30%,即注释时这些蛋白功能未被鉴定 [2] 。随着分子生物学研究的深入,大量未知功能基因被鉴定出来,其生物学功能也得到了验证。但即便是在模式植物拟南芥中,也还有大量基因的功能仍未明晰。

近年来,基因组学、转录组学、蛋白组学的迅猛发展,为研究DUF家族基因功能提供了有力的支撑,一些DUF蛋白的功能也陆续被鉴定出来。有研究发现,大量DUF蛋白在植物生长发育和响应逆境胁迫中发挥着重要的作用。在拟南芥中,DUF231家族成员At3g55990参与植物对低温胁迫的负调控 [3] ;DUF966家族成员At3g46110通过调控生长素的合成来影响植物生长发育情况 [4] ;DUF4228家族成员能够与非生物胁迫调控因子发生互作,如At1g76660能够与CML38和WRKY40互作 [5] ,At1g21010能够与PP2A互作 [6] ,从而参与植物对非生物胁迫的应答 [7] 。拟南芥DUF579家族成员AGM1和AGM2与植物细胞壁半纤维素主要成分木聚糖的合成有关 [8] [9] ;DUF761家族成员的过表达会导致植株出现叶片变小、根变短等表型 [10] ;DUF647家族成员RUS4与JA相关基因的表达存在一定的关系 [11] [12] 。在水稻中,过表达DUF966家族成员,能够显著降低对高温、干旱、盐等非生物胁迫的耐受性 [13] ;DUF1645家族成员能够显著提高转基因水稻对干旱的耐受性 [14] ;水稻中DUF1644家族成员OsSIDP366正向调控水稻对干旱的胁迫响应 [15] 。DUF蛋白在植物抗病方面也发挥着重要作用。在拟南芥中,通过过表达DUF581蛋白转录因子IRM1,可以增强植株对拟南芥蚜虫的抗性 [16] ;在棉花中,GhDUF642-10基因能够通过调控木质素、NO、H2O2及POD含量,以此来提高对黄萎病的抗性 [17] 。有研究发现,在水稻和拟南芥中分别存在6个、8个DUF760基因,DUF760家族成员在拟南芥中参与叶绿体CLP蛋白酶系统的蛋白互作,有多个CLP蛋白酶亚基与DUF760家族成员深度连接 [18] 。

以上研究结果表明,DUF基因家族在植物生长发育和响应非生物逆境胁迫中发挥着重要的作用。但目前小麦还有很多DUF家族成员及生物学功能未被鉴定,尤其是国内外针对小麦DUF760基因家族的全基因组鉴定与表达方面的报道还未发现。本研究在小麦全基因组范围内对DUF760基因家族成员进行了鉴定,并对其蛋白特性、启动子顺式作用元件和表达模式进行了分析,为进一步研究TaDUF760基因功能提供重要理论依据。

2. 材料与方法

2.1. 候选基因的鉴定与筛选

从Ensemble Plants数据库(http://plants.ensembl.org/index.html)中下载普通小麦基因组序列、蛋白质序列和基因注释文件。在Pfam数据库中下载隐马尔可夫模型DUF760 (PF05542)作为搜索模型,利用HMMER 3.4软件筛选含有该结构域的所有蛋白序列,利用NCBI-CDD (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)和SMART (https://smart.embl.de/)检测分析候选蛋白,去除冗余候选基因。

2.2. 蛋白特性预测

利用ExPASy网站ProtParam tool工具(http://web.expasy.org/protparam/)预测小麦DUF760基因的蛋白特性 [19] ,包括氨基酸长度、分子量(Mw)、等电点(pI)、亲水指数(GRAVY)和不稳定系数。利用CELLO v.2.5 (http://cello.life.nctu.edu.tw/)网站对序列进行亚细胞定位预测 [20] 。

2.3. 基因进化树、基因结构和蛋白保守基序分析

使用ClustalW软件对小麦DUF760蛋白序列进行多序列比对;利用MEGA7软件中的最大自然法构建系统进化树 [21] ,并利用Evolview在线工具(https://www.evolgenius.info/evolview/#/treeview)对进化树进行美化。使用MEME在线软件(http://meme-suite.org/index.html)对小麦DUF760基因蛋白质进行Motif分析,设置Motif搜索值为10 [22] ;根据小麦DUF760基因注释信息,通过TBtools软件绘制基因结构图 [23] 。

2.4. 启动子顺式作用元件分析

将起始密码子ATG上游1500 bp的基因组序列作为基因的启动子序列,利用PlantCARE网站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析家族成员启动子顺式作用元件 [24] ,将与生长发育、激素应答、胁迫响应相关的元件进行统计和分析。

2.5. 转录组分析

利用小麦表达数据库expVIP (http://www.wheat-expression.com/),获得小麦DUF760家族基因在小麦不同组织和不同胁迫下的表达数据。利用TBtools软件绘制表达热图。

3. 结果与分析

3.1. TaDUF760基因家族的鉴定和蛋白特性预测

通过在小麦全基因组搜索和分析,共找到16个编码DUF760保守结构域的基因,根据它们在染色体的位置,分别命名为TaDUF760-1~16 (表1)。小麦DUF760家族基因编码的氨基酸长度为333~413aa,分子量在36.7 KD至45.5 KD之间,蛋白等电点为4.92~9.19,亲水性指数为−0.411~−0.186,均为亲水性蛋白质,不稳定系数为47.67~66.26。TaDUF760家族基因在A、B、D三个染色体组上均有分布,并且具有相似性。亚细胞定位预测结果显示,所有TaDUF760蛋白位于叶绿体或细胞核上。

Table 1. Information of DUF760 family members in wheat

表1. 小麦DUF760家族成员信息

3.2. TaDUF760基因系统发育分析

通过对16个小麦、8个拟南芥和6个水稻的DUF760家族蛋白序列进行了多序列比对,同时构建系统进化树(图1)。系统进化树分析结果显示,小麦、拟南芥、水稻DUF760家族成员可以明显分为2个亚家族(Group I和Group II)。TaDUF-1、2、3、4、6、7、9属于Group I,TaDUF-5、8、10、11、12、13、14、15、16属于Group II。在小麦基因组中,DUF760基因要远多于水稻和拟南芥,可能是因为小麦为异源六倍体,不同染色体组间拥有同源基因导致的 [25] 。

3.3. TaDUF760基因保守基序(motif)与基因结构分析

为进一步了解DUF760基因特征,对TaDUF760家族成员进行了蛋白保守基序分析和基因结构分析(图2)。保守基序分析结果显示,在TaDUF760蛋白序列中搜索到的Motif长度从29到50不等,同一亚族的TaDUF760蛋白序列具有相似的Motif分布,所有的成员都含有Motif1和Motif7,而Motif4、Motif9和Motif10是Group I亚族特有的,Motif2只存在于Group II亚族中。基因结构分析显示,同一亚族的DUF760基因结构也具有相似性,所有的TaDUF760序列两端均含有UTR非编码区域。Group I亚族成员均含有3个外显子,而Group II亚族成员则含有6~7个外显子。

3.4. TaDUF760基因启动子顺势作用元件分析

通过对TaDUF760基因启动子顺势作用元件的可视化分析,共鉴定到762个与激素应答、生长发育和胁迫响应相关的顺式作用元件(图3),其数量分别为293个、166个、303个,相应的元件种类分别为

Figure 1. Phylogenetic relationships of DUF760 proteins in Triticum aestivum, Arabidopsis thaliana and Oryza sativa

图1. 小麦、拟南芥、水稻DUF760蛋白进化关系

Figure 2. Conserved gene sequence and gene structure of TaDUF760 genes

图2. TaDUF760基因的保守基序和基因结构

11、13、30种。激素应答相关顺式作用元件,主要涉及茉莉酸甲酯(MeJA)、脱落酸(ABA)、生长素(IAA)和赤霉素(GA),其中ABRE (ABA响应)、G-Box (IAA响应)、TGACG-motif (MeJA响应)和CGTCA-motif (MeJA响应)在所有TaDUF760基因启动子中均存在。胁迫响应相关顺式作用元件包括与干旱响应、低温响应、光胁迫响应等有关的元件。

3.5. TaDUF760在小麦组织中的表达模式分析

本研究利用小麦RNA-seq数据库expVIP,对小麦不同组织中的TaDUF760基因进行了转录表达水平分析(图4)。结果显示TaDUF760基因在不同组织中表达模式不同,其中,TaDUF760-1TaDUF760-2TaDUF760-3TaDUF760-11TaDUF760-12TaDUF760-13在小麦各个组织中表达水平较低;TaDUF760-4

Figure 3. Cis-acting element analysis of TaDUF760 genes. (a) Phylogenetic tree of TaDUF760 family; (b) The cis-acting element of TaDUF760 genes; (c) Statistical map of cis-acting elements of TaDUF760 genes

图3. TaDUF760基因的顺式作用元件分析。(a) TaDUF760家族系统发育树;(b) TaDUF760基因顺式作用元件;(c) TaDUF760基因顺式作用元件数量统计

TaDUF760-14TaDUF760-15TaDUF760-16基因在根、茎、穗和籽粒中表达水平要显著低于叶片。而在小麦根系组织中,TaDUF760-5TaDUF760-6TaDUF760-7TaDUF760-8TaDUF760-9和TaDUF760-10基因均有较高水平的表达。在小麦茎秆中TaDUF760-10基因的表达水平最高。在小麦籽粒中TaDUF760-5TaDUF760-8TaDUF760-10表达水平要高于其他基因。

3.6. TaDUF760在非生物胁迫下的表达分析

通过对小麦在干旱和热胁迫处理下的转录组数据可视化分析发现,不同TaDUF760基因对干旱和热胁迫的响应程度不同(图5)。在干旱胁迫下,TaDUF760-8TaDUF760-10基因表达量均有不同程度下调;TaDUF760-4基因则表现为上调,而TaDUF760-5TaDUF760-6TaDUF760-7TaDUF760-9基因表达量则表现为先升高再降低。在热胁迫1 h处理下以及旱热胁迫1 h处理下,TaDUF760-6TaDUF760-7TaDUF760-9三个基因表达量均出现急剧上调。说明TaDUF760-6TaDUF760-7TaDUF760-9三个基因可能在小麦面对热胁迫时发挥着重要作用。

Figure 4. Tissue expression profile analysis of TaDUF760 genes

图4. TaDUF760基因组织表达图谱分析

Figure 5. Transcriptome analysis of TaDUF760 genes under abiotic stress

图5. TaDUF760基因在非生物胁迫下的转录组分析

4. 讨论

本研究通过对小麦全基因组进行生物学技术分析,共鉴定到16个TaDUF760基因家族成员,在A、B、D三个染色体组上均有分布,亚细胞定位均定位在叶绿体或者细胞核上。通过系统进化树分析和基因结构分析,TaDUF760家族成员可以分成Group I和Group II两个亚家族,两个亚家族在保守基序分布情况和基因结构上也具有一定的差异性,保守基序Motif1和Motif7与TaDUF760结构域序列具有高度的相关性。

小麦组织转录组数据结果显示,TaDUF760基因在小麦根、茎、叶、穗和籽粒上均有表达,但不同家族成员表达强度不一。TaDUF760-4TaDUF760-5TaDUF760-6TaDUF760-7TaDUF760-8TaDUF760-9TaDUF760-10TaDUF760-14TaDUF760-15TaDUF76016在小麦叶片中表达量要明显高于其他成员,再结合其定位于叶绿体或细胞核,说明这10个成员可能参与光合作用。TaDUF760-5TaDUF760-6TaDUF760-7TaDUF760-8TaDUF760-9TaDUF760-10在小麦根系中表达量相对较高,推测其可能参与小麦根系某些代谢过程。TaDUF760-5TaDUF760-8TaDUF760-10在小麦籽粒中表达水平要显著高于其他成员,暗示其可能在小麦籽粒发育过程中发挥重要作用。此外,部分家族成员之间存在类似的表达模式,如TaDUF760-6TaDUF760-7和TaDUF760-9以及TaDUF760-5TaDUF760-8和TaDUF760-10等,这些成员在小麦生长过程中是否发挥着协作或者相似的功能还有待进一步试验验证。

基因表达受多种顺式作用元件的调节和影响,对基因启动子顺式作用元件进行分析,能够初步预测该基因可能参与的信号通路 [26] 。本研究发现,TaDUF760启动子区域存在大量与胁迫响应、生长发育和激素应答相关的顺式作用元件。在激素应答相关顺式作用元件中,ABRE元件(ABA响应)、G-Box元件(IAA响应)、TGACG-motif元件(MeJA响应)和CGTCA-motif元件(MeJA响应)均重复存在于所有的成员启动子区域,说明TaDUF760家族成员可能在小麦激素调控信号通路中发挥一定作用。TaDUF760-16启动子区域含有数量最多的与激素应答相关的顺式作用元件,包含12个ABRE元件和10个G-Box元件,以此推测TaDUF760-16可能在ABA信号通路和IAA信号通路中发挥着不可或缺的作用。在胁迫响应相关顺式作用元件中,存在多个与湿度、温度以及光照响应相关的元件存在,结合本研究中对TaDUF760在非生物胁迫下表达模式分析,TaDUF760-6TaDUF760-7TaDUF760-9可能在植物干旱与高温逆境胁迫下发挥着重要作用。

5. 结论

本研究对TaDUF760家族成员进行了多方位的分析,不同成员在不同组织中表达模式不一,面对旱热胁迫时,各成员也表现出多样的响应表达模式,说明TaDUF760家族成员在小麦生长发育和响应胁迫时可能发挥着重要的功能,弥补了国内外针对小麦DUF760基因家族的全基因组鉴定与表达方面研究的空白,为后期深入探索TaDUF760家族各成员生物学功能,以及利用分子育种等手段创新种子资源提供了重要线索。

参考文献

[1] Robert, D., Finn, P., Coggill, R., et al. (2016) The Pfam Protein Families Database: Towards a More Sustainable Future. Nucleic Acids Research, 44, D279-D285.
[2] El-Gebali, S., Mistry, J., Bateman, A., Eddy, S.R., et al. (2019) The Pfam Protein Families Database in 2019. Nucleic Acids Research, 47, D427-D432.
https://doi.org/10.1093/nar/gky995
[3] Xin, Z., Mandaokar, A., Chen, J., Last, R.L. and Browse, J. (2007) Arabidopsis Esk1 Encodes a Novel Regulator of Freezing Tolerance. The Plant Journal, 49, 786-799.
https://doi.org/10.1111/j.1365-313X.2006.02994.x
[4] Shen, L., Zhong, T., Wang, L., Zhang, Q. and Ye, J. (2019) Characterization the Role of a Ufc Homolog, Atauxrp3, in the Regulation of Arabidopsis Seedling Growth and Stress Response. Journal of Plant Physiology, 240, Article ID: 152990.
https://doi.org/10.1016/j.jplph.2019.152990
[5] Yamaguchi, M., Fujimoto, H., Hirano, K., Araki-Nakamura, S., Ohmae-Shinohara, K., Fujii, A., et al. (2016) Sorghum Dw1, an Agronomically Important Gene for Lodging Resistance, Encodes a Novel Protein Involved in Cell Proliferation. Scientific Reports, 6, Article No. 28366.
https://doi.org/10.1038/srep28366
[6] Pernas, M., García-Casado, G., Rojo, E., Solano, R. and Sánchez-Serrano, J.J. (2010) A Protein Phosphatase 2a Catalytic Subunit Is a Negative Regulator of Abscisic Acid Signalling. Plant Journal, 51, 763-778.
https://doi.org/10.1111/j.1365-313X.2007.03179.x
[7] Kavas, M., Mostafa, K., Segin, Z., Yerlikaya, B.A., Yldrm, K. and Gkdemir, G. (2023) Genome-Wide Analysis of Duf221 Domain-Containing Gene Family Incommon Bean and Identification of Its Role on Abiotic and Phytohormone Stress Response. Genetic Resources and Crop Evolution, 70, 169-188.
https://doi.org/10.1007/s10722-022-01421-7
[8] Temple, H., Mortimer, J.C., Tryfona, T., Yu, X., Lopez-Hernandez, F., Sorieul, M., et al. (2019) Two Members of the Duf579 Family Are Responsible for Arabinogalactan Methylation in Arabidopsis. Plant Direct, 3, e00117.
https://doi.org/10.1002/pld3.117
[9] Mizukami, A., Inatsugi, R., Jiao, J., Kotake, T., Kuwata, K., Ootani, K., et al. (2016) The Amor Arabinogalactan Sugar Chain Induces Pollen-Tube Competency to Respond to Ovular Guidance. Current Biology, 26, 1091-1097.
https://doi.org/10.1016/j.cub.2016.02.040
[10] Zhang, F.H.X. (2019) Characterization of an Arabidopsis thaliana Duf761-Containing Protein with a Potential Role in Development and Defense Responses. Theoretical and Experimental Plant Physiology, 31, 303-316.
https://doi.org/10.1007/s40626-019-00146-w
[11] Acosta, I.F. and Marine, P. (2019) Jasmonate Signaling during Arabidopsis Stamen Maturation. Plant and Cell Physiology, 60, 2648-2659.
https://doi.org/10.1093/pcp/pcz201
[12] Zhao, S.Q., Li, W.C., Zhang, Y., Tidy, A.C. and Wilson, Z.A. (2019) Knockdown of Arabidopsis Root Uvb Sensitive4 Disrupts Anther Dehiscence by Suppressing Secondary Thickening in the Endothecium. Plant & Cell Physiology, 60, 2293-2306.
https://doi.org/10.1093/pcp/pcz127
[13] Luo, C., Guo, C., Wang, W., Wang, L. and Chen, L. (2014) Overexpression of a New Stress-Repressive Gene Osdsr2 Encoding a Protein with a Duf966 Domain Increases Salt and Simulated Drought Stress Sensitivities and Reduces Aba Sensitivity in Rice. Plant Cell Reports, 33, 323-336.
https://doi.org/10.1007/s00299-013-1532-0
[14] Cui, Y.C., et al. (2016) Ossgl, a Novel Duf1645 Domain-Containing Protein, Confers Enhanced Drought Tolerance in Transgenic Rice and Arabidopsis. Frontiers in Plant Science, 7, Article ID: 420747.
https://doi.org/10.3389/fpls.2016.02001
[15] Guo, C., Luo, C., Guo, L., Li, M., Guo, X., Zhang, Y., et al. (2016) Ossidp366, a Duf1644 Gene, Positively Regulates Responses to Drought and Salt Stresses in Rice. Journal of Integrative Plant Biology, 58, 492-502.
https://doi.org/10.1111/jipb.12376
[16] 罗成科, 肖国举, 李明. 不同未知功能结构域蛋白家族(DUFs)基因在植物中的生物学功能[J]. 植物生理学报, 2015, 51(2): 153-158.
[17] 解美霞. 陆地棉WAK和DUF642基因家族抗黄萎病功能分析[D]: [硕士学位论文]. 保定: 河北农业大学, 2020.
[18] Liao, J.Y.R., Friso, G., Forsythe, E.S., Michel, E.J.S., Williams, A.M., Boguraev, S.S., et al. (2022) Proteomics, Phylogenetics, and Coexpression Analyses Indicate Novel Interactions in the Plastid CLP Chaperone-Protease System. The Journal of Biological Chemistry, 298, Article ID: 101609.
https://doi.org/10.1016/j.jbc.2022.101609
[19] Li, Q.Y., et al. (2019) Genome Wide Identification and Expression Analysis of the U-Box Gene Family in Citrus. Scientia Agricultura Sinica, No. 11, 1942-1960.
[20] Yu, C.-S., Chen, Y.-C., Lu, C.-H. and Hwang, J.-K. (2006) Prediction of Protein Subcellular Localization. Proteins: Structure, Function, and Bioinformatics, 64, 643-651.
https://doi.org/10.1002/prot.21018
[21] Kumar, S., Stecher, G. and Tamura, K. (2015) Mega7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Molecular Biology and Evolution, 33, 1870-1874.
https://doi.org/10.1093/molbev/msw054
[22] Bailey, T.L., Johnson, J., Grant, C.E. and Noble, W.S. (2015) The Meme Suite. Nucleic Acids Research, 43, W39-W49.
https://doi.org/10.1093/nar/gkv416
[23] Chen, C., Wu, Y., Li, J., Wang, X., Zeng, Z., Xu, J., Liu, Y., Feng, J., Chen, H., He, Y. and Xia, R. (2023) TBtools-II: A “One for All, All for One” Bioinformatics Platform for Biological Big-Data Mining. Molecular Plant, 16, 1733-1742.
https://doi.org/10.1016/j.molp.2023.09.010
[24] Magali, L., Déhais Patrice, Gert, T., Kathleen, M., Yves, M., Yves, V.D.P., et al. (2002) Plantcare, a Database of Plant Cis-Acting Regulatory Elements and a Portal to Tools for in Silico Analysis of Promoter Sequences. Nucleic Acids Research, 30, 325-327.
[25] Singh, K., Chhuneja, P., Gupta, O.P., Jindal, S. and Yadav, B. (2018) Shifting the Limits in Wheat Research and Breeding Using a Fully Annotated Reference Genome. Science, 361, eaar7191.
[26] 郑晓瑜, 郭晋艳, 张毅, 等. 植物非生物胁迫诱导启动子顺式作用元件的研究方法[J]. 植物生理学报, 2011, 47(2): 129-135.