如何寻找miRNA靶基因?microRNA(miRNA)是一类能够调节基因表达的短单链內源非编码RNA(约22nt),通过与互补的mRNA选择性地结合抑制蛋白的产生,广泛存在于动物、植物、病毒等多种有机体中miRNA通常位于基因间或者内含子区域,在细胞核内有RNA聚合酶Ⅱ转录产生具有帽子结构多聚腺苷酸尾巴的pri-miRNA在核酸酶Drosha及其辅助因子Pasha的作用下,pri-miRNA被处理成70个核苷酸组成具有茎环结构的pre-miRNA,然后由Exportin 5等转运至细胞质Dicer将pre-miRNA切割成约22nt的双链miRNA,双链miRNA讲解形成单链的成熟miRNA成熟miRNA还需要与Argonaute蛋白等组装形成RNA诱导沉默复合体(RISC),RISC作用于特异mRNA的3’UTR,从而抑制翻译过程或者直接讲解mRNA整个过程如图所示 尽管对miRNA功能的认识还不是非常清楚,但miRNA在许多生物过程中起关键作用,包括发育、细胞分化、增殖、凋亡、肿瘤转移等准确快速地预测miRNA靶基因对于研究miRNA功能以及分析miRNA参与的生物学过程具有十分重要的意义。
目前寻找miRNA靶基因的方法主要有生物信息学以及生物实验方法1、生物信息学方法生物信息学方法主要是利用某种算法对靶基因样本进行评分及筛选生物信息学的方法只是通过算法为研究人员提供可能性最大的参考信息,还需要通过实验进行验证使用计算机预测植物miRNA靶基因比较简单,因为在植物中miRNA与靶基因几乎还是以完全互补配对的方式结合,预测不需要复杂的算法而预测动物miRNA靶基因则存在一定的困难,主要是目前已知的miRNA靶基因及其确切靶点不多,在算法编写时没有足够的已知样本可供参考但是,miRNA与靶基因间的相互作用仍然具有一定的规律性目前常规的算法主要遵循以下几个常用原则:(a)miRNA与靶基因的互补性;(b)miRNA靶位点在不同物种之间的保守性;(c)miRNA-mRNA双链之间的热稳定性;(d)miRNA靶位点不会有复杂的二级结构;(e)miRNA 5’端于靶基因的结合能力强于3’端除了这些基本原则以外,不同的预测方法还会根据各自总结的规律对算法进行限制和优化1)miRanda miRanda是最早利用生物信息学对miRNA靶基因进行预测的软件,由Enright等人[1]于2003年开发设计。
其对3’UTR的筛选依据主要是从序列匹配、miRNA与mRNA双链的热稳定性以及靶位点的保守性三个方面进行分析综合这3条原则,miRanda选取每条miRNA相对的3’UTR中排名前十位的基因,作为miRNA的候选靶基因,对于多个miRNA对应于同一靶位点的情况,miRanda使用贪心算法(Greedy Algorithm)选取其中得分最高且自由能最低的那一对[2](2)TargetScan和TargetScanSTargetScan是Lewis等人[3]在2003年开发的一款用于预测哺乳动物miRNA靶基因的软件,该软件将RNA间相互作用的热力学模型与序列比对分析相结合,预测不同物种间保守的miRNA结合位点TargetScan还引入了信号噪声比来评估预测结果的准确度,所谓信号噪声比即用已知(信号组)和随机生成的miRNA(噪声组)分别对mRNA的3’UTR进行预测,所得靶基因数目的比值随着物种数目的增多,预测得到的靶基因减少,但准确性得到了相应的提高后来,Lewis等人[4]又对TargetScan进行了优化,即TargetScanSTargetScanS在人、小鼠、大鼠的基础上增加了狗(Canis familiaris)和鸡(Gallus gallus)的基因组数据,同时在算法上做了改动。
3)RNAhybridRNAhybrid是Rehmsmeier等人[5]在2004年开发的一种基于分析miRNA和靶基因间形成双链的二级结构,从而预测miRNA靶基因的软件RNAhybrid在实质上是一种经典RNA二级结构预测软件的扩展,能够快速、准确地计算一条短链RNA和一条长链RNA杂交(如miRNA和mRNA 3’UTR)时的自由能,并基于此来预测果蝇中miRNA的靶基因RNAhybrid的算法禁止分子内、miRNA 分子间及靶基因间形成二聚体,根据miRNA和靶基因之间结合自由能探测最佳的靶位点4)DIANA-microTDIANA-microT是Kiriakidou[6]等人于2004年开发的一款结合了生物信息学和实验学方法的靶基因预测软件DIANA-microT主要考虑单一结合位点的miRNA靶基因此外在寻找结合位点时,除了必需的5’端种子区外,典型的中央突起以及miRNA在3’端与mRNA的结合也得到了考虑在算法方面,DIANA-microT主要基于以下两点原则对miRNA靶基因进行判断:首先,通过动态规划算法计算经典的Watson-Crick碱基对及G:U错配的自由能,进而衡量miRNA与靶基因间的结合能力;其次,miRNA相关蛋白影响miRNA与靶基因结合时形成的中央突起的大小与位置,进而影响miRNA与靶基因的结合。
5)PicTarKrek等人[7]在2005年采用一种更先进的算法来预测脊椎动物、线虫和果蝇中miRNA的靶基因,并通过实验方法进行了验证,这种算法就是PicTar,即组合靶位点的概率识别(probabilistic identification of combinations of target sites)PicTar的算法包括两个方面:识别单个miRNA的靶位点;为组合的靶位点评分通过生物信息学和实验方法的分析,PicTar算法估计会有30%左右的假阳性率6)RNA22RNA22是由Miranda等人[8]于2006年开发的一种识别miRNA靶位点以及相应miRNA-mRNA异源双链的软件RNA22与其他miRNA靶基因预测软件不同首先,RNA22的预测不依赖于物种间的保守性,而是认为即使近亲物种不存在miRNA结合位点,仍有可能是miRNA的靶基因;其次,RNA22与其他软件的预测方向不同,RNA22不是从miRNA入手寻找它的靶基因,而是首先从感兴趣的序列入手,寻找假定的miRNA结合位点,再进一步确定其被哪条miRNA调控动物中miRNA靶基因预测方法预测方法网址检索范围算法特点miRandahttp://www.microrna.org/人,果蝇,斑马鱼序列匹配, 双链结合自由能, 物种间保守性TargetScan/TargetScanShttp://www.targetscan.org/人,小鼠,大鼠,狗提出“miRNA种子区”的概念RNAhybridhttp://bibiserv.techfak.uni-bielefeld.de/rnahybrid/哺乳动物快速准确计算miRNA-mRNA二聚体自由能DIANA-microThttp://www.diana.pcbi.upenn.edu/人,小鼠,大鼠,果蝇考虑miRNA调控单个靶位点的情况PicTarhttp://pictar.bio.nyu.edu/脊椎动物区分“完全匹配种子区”与“不完全匹配种子区”RNA22 由mRNA入手预测相关miRNA上述不同算法各有其特点,主要还是依据miRNA与其靶位点的互补性、miRNA靶位点的保守性、miRNA-mRNA双链之间的热稳定性及附近序列的二级结构等原则设计的。
其中,miRanda是将miRNA-mRNA之间的序列匹配,保守性及热稳定性作为计算参数,有比较好的检出率,但是假阳性率也较高;TargetScan提出了“种子区”的概念,增加了预测的精确度;RNAhybrid的研究重点在RNA二级结构预测方面,能够更快速准确地计算miRNA-mRNA双链的自由能,降低了假阳性率;DIANA-microT则主要考虑miRNA调控单个靶基因的情况,同时考虑中央突起以及miRNA在3’端与mRNA的结合;RNA22与其他算法不同,不考虑物种间的保守性,检出率较高2、生物学实验方法由于计算机模拟在预测miRNA靶基因时存在一定的局限性,因此很多学者也希望能够利用生物学实验方法直观地寻找miRNA靶基因1) 从mRNA水平寻找miRNA靶基因(a)miRNA靶基因大规模寻找将miRNA成熟体双链或腺病毒载体转染至细胞中,使得miRNA在细胞中过表达,之后利用基因芯片分析mRNA的变化以找出相应miRNA的靶基因[9]由于miRNA在体内通过翻译抑制或影响mRNA的稳定性起作用,因此这种方法在寻找起翻译抑制作用的miRNA的靶基因时存在一定困难Beitzinger等人[10]利用AGO蛋白家族既能结合miRNA又能结合mRNA的特性,分别使用AGO-1和AGO-2蛋白的单克隆抗体在人类细胞中进行免疫共沉淀,得到与AGO-1和AGO-2蛋白结合的mRNA各600条,并通过克隆测序对这些mRNA进行鉴定。
同时,从与AGO-1蛋白结合的mRNA中随机挑选6条进行荧光素酶报告基因检测,发现其中有5条都是miRNA的靶基因与上述工作类似, Easow等人[11]也是利用纯化miRNP来分析miRNA的靶基因他们利用基因芯片分析了miRNP结合的mRNA后发现,大量计算机预测的miRNA靶基因得到了富集,同时为了分析单个miRNA的靶基因,对野生型果蝇和miR-1缺失果蝇的miRNP结合mRNA进行了分析,得到并利用实验方法鉴定miR-1调节的mRNA,为miRNA靶基因的寻找提供了新的思路b)miRNA靶基因的精确寻找Liu等人[12]在研究Mir-16家族的功能时建立了一种针对miRNA靶基因的反向筛选法首先,确定了感兴趣的基因ccnd1,将它的3’UTR构建到荧光素酶报告载体中,之后与构建的miRNA表达文库共转染HepG2细胞,得到荧光值明显下降的miRNA,再将得到的miRNA在体内验证其功能,最终得到Mir-16家族能够调节CCND1基因该方法的关键在于,利用了自行构建的miRNA表达文库,能够方便同时研究多条miRNA,通过体外实验对候选miRNA进行初步筛选,从而快速地鉴定一条mRNA所对应的多条miRNA。
2)从蛋白质水平寻找miRNA靶基因 由于miRNA所介导的转录后翻译抑制过程不引起mRNA水平的改变,因此依据mRNA水平的变化寻找miRNA靶基因的方法在检出率上存在一定问题Selbach[13]和Baek[14]两个研究组分别利用蛋白质组学的研究方法,建立了从蛋白质水平寻找miRNA靶基因的新方法两个课题组分别将成熟miRNA双链转染HeLa细胞,利用细胞培养稳定同位素标记技术(stable isotope labeling with amino acids in cell culture),将转染了成熟miRNA双链的细胞和正常细胞分别培养于含轻/重型稳定同位素标记必需氨基酸的培养基中,经过若干次细胞倍增后,稳定同位素按照序列特异的方式完全掺入到新合成的蛋白质中,通过比较标记前后同一肽段的质谱峰值变化实现对蛋白质的精确定量,在检测了2000~5000个蛋白后,两个研究组分别发现,转染一条miRNA后有几百个蛋白的表达水平发生了改变,许多改变在mRNA水平上不能得到体现前面提到很多寻找miRNA靶基因的方法,这里也不得不提miRNA靶基因的鉴定与miRNA靶基因的预测方法相比,对miRNA靶基因进行实验验证的方法并。