二级结构(生物学等学科中的生物巨分子)
VLoG
次浏览
更新时间:2023-05-22
二级结构
生物学等学科中的生物巨分子
基本信息
中文名 | 二级结构 |
外文名 | secondary structure |
学科 | 生化 |
含义 | 生物巨分子 |
概述
二级结构在生物化学及结构生物学中,是指一个生物巨分子,如蛋白质及核酸(DNA或RNA),局部区段的三维通式。它并不描述任何特定的原子位置,而这会在三级结构中处理。
详细信息
由于氢键与其他结构特征有所关联,所以它所定义的二级结构会稍为不正式。就如蛋白质螺旋,在拉曼强传标绘图的特定区域,通常会采用主链二面角。这样,以这个二面角的区段都会被称为“螺旋”,而不论它是否真正的氢键。其他稍为不正式的定义亦有被建议,且是多是应用曲线微分几何的观念,如曲率及扭量。而最不正式的,要算是结构生物学定以肉眼来决定及纪录原子量级的二级结构。
编号
DSSP是“Define Secondary Structure of Proteins”的缩写,它是一编文章正式列出已知三维结构的蛋白质二级结构。DSSP编号一般是用单一英文字母来描述蛋白质二级结构。二级结构是根据氢键模式来指定的。
G:3转角螺旋(亦即310螺旋)。最短长度为3个残基。
I:5转角螺旋(π螺旋)。最短长度为5个残基。
T:氢键转角(3、4或5个转角)。
B:独立β桥内的残基(一对β折叠氢键)
S:弯曲(唯一非氢键的指定)
所有不是以上形态的残基,在DSSP都是以空格来指定的,而有时则以C来代表卷曲或L来代表环。螺旋(即G、H及I)及折叠形态都需要一定的长度。这即是指两个在一级结构邻接的残基必须形成相同的氢键模式。如果螺旋或折叠的氢键模式太短,就会分别以T或B来编码。当中亦有其他蛋白质二级结构编号,但却较少使用。
蛋白质二级结构预测
早期蛋白质二级结构预测的方法是建基于氨基酸形成螺旋或折叠的倾向,而有时须联同估计形成二级结构的能量的方法来使用。这些方法在预测残基的三种状态(螺旋、折叠或卷曲)可以有约60%的准确性,若使用多序列比对可以将准确性大幅提升至80%。多序列比对可以知道氨基酸在某一位置的完正分布(包括在其附近的位置,一般在每一边的7个残基),而演化过程提供了结构趋向更明确的图画。例如,在蛋白质某位置的甘胺酸,本身已表明那是一个任意形。但是多序列对比可以发现,在接近十亿年演化后95%的蛋白质中,那是一个有利螺旋的氨基酸。再者,若在那位置检测平均疏水性,亦会发现其残基可溶性是与α螺旋一致。综合来说,这些因素显示原先蛋白质内甘胺酸是α螺旋结构,而非任意形。多种方法都会结合已有的数据来组成三种状态的预测,这些方法有神经网络、隐马尔可夫模型及支持向量机。现代预测方法亦可在每一个位置的预测结果提供信赖分数。
二级结构预测方法一直不断地在校准,例如EVA实验。基于约270个星期的测试,最准确的方法要算是PsiPRED、SAM、PORTER、PROF及SABLE。有趣的是,在这多种方法中找出共识或一致,并不能提升它们的准确性。最大改善的地方似乎是在β股的预测,因为所使用的方法会忽视一些β股段。整体上而言,最高的预测准确性只可以达90%,因DSSP的标准方法的性质,与校准的预测相违背。
准确的二级结构预测是三级结构预测的重要原素。例如一个确定的βαββαβ二级结构模式,就是铁氧化还原蛋白的记号。
蛋白质
核酸
核酸亦有二级结构,大部份都是单股核糖核酸(RNA)分子。RNA二级结构可以分为螺旋(紧接的碱基对)及不同种类的环(被螺旋围绕的不成对核苷酸)。茎环结构是一个碱基对螺旋结构,末端为短少的不成对环。这种茎环结构非常普遍,并且是建构大型结构基元,如三叶草结构(即如在转运RNA中的四个螺旋结点)的基本单位。内环结构(在长碱基对螺旋中的短而不成对碱基)及膨出(在螺旋股中额外插入,但却在相对股中没有配对的碱基)亦很经常会出现。最后,伪结及base triples亦会出现在RNA。
由于RNA二级结构差不多全都是由碱基对作为中介,它可以说是确定在一个分子或复合物中哪些碱基成对。但是,传统的华生—克里克碱基对并非唯一在RNA的配对方法,霍氏配对方法亦很普遍。
结构
生物信息学的其中一种应用是使用预测的RNA二级结构来搜寻用作RNA功能形式而非编码的基因组。举例来说,小分子RNA有着由小内环中断的长茎环结构。计算可能的RNA二级结构可以用动态规划方法,但是它不能侦测出伪结或是其他碱基对没有全面网罗的情况较通用的方法有随机上下文无关语法。Mfold是一个使用动态规划的网站。
比对
蛋白质及RNA二级结构都可以用在协助多序列比对。这种比对在加入有关的二级结构资料后,可以变得更为准确。但有时对RNA却不太有用,这是由于RNA碱基对比序列更受到高度保存。一些不能比对一级结构的蛋白质,二级结构有时亦可以找出它们之间的关系来。