|
统计获得的经验说明,DNA 中密码子的使用频率不是平均分布的,某些密码子会
以较高的频率使用而另一些则较少出现。这样就使得编码区的序列呈现出可察觉的
统计特异性,即所谓的“密码子偏好性”。利用这一特性对未知序列进行统计学分析
可以发现编码区的粗略位置。这一类技术包括:双密码子计数(统计连续两个密码
子的出现频率);核苷酸周期性分析(分析同一个核苷酸在 3,6,9,...位置上周期性出现
的规律);均一/复杂性分析(长同聚物的统计计数);开放可读框架分析等。
常见的编码区统计特性分析工具将多种统计分析技术组合起来,给出对编码区的综
合判别。著名的程序有 GRAIL 和 GenMark 等,GRAIL 提供了基于 Web 的服务。
GRAIL 的网址是:http://compbio.ornl.gov/Grail-1.3/。
|
|