《计算生物学重点》由会员分享,可在线阅读,更多相关《计算生物学重点(2页珍藏版)》请在金锄头文库上搜索。
1、名词解释(共 21 分,每小题 3 分):Motif/部分酶切/贪婪算法/无根树/汉明距离/有向无圈图/Open reading frame/Intron/exon /限制性酶切图谱/穷举搜索算法/大 O 记号/缺口罚分联配/有根树/反序排序法选择题(共 20 分,每小题 2 分) ;填空题(共 14 分,每空 1 分) 矩阵和数组的加、减、乘、除;矩阵中元素的引用,绘制不同图形使用的函数, 什么是 for, while 循环等等。 给定序列 t 条,如何计算剖面矩阵得分,汉明距离。什么是反序排序,断点 若 8 为引入缺口罚分, 2 为缺口中每个字符的罚分,则序列中 5 个连 续的单字符缺口罚
2、分之和为 。蛋白质序列比较的常用得分矩阵有 和 。 菲波那契问题中第 8 个菲波那契数 F(8)是 。计算题(共 30 分,每小题 10 分) ;论述题(共 15 分) 1考虑部分酶切, ,以下为已知的任意两个酶切位点之间片段的长度集合 L1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 5, 5, 6, 7, 7, 7, 8, 9, 10, 11, 12 求解 L 的部分酶切问题(即寻找 XL 的 X) ,即酶切图谱上所有酶切位点 的位置的集合,包括开始和结束。2现有两条序列分别是 v = TACGGGTGA 和 w=GGACGTACG,假设匹配得分=1,错配得分=2,空位罚分=1
3、,利用动态规划算法对这两条序列进行全局比对,画出对应于计算过程的得分矩阵及最优路径,并给出这两条序列最终的比对结果。3现有两条序列 v = TACGGGTGA 和 w=GGACGTACG,假设匹配奖励为+1,错配罚分为2 和插缺罚分均为 1.填写序列 v 和 w 之间的局部联配的动态规划表。并给出这两条序列局部比对的最终结果。 5.利用反序设计一个排序 基因组的近似算法(即将它变换成恒等 排列) (书写伪代码) ,并估计该算法的性能保证。 6.对于发现基序和寻找中间字符串问题,穷举搜索法 /分支定界法/贪婪算法/ 动态规划法需要运行的时间(即算法复杂度)分别是多少?各方法的优缺点 是?3给定一棵树 T,其每片叶子是由 4 个字母(A T C G)所标记,44 阶的可加权得分矩阵如下表,求解树 T 最小化加权简约得分的内部顶点的标记。2给定一个 44 阶的可加距离矩阵 D,求解一棵符合 D 的含有 4 片叶子的 加权无根树 T,列出计算过程。