中华大学生物资讯学系专题报告

上传人:壹****1 文档编号:493496029 上传时间:2023-05-12 格式:DOCX 页数:4 大小:56.63KB
返回 下载 相关 举报
中华大学生物资讯学系专题报告_第1页
第1页 / 共4页
中华大学生物资讯学系专题报告_第2页
第2页 / 共4页
中华大学生物资讯学系专题报告_第3页
第3页 / 共4页
中华大学生物资讯学系专题报告_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《中华大学生物资讯学系专题报告》由会员分享,可在线阅读,更多相关《中华大学生物资讯学系专题报告(4页珍藏版)》请在金锄头文库上搜索。

1、中華大學生物資訊學系專題報告擷取碼的轉換應用於同源序列搜尋The application of transformation of accession numbers to homologous sequence searching 專題組員:李昱賢、蔡承錞、張智堯、曹富凱專題編號:PROJ2023-BIOINFO-9410指導老師:侯玉松老師一、摘要每個蛋白質都有其代號與同源性,而每個蛋白質資料庫中都有其自家的蛋白質擷取碼代號,其主鍵(Primary Key)不同能應用的資料庫當然也不同,為了能轉換各個資料庫的主鍵,我們收集了各資料庫的資料與同源資料加以整理並且建立了對照表,再利用擷取碼對照

2、表與同源對照表,建立我們自己的轉換程式與同源蛋白搜尋程式,最後為了需求者的方便,我們把上述程式加以整合,並且視窗化,完成了一個具蛋白質擷取碼轉換與同源搜尋功能的整合程式。二、簡介由於有些研究者在研究蛋白序列時,取得了資料庫的蛋白質擷取碼後,如果想再另外的資料庫上搜尋時,有時會因為兩種資料庫的命名擷取碼方式不同,造成研究者在不同資料庫中做搜尋時,會發生擷取碼無法對照或找不到該擷取碼的困擾,所以本專題主要目的是嘗試用程式來轉換擷取碼,讓研究者可以透過程式,來轉換自己所需的擷取碼,以便可以在另外的資料庫中使用。另一方面研究者在轉換所需擷取碼之後,我們提供該擷取碼的相關同源蛋白,讓研究者不僅可以知道各

3、個資料庫的蛋白質擷取碼並且可以讓他們進一步了解這些蛋白質擷取碼的相關性,不在需要到網站上做搜尋,只需要藉由程式就可以達到目的。三、專題進行方式(一)蒐集資料泼1.河何謂麻擷取轨碼?像擷取岩碼就盾像是流資料诱庫中商的主兵鍵(辉Pr择im厉ar判y 糖Ke辜y)块,而细Pr势im辆ar不y 捏Ke向y的葛作用屯是尋时找或键查詢俩資料桐的主讽要依狐據,幻任何仗候選丈鍵都皮可當禽主鍵结,但剖只能学有一确個主较鍵,浇以鑰自匙狀现的標戴記表题示主欣鍵值秆。豪所以普每個裕擷取敬碼就衫像我避們的砍身分酱證字须號一套樣,回是獨寿一無蝇二的夸,我骨們可慕以依释據擷举取碼婆,找答到我喇們需得要的灯蛋白转質序格列。水

4、2药.擷有取碼肝轉換续資料贸PI据R(效Pr炕ot柜ei婆n撑In骂fo辩rm缩at析io晓n 编Re令so润ur竹ce替)為惨PI凳R-亭In鼻te蜻rn魔at爬io脾na骂l這头個大许分子偶序列累資料框收集闹中心熄所維录持的我蛋妨白网質序佳列資别料庫奴此中馆心包奉括N雨at棍io烧na夸l 芦Bi糠om幼ed接i各C夫al颂Re礼se窑ar趋ch警Fo辉un揉da速ti蓄on继(N最BR拆F)猜Pr藏ot鹿ei旦n兄In搅fo窝rm演at搅io捎n舰Re掩so黄ur覆ce朵(P党IR古),德日本输Ja蚀pa屯n 纸In肢te弱rn泉at或io目na攀l 驳Pr支ot授ei国n 瓣In切fo

5、散rm御at廊io即n 题Da穗te好ba驰se茄 M义ar朝ti乱ns礼cr石ie惑d 叼In秘st语it冈ut雄e 果fo叙r 锁Pr竖ot往ei长n 骑Se仇qu吐en让ce校(M沫PS熄)喊 提打供了蝴我們推各個掀資料脉庫轉福換成阻un肿ip牌or农t的尖資料罩。(爬圖一窗)末(松ht捏tp件:/递/p嚼ir贼.g俘eo兆rg走et肤ow询n.惠ed岔u/纹pi渗rw简ww箩/i颜nd耐ex垮.s花ht创ml苗)该圖一吓:P昌IR呆擷取励碼轉够換範症例哭例如炸紅框捷處分猜別為盗 G喘I資仰料庫温裡的颈65虎3 牛04剖09景5與湾 E耽MB减L 乐資料绕庫的伏CR扑94没03立53戒轉

6、換猜成u兴ni尿po纹rt第的擷垄取碼致為Q泻4U纵9M盖9。殖3勺.同昨源蛋烂白質腹資料氧In姥pa棚ra园no万id与(隶ht迈tp哗:/王/i青np畅ar差an替oi码d.躁sb虹c.混se怎/c胜gi脆-b沾in初/i父nd兆ex轨.c胸gi务)裡帝面有惯物種增對物迷種的晨同源百蛋白坦序列朴資料呈,本咬專題惧由此潜資料严庫擷胜取酵尚母菌虑(S咽.c汇er芝ev巡us貌ia路e)睡、耀線池蟲周(C脖.e祖le涨ga乒ns身)、臣果蠅案(D浙.m烘el湾an倒og晶as咸te涝r)燕、阿狂拉伯盟芥(非A.剪th验al煤ia昆 n醉a)醋、人羽類(终H.邻sa穷pi惊en爷s)根、大盏腸桿拥

7、菌(血E.棚co忧li闸k1台2)渣的同选源蛋料白配共對資楼料。努共包屋括了堆57洲92底個酵侮母菌理蛋白分質、柿26耗81狭9姨個阿贸拉伯游芥蛋尺白質删、册20臭08纲4葛個線狠蟲蛋师白質兆、思13嚷85月4览個果樱蠅蛋裳白質智、妖22宇(圖茶二)雷。越圖二再:I肥np隆ar竭an绢oi命d肚同源僚蛋白技資料妻範例朽例如扒紅框起中赌編號宜1的提群組并,為哲人類照的E陈NS祝P0罗00谁00胜37热15命26哪蛋白乌質與食阿拉专伯芥要的A租T受4G敏37默88吉0.庸1、戒AT苗1G锹80灭07图 0肚.1恩具兼有同鸡源關料係煌。而谣HO塔MS染A為附Ho祝mo苏 s凉ap刚ie餐ns编的縮寺

8、寫某,縮述寫方避式為弱取淋Ho谈mo期的前侨面三抓個字辆母與伯sa染pi偿en罪s前录面兩洽個字兴母饺,其站他物易種也桶是以尊此方释式進冈行縮次寫。怕(缠二忍)眨專題扑進行勿本專揪題為奥了讓嫁在研竭究過邪程更馅有計佛畫,怕並且辉進行但重點狡式的谣研究瘦,所隙以製赚作了争專題摸流程边表(摧表一纠)。睁表一摩:專艺題流屠程圖变(1炭)進现行資团料整危合蹄由於兴PI震R陡提供熔的資投料過扔於凌萌亂(活圖一茅),秀所以脾我們宋利用强程式广,先县進行岔整理妖,凶整理餐出7荐個資圈料庫这對應选UN稳IP属OR灯T的被擷取呀碼董,塞例如野CY与GD铜有6霜64低4筆段、辩Wo富rm森ba甲se相有2虏28支

9、33训筆玩、阵TA偶IR刑有2渔64正59三筆 矿、烟En孔se稻mb巷l有甚22洪35葬68才筆吸、因di舅ct呼yB凯as死e有钢12珠75压0筆辫、柜Fl妖yB昏as徒e脉有屑38猛72察4筆栋、射ZF忙IN筝有1变81读58佛筆本。尖(妇圖三陡)艘圖晒三娇:里例如赶紅框革中充Wo建rm迈ba串se别裡 唯WB洽Ge章ne写00巾01唐20淘15笑對應肥un些ip派or茶t擷俭取碼没為Q乐17脊76羞1妻。抬(2汁)商設計仔擷取恢碼對凭照叠程式漫在轉丘換方坝面,右為了营在龐客大的征資料敏裡蒐挺尋我与們所呜需要设轉換辽的擷占取碼伟,在并眾多落的蒐燥尋法竭裡,绞我們录選擇复使用粒二分距搜尋蛙

10、法(漆Bi掀na坑ry酬 s庆ea滩rc网h)溉來進活行搜叙尋。骂而如症果要鉴利用非二分澡搜尋智法,淘其資咱料需善要經职過排胜序,够在處拉理資坡料上葬,我誉們使滩用快海速排业序法门(Q拴ui载ck填 S缩or爪t)叛來進汤行排厚序。舞利用渴快速漏排序辆法,富將資卷料經咳過排稼序後推,再痰由二速分搜唐尋法奏來對演我們纷欲搜骄尋的渠目標燃進行违搜尋泡。誓(3彩)三建立皇擷取步碼轉思換表险有了勺以上银各個吉資料潜庫對挂應的瞎擷取奖碼,卸再利恭用程凳式艘建立键擷取进碼轉夕換表五,例咽如我棒們要盾把裁Wo竭rm逼ba盆se书中的傻WB温Ge欲ne筹00乏01像20猫15渔轉換静成E旅ns唯em谋bl况的

11、擷糕取碼脑,搜伍尋出立WB翻Ge迎ne闭00牛01秆20秩15蜘對應命un艰ip帮or钩t的燃擷取说碼為信Q1位77斑61鞭(圖闪三眠)柴,再心從E勉ns绿em骑bl燃_u茅ni便po厌rt饲中搜枯尋出榜Q1肚77罚61拐的對奏應擷风取碼免為火T2燥5B驼9.拆9嫩,所盈以涉Wo适rm脚bs县ae毕的裤WB吃Ge廊ne煤00溜01旁20隶15始在E垃ns故em白bl咐裡的乏擷取吨碼為势T2蹈5B禾9.糖9跃。辈(凉圖四讨)骂圖落四阴:例俩如紅采框中诱得知隆En豆se疾mb摊l裡喂T2缩5B绪9.侵9的添un别ip俘or编t擷浮取碼抬也是巴Q1钢77娘61器。越(4酬)設沃計搜膊尋同洁源資刻料程

12、刚式忠在整晕理I村np型ar柔an升oi魂d同方源資究料時底,我驶們在趴程式深一開彩始設卖計兩堤個2宇維处陣列撤(設暂為b棚uf定_w渣or挎m與燃bu并f_克ye傻st团),淡用來俊暫存际我們石搜尋净到的邮擷湖取碼威,接悟著我适們用芬雙重缺迴圈盏寫入馋檔案胀,以那圖六糕為例针線蟲庆(C航.e梨le蔽ga嘉ns顽)中摄WB因Ge钱ne经00营01乐20丹15希的蛋咸白質俯與式果蠅椒(F拿ly查 b干as誉e)潜的咬FB半pp勺00饼70部36遮8元經程坐式建而立之业後為杨圖七贷的對软照表匪(5杀)泊同源身對照敬表惭範例毙我們锅舉一液個例贤子來拆說明祝,假柄設拾使用屠者想辆要搜冒尋甜線蟲改(C饱

13、.e闭le外ga惰ns出)觉中潜WB伪Ge婚ne切00龟01锦20裙15绢擷取胃碼桑和果董蠅(罢Fl妈y 王ba萌se掀)夕的同贝源蛋认白杠擷取形碼窃,航然後军再將水這擷瓜取碼故輸入讨程式龄之中柴,找涝到音果蠅看的同萄源蛋临白擷变取碼应為储FB棋pp泳00娃70谋36露8节(撞圖五旋)炸圖亲五协:例丰如紅杏框中开為慎線蟲脖蛋白忍擷取服碼為宋WB羡Ge漆ne孝00动01被20哲15歪而找细出果下蠅的舒同源捏蛋白位擷取设碼為扛FB嘴pp添00签70矩36某8匙。气圖六如:紅双框中圾顯示用線蟲劫與果欠蠅為疫同源要蛋白伙的轉却換表美。绿在贞物種武的同阻源蛋衡白之短中有页些蛋观白會置有一锣對一激(垃圖七

14、救)同涉源性师。忆圖七亏:紅谷框中董顯示诊線币蟲的剪WB双Ge务ne断00偏00激4享20担9吼、轨WB吹Ge梯ne驰00平00向42非10仪與W趁BG策en圾e0痰00值0味42鸟08诉擷取成碼與箭果蠅爸的侄FB里pp沙00征88虫44蓝3困同源笛。装(6糕)程认式視酸窗化僻我們邀將上爹述的牲所有邻方法贫統整逢於一乒個視执窗程肯式之引中,份並且当利用蹦了塑C+撕+ 称Bu次il航de赔r恰中的郑元件闭,例痕如B卵ut娱to绿n、秒co蓬mb身ob性ox循、e烦di坑t、贫ri看ch额 e墙di摧t元作件來沫達成耕視窗伯化的悦目標馒,最岁後使扬用者兼只要胁輸入搅蛋白茧質愚擷取坡碼,亏就可腿以找

15、轮到想鸦要查桌詢資卷料庫产的擷瓶取碼牛,並停且列乳出其勺同源赢關係纺。岔這樣效子我沙們就偶能將打這些六在網醉站上铺繁雜组的資惧料搜烛尋精茂簡化难,增搬加使注用者烂搜尋晋的便烤利性届,減剩少花黎費把矩找到艺後的联擷取著碼再镜貼到艘找同批源網扶站的颤複雜凡性與纯時間你。树(7剑)測虏試程恳式阵最後跨程式带執行矮畫面煎如圖聚八汤。桨圖八晌: 扎程式墓執行胃畫面乳最後闷在視套窗化翻後,雾測試么看看饼在輸岁入擷传取碼录畫面犹中輸仗入T瓜25介B9很.9水下拉坛式選今單裡剂的資添料庫碍纇別殊選E捎ns贪em哨bl尽,然浑後再惧輸出牙擷取厌碼那伴裡的暖資料蒸庫類汪別選菠Wo议rm于ba屯se限,最偷後在动執

16、行草後,碌成功毒的再级輸出让擷取植碼畫法面裡往跑出蓬他在常裡的此擷取幻碼為绵WB骨Ge占ne备00逐01扎20识15凑。晕搜讽若是烘使用唤者想僻進一御步了所解該拆擷取依碼的格同源岛蛋白碍,在御按同很源搜索尋鈕雷,就脆可以阔在輸起出視跟窗得宇到相滚關資好料。铅(三拌)主养要困更難锡與解默決之窗道桃(1剑)壮專題跳進行麦初期离最大兆的困戒難是窝沒有扇相關扶的資泛料辈。敢在不衣斷的坏搜尋皮中,洽最後愿在P末IR耽網站尤與I粮np伶ar厕an饲oi撞d轿中找贝到索相關再的資千料鹿,才捧得以脆開始旬設計钩程式黄,轨然後艳進行锦對照怒表建茧立。冒(2钳)仰獲得帮網站愤提供渴的句資料规後,乎發現沙資料帆過於污龐大接與雜是亂脸。者於是伴我們醋設計睬一個镰可以冻建立挽對照唤表的阅程式集,來篮建立隶我們基自己旷所需港的轉哈換表伸,使从得資有料倍得到唯整合烫。且(3秒)鲁

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 金融/证券 > 财经资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号