circos教程

上传人:xmg****18 文档编号:145409727 上传时间:2020-09-20 格式:DOC 页数:34 大小:3.64MB
返回 下载 相关 举报
circos教程_第1页
第1页 / 共34页
circos教程_第2页
第2页 / 共34页
circos教程_第3页
第3页 / 共34页
circos教程_第4页
第4页 / 共34页
circos教程_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《circos教程》由会员分享,可在线阅读,更多相关《circos教程(34页珍藏版)》请在金锄头文库上搜索。

1、. . rcos为了能准确地画出染色体示意图,染色体的定义,位置,大小,以及显示的形式都是circos需要考虑的。这些要素需要在数据文件当中定义出来。数据结构染色体组型(karyotypes)是一类特殊的数据。一般的,它保存在名为xx.karyotype.txt文件当中。它将定义染色体的大小,ID,名称和颜色。每一行一条染色体,格式如下:chr - ID LABEL START END COLOR最开始的chr表示,这一行将定义一个染色体。然后是一个短线占位符。这个占位符通常用来定义所属关系,对于染色体来说,没有所属。ID是染色体唯一且不能重复的标识。之后的LABEL是将来用于显示在图上的文本

2、。如果一个染色体组型文件里面包含多个不同来源的染色体组,设置ID最好的办法就是使用前缀。比如hs=homo sapiens, mm=mus musculus等等。有时候你可以使用hs19做为前缀来明示数据来源版本。其实,即使是只有一个来源的染色体组,也最好使用前缀,以规文件格式。START和END值定义了染色体的大小。对于染色体组型文件,需要指明的是,这里的START和END应该是染色体本身的大小,而不是你想绘制部分的起止位置。指定绘制部分将由其它文件来定义。COLOR是于定义显示的颜色。如果染色体组不以条纹(cytogenetic bands)图谱覆盖的话,那么就会以这里设置的颜色显示。对于

3、人类基因组而言,circos预设了与染色体相同的名字做为颜色名,比如chr1, chr2, chrX, chrY, chrUn.下面就是hg19的例子:chr - hs1 hs1 0 249250621 chr1chr - hs2 hs2 0 243199373 chr2chr - hs3 hs3 0 198022430 chr3chr - hs4 hs4 0 191154276 chr4chr - hs5 hs5 0 180915260 chr5chr - hs6 hs6 0 171115067 chr6chr - hs7 hs7 0 159138663 chr7chr - hs8 hs8

4、0 146364022 chr8chr - hs9 hs9 0 141213431 chr9chr - hs10 hs10 0 135534747 chr10chr - hs11 hs11 0 135006516 chr11chr - hs12 hs12 0 133851895 chr12chr - hs13 hs13 0 115169878 chr13chr - hs14 hs14 0 107349540 chr14chr - hs15 hs15 0 102531392 chr15chr - hs16 hs16 0 90354753 chr16chr - hs17 hs17 0 811952

5、10 chr17chr - hs18 hs18 0 78077248 chr18chr - hs19 hs19 0 59128983 chr19chr - hs20 hs20 0 63025520 chr20chr - hs21 hs21 0 48129895 chr21chr - hs22 hs22 0 51304566 chr22chr - hsx hsx 0 155270560 chrxchr - hsy hsy 0 59373566 chry一般的,我们都会在染色体组型文件当中加上条纹图谱的信息,这样才会让染色体图谱看上去有被染色的效果。文件格式与之前的一致,也只有七列。band DO

6、MAIN ID LABEL START END COLOR这里的DOMAIN就是染色体组型当中的ID就好了,其它的定义与前面的一致。下面就是一个例子。band hs1 p36.33 p36.33 0 2300000 gnegband hs1 p36.32 p36.32 2300000 5400000 gpos25band hs1 p36.31 p36.31 5400000 7200000 gnegband hs1 p36.23 p36.23 7200000 9200000 gpos25band hs1 p36.22 p36.22 9200000 12700000 gnegband hs1 p3

7、6.21 p36.21 12700000 16200000 gpos50band hs1 p36.13 p36.13 16200000 20400000 gnegband hs1 p36.12 p36.12 20400000 23900000 gpos25band hs1 p36.11 p36.11 23900000 28000000 gnegband hs1 p35.3 p35.3 28000000 30200000 gpos25band hs1 p35.2 p35.2 30200000 32400000 gnegband hs1 p35.1 p35.1 32400000 34600000

8、gpos25band hs1 p34.3 p34.3 34600000 40100000 gnegband hs1 p34.2 p34.2 40100000 44100000 gpos25band hs1 p34.1 p34.1 44100000 46800000 gnegband hs1 p33 p33 46800000 50700000 gpos75band hs1 p32.3 p32.3 50700000 56100000 gnegband hs1 p32.2 p32.2 56100000 59000000 gpos50band hs1 p32.1 p32.1 59000000 6130

9、0000 gnegband hs1 p31.3 p31.3 61300000 68900000 gpos50band hs1 p31.2 p31.2 68900000 69700000 gnegband hs1 p31.1 p31.1 69700000 84900000 gpos100band hs1 p22.3 p22.3 84900000 88400000 gnegband hs1 p22.2 p22.2 88400000 92000000 gpos75.cytogenetic bands的名称例子:1p36.33 其命名规则是之前的数字、字母为染色体代号,一般是数字或者X,Y。而之后会有

10、字母p或者q。p代表短臂,q代表长臂。而每个band都会有颜色深浅的不同,这里主要以gpos和gneg来区别。为了和真实值更接近,circos还定义了一系列的灰度。设置文件circos的设置文件可以分为多个文件,也可以只写在一个文件里。一般地,为了人们阅读方便,都会写在多个文件,每个文件描述不同的部分,最后由一个主文件来调用就可以了。这一节,需要设置三个方面,一,数据源,二如何画染色体,三如何画坐标,所以我们也将它分为三个文件,分别名为circos.conf, ideogram.conf,和ticks.conf。由circos.conf来定义数据源,并调用ideogram.conf和ticks

11、.conf。circos.conf的容white = 255,255,255black = 0,0,0blue = 0,0,255 # specify the karyotype file herekaryotype = karyotype.human.hg19.txt chromosomes_units = 1000000chromosomes_display_default = yes 这里可以注意到它引入其它文件时使用的是的方式。注意,这里include会从circos所在的目录开始寻找,而不是当前目录。我们可以在circos的安装目录当中找到一个名为etc的目录,可以点击查看其中的co

12、lors.ucsc.conf,image.conf,以及housekeeping.conf的容。在circos当中使用karyotype=xxx语句来定义了karyotype的数据来源。chromosomes_units=1000000定义了基准单位。可以试着把这个值扩大10倍。接下来我们看ideogram.conf。在ideogram.conf文件中,定义了如何显示染色体组型。 default = 0.005rbreak = 5u #position configurationradius = 0.90rthickness = 100pfill = yesfill_color = black

13、stroke_thickness = 2stroke_color = black #label configurationshow_label = yeslabel_font = boldlabel_radius = dims(ideogram,radius) + 0.07rlabel_with_tag = yeslabel_size = 36label_parallel = no #band configurationshow_bands = yesfill_bands = yesband_stroke_thickness = 2band_stroke_color = whiteband_transparency = 0 在ticks.conf当中定义了如何来绘制刻度。show_ticks = yesshow_tick_labels = yes skip_first_label = noskip_last_label = noradius = dims(ideogram,radius_outer)tick_separation = 3plabel_separation = 1pmultiplier = 1e-6color = blackthickness = 4psize = 20p spacing = 1ushow_label = nothick

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号