Hi-C数据处理分析的利器Juicer是怎样的,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
廊坊网站建设公司成都创新互联,廊坊网站设计制作,有大型网站制作公司丰富经验。已为廊坊千余家提供企业网站建设服务。企业网站搭建\外贸网站制作要多少钱,请找那个售后服务好的廊坊做网站的公司定做!
通过Hi-C数据可以分析TAD,chromatin loops等染色质空间结构的基本单元,加强我们对染色质三维结构的认知。面对海量的Hi-C数据,如何高效完成数据分析成为了一个挑战。
目前针对Hi-C数据的分析也有很多的软件可以用,而juicer无疑是使用的最广泛的软件之一。该软件的源代码托管在github上,
如下图所示,和其名字一样,juicer就像是一款榨汁机,输入Hi-C产生的原始fastq数据,经过层层加工,直到产生有效的数据分析结果。在整个数据分析过程中,使用者不需要高深的编程技巧,只需要一些基本的操作规范,人人都可以使用该软件来分析Hi-C数据。
juicer作为一款强大的分析软件,有以下几个特点
可以分析处理TB级别的海量数据,可以有效利用FPGA, GPU,集群等硬件资源来加速处理速度
提供了数据预处理,交互图谱创建和可视化,TAD和染色质环结构预测等一些列完整的pipeline
简单易用,不需要复杂的背景知识
该软件按照功能拆分成了三个大的分析步骤,依次运行即可得到最终的分析结果
数据预处理,将原始的fastq序列比对参考基因组,识别其中的valid pairs, 并生成一个后缀为hic的文件
读取hic文件,创建可视化的交互图谱,也称之为contact map, 并进行归一化
采用算法预测TAD和染色质环等结构
完整功能示意如下
juicer采用ArrowHead算法对原始的交互矩阵进行转化,并预测TAD拓扑关联结构域,采用HiCUUPS算法识别染色质环chromatin loops。和其他Hi-C数据处理软件相比,juicer的功能更为齐全
juicer独创了一种名为hic
的文件格式,用来存储Hi-C数据的相关信息,这种格式是一种高度压缩的二进制文件格式,在以下链接可以查看这种格式的详细信息
https://github.com/theaidenlab/juicebox/blob/master/HiC_format_v8.docx
在后续的文章中,会详细介绍该软件的用法。
关于Hi-C数据处理分析的利器Juicer是怎样的问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。
文章题目:Hi-C数据处理分析的利器Juicer是怎样的
文章转载:http://scyingshan.cn/article/pgihep.html