PacBio长read纠错方法

王闯
创建于2023-05-15
阅读 202
收藏TA

需扫码在手机上打开
文章后点击更新提醒

PacBio长read纠错方法


是的,PacBio长read纠错算法主要有以下几种:


1. PBcR:这是一种自纠错算法,利用PacBio自带的PBjelly模块对长read进行纠错,并且结合短read信息来提高纠错效果。


2. FALCON(Overlap-Layout-Consensus):这是一种基于重叠图比对的自纠错算法,通过构建长read之间的重叠图,再通过overlap、layout和consensus三个过程来进行纠错。


3. Canu:这也是一种自纠错算法,采用了最近邻链递推(NLCT)算法来构建长read的精确匹配,并且引入了多种过滤策略来提高比对准确性。


4. PacBioToCA:这是一种混合纠错算法,采用遗传算法对长read进行优化,并且利用了Illumina短read的纠错思想,将长read拆分为多个子序列进行纠错。


5. LSC:这也是一种混合纠错算法,采用遗传算法和从头组装、参考对照两种策略进行纠错,对低质量长read的纠错效果较好。


6. ECTools:这是一种基于错误矫正的贝叶斯框架的混合纠错算法,利用长read机器错误分类的准确性来进行纠错。


7. LoRDEC:这是一种利用Illumina短read信息的辅助纠错算法,利用短read对长read进行校对和修剪,并且结合DE Bruijn graph技术来进一步提高纠错效果。


8. Proovread:这也是一种基于短read的辅助纠错算法,针对长read进行操作并构建其consensus序列,从而提高长read的精度。


9. NaS:这是一种利用神经网络模型的混合纠错算法,通过端到端的训练和过滤来优化长read。


以上这些算法在PacBio长read数据纠错中被广泛使用,可以根据不同需求选择适合自己的纠错方法。

阅读 202
文章由 美篇工作版 编辑制作
投诉