PacBio长read纠错方法

王闯

创建于2023-05-15

阅读 207

PacBio长read纠错方法

是的，PacBio长read纠错算法主要有以下几种：

1. PBcR：这是一种自纠错算法，利用PacBio自带的PBjelly模块对长read进行纠错，并且结合短read信息来提高纠错效果。

2. FALCON（Overlap-Layout-Consensus）：这是一种基于重叠图比对的自纠错算法，通过构建长read之间的重叠图，再通过overlap、layout和consensus三个过程来进行纠错。

3. Canu：这也是一种自纠错算法，采用了最近邻链递推（NLCT）算法来构建长read的精确匹配，并且引入了多种过滤策略来提高比对准确性。

4. PacBioToCA：这是一种混合纠错算法，采用遗传算法对长read进行优化，并且利用了Illumina短read的纠错思想，将长read拆分为多个子序列进行纠错。

5. LSC：这也是一种混合纠错算法，采用遗传算法和从头组装、参考对照两种策略进行纠错，对低质量长read的纠错效果较好。

6. ECTools：这是一种基于错误矫正的贝叶斯框架的混合纠错算法，利用长read机器错误分类的准确性来进行纠错。

7. LoRDEC：这是一种利用Illumina短read信息的辅助纠错算法，利用短read对长read进行校对和修剪，并且结合DE Bruijn graph技术来进一步提高纠错效果。

8. Proovread：这也是一种基于短read的辅助纠错算法，针对长read进行操作并构建其consensus序列，从而提高长read的精度。

9. NaS：这是一种利用神经网络模型的混合纠错算法，通过端到端的训练和过滤来优化长read。

以上这些算法在PacBio长read数据纠错中被广泛使用，可以根据不同需求选择适合自己的纠错方法。