Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
guest: Алексей IP-штамп: fr66i0.zZ1ERY гость |
Задача: сделать референсную сорку транскриптома морского вторичноротого, для чего было скачано много-много ридов с SRA, а также свои, после чего они все были очень жестко почищены по качеству. Проблема: даже после пропуска через корректор ридов BayesHammer и последующей сборки (SPAdes), оказалось, что есть много-много почти одинаковых (>99%) на нуклеотидном уровне контигов. Предположение: риды хоть и одного вида, но разных популяций, видимо много полиморфизмов и всяких снипов. Собственно вопрос: как преодолеть проблему, чтобы качественно решить задачу? Просто удалять дубли не хочу, иначе уже не референс будет. Пробовал делать много итераций (5) коррекции (стандартно 1) Есть вариант попробовать делать несколько итераций сборки с постоянным повышением размера k-мера, либо сделать еще больше итераций коррекции. |
guest: great IP-штамп: frj5GEfdEWR5M гость |
|
guest: 123 IP-штамп: frJhOCvSv9ICE гость |
|
guest: 123 IP-штамп: fr4iy3.kHUw02 гость |
|
guest: 123 IP-штамп: frXqkB4MpP2jQ гость |
|
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |