Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
Nemestnyi |
Для анализа нуклеотидных последовательностей вроде как существует множество различных моделей учитывающих различия в скорости замен как отдельных нуклеотидов в последовательностях, так и отдельных участков этих самых последовательностей. Читал, что модель GTR+G+I вроде как является как-бы самой общей и учитывает все параметры учитываемые другими более простыми (с меньшим числом параметров) моделями. Вопрос: Необходимость подбора оптимальной модели с помощью всяких там информационных критериев типа BIC и АIC, которые реализованы в некоторых программах, они имеют целью лишь найти самую наименее ресурсозатратную (по вычислительным мощностям), но с достаточным количеством параметров модель? И в принципе, если позволяют вычислительные ресурсы можно спокойно применять в любой ситуации модель GTR+G+I? Или и эта модель может не дать достаточной точности, которую обеспечит какая-то иная эволюционная модель? |
MMM Постоянный участник |
НО! -- они имеют целью лишь найти самую наименее ресурсозатратную (по вычислительным мощностям) А какую они еще могут иметь цель? --И в принципе, если позволяют вычислительные ресурсы можно спокойно применять в любой ситуации модель GTR+G+I? Или и эта модель может не дать достаточной точности, которую обеспечит какая-то иная эволюционная модель? А что есть "точность эволюционной модели" в философском понимании. Грубо говоря: некий критерий степени отклоннения от действительности. НО! О действительности мы имеем весьма мутные представления, а с точки зрения нуклеотидных последовательностей, вообще никакого. Откуда следует, что никакого критерия близости мы составить не можем просто из-за отсутствия информации о реальном объекте, который пытаемся моделировать. Сообщение было отредактировано MMM - 27.02.2018 09:52 |
Nemestnyi |
(MMM @ 27.02.2018 10:50) Я не биоинформатик. Вам бы лучше задать этот вопрос в другом разделе форума. НО! -- они имеют целью лишь найти самую наименее ресурсозатратную (по вычислительным мощностям) А какую они еще могут иметь цель? --И в принципе, если позволяют вычислительные ресурсы можно спокойно применять в любой ситуации модель GTR+G+I? Или и эта модель может не дать достаточной точности, которую обеспечит какая-то иная эволюционная модель? А что есть "точность эволюционной модели" в философском понимании. Грубо говоря: некий критерий степени отклоннения от действительности. НО! О действительности мы имеем весьма мутные представления, а с точки зрения нуклеотидных последовательностей, вообще никакого. Откуда следует, что никакого критерия близости мы составить не можем просто из-за отсутствия информации о реальном объекте, который пытаемся моделировать. Ну какие-то выводы из наблюдений за нуклеотидными заменами мы, все же, сделать, наверное, можем. Там накопление синонимичных, несинонимичных замен в кодирующих белок генах, более и менее полиморфные участки в последовательностях... Хотя все эти математические методы признаться и у меня вызывают определенную долю скепсиса. Но, на одной философии статью написать сложновато, по этому, без них никуда! Думаете лучше спросить в разделе: "Биофизика и матметоды в биологии"? Хорошо, попробую. |
MMM Постоянный участник |
|
Gariaev Постоянный участник |
|
Nemestnyi |
(MMM @ 27.02.2018 12:42) Конечно мы можем делать выводы, вводя какие угодно математические критерии сходства последовательностей нуклеотидов или аминокислот, но гипотетическая точность этих выводов останется гипотетической. Я вас призываю не делать из мухи слона и не зацикливаться на "точности" моделей. Я и не зацикливаюсь, но все же интересно знать ответ на вышепоставленный вопрос, хотя бы теоретически, учитывает модель GTR+G+I совокупность параметров более простых моделей ( JC69, K80, F81, HKY85, T92, TN93...) со всякими +G+I (где это применимо) и является их обобщением? И можно ли ей одной(если не заморачиваться с затратой на вычислительные ресурсы опять же) заменить полноценно остальные или нет? Но в мат. методах по данному вопросу вообще тишина, А здесь предлагают не заморачиваться.) |
dk Постоянный участник Россия |
Да, сама по себе модель GTR может "заменить" все другие - но только при установлении должной частоты замен, формы кривой и частоты инверсий. Тогда вопрос - зачем вообще "в ручную" забивать все эти значения, если можно просто использовать более простую модель (того же JC). Опять же, отсылая Вас к Нэю - чем сложнее применяемая модель, тем будет больше варианса и тем менее достоверны выводы. Вообще уважаемый МММ как всегда прав - выбор модели, как бы Вы скрупулёзно к нему не подходили, будет лишь гипотетически описывать процессы, происходящие в Вашем наборе данных (и вовсе не гарантирует что, например, восстановленное дерево генов хоть как-то соответствует реальному дереву видов). Плюс к этому - выбор адекватной модели в целом ещё тот геморрой: для кодирующих локусов, например, установить кодоны, а рРНК, например, и вовсе является набором доменов (дуплексы и петли), которые эволюируют как отдельные локусы. Так что не усложняйте себе жизнь - аккуратно определите параметры модели для нужных локусов и используйте именно эти конкретные параметры для дальнейшего восстановления филогении. Никакой "универсальной" модели под все наборы данных нет (и быть не может), так что используя GTR+G+I со значениями по умолчанию Вы рискуете либо сильно снизить достоверность, либо и вовсе получить неверную топологию.
|
Nemestnyi |
|
watchesonline89 Постоянный участник |
|
« Предыдущая тема · Молекулярная и клеточная биология · Следующая тема » |