Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
Рендалл |
Я сам не специалист в вашей области. Подскажите, есть ли программы которые бы с помощью анализа генетических последовательностей могли бы оценивать степень сходства между геномами, тем самым обеспечивая основания для эволюционной классификации? А то программ много: Жизни не хватит всё осмотреть. И сразу вопрос (если такие программы есть): а какие математические алгоритмы лежат в основе программ и где можно это увидеть?
|
Guest IP-штамп: fr72UFQK8.eG6 гость |
про алгоритмы сами читайте, там есть подробные описания |
Рендалл |
|
Grumeza Radu Участник Limburg, Belgium |
|
Рендалл |
Я нашёл кучу методов, которые кучей и применяются. Так и обстоит дело в молекулярной биологии? Наприме наводящий вопрос: 1) применяются ли методы кластерного анализа? 2) если да, то какие меры используются и какие сопобоы построения дендрограмм? 3) какие ещё методы многомерного стат. анализа и вообще статистики применяются? 4) какие из метдов применяются в специализированных программах для молекулярных биологов? Доступно изъясняюсь? |
Esya Постоянный участник PA, USA |
Доступно? |
Guest IP-штамп: fr45uHVgO7WZ2 гость |
1: Nature. 2008 Apr 17;452(7189):872-6. The complete genome of an individual by massively parallel DNA sequencing. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT, Gomes X, Tartaro K, Niazi F, Turcotte CL, Irzyk GP, Lupski JR, Chinault C, Song XZ, Liu Y, Yuan Y, Nazareth L, Qin X, Muzny DM, Margulies M, Weinstock GM, Gibbs RA, Rothberg JM. Human Genome Sequencing Center, Baylor College of Medicine, One Baylor Plaza, Houston, Texas 77030, USA. The association of genetic variation with disease and drug response, and improvements in nucleic acid technologies, have given great optimism for the impact of 'genomic medicine'. However, the formidable size of the diploid human genome, approximately 6 gigabases, has prevented the routine application of sequencing methods to deciphering complete individual human genomes. To realize the full potential of genomics for human health, this limitation must be overcome. Here we report the DNA sequence of a diploid genome of a single individual, James D. Watson, sequenced to 7.4-fold redundancy in two months using massively parallel sequencing in picolitre-size reaction vessels. This sequence was completed in two months at approximately one-hundredth of the cost of traditional capillary electrophoresis methods. Comparison of the sequence to the reference genome led to the identification of 3.3 million single nucleotide polymorphisms, of which 10,654 cause amino-acid substitution within the coding sequence. In addition, we accurately identified small-scale (2-40,000 base pair (bp)) insertion and deletion polymorphism as well as copy number variation resulting in the large-scale gain and loss of chromosomal segments ranging from 26,000 to 1.5 million base pairs. Overall, these results agree well with recent results of sequencing of a single individual by traditional methods. However, in addition to being faster and significantly less expensive, this sequencing technology avoids the arbitrary loss of genomic sequences inherent in random shotgun sequencing by bacterial cloning because it amplifies DNA in a cell-free system. As a result, we further demonstrate the acquisition of novel human sequence, including novel genes not previously identified by traditional genomic sequencing. This is the first genome sequenced by next-generation technologies. Therefore it is a pilot for the future challenges of 'personalized genome sequencing'. |
move |
А тут про него написано: |
Grumeza Radu Участник Limburg, Belgium |
|
Рендалл |
(Guest @ 13.05.2008 14:43) Вот тут геном Уотсона сравнивали с геномом Вентера . Во-первых, принято давать ссылку если публикация есть и Интернет. Во-вторых, в Резюме, которое вы тут приводите ничего нам не говорит о том, какие математические методы применяются. В-третьих, "To read this story in full you will need to login or make a payment (see right)". Или вы предлагаете мне на каждую вашу ссылку регистрироваться в новом электронном издании?1: Nature. 2008 Apr 17;452(7189):872-6. The complete genome of an individual by massively parallel DNA sequencing. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT, Gomes X, Tartaro K, Niazi F, Turcotte CL, Irzyk GP, Lupski JR, Chinault C, Song XZ, Liu Y, Yuan Y, Nazareth L, Qin X, Muzny DM, Margulies M, Weinstock GM, Gibbs RA, Rothberg JM. Что касается ссылок на BLAST, то я их видел, но опять же про математику там ни слова. Итак, подытожим: никто тут понятия не имеет, какие мат. алгоритмы используют различные программы для мол. биологов. В отдельных статьях по молекулярной биологии используют то кластерный анализ, то факторный, то элементарную описательную статистистику. Для сравнения ВОЗМОЖНО используют кластерный анализ. |
Рендалл |
1. (2008) Persistence drives gene clustering in bacterial genomes Кто-нибудь знает, что там за мера расстояния приведена? Жуть! 2. (2007) Discovering functional linkages and uncharacterized cellular pathways using phylogenetic profile comparisons: a comprehensive assessment Оценка степени сходства между двумя профилями (Assessing the degree of similarity between two profiles) была использована mutual information (MI) measure: MI(A, B) = H(A) + H(B) - H(A, B) - Абсолютно эклектичный коэффициент, в котором по сути убрали пересечение, то есть основу для определения сходства. Далее там есть модифицированный (под БД) коэф Жаккара. 3. (2007) Comparative Genomics of Large Mitochondria in Placozoans Только ссылка на программы и ни одной формулы. А такое громкое название ) 4. Genomic Gene Clustering Analysis of Pathways in Eukaryotes Database, BLAST - ключевые слова. Почти нет формул. |
Guest IP-штамп: fr45uHVgO7WZ2 гость |
|
Grumeza Radu Участник Limburg, Belgium |
MANTIS, a phylogenetic framework for multi-species genome comparisons Посмотрите может пожет чем нибудь |
Рендалл |
Вот здесь даже об анализе данных говорят, но усё закрыто от глаз юзера: Кроме того, проскакивают Monte-Carlo Test и масса ссылок. Кстати, во второй ссылке тож математики не много. Короче говоря, алогритмы запаяны в программы и никто понятия не имеет как они считают и строят графики ))) |
Den-N Постоянный участник |
Слышал также что используют программу PHYLIP, но сам с ней толком не знаком: Перечень прог на этом сайте очень большой, но они разбиты на категории - можно ограничиться только интересующими пакетами и попробовать пару-тройку из начала списка: Сообщение было отредактировано Den-N - 23.05.2008 05:57
|
Chlorum Постоянный участник |
|
Guest IP-штамп: frsgB6QvPHhG. гость |
Возьмите хорошую програму (тут уже называли PHYLIP, я бы добавила MrBayes (мое личное предпочтение), PAUP, RAXML), посмотрите мануал к ней и главную статию опубликованную по програме. Если хотите поразбираться -- хорошая книжка Inferring Phylogenies by Joseph Felsenstein, этот парень, кстати, и есть автор пакета PHYLIP. |
Рендалл |
(Guest @ 25.05.2008 12:05) Меня в основном интерсует какими методами для сравнения пользуются молекулярные биологи. Никто же не будет оспаривать, что во основе комп. программ лежат математические алгоритмы.Область это довольно разросшаяся и если вы не собираетесь этим профессионально заниматься смысла в попытках понять ВСЕ не вижу. Я весьма профессионально занимаются сравнительным анализом флор, НО мне интересно как с этим обстоит дело в других областях. В частности встречал статьи, в которых используется коэффициент сходства Жаккара (он изначально появился во флористике). Вот и интересно каким образом сравнивают в вашей области.Возьмите хорошую програму (тут уже называли PHYLIP, я бы добавила MrBayes (мое личное предпочтение), PAUP, RAXML), посмотрите мануал к ней и главную статию опубликованную по програме. Поищу, почитаю.
Если хотите поразбираться -- хорошая книжка Inferring Phylogenies by Joseph Felsenstein, этот парень, кстати, и есть автор пакета PHYLIP. |
Юджин Постоянный участник |
(Рендалл @ 25.05.2008 15:43) Меня в основном интерсует какеими методами для сравнения пользуются молекулярные биологи. Никто же не будет оспаривать, что во основе комп. программ лежат математические алгоритмы. Даже в основе одной проги несколько разных алгоритмов и математических подходов сразу работает. Тут или вопрос нужно ставить очень точно или начинать от сотворения мира. Биоинформатика разрослась и на палтцах уже ничего не объяснить. Я вот чтобы разобраться в этом пошел учиться в Манчестерский универ он-лайн и теперь вижу что все сложней в 1000 раз чем я предполагал ло этого. А вообще на сайтах NCBI и EMBL стоят все необходимые вам проги. Я не удивлюсь если их уже по 100 ато и больше. Какждая из них использует по неск алгоритмов. Там к ним инструкции. Многих или большинство пользователей этих прог математичесая начинка вообще не волнует. Можно шарить по гуглу или в пабмеде (с установкой на ревью и др ключевые слова в Limit) и находить полезные вещи типа этого |
Esya Постоянный участник PA, USA |
|
Рендалл |
(Юджин @ 26.05.2008 02:49) Даже в основе одной проги несколько разных алгоритмов и математических подходов сразу работает. Меня главным образом интерсуют вопросы классификации. В геоботанике и экологии используются методы кластерного анализа (но меры несколько отличаются от запаянных в программы, например в ту же Statistica 6.0).Тут или вопрос нужно ставить очень точно или начинать от сотворения мира. Биоинформатика разрослась и на палтцах уже ничего не объяснить. Это точно. Вот только почему то перегиб идёт в сторону геномики и протеиномики. Почему бругих био забывают? Я вот чтобы разобраться в этом пошел учиться в Манчестерский универ он-лайн и теперь вижу что все сложней в 1000 раз чем я предполагал ло этого. Кстати, присоединяюсь к просьбе Esya. Многих или большинство пользователей этих прог математичесая начинка вообще не волнует. Охотно верю. А меня вот как раз именно это и интересует, а то изучаю стат. программы как чёрный ящик. Например, Statistica свой сайт на русском языке имеет и всё равно вопросов масса.Можно шарить по гуглу или в пабмеде (с установкой на ревью и др ключевые слова в Limit) и находить полезные вещи типа этого Шарю. Полный сумбур с мат. методами и использование программ не вдаваясь в суть. Так видимо и обстоит дело.
|
Guest IP-штамп: frsgB6QvPHhG. гость |
Но кластерным анализом никто не пользуется, т.к. в большинстве случаев интересует не какие последовательности похожы и сколько групп похожих последовательностей есть в наборе данных, а то как они, последовательности, появились, т.е. все филогенетическое дерево. Хотя самые простые алгоритмы (neighbor joining, например) похожы на алгоритмы кластеризации. В зависимости от расстояния (согласно метрике) алгоритм соединяет самые близкие последовательности одну за одной. В основном в филогенетических програмах используется либо "максимальное правдоподобие" либо "максимальная экономия". В первом случае тестируются все, ну или почти все..., возможные варианты топологии дерева и находится самое правдоподобное (согласно этому самому likelihood score). Во втором та же песня, тестируются все возможные варианты топологии, но критерием хорошести является количество замен сделаных во всем дереве, чем их меньше, тем дерево лучше. Считается, что наиболее эффективно восстанавливают филогению алгоритмы использующие максимальное правдоподобие (тестируется на симулированных данных, для которых известна эволюционная история и на реальных данных, в этом случае критерием эффективности алгоритма является минимальное количество генных дупликаций и потерь). В общем все так, без деталей и на пальцах... Задавайте вопросы -- будем отвечать по возможности.
|
Рендалл |
(Guest @ 27.05.2008 18:56) Но кластерным анализом никто не пользуется, т.к. в большинстве случаев интересует не какие последовательности похожы и сколько групп похожих последовательностей есть в наборе данных, а то как они, последовательности, появились, т.е. все филогенетическое дерево. Странно, я видел работы, в результате которых строят дендрограммы, причём их немало в журналах по биоинформатике. Я, что-то не могу понять различий которые вы уточняете. Вы же сравниваете два объекта (геномы например), следовательно определяете отношения сходства (или различия, оно же расстояние).В зависимости от расстояния (согласно метрике) алгоритм соединяет самые близкие последовательности одну за одной. А почему мы не считаете, что это кластерный анализ. Это же один из способов построения tree diagram.Какие расстояния обычно используются? Евклидово, Манхэттенское или есть какие то специфические? В первом случае тестируются все, ну или почти все..., возможные варианты топологии дерева и находится самое правдоподобное (согласно этому самому likelihood score). Максимальное правдоподобие определяется вероятностными методами? А варианты дерева появляются вследствие чего?Во втором та же песня, тестируются все возможные варианты топологии, но критерием хорошести является количество замен сделаных во всем дереве, чем их меньше, тем дерево лучше. НЕ понял что такое замена. НЕсовпадение по нуклеотидам сравниваемых геномов?Я нашёл пример матрицы замен (http://195.178.207.138/projects/newsite/lections_2008/biotexts.pdf). Вот только не пойму зачем вводить сложное условие: "За совпадение +2, за несовпадение –1, за вставку 1". Разве нельзя просто: "Есть совпадение - 1, нет совпадения - 0" и получим нормальную матрицу. Сообщение было отредактировано Рендалл - 28.05.2008 00:56 |
Guest IP-штамп: frsgB6QvPHhG. гость |
2. Да, поэтому я и сказала, что они похожи. Расстояние определяется уже не между самими обьектами, а между обьектом и гипотетическим прародителем, а потом от прародителя к другому обьекту. При этом длинна ветви есть средняя вероятность замены на сайт в соответствии с имеющимися данными и выбранной моделью эволюции. Моделей эволюции много, посмотрите элементарно статьи в Википедии, народ хоть Википедию и не уважает, но чтобы общее представление получить ее вполне хватит. Статья Models of DNA evolution. 3. Да. 4. На самом деле не замены, просто изменения. любые. Замены одного нуклеотида на дрогой (с учетом модели эволюции, конечно), вставки, делеции. Кажется, вам просто надо взять и построить хорошее дерево. Возьмите штук так 10 последовательностей ДНК для какого нибудь генного семейства и соответствующие им аминокислотные, протестируйте модели эволюции (modeltest and prottest, соответственно) и постройте 2 дерева с помощью MrBayes, на пример. Потом возьмите видовое дерево, посчитайте сколько в каждом из 2х полученных деревьев дупликаций и потерь и станете вы спецом в нелегком филогенетическом деле. |
Рендалл |
(Guest @ 28.05.2008 08:56) 1. Что есть главная цель кластерного анализа? Найти кластеры. А уж каковы взаимоотношения между отдельными обьектами не важно, а дендрограмы полужаются только для иерархических методов, а кроме них есть еще куча других. Так дендрограмма и показывает связь между объектами: более похожие объединяются раньше, менее похожие позже.То что есть неиерархические методы классификации это ясно. Расстояние определяется уже не между самими обьектами, а между обьектом и гипотетическим прародителем, а потом от прародителя к другому обьекту. У этого прародителя должны же быть какие-то признаки )) а иначе как же идёт сравнение? На вероятностях далеко не уедешь.Моделей эволюции много, посмотрите элементарно статьи в Википедии, народ хоть Википедию и не уважает, но чтобы общее представление получить ее вполне хватит. Статья Models of DNA evolution. Вот когда сравниваются геномы или там белки это я понимаю. По результатам сравнения подтверждается таксономическая близость.Кажется, вам просто надо взять и построить хорошее дерево. Возьмите штук так 10 последовательностей ДНК для какого нибудь генного семейства и соответствующие им аминокислотные, протестируйте модели эволюции (modeltest and prottest, соответственно) и постройте 2 дерева с помощью MrBayes, на пример. Вот так я и интересовался какими методами проводят сравнение в молекулярной биологии. Как дело обстоит в флористике и экологии я знаю. Было интересно узнать как это у вас делается ))
|
tinhdaika99 |
giới thiệu review các sản phẩm tăng cường sinh lý, sinh lý nam mỹ phẩm, làm đẹp, sinh lý nữ, phong thủy, tăng cân giảm cân, sức khỏe, đau dạ dày bệnh thận, cây thuốc, hàng đầu tại việt nam chia sể các loại bệnh, các loại thuốc, kiến thức So thanks you <a href="https://chiase24h.info/">yếu sinh lý</a> <a href="https://chiase24h.info/">yếu sinh lý</a> <a href="https://chiase24h.info/sinh-ly-nam/">sinh lý nam</a> <a href="https://chiase24h.info/myphamlamdep/">mỹ phẩm làm đẹp</a> <a href="https://chiase24h.info/tanggiamcan/">tăng giảm câm</a> |
vrida2 Постоянный участник |
|
lyx90152 Участник |
|
vrida2 Постоянный участник |
|
Guest IP-штамп: frpYd0YygcNIA гость |
Harry Kane led the romp |
guest: 123vega IP-штамп: frpXPq5TOmUHs гость |
rate is "too little, too late". |
guest: 123vega IP-штамп: fr/1ZkUsuBQOE гость |
|
guest: 123vega IP-штамп: frY/5Vmfd77P. гость |
|
vrida2 Постоянный участник |
|
guest: 123vega IP-штамп: frpXPq5TOmUHs гость |
|
guest: 123vega IP-штамп: frpYd0YygcNIA гость |
|
guest: 123vega IP-штамп: frpYd0YygcNIA гость |
|
guest: 123 IP-штамп: frAWeMdOsBSXM гость |
|
guest: 123 IP-штамп: frJhOCvSv9ICE гость |
|
guest: 123 IP-штамп: frXqkB4MpP2jQ гость |
|
guest: 123 IP-штамп: frXqkB4MpP2jQ гость |
|
guest: 123 IP-штамп: frAWeMdOsBSXM гость |
|
vrida2 Постоянный участник |
|
vrida2 Постоянный участник |
|
watchesonline89 Постоянный участник |
|
guest: 123vega IP-штамп: frAWeMdOsBSXM гость |
|
watches89 Постоянный участник |
|
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |