Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
Статистик IP-штамп: frvdAASQAkCp6 гость |
|
Nastja Постоянный участник Новосибирск |
|
LK Постоянный участник Москва |
Это называется не "корректировать", а "вешать самому себе лапшу на уши". |
ssh Участник |
Сообщение было отредактировано ssh - 01.05.2005 14:56
|
gostya Постоянный участник |
Eli Kintisch "In the most extensive scientific misconduct case the National Institutes of Health (NIH) has seen in decades, a researcher formerly at the University of Vermont College of Medicine in Burlington has admitted in court documents to falsifying data in 15 federal grant applications and numerous published articles. Eric Poehlman, an expert on menopause, aging, and metabolism, faces up to 5 years in jail and a $250,000 fine and has been barred for life from receiving any U.S. research funding..." "...After DeNino filed a formal complaint, a university investigative panel looked into Poehlman's research and uncovered falsified data in three papers. These included a much-cited 1995 Annals of Internal Medicine study that suggested hormone replacement therapy could prevent declines in energy expenditure and increases in body fat during menopause. In that paper Poehlman presented metabolic data on 35 women taken 6 years apart. Most of the women did not exist, according to the statement Poehlman signed. (In 2003 the paper was retracted.) Poehlman left Vermont in 2001, before the investigation ended, for the University of Montreal. He left there in January and now lives in Montreal..." http://www.sciencemag.org/cgi/content/full...tdate=4/30/2005 |
SchimmelHunter Постоянный участник Девчинщина, Водопадова Церква |
Если ошибок не обнаруживается, то принимаю всё, как есть, несмотря на странность. |
LK Постоянный участник Москва |
Респект, у меня не хватило пороху, а впечатление было абсолютно такое же - я даже наверх посмотрела, чтобы убедиться, что это наш форум. Бывало, если я абсолютно уверен в результате, а в статистике не очень Когда применяют неподходящий стат. метод (напр., достоверность различий считают по Стьюденту, не глядя на распределение переменной), то и в самом деле можно получить нелепый результат - по цифрам вроде есть отличия, а по достоверности нет, или наоборот. Но ведь вы не в лесу живете, всегда можно найти кого-то, кто вам объяснит, в чем дело. Сообщение было отредактировано LK - 01.05.2005 20:11 |
Статистик IP-штамп: frN1VblhtnDyg гость |
(LK @ 01.05.2005 19:54) 2 ssh Респект, у меня не хватило пороху, а впечатление было абсолютно такое же - я даже наверх посмотрела, чтобы убедиться, что это наш форум. Хотелось бы отметить уважаемым дискуссантам, что представлены 4 разных варианта ответа. Вопрос действительно неоднозначный- насколько исследователь вправе доверятся собственному видению полученных данных или же он должен покорно ( или как вариант слепо) следовать сухим математическим заключениям, плюс-минус=однозначно. Да и вряд ли тут есть оригиналы, занимающиеся голосованием под разными логинами. Да и какой в этом прок? Вероятно, результаты действительно отражают неоднозначность однозначных оценок . Сам я в голосовании не участвую, просто хочу посоветоваться с мнением других и определится со своим.
|
ssh Участник |
Но еще было бы интересно послушать голосовавших за разные пункты, хотя бы в анонимной форме. Ведь наверняка у выбравших "бывало, если я абсолютно уверен в результате, а в статистике не очень" есть какое-то, хотя бы интуитивное, обоснование своих действий? |
LK Постоянный участник Москва |
Вопрос действительно неоднозначный- насколько исследователь вправе доверятся собственному видению полученных данных или же он должен покорно ( или как вариант слепо) следовать сухим математическим заключениям, плюс-минус=однозначно Вы биологическим протоколам как следуете, покорно или слепо? Наверное, если уж что-то меняете, то разумно, а не вливая буфер, к-рый Вам интуитивно нравится, вот только фермент в нем практически теряет активность. Вот здесь мы и приехали - чтобы изменить протокол и не вляпаться, надо как минимум иметь какую-то специальную подготовку (ну, например, выпускник-биохимик поменяет и поймет, почему стало лучше или хуже, а врачам лучше брать готовые наборы и не рыпаться). Тесты мат. статистики - это и есть протоколы, сухие только для тех, кто применяет их слепо, не пытаясь понять, каким графическим представлениям соответстует тот или иной тест. Они все из картинок вышли, и вот когда Вы считаете и параллельно строите соответствующие графики (в каждом модуле статпакета нужные кнопки натыканы), разрыв между видением исходных данных и цифрой в конце исчезает. А чтобы это делать, нужно хотя бы немного почитать, информации навалом - популярной, специальной, промежуточной, весь интернет утыкан. А вообще представьте себе математика, который решил заняться ПЦР и вместо циклера бодро взял микроволновку. Ну такое у него видение данного метода, в конце концов там переменное тепловое поле, здесь переменное волновое, почему он должен следовать вашему сухому протоколу? А в статье написал: использовали общепринятый протокол, выход 0 целых хрен десятых, и на этом построил новую теорию эволюции . Сообщение было отредактировано LK - 02.05.2005 11:26
|
Статистик IP-штамп: frvdAASQAkCp6 гость |
(ssh @ 02.05.2005 10:22) Должен сказать (как человек, иногда имеющий дело с опросниками), что вопросы подобраны весьма удачно Все из жизни. |
ssh Участник |
(LK @ 02.05.2005 09:25) Все это правильно, но, похоже, большинство относится к статистике как к заведомо ненужной и очень скучной формальности. Это неудивительно - биологи ведь традиционно плохо понимают в математике, и эта негативная корреляция имеет место, мне кажется, во всем мире. На Западе азы статистики обычно (кажется...) преподают уже в школах, так что там это не так страшно...Вообще-то статистика - штука достаточно хитрая, и нужно не только знать основные принципы, но и при всякой возможности консультироваться со специалистами. Иначе можно легко попасть впросак. Например, я постоянно обнаруживаю у людей, работающих с большим числом переменных, непонимание того, что нельзя использовать результаты применения стат. теста к каждой переменной по отдельности, если переменных много, без коррекции уровня значимости. (До сих пор такие ляпы пропускают и некоторые вроде бы приличные журналы.) Что при этом можно получить, очень хорошо иллюстрирует творчество отца и сына Ам*** из Уфы. Как-то к нам на кафедру был прислан толстенький двухтомник материалов некоей конференции, в каждой (или почти каждой) статье которого один из них был соавтором (!). Большинство "работ" было сделано на основе расчета коэффициента корреляций между кучей показателей, и всегда некоторые оказывались значимыми. А тематика была весьма и весьма своеобразной (напр., одна из значимых корреляций обнаружилась между каким-то белком в моче и "показателем преданности фирме"!). То, что результаты часто были "значимыми", неудивительно - при уровне значимости 0.05 и сотне тестов можно получить в среднем до 5 "значимых результатов" при полном отсутствии реальных связей между показателями... Через некоторое время после появления сборника (над которым многие коллеги потешались, хотя и далеко не все понимали, в чем фишка) явился и один из Ам***, так что у меня была возможность немного с ним пообщаться. По тому впечатлению, которое удалось составить, он скорее фанатик, чем жулик. На вопрос о том, пытались ли они воспроизводить результаты какой-нибудь работы (из примерно полутора или двух сотен, если мне не изменяет память), он насупился и заявил, что у них в Уфе очень трудно с финансированием, их очень зажимают, и нужно как быстрее идти вперед, пока совсем не задавили, так что не до такой роскоши. А когда я попытался сделать заход насчет того, что нужно вводить какие-то поправки к уровню значимости, когда у них такое огромное число коэффициентов корреляции, он стал возмущаться - мол, мы все делаем правильно, и кто вы вообще такой, чтобы катить бочку на уникальные и прорывные исследования. Однако самое забавное то, что в статистике до совсем недавнего времени не было хороших инструментов для таких поправок! По сути дела, единственным универсальным стандартным инструментом была т.н. поправка Бонферрони (деление уровня значимости на число переменных) - это архиконсервативный метод, который во многих случаях делает выявление значимых результатов попросту невозможным. Лишь очень немногие представляют себе, как работать с рандомизационными методами, которые могут частично снимать проблему, но обычно отсутствуют в стандартных статпакетах. А многие ли слышали про False Discovery Rate control? Боюсь, что на этом форуме таких может почти что и не найтись - эта штука стала всерьез развиваться только в самые последние годы, хотя она имеет хорошие шансы через несколько лет полностью вытеснить поправку Бонферрони из большинства областей, где та применяется. Кстати, один из мощных алгоритмов такого рода (одновременно используется рандомизация и FDR control) встроен в "BRB ArrayTools" мб, кто-н ими тут пользуется? http://linus.nci.nih.gov/BRB-ArrayTools.html ; статья: E.L.Korn, J.F.Troendle, L.M.McShane, R.Simon (2004) Controlling the number of false discoveries: application to high-dimensional genomic data. Journal of Statistical Planning and Inference, 124(2):379-398. (Ну и понаписал я тут... самому надо работать больше, а не на форумах сидеть, блин ) Сообщение было отредактировано ssh - 02.05.2005 19:36
|
Дядя ФАКСер Постоянный участник Nothern Maccaronia, Ticinum |
Чего не наблюдаемъ- не пишемъ" ((С) И.Ф. Крузенштернъ) И мы вот- так же. |
Tom1 Постоянный участник |
Чего не наблюдаемъ- не пишемъ" ((С) И.Ф. Крузенштернъ)" Человек и пароход.... |
Urrу Постоянный участник |
(Дядя ФАКСер @ 02.05.2005 20:49) Безнадежно устаревшая парадигма! Как насчет: " - Ты суслика видишь? - Нет... - И я не вижу... а он есть!" (с) "ДМБ" |
vb Постоянный участник |
В. Мне кажется, что мой критерий не очень мощный. Поэтому стесняюсь выступать на конференциях. Боюсь, что все будут смеяться. Где можно провести увеличение мощности критерия? О. Ну это обычное заблуждение начинающего статистика. Часто дело не в мощности критерия, а в умении им пользоваться. Я знал людей у которых критерий был совсем слабеньким, но какие фокусы они им проделывали! В принципе мощность критерия можно увеличить, но в специализированной клинике и после обязательной консультации специалиста. В. Мне 20 лет. У меня маленькая выборка, а нравится журнал с большим импакт-фактором. Наверное, у нас несовместимость, он не обращает на меня внимание. Что же делать? О. Не расстраивайтесь. Во-первых, выборка – дело наживное. Почти у всех девочек вашего возраста выборка еще развивается. Старайтесь постепенно увеличивать ее. Главное не переусердствовать в первые годы научной жизни. А импакт-факторы бывают и дутыми. В. Я активно занимаюсь статистикой уже год. У меня два постоянных партнера: Statistica 6.0 и SSPP. Но летом нужно ехать в деревню к родителям. Там нет компа. Скажется ли воздержание на моем здоровье? О. Нечего страшного не будет в том, что немного поработаете руками. Иногда это даже полезно. В. У меня на графике появляются какие-то точки, это опасно?! О. Проводите дискриминацию два раза в день и обязательно проверьте выборку на нормальность. В. Мама говорит, что если часто заниматься статистикой, то на руках волосы вырастут, а я ничего не могу с собой поделать. Правда ли это? О.
|
avial Постоянный участник |
(ssh @ 02.05.2005 17:30) Однако самое забавное то, что в статистике до совсем недавнего времени не было хороших инструментов для таких поправок! По сути дела, единственным универсальным стандартным инструментом была т.н. поправка Бонферрони (деление уровня значимости на число переменных) - это архиконсервативный метод, который во многих случаях делает выявление значимых результатов попросту невозможным. Вот. И отсюда следует вопрос из темы - должен ли я доверять излишне консервативному методу? Ведь не зря уже столько лет на страницах журналов не утихает спор билогов с математиками по поводу коррекции результатов множественых сравнений. И чья вина в отсутствии адекватных методов? К тому же не совсем ясна применимость Бонферрони к конкретным ситуациям. Ограничиваться ли рамками одного эксперимента или вовлекать все исследование и т.д. Не все так просто. (ssh @ 02.05.2005 17:30) Лишь очень немногие представляют себе, как работать с рандомизационными методами, которые могут частично снимать проблему, но обычно отсутствуют в стандартных статпакетах. А многие ли слышали про False Discovery Rate control? Боюсь, что на этом форуме таких может почти что и не найтись - эта штука стала всерьез развиваться только в самые последние годы, хотя она имеет хорошие шансы через несколько лет полностью вытеснить поправку Бонферрони из большинства областей, где та применяется. Если не ошибаюсь, статистические пакеты ссылаются на работу Хочберга 95 года. Самое интересное, что абсолютно все костыли к Бонферрони - и Сидак, и Хочберг, и Холм, и FDR, - все имеют абсолютно элементарнейшее представление в математическом смысле. Хоть на бумажке считай. Но почему для билогов об этом не пишут? Я, например, до всего этого должен был доходить сам. Но ведь это время. Время, отнятое от основного исследования. (ssh @ 02.05.2005 17:30) Кстати, один из мощных алгоритмов такого рода (одновременно используется рандомизация и FDR control) встроен в "BRB ArrayTools" мб, кто-н ими тут пользуется? [url=http://linus.nci.nih.gov/BRB-ArrayTools.html] Не знал, посмотрю. Пока что результатом моих трехлетних разборок со статистикой стала программка в экселе. Ибо оказалось проще написать это все самостоятельно, чем пытаться выискивать в различных стат. пакетах. А Westfall-Young вообще встречается только в пакетах анализа чипов. Монте-Карло тоже оказалось проще самому написать. Почему? Ну ведь не трудно лишнюю кнопочку добавить в пакет. А биологам приятно. И не будет потом разборок о правильности и применимости. ЗЫ: И еще. Всегда хотел спросить у статистика - ведь хи-квадрат и фишер тоже, вообще говоря, параметрические методы? И 99% современных статей просто неверны, применяя эти критерии без проверки распределения данных? Получается, только Монте-Карло и можно применять? Сообщение было отредактировано avial - 05.05.2005 14:25 |
SchimmelHunter Постоянный участник Девчинщина, Водопадова Церква |
А что есть продолжение? Как-то оборвалось на вопросе, а не ответе. |
А Постоянный участник Россия |
Рассказать волшебный рецептик? Ставится большой избыток опытов, из которых статистически обрабатываются те, кот. входят в указанный интервал. Картинки прекрасные, хоть и подозрительные (очень уж маленькие доверительные интервалы). Вот только я сильно сомневаюсь, что это хорошо |
Статистик IP-штамп: frvdAASQAkCp6 гость |
|
А Постоянный участник Россия |
(Статистик @ 05.05.2005 16:28) Если бы только со статистикой это... И с самим фактом получения результатов во многих статьях бывает несоответствие. В этом я убедился, пытаясь использовать методики, условия экспериментов или ПЦР-праймеры из буржуйских статей. Такие вещи часто не идут и идти не могут даже теоретически. При колабораторстве и доверительных отношениях авторы могут просто в переписке предупредить - "не пытайтесь использовать из статьи вот это, а посмотрите вот то". В худшем случае делаешь как написано и, если не получается, анализируешь, а может ли "это" работать. Я как-то уже упоминал о чудо-праймерах к известному гену, когда были из 2 тпн выбраны именно те два олига с феноменальной само- и взаимокомплементарностью при низкой температуре отжига, которые в теории работать никогда не должны. И так для двух генов. И с протоколами реакций часто полный бред. Я думаю, многие коллеги могли бы привести еще море примеров. Как Вам такое Кстати, к чести соотечественников, относительно праймеров в отечественных статьях я такого не встречал. Наоборот, иногда приводят не относящуюся к делу, но выдающую планы на будущее подноготную в виде добавок с 5'-конца). И кажется ли Вам корректной избирательная обработка результатов, сильно заужающая разброс? Возможно, она даже точнее передает закономерность. В конце концов при нормальной статобработке совсем выпадающие результаты отбюрасываются как артефакты, но должен же быть предел. |
А Постоянный участник Россия |
В общем, как известно, есть ЛОЖЬ, есть БОЛЬШАЯ ЛОЖЬ, и есть СТАТИСТИКА. Как-то я уже писал о статье коллег из солнечного Магадана, регулярно публикующих статьи по этногенетике в журнале "Генетика", что-то типа "Митохондриальный портрет восточных славян". Так вот, там с точностью до сотых (для такого исследования результат феноминальный, это меня и поразило), писалось о встречаемости среди жителей России стандартных митохондриальных генетических маркеров. При том там украинцы, русские... жители каких-то регионов. Только размер выборки не был указан. Так вот, подсчитав все это исходя из результатов (с десятыми и сотыми - это с великолепной точностью воспроизводится в целые). Так вот, оказалось что всех их, и украинцев (двое из которых, судя по фамилиям - авторы) и русских и татар, финно-угров ... в сумме было 21 А в их статьях еще ссылки на статьи какого-то английского дельца, который, судя по результатам, тоже тот еще шулер... А ведь какие там фундаментальные выводы! Они могут войти в анналы и антропологии (все это переностится на о родство, происхождение и миграции народов), истории, аж эволюции человека. Коллеги, please, дополните мои примеры статистических манипуляций своими или напишите, что там, где Вы работаете, такого нет. Сообщение было отредактировано А - 05.05.2005 20:44 |
Nastja Постоянный участник Новосибирск |
применение критерия Стьюдента к заведомо ненормально распределенным данным Сообщение было отредактировано Nastja - 05.05.2005 21:00 |
avial Постоянный участник |
(А @ 05.05.2005 18:15) Я как-то уже упоминал о чудо-праймерах к известному гену, когда были из 2 тпн выбраны именно те два олига с феноменальной само- и взаимокомплементарностью при низкой температуре отжига, которые в теории работать никогда не должны. И так для двух генов. И с протоколами реакций часто полный бред. Я думаю, многие коллеги могли бы привести еще море примеров. Ну праймеры, не садящиеся на исследуемый ген даже теоретически мне встречались. В конце концов, это могло быть элементарной опечаткой/ошибкой. А вот давно встреченная статья, где рестриктаза, режущая нужный сайт узнавания, находящийся в середине апликона, совершенно случайно резала этот же апликон еще в паре мест, а у авторов красивые картинки на геле "как должно быть" - это как назвать? Жалею, что был тогда молодым и статью просто выбросил. А по статистике... Кстати, интересный вопрос, сколько значащих цифр у целого числа? Не у приближенного, записанного с точностью до целых - с ним все понятно, а именно целого по определению? И зачем округлять частное от деления двух целых чисел? Вы сомневаетесь в 63 знаке дроби 1/3? У вас есть основания считать, что там будет не тройка? Всегда вот мучал такой глупый вопрос |
Nastja Постоянный участник Новосибирск |
|
Wolf Постоянный участник |
Вопрос о выкидывании данных из небольшой выборки (которая не может быть большой), кстати, скорее все же не статистика, а что-то ближе к интуиции. |
Nastja Постоянный участник Новосибирск |
А про нелинейный фиттинг мне так советовали - сводить все к линейному... |
Wolf Постоянный участник |
|
avial Постоянный участник |
|
Aglaya moderator |
(Nastja @ 05.05.2005 21:57) Тоже мне, удивили. Калибровочную прямую – по двум – вот высший пилотаж (не в статье, правда, видела). |
Wolf Постоянный участник |
|
Aglaya moderator |
|
Wolf Постоянный участник |
Построение сигмоиды (пусть 3 параметра) по 4 точкам равноценно построению прямой по двум точкам. С 5 параметрами по 4 точкам - абсурд. Число степеней свободы меньше на 1 числа измерений. К сожалению, сам сейчас вынужден оставить на потом часть результатов из-за большой ошибки измерения. |
Aglaya moderator |
|
Wolf Постоянный участник |
Сейчас вот приходится смотреть полностью записи и пометки, чтобы можно было найти, где выпадают значения. Выборка мала - особенность направления, вряд ли может быть повторена - особенность много чего, обьекта, а не субьекта. Вот и перебираю заметки, в чем согласен с Nastja. Хотя, конечно, разные подходы - где-то рациональнее повторить сто раз, где-то - приходится разбирать, что есть. |
LK Постоянный участник Москва |
А кунсткамера статистических ляпов в биологич и мед статьях уже есть - http://www.biometrica.tomsk.ru. ЕС50 по 4 точкам рассчитать можно. Постройте сигмоиду (кривую Больцмана) и прологарифмируйте обе оси, получится практически прямая. А для прямой 4 точки маловато, конечно, но не смертельно. Сообщение было отредактировано LK - 05.05.2005 23:44 |
Aglaya moderator |
|
avial Постоянный участник |
Во чего нашел. Хотя я бы сказал, что это хи-квадрат - разновидность точного Фишера. Ну да ладно. Тогда на повестке дня остаются только множественные сравнения А тот сайт года три назад был хорошим. С тех пор они почти все сделали платным и он стал почти бесполезным. Хотя я оттуда достаточно много материалов сохранил. Сообщение было отредактировано avial - 06.05.2005 00:28 |
гость: L IP-штамп: frd2SkIM.hhaA гость |
|
Wolf Постоянный участник |
Aglaya: с линеаризацией замечательно, похоже, если значения различаются сильно. |
vb Постоянный участник |
|
vb Постоянный участник |
(SchimmelHunter @ 05.05.2005 12:45) нет времени. можешь продолжить сам. |
avial Постоянный участник |
ЗЫ: Про Бонферрони тема сдулась? |
LK Постоянный участник Москва |
(Wolf @ 05.05.2005 22:31) А если нужен 1-2 параметра + один усредняется для нескольких кривых и рассматривается как 1 (все значения кривой нормируются на 1 как max)? Можно сформулировать задачу в письме или здесь подробно? У меня не EC50, правда. Лучше здесь сначала попробовать (если не окажется, что конкретные цифры нужны, как у aga). Про Бонферрони не сдулась. На мой взгляд, для биологов эта проблема в основном психологическая. Достоверность корреляц связи - это как бы прогноз на следующий раз (когда будет поставлен такой же опыт, обследована похожая выборка людей и т.д.). Пока не сделаешь эти следующие попытки, невозможно утверждать, что между коррелирующими величинами действительно есть связь. Можно только предполагать. А на биометрике зря ввели платный раздел. Теперь все выглядит так - платите бабки, или мы вашу работу выставим в Кунсткамере. Конечно, математикам тоже есть нужно, но раньше этот сайт сближал биологов и математиков, а теперь наоборот. |
Nastja Постоянный участник Новосибирск |
множественные сравнения - мне пока ANOVA хватало. |
ssh Участник |
(LK @ 06.05.2005 07:24) Про Бонферрони не сдулась. На мой взгляд, для биологов эта проблема в основном психологическая. Достоверность корреляц связи - это как бы прогноз на следующий раз (когда будет поставлен такой же опыт, обследована похожая выборка людей и т.д.). Пока не сделаешь эти следующие попытки, невозможно утверждать, что между коррелирующими величинами действительно есть связь. Можно только предполагать. Не понимаю, а в чем тут может быть отличие от любого другого применения статистических методов? Имхо, результат стат. теста - всегда как бы прогноз на все последующие случаи, и чем он надежнее (чем лучше сработала статистика), тем с бОльшей уверенностью можно доверять результату в целом, т.е. считать его "научным". (Причем эту уверенность дают именно стат. методы - без них можно работать лишь "на глазок", со всеми неизбежными зрительными иллюзиями, самообманом и т.п.)2 avial : Почему разработчики стат. пакетов никак не допрут до того, чтобы вводить в них в удобном виде поправки на множественные сравнения - хрен их знает. Мб, потому, что это еще неустоявшаяся область... хотя, впрочем, в Статистике нет даже и кнопочки "Бонферрони"... Хотя основная идеологическая статья, насколько я могу судить, была действительно в 1995 году, но конкретные воплощения тестов с тех пор сильно развивались, и до сих пор вроде бы есть некоторые неясности (в частности, если я не ошибаюсь, обычно исходят из того, что различия не очень сильно скоррелированы между переменными, что часто нарушается на практике). Если посмотреть алгоритмы в статье Korn et al. (см выше), то там они уже довольно навороченные - сильно отличаются от ранних алгоритмов и даже от Benjamini, Krieger, Yekutieli (2004) ( http://www.math.tau.ac.il/~yekutiel/papers/kby22.pdf - тут как раз очень простой метод, кажется, можно считать даже действительно вручную; но он совсем уж подозрительно либерален). Еще проблема - из-за больших различий разных критериев по мощности на практике можно получить чрезвычайно разные результаты с разными тестами (сам я пока использовал только пару непересекающихся методов, но есть статьи по нейроимиджингу и ЭЭГ, где сравниваются разные методы). А кстати, Вы сказали "статистические пакеты ссылаются на работу Хочберга 95 года" - а не могли бы вспомнить, какие именно? "Ограничиваться ли рамками одного эксперимента или вовлекать все исследование и т.д." - да, это забавный вопрос... статистик, наверное, сказал бы: а на какой конкретно вопрос вы хотите ответить? но чтобы вопрос сформулировать, лучше иметь готовые примеры... вроде бы их нетрудно наваять, но пока что вся эта наука (не статистика, а альтернативы к Бонферрони), похоже, в слишком зачаточном состоянии. Есть какие-то неплохие книжки по рандомизационным методам, даже хорошо написанные. Кажется, вот эта очень грамотная и читабельная: Eugene S. Edgington, Marcel Dekker (1995) Randomization Tests. Базовые принципы там вроде бы должны быть (увы, внимательно почитать ее у меня не было возможности). Но она была написана десять лет назад, так что, естественно, никакого FDR |
А Постоянный участник Россия |
Интересно, и зачем эта диломница теряла время на такое. Вообще имхо в эпоху цифровой фотографии и цифровых камер поставить и заснять хороший форез, даже переставить несколько раз, обычно значительно проще, чем качественно подправить существующий (не говоря уж о рисунке полностью), даже при наличии художественного таланта. |
Guest IP-штамп: froLOOvyV3Njo гость |
2ssh В SAS об этом довольно подробно расписано http://www.id.unizh.ch/software/unix/statm...ap43/sect14.htm Именно отсюда я и взял формулки для экселя. И ссылки вроде тоже из него. Westfall-Young мне показался самым простым из "пермутационных", по крайней мере, алгоритмически. Но его я вообще нашел только в нескольких презентациях. Собственно, книжку их не смотрел пока, но хочу. Ибо перспективно |
LK Постоянный участник Москва |
ssh: Не понимаю, а в чем тут может быть отличие от любого другого применения статистических методов? Да в том-то и дело, что ни в чем. Только Вы продвинутый пользователь , а обычно биологи и медики именно этого и не понимают (я по своему институту сужу, по статьям, ну и результаты голосования впечатляющие). Кнопку "Бонферрони" сделать можно, только проблема останется прежняя - что с поправкой достоверное, то уже как бы доказано. Кстати, в Статистике есть кнопка "изменить уровень значимости" (на 0,01 или 0,001, скажем). Делите 0,05 на число переменных и выставляете себе новый уровень. Nastja: но не в том случае, если все значения на графике фактически являются либо -бесконечность, либо +бесконечность Обычно концентрации или дозы берут с определенным шагом, ну скажем через порядок, если наобум. С десятичными логарифмами это все хорошо поджимается. Только не подумайте, что я призываю ограничиваться 4-мя точками . Сообщение было отредактировано LK - 06.05.2005 19:05 |
ssh Участник |
(Guest @ 06.05.2005 13:45) Вообще, для мед. генетики и ассоциативных исследований проблема множественных сравнений стоит довольно остро. Могу представить. То же в нейроимиджинге. Хорошо, что это стало осознаваться За ссылку - спасибо! (Я стараюсь собирать все, что относится к этой теме.) Видимо, САС - первый крупный пакет, в котором что-то в этом роде появилось? (В последней версии Статистики вроде бы ничего не было.) Увы, к практически удобным он не относится, хорошо хоть алгоритмы хорошо расписаны. Но, насколько я понял, "наука с тех пор ушла вперед". К сожалению, в пакете, про который я писал выше - http://linus.nci.nih.gov/BRB-ArrayTools.html - процедура коррекции p закопана где-то довольно глубоко, но там она наиболее развита - в частности, одновременно используется FDR control и рандомизация. Алгоритм описан в статье Korn et al., на которую я тоже давал ссылку, но его довольно трудно воспроизводить самостоятельно. Процедура Benjamini and Hochberg (1995), описанная в Вашей ссылке, слишком упрощенная, мне особенно не нравится, что "they are guaranteed to control the false discovery rate only with independent p-values that are uniformly distributed under their respective null hypotheses". Я сделал простенькую програмку в Матлабе по более развитому варианту этого алгоритма (Yoav Benjamini, Abba M. Krieger and Daniel Yekutieli (2004). Adaptive Linear Step-up Proceudres that control the False Discovery Rate http://www.math.tau.ac.il/%7Eyekutiel/papers/kby22.pdf ; более простое и ясное изложение процедуры есть в Hemmelmann C, Horn M, Susse T, Vollandt R, Weiss S. New concepts of multiple tests and their use for evaluating high-dimensional EEG data. J Neurosci Methods. 2005 Mar 30;142(2):209-17), если кому-н мб полезна, могу выслать. Но она дает подозрительно либеральные результаты... Я думаю, в этой области сейчас что-то новое будет появляться каждые несколько месяцев. |
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |