|
| * | |
|
Molbiol.ru | БИОХИМИЯ | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Туризм | Работы и услуги | Биржа труда | ЖИЗНЬ РАСТЕНИЙ · ILLUMINA SEQUENCING · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ · ИЗДАТЕЛЬСТВО КМК Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
* Минимальный объем выборки
![]() ![]() ![]() |
bklimovichПостоянный участник |
имеются 2 выборки - объемы опухолей в опыте и контроле. Признак варьирует очень сильно (среднее=800, SD=1000). Как определить минимальный объем выборки, чтобы с вероятностью 95% увидеть различия между двумя выборками (если они, конечно, есть)? Заранее благодарен |
Den-NУчастник |
(1). Распределение признака ненормальное, но одновершинное. Посмотрите гистограмму распределения признака. Скорее всего распределение будет асимметричным - с удлинённым хвостом справа. Такие распределения близки к логарифмически нормальному. Поэтому попробуйте прологарифмировать исходные данные, посмотрите станет ли распределение более симметричным. Если да - работайте далее с логарифмами. Расчёт выборки для сравнения t-критерием Стьюдента - есть онлайновые калькуляторы, например: Выберите ... (two-sided independent) - двусторонний тест для независимых выборок. Альфа = 0.05 (уровень значимости), Бета = 0.2 (обычно мощность в 80% считается достаточной), D - разница в размерах опухолей 2-х групп, которую вы хотите обнаружить. Чем меньше разница, тем закономерно больше наблюдений понадобится. Если работаете с ln - вводите разность в логарифмах. В последней ячейке вбейте SD - 1000 или ln(1000) если будете всё логармировать. Go! (2) Хуже, если распределение признака не одновершинное, а с несколькими модами. Значит выборка неоднородна - в ней присутствует несколько классов опухолей (классов не в медицинском, а в статистическом смысле). В этом случае средний размер в выборке будет определятся соотношением особей с разными размерными классами опухолей и сравнение групп нужно будет проводить не по среднему размеру опухоли, а по количеству особей в каждом классе опухолей - сравнивать однородность распределения особей по размернм классам опухолей. Это делается с помощью критериев типа хи-квадрат, но пока никаких рекомендаций по объёму выборок дать нельзя. Вопросы медицинской статистики обсуждают здесь: Сообщение было отредактировано Den-N - 03.12.2009 21:24 |
bklimovichПостоянный участник |
Да, распределение, безусловно, не нормальное, оно унимодальное с хвостом справа. После логарифмической трансформации тест Колмогорова-Смирнова показывает нормальность распределения, среднее становится 6, SD - 2,2, это уже на что-то похоже. Правильно я понимаю, что делать надо так: у двух моих выборок разница между средним и медианой составляет примерно 1 (после трансформации данных). Это значение и вводится в калькулятор? Он выдает 79. То есть, чтобы доказать статичтическую значимость различий признака в двух группах необходимо 79 образцов? |
Den-NУчастник |
"у двух моих выборок разница между средним и медианой составляет примерно 1..." Здесь не понял. Ведь планирование объёмов выборок проводится до исследования на основании предварительных и/или литературных данных. Если же вы уже имеете измерения в обеих выборках - зачем такие расчёты? Сравнивайте 2 выборки напрямую - может имеющихся объёмов будет уже достаточно для обнаружения статистически значимых различий в средних. Сообщение было отредактировано Den-N - 04.12.2009 17:24 |
bklimovichПостоянный участник |
я как бы считаю, что получил предварительные данные о вариации признака (пилотный эксперимент на маленькой выборке). данные из опыта и контроля различаются, но недостоверно. соответственно, вопрос поставлен: какой мне нужен объем выборки, чтобы при существующем разбросе данных наблюдаемая разница могла бы быть расценена как достоверная. Или такой вопрос не слишком правомерен? |
Den-NУчастник |
|
bklimovichПостоянный участник |
На самом деле это действительно был пилотный эксперимент: посмотрели разброс признака, поняли, сколько надо брать животных для получения достоверных данных. Но, главное, тенденция, наметившаяся в опыте, хоть и не доказанная статистически, свидетельствует о том, что получаемый результат противоположен желаемому, то есть увеличив объем выборки (в нашем случае в 4 раза) мы лишь статистически обоснованно поймем, что зря потратили силы и деньги. Так что и не стоит мучатся: либо модель неадекватна, либо проверяемая гипотеза не верна в целом. Еще раз спасибо за помощь! |
bubnilkin |
заранее спасибо |
Den-NУчастник |
Урбах Ю. Биометрические методы, стр. 158-..., - с примером. Хальд А. Математическая статистика с техническими приложениями, стр. 636-... Обе книги можно найти в сети (75 и 14 Мб соответственно).
|
| « Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |
![]() ![]() ![]() |