СтормовЪ - лаборатория для профессионалов спонсор проекта: компания "СтормовЪ"   Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | БИОХИМИЯ | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Туризм | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZBIO

ЖИЗНЬ РАСТЕНИЙ · ILLUMINA SEQUENCING · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ · ИЗДАТЕЛЬСТВО КМК


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 

Щёлкните, чтобы внести в Избранные Темы* Минимальный объем выборки
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* Схема · [ Стандартный ] · +Перв.сообщ.


 
Добавить сообщение в темуСоздать новую темуСоздать голосование
Участник оффлайн! bklimovich
Постоянный участник



 прочитанное сообщение 03.12.2009 16:05     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #1 множественное цитирование

Коллеги, подскажите пожалуйста:
имеются 2 выборки - объемы опухолей в опыте и контроле. Признак варьирует очень сильно (среднее=800, SD=1000). Как определить минимальный объем выборки, чтобы с вероятностью 95% увидеть различия между двумя выборками (если они, конечно, есть)?
Заранее благодарен
Участник оффлайн! Den-N
Участник



 прочитанное сообщение 03.12.2009 21:14     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #2 множественное цитирование

Такая сильная вариабельность признака указывает на ненормальность распределения. Для ваших данных коэффициент вариации = 1000/800=1,25 или 125%, тогда как в не слишком малых выборках из нормального распределения он не может превышать 33%. Причин - 2. Соответственно решения будут различны.

(1). Распределение признака ненормальное, но одновершинное. Посмотрите гистограмму распределения признака. Скорее всего распределение будет асимметричным - с удлинённым хвостом справа. Такие распределения близки к логарифмически нормальному. Поэтому попробуйте прологарифмировать исходные данные, посмотрите станет ли распределение более симметричным. Если да - работайте далее с логарифмами. Расчёт выборки для сравнения t-критерием Стьюдента - есть онлайновые калькуляторы, например: http://www.changbioscience.com/stat/ssize.html
Выберите ... (two-sided independent) - двусторонний тест для независимых выборок. Альфа = 0.05 (уровень значимости), Бета = 0.2 (обычно мощность в 80% считается достаточной), D - разница в размерах опухолей 2-х групп, которую вы хотите обнаружить. Чем меньше разница, тем закономерно больше наблюдений понадобится. Если работаете с ln - вводите разность в логарифмах. В последней ячейке вбейте SD - 1000 или ln(1000) если будете всё логармировать. Go!

(2) Хуже, если распределение признака не одновершинное, а с несколькими модами. Значит выборка неоднородна - в ней присутствует несколько классов опухолей (классов не в медицинском, а в статистическом смысле). В этом случае средний размер в выборке будет определятся соотношением особей с разными размерными классами опухолей и сравнение групп нужно будет проводить не по среднему размеру опухоли, а по количеству особей в каждом классе опухолей - сравнивать однородность распределения особей по размернм классам опухолей. Это делается с помощью критериев типа хи-квадрат, но пока никаких рекомендаций по объёму выборок дать нельзя.
Вопросы медицинской статистики обсуждают здесь: http://forum.disser.ru

Сообщение было отредактировано Den-N - 03.12.2009 21:24
Участник оффлайн! bklimovich
Постоянный участник



 прочитанное сообщение 04.12.2009 12:09     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #3 множественное цитирование

Спасибо за совет!
Да, распределение, безусловно, не нормальное, оно унимодальное с хвостом справа.
После логарифмической трансформации тест Колмогорова-Смирнова показывает нормальность распределения, среднее становится 6, SD - 2,2, это уже на что-то похоже. Правильно я понимаю, что делать надо так: у двух моих выборок разница между средним и медианой составляет примерно 1 (после трансформации данных). Это значение и вводится в калькулятор? Он выдает 79. То есть, чтобы доказать статичтическую значимость различий признака в двух группах необходимо 79 образцов?
Участник оффлайн! Den-N
Участник



 прочитанное сообщение 04.12.2009 17:23     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #4 множественное цитирование

А почему между средним и медианой? Между двумя средними. Т.е. из логарифма первой выборки вычесть логарифм предполагаемого среднего второй выборки. Понятно, что если вы предполагаете, изменение показателя в опыте на 10% относительно контроля то потребуется высокая чувствительность критерия - понадобится много наблюдений, а если изменение в 10 раз - совсем немного.
"у двух моих выборок разница между средним и медианой составляет примерно 1..." Здесь не понял. Ведь планирование объёмов выборок проводится до исследования на основании предварительных и/или литературных данных. Если же вы уже имеете измерения в обеих выборках - зачем такие расчёты? Сравнивайте 2 выборки напрямую - может имеющихся объёмов будет уже достаточно для обнаружения статистически значимых различий в средних.

Сообщение было отредактировано Den-N - 04.12.2009 17:24
Участник оффлайн! bklimovich
Постоянный участник



 прочитанное сообщение 04.12.2009 19:09     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #5 множественное цитирование

конечно между двумя средними, ну или двумя медианами, они примерно сравнялись.
я как бы считаю, что получил предварительные данные о вариации признака (пилотный эксперимент на маленькой выборке). данные из опыта и контроля различаются, но недостоверно. соответственно, вопрос поставлен: какой мне нужен объем выборки, чтобы при существующем разбросе данных наблюдаемая разница могла бы быть расценена как достоверная. Или такой вопрос не слишком правомерен?
Участник оффлайн! Den-N
Участник



 прочитанное сообщение 04.12.2009 20:30     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #6 множественное цитирование

Ну тогда вы действуете абсолютно грамотно. И из этих действий следует неутешительный вывод о необходимости 80 наблюдений в каждой группе в рамках стандартного подхода к анализу данных. Если получение таких выборок проблематично - можно пойти на маленькую хитрость. Почитайте про технику последовательного анализа Вальда. Например, есть описание с примером в Урбах. Биометрические методы (можно найти в сети - около 80 МБ) и в Хальд. Математическая статистика с техническими приложениями (есть в сети, но не нашёл бесплатно). При таком анализе на основании предварительных данных рассчитываются границы коридора принятия решения, и испытания продолжаются пока график функции, которая пересчитывается после каждого нового наблюдения не перейдёт одну из этих границ (есть различия - нет различий). Этот подход требует в 2-3 раза меньших объёмов выборок и позволяет быстрее принять статистически обоснованное решение - не случайно эта техника составляла гостайну США все военные годы и была рассекречена только в 1950-м году.
Участник оффлайн! bklimovich
Постоянный участник



 прочитанное сообщение 05.12.2009 12:04     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #7 множественное цитирование

Спасибо большое, чувствую, на специалиста наткнулся))
На самом деле это действительно был пилотный эксперимент: посмотрели разброс признака, поняли, сколько надо брать животных для получения достоверных данных. Но, главное, тенденция, наметившаяся в опыте, хоть и не доказанная статистически, свидетельствует о том, что получаемый результат противоположен желаемому, то есть увеличив объем выборки (в нашем случае в 4 раза) мы лишь статистически обоснованно поймем, что зря потратили силы и деньги. Так что и не стоит мучатся: либо модель неадекватна, либо проверяемая гипотеза не верна в целом.
Еще раз спасибо за помощь!
Участник оффлайн! bubnilkin




 прочитанное сообщение 19.06.2010 07:32     Сообщение для модератора         Личное письмо
Цитировать Поместить сообщение в колонку новостей  URL #8 множественное цитирование

уважаемый Den-N, не могли бы объяснить просто про последовательный анализ вальда? или скажите, где про него просто написано (я не разбираюсь в математике...

заранее спасибо
Участник оффлайн! Den-N
Участник



 прочитанное сообщение 12.07.2010 19:36     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #9 множественное цитирование

Последовательный (секвенциальный) анализ.
Урбах Ю. Биометрические методы, стр. 158-..., - с примером. Хальд А. Математическая статистика с техническими приложениями, стр. 636-... Обе книги можно найти в сети (75 и 14 Мб соответственно).

Всего благодарностей: 1Поблагодарили (1): bubnilkin

*




Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.
Имя:

 преобразовывать смайлики · показать смайлики
Назначение кнопок:

   Поблагодарить автора сообщения — поблагодарить автора
   Удалить сообщение — удалить
   Редактировать сообщение — редактировать
   Поместить сообщение в колонку новостей — поместить в колонку новостей
   Цитировать — цитировать сообщение
   не входит в цитирование/входит в цитирование — цитировать несколько
   Отметить СПАМ-сообщение — обозначить спам
   Сообщение для модератора — связь с модератором
   Участник онлайн!/Участник оффлайн! — автор онлайн/оффлайн
   Фотография — фотография автора

   - остальные обозначения -
 
   *
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема »
Быстрый ответДобавить сообщение в темуСоздать новую тему

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте.  ·  Новая сауна в Москве для парения.  ·  здесь можно скачать фильмы бесплатно  · 
--- сервер арендован в компании euhoster.ru, Финляндия, г.Хельсинки ---
 ·  term paper  ·  free dating sites  ·  Если нужна работа, заходите на Slando  · 
--- администрирование сервера: Intervipnet ---
 ·  Купить bluetooth гарнитуру на SotMarket.ru  ·  отличный выбор ванны чугунные с доставкой  ·  недорогие межкомнатные двери в интернет-магазине  · 

Синтол · Millipore · Диаэм · Axygen · ДНК-синтез · БиоЛайн · Beckman Coulter · Хеликон · Химмед · Биосан · Merck KGaA · Waters · Elite-Genetix
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 07.09.10 14:43
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft