Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 


Щёлкните, чтобы внести в Избранные Темы* R - Kolmogorov-Smirnov test (ks.test)
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* [ Схема ] · Стандартный · +Перв.сообщ.


Участник оффлайн! nattali80
Участник



 прочитанное сообщение 21.06.2013 17:20     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #1 множественное цитирование
Вопрос
Я только начинаю изучать R, не могли бы вы помочь разобраться с деталями проведения в R стат. анализа Kolmogorov-Smirnov для двух выборок?.


Ориентировалась по хелпу к ks.test (это пакет базовой библиотеки - stats)
Для сравнения проводила анализ с теми же данными в R и в SPSS.

Код в R:

> #1. Test September and November
> September <- c (2.4758620690, 1.0232558140, 2.4800000000, 1.5468750000, 3.1358024691, 2.6000000000,2.1904761905, 1.2,  1.4210526316, 1.6666666667, 3.4177215190, 1.1363636364, 1.2790697674)

> c=1
> November<- c(2.350, 1.0638297872, 2.8571428571, 2.40, 1.7407407407, 1.9565217391, 0.50, 1.0512820513, 1.5510204082, 0.880952381, 6.8777777778, 0.6097560976, 0.7894736842)

> c=1

> # Do September and November come from the same distribution?
> ks.test(September, November)

        Two-sample Kolmogorov-Smirnov test

data:  September and November
D = 0.3846, p-value = 0.2999
alternative hypothesis: two-sided



И результаты Колмогоров-Смирнов теста для двух выборок с этими же данными в SPSS (данные из итоговой таблицы)

1.Нулевая гипотеза: «Распределение А является одинаковым для категорий month»
2. Критерий: «Критерий Колмогорова-Смирнова для независимых выборок»
3. Значимость 0,291
4. Решение: «Нулевая гипотеза принимается»
Примечание: «Выводятся асимптотические значимости. Уровень значимости равен 0.05»


Мои вопросы по проведению этого анализа в R.

Вопрос первый. В тесте (ks.test), который я использовала - в хелпе не указано (или же я не понимаю где это), как задавать критерий значимости (по идее ведь его можно выбирать самому). Также не указано, какой они берут по умолчанию критерий значимости. (в SPSS он указан – 0,05).
Как можно понять, какой используется по умолчанию критерий значимости в ks.test?. Как можно задать другой критерий значимости (н-р 0.001 , 0.001 и т.п.)?
Исходя из моего кода в R – является ли он правильным, или там как раз не хватает задания критерия значимости?

И вопрос второй.
Как видно из кода R и результатов SPSS – определенная значимость (p-value) примерно одинаковы (0.2999 в R и 0,291 в SPSS). То есть можно предположить, что расчет в R проведен всё же правильно. Но ответ SPSS – “Нулевая гипотеза принимается”, а ответ R – “alternative hypothesis: two-sided”. Что означает такой ответ R? Что он принимает альтернативную гипотезу? Но почему если это так? Или же это просто такой стиль оформления исходных условий проведения теста? Но по идее, он, как и SPSS, должен написать именно, что "нулевая гипотеза принимается"
 
Добавить сообщение в темуСоздать новую темуСоздать голосование
Ответы
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 23.06.2013 02:18     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #2 множественное цитирование

Любой статистический критерий это - математический метод, позволяющий количественно рассчитать Р. Для того чтобы быть хорошим исследователем-практиком вовсе необязательно знать собственно математический метод, т.к. есть очень сложные методы для понимания которых нужно быть именно математиком. Но хороший исследователь должен уметь правильно выбирать из всего многообразия существующих математических методов (стат. критериев) именно тот, который оптимален в данном конкретном случае. Для этого нужно быть больше чем просто практиком, но всё-же не нужно быть математиком (и это радует smile.gif ). Важно знать основные принципы выбора критерия + сильные и слабые стороны конкретного критерия. В хороших учебниках их пытаются расписать максимально понятным для нематематиков языком. Т.е. если вы, опираясь на такое руководство, пришли к выводу, что критерий Колмогорова-Смиронова и есть тот самый оптимальный критерий для вашей задачи, типа данных и объёмов выборок, то ему в любой программе нужно просто "скормить" сырые данные (и только их), чтобы он выдал Р.

Проблема выбора оптимального критерия намного важнее каких-то технических деталей реализации расчётного алгоритма конкретного метода и даже того точные или асимптотические оценки выдаёт программа. Т.е сначала выбираем лучший метод, а уже потом лучшую программу с ним.

Что касается стат. проверки гипотез, то тут действительно есть и путаница и недопонимание даже у авторов учебников.

Всего благодарностей: 1Поблагодарили (1): nattali80
Участник оффлайн! nattali80
Участник



 прочитанное сообщение 23.06.2013 17:57     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #3 множественное цитирование

Den-N, ваше сообщение #8.
Большое спасибо. Мне стал понятен подход к использованию. Да, выбрать критерий, и просто использовать его в программе. Но всё таки.. очевидно, что обычный исследователь чаще этим и ограничиться, не будет сравнивать и закапываться.

Но вот даже в этом маленьком примере – видна разница между расчетом в R и расчетом в SPSS. Отсюда возникает предположение – что они используют разную методику расчетов. Отсюда возникает желание – увидеть эту методику в этих программах. Да и просто – создавая программу, очевидно, что авторы должны создавать возможность «проверить» их, как они считают а как же иначе? На основе чего им доверять? То есть, может быть, это громоздко и ненужно выводить всё в описании к опции. Но должна быть возможность – найти информацию об использованном математическом принципе расчета. Пусть даже понятным только для математика. Подходя к серьезной научной задаче – нельзя слепо полагаться на программы, нужно иметь возможность проверить ключевые вещи самому, или имея кого-то в команде кто может это сделать.



(Den-N @ 23.06.2013 03:18)


Проблема выбора оптимального критерия намного важнее каких-то технических деталей реализации расчётного алгоритма конкретного метода и даже того точные или асимптотические оценки выдаёт программа. Т.е сначала выбираем лучший метод, а уже потом лучшую программу с ним.

Что касается стат. проверки гипотез, то тут действительно есть и путаница и недопонимание даже у авторов учебников.


Сообщение было отредактировано nattali80 - 23.06.2013 18:02
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 23.06.2013 20:55     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #4 множественное цитирование

(nattali80 @ 23.06.2013 20:57)
Ссылка на исходное сообщение  Den-N, ваше сообщение #8.
Но вот даже в этом маленьком примере – видна разница между расчетом в R и расчетом в SPSS. Отсюда возникает предположение – что они используют разную  методику расчетов. Отсюда возникает желание – увидеть эту методику в этих программах. Да  и просто – создавая программу, очевидно, что авторы должны создавать возможность «проверить» их, как они считают а как же иначе? На основе чего им доверять? То есть, может быть, это громоздко и ненужно выводить всё в описании к опции. Но должна быть возможность – найти информацию об использованном математическом принципе расчета. Пусть даже понятным только для математика. Подходя к серьезной научной задаче – нельзя слепо полагаться на программы, нужно иметь возможность проверить ключевые вещи самому, или имея кого-то в команде кто может это сделать.

Конечно, возможность проверки обязательно должна быть, т.к. даже крутые пакеты неизбежно содержат ошибки. Даже в математических библиотеках Excel'я есть ошибки, что уж говорить о более специализированных/ менее распространённых пакетах. Если хотите разбираться с критерием Колмогорова, известным на западе как критерий Колмогорова-Смирнова, то лучше всего он изложен в
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М: Наука, 1983. 416 с.
на стр. 80-82. Там даны как точные формулы, так и аппроксимации разной степени точности, а также ссылки на литературу.

Всего благодарностей: 1Поблагодарили (1): nattali80
Участник оффлайн! nattali80
Участник



 прочитанное сообщение 24.06.2013 01:27     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #5 множественное цитирование

(Den-N @ 23.06.2013 21:55)
Если хотите разбираться с критерием Колмогорова, известным на западе как критерий Колмогорова-Смирнова, то лучше всего он изложен в
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М: Наука, 1983. 416 с.
на стр. 80-82. Там даны как точные формулы, так и аппроксимации разной степени точности, а также ссылки на литературу.


Ну на данном этапе мне важно знать, что это вообще в принципе можно проверить, и кто-то это, вероятно, и делает, то есть - идет контроль на ошибки в пакетах.


(Den-N @ 23.06.2013 02:09)
Для проверки гипотез в настоящее время используется так называемый "синтетический" частотный подход, который идеологически, по-сути, есть подход 1 - подход Фишера, и хорошие программы должны выдавать точные достигнутые значения Р.


А вот по "синтетическому" частотному подходу - может быть вы подскажете, какое он имеет название на английском, чтобы можно было найти о нем информацию и понять в общих чертах суть, грамотно сослаться в методике работы и пр.?

Сообщение было отредактировано nattali80 - 24.06.2013 01:31

Сообщения этой темы
прочитанное сообщение nattali80   R - Kolmogorov-Smirnov test (ks.test)   21.06.2013 17:20
прочитанное сообщение Flyamer   Нет, R не делает за Вас решения по поводу верности...   21.06.2013 22:32
прочитанное сообщение nattali80   Я, видимо, несколько запуталась в теории, оттого...   22.06.2013 03:12
прочитанное сообщение Flyamer   Честно скажу, я крайне плохо разбираюсь в этом на ...   22.06.2013 11:06
прочитанное сообщение nattali80   Спасибо за помощь! Мне сейчас это пока плохова...   22.06.2013 18:55
прочитанное сообщение Den-N   Подход 2 по Резнику - подход, вытекающий из концеп...   23.06.2013 01:09
прочитанное сообщение nattali80   Большое спасибо за разъяснения! Они усложнили ...   23.06.2013 01:18
прочитанное сообщение Guest   Смысл предельно ясен. Для того, чтобы написать в ...   23.06.2013 17:05
прочитанное сообщение Den-N   Любой статистический критерий это - математический...   23.06.2013 02:18
прочитанное сообщение nattali80   Den-N, из вашего сообщения (url#6), а также из дру...   23.06.2013 17:52
прочитанное сообщение nattali80   Den-N, ваше сообщение #8. Большое спасибо. Мне ст...   23.06.2013 17:57
прочитанное сообщение Den-N   Конечно, возможность проверки обязательно должна ...   23.06.2013 20:55
прочитанное сообщение nattali80   Ну на данном этапе мне важно знать, что это вооб...   24.06.2013 01:27
прочитанное сообщение Flyamer   У R открыт код, можно посмотреть, что там комп вып...   23.06.2013 20:40
прочитанное сообщение Den-N   В сортированном материале не нашёл, значит быстро ...   24.06.2013 17:13
прочитанное сообщение nattali80   Большое спасибо! Wiki отличная вещь для нача...   25.06.2013 06:38
прочитанное сообщение guest: 123   SINCE LAUNCHING AMB CASINO HIS INVASION OF UKRAINE...   31.05.2022 11:07
прочитанное сообщение asd   South Korea 123VEGA and the US launched WAZDAN eig...   06.06.2022 10:50
прочитанное сообщение guest: 123   Saxon Mullins 123VEGA says she once had PRAGMATIC ...   11.06.2022 11:09


*




Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.
Имя:

 преобразовывать смайлики · показать смайлики
Назначение кнопок:

   Поблагодарить автора сообщения — поблагодарить автора
   Удалить сообщение — удалить
   Редактировать сообщение — редактировать
   Поместить сообщение в колонку новостей — поместить в колонку новостей
   Цитировать — цитировать сообщение
   не входит в цитирование/входит в цитирование — цитировать несколько
   Отметить СПАМ-сообщение — обозначить спам
   Сообщение для модератора — связь с модератором
   Участник онлайн!/Участник оффлайн! — автор онлайн/оффлайн
   Фотография — фотография автора

   - остальные обозначения -
 
   *
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема »
Быстрый ответДобавить сообщение в темуСоздать новую тему

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте  ·  Доска объявлений Board.com.ua  · 
--- сервер арендован в компании Hetzner Online, Германия ---
--- администрирование сервера: Intervipnet ---

Хеликон · Диаэм · ИнтерЛабСервис · Beckman Coulter · SkyGen · ОПТЭК · BIOCAD · Евроген · Синтол · БиоЛайн · Sartorius · Химэксперт · СибЭнзим · Tecan · Даниес · НПП "ТРИС" · Биалекса · ФизЛабПрибор · Genotek · АТГ Сервис Ген · Биоген-Аналитика
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 20.04.24 01:28
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft