Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 

Ответ в R - Kolmogorov-Smirnov test (ks.test)

Иконка сообщения*  [ Без иконки ]   Важно!   Вопрос   Информация     Обмен опытом   Шутка, забавная история     Поздравления, благодарности   Возмутительно!   Проблема   Картинки, фотографии
Введите имя

 [вст. закрывающие теги*

*


*



Смайлик: согласен Смайлик: не согласен Смайлик: улыбка Смайлик: пожалуйста, умоляю! Смайлик: помираю со смеху Смайлик: подмигивание Смайлик: подшучивать, дразнить Смайлик: смущение Смайлик: мне стыдно Смайлик: жуть! Смайлик: не понял Смайлик: закатывать глаза Смайлик: недовольство, огорчение Смайлик: рёв в три ручья Смайлик: злость Смайлик: супер Смайлик: умник Смайлик: чайник Смайлик: сходка Смайлик: Ура! Смайлик: не получается!
Перевод выделенного текста из латиницы в кирилицу. Текст в квадратных скобках '[]' не преобразуется

Пример: biologija -> биология [b] - полужирный шрифт

Пример: [b]полужирный[/b] [i] - курсив

Пример: [i]курсив[/i] [u] - подчёркнутый

Пример: [u]подчёркнутый[/u] [sup] - верхний индекс

Пример: температура 37[sup]o[/sup]C [sub] - нижний индекс

Пример: H[sub]2[/sub]O - вода [QUOTE] - применяется для цитирования чужих сообщений, цитата вставляется с небольшим отступом от края текста

Пример: [QUOTE]цитата[/QUOTE] [code] - форматирование как при вводе
Применяется для вывода теста как он есть, с предотвращением форматирования (автопереноса на новую строку), без интерпретации кодов форума и смайликов; вставляется с небольшим отступом от края текста.

Пример: 
[code]
программный код
	1 строка
	2 строка
[/code] [list] - список:
возможны опции: 1, a, A, i, I
[list] неупорядоченный; 
[list=1] нумерованный; 
[list=A] упорядоченный по буквам A-Z

Пример:
[list=1]
[*] первая строка;
[*] вторая строка;
[/list] Тег [hr] - горизонтальная разделительная линия

Пример: 
Абзац 1
[hr]
Абзац 2 [url] - гиперссылка

Примеры:
[url]www.ncbi.nlm.nih.gov[/url]
[url=http://www.ncbi.nlm.nih.gov/]NCBI[/url] [email] - ссылка на адрес электронной почты

Пример: [email]masha@mail.ru[/email] Тег [img] - рисунок
[img] - в строке;
[imgL] - выравнивание по левому краю; 
[imgR] - выравнивание по правому краю.

Пример:
[img]http://molbiol.ru/izo/rl.gif[/img] [ru] - только для русских читателей

Пример:
[ru]это увидят только те, кто использует русский интерфейс[/ru] [en] - только для английских читателей

Пример:
[en]это увидят только те, кто использует английский интерфейс[/en] [self] - текст виден только вам и администрации

Пример:
[self]это увидите только вы сами[/self]
[left] - выравнивание по левому краю

Пример: [left]текст слева[/left] [center] - выравнивание по центру

Пример: [center]текст в центре[/center] [right] - выравнивание по правому краю

Пример: [right]текст справа[/right] [just] - выравнивание по обоим краям

Пример: [just]выровненный текст[/just]

     размер сообщения / макс. размер:  / 15360


Последние 10 сообщений [ в обратном порядке ]
nattali80 Отправлен 25.06.2013 06:38
 
(Den-N @ 24.06.2013 18:13)
Ссылка на исходное сообщение  В сортированном материале не нашёл, значит быстро не найду. Но можно и от википедии оттолкнуться:
http://en.wikipedia.org/wiki/Statistical_hypothesis_testing
Здесь он назван не "синтетическим", а "гибридным".
Немного истории и много критики по русски во вложении.


Большое спасибо! Wiki отличная вещь для начала любого изучения, а то и заполнения части вводной информации.

The modern version of hypothesis testing is a hybrid of the two approaches that resulted from confusion by writers of statistical textbooks (as predicted by Fisher) beginning in the 1940s.



Немного истории и много критики по русски во вложении.

Спасибо!
Den-N Отправлен 24.06.2013 17:13
  В сортированном материале не нашёл, значит быстро не найду. Но можно и от википедии оттолкнуться:
http://en.wikipedia.org/wiki/Statistical_hypothesis_testing
Здесь он назван не "синтетическим", а "гибридным".
Немного истории и много критики по русски во вложении.
nattali80 Отправлен 24.06.2013 01:27
 
(Den-N @ 23.06.2013 21:55)
Если хотите разбираться с критерием Колмогорова, известным на западе как критерий Колмогорова-Смирнова, то лучше всего он изложен в
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М: Наука, 1983. 416 с.
на стр. 80-82. Там даны как точные формулы, так и аппроксимации разной степени точности, а также ссылки на литературу.


Ну на данном этапе мне важно знать, что это вообще в принципе можно проверить, и кто-то это, вероятно, и делает, то есть - идет контроль на ошибки в пакетах.


(Den-N @ 23.06.2013 02:09)
Для проверки гипотез в настоящее время используется так называемый "синтетический" частотный подход, который идеологически, по-сути, есть подход 1 - подход Фишера, и хорошие программы должны выдавать точные достигнутые значения Р.


А вот по "синтетическому" частотному подходу - может быть вы подскажете, какое он имеет название на английском, чтобы можно было найти о нем информацию и понять в общих чертах суть, грамотно сослаться в методике работы и пр.?
Den-N Отправлен 23.06.2013 20:55
 
(nattali80 @ 23.06.2013 20:57)
Ссылка на исходное сообщение  Den-N, ваше сообщение #8.
Но вот даже в этом маленьком примере – видна разница между расчетом в R и расчетом в SPSS. Отсюда возникает предположение – что они используют разную  методику расчетов. Отсюда возникает желание – увидеть эту методику в этих программах. Да  и просто – создавая программу, очевидно, что авторы должны создавать возможность «проверить» их, как они считают а как же иначе? На основе чего им доверять? То есть, может быть, это громоздко и ненужно выводить всё в описании к опции. Но должна быть возможность – найти информацию об использованном математическом принципе расчета. Пусть даже понятным только для математика. Подходя к серьезной научной задаче – нельзя слепо полагаться на программы, нужно иметь возможность проверить ключевые вещи самому, или имея кого-то в команде кто может это сделать.

Конечно, возможность проверки обязательно должна быть, т.к. даже крутые пакеты неизбежно содержат ошибки. Даже в математических библиотеках Excel'я есть ошибки, что уж говорить о более специализированных/ менее распространённых пакетах. Если хотите разбираться с критерием Колмогорова, известным на западе как критерий Колмогорова-Смирнова, то лучше всего он изложен в
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М: Наука, 1983. 416 с.
на стр. 80-82. Там даны как точные формулы, так и аппроксимации разной степени точности, а также ссылки на литературу.
Flyamer Отправлен 23.06.2013 20:40
  У R открыт код, можно посмотреть, что там комп выполняет) Если тест написан на самом R'е, то должно быть вполне реально разобраться.
nattali80 Отправлен 23.06.2013 17:57
  Den-N, ваше сообщение #8.
Большое спасибо. Мне стал понятен подход к использованию. Да, выбрать критерий, и просто использовать его в программе. Но всё таки.. очевидно, что обычный исследователь чаще этим и ограничиться, не будет сравнивать и закапываться.

Но вот даже в этом маленьком примере – видна разница между расчетом в R и расчетом в SPSS. Отсюда возникает предположение – что они используют разную методику расчетов. Отсюда возникает желание – увидеть эту методику в этих программах. Да и просто – создавая программу, очевидно, что авторы должны создавать возможность «проверить» их, как они считают а как же иначе? На основе чего им доверять? То есть, может быть, это громоздко и ненужно выводить всё в описании к опции. Но должна быть возможность – найти информацию об использованном математическом принципе расчета. Пусть даже понятным только для математика. Подходя к серьезной научной задаче – нельзя слепо полагаться на программы, нужно иметь возможность проверить ключевые вещи самому, или имея кого-то в команде кто может это сделать.



(Den-N @ 23.06.2013 03:18)


Проблема выбора оптимального критерия намного важнее каких-то технических деталей реализации расчётного алгоритма конкретного метода и даже того точные или асимптотические оценки выдаёт программа. Т.е сначала выбираем лучший метод, а уже потом лучшую программу с ним.

Что касается стат. проверки гипотез, то тут действительно есть и путаница и недопонимание даже у авторов учебников.
nattali80 Отправлен 23.06.2013 17:52
  Den-N, из вашего сообщения (url#6), а также из других сообщений треда.
1. Следует, что все хорошие программы сейчас используют для проверки стат. гипотез метод Фишера (Первый метод по ссылке Резника в моем сообщении) = "синтетический" частотный подход.

И для него пользователь не должен указывать уровень значимости, а, наоборот, исходя из рассчитанного программой точного значения p-value - должен сравнивать его с любым желаемым для себя уровнем значимости (сообщение #2)

2. Однако не следует ли из того, что при расчете в SPSS пользователь может задавать любой уровень значимости (а 0,05 – это просто установка по умолчанию), что это уровень значимости входит в расчет P-value в SPSS? И что тогда, может быть, они используют все-таки второй подход (из ссылки по Резнику), где уровень значимости входит в формулу?
Guest Отправлен 23.06.2013 17:05
 
(Den-N @ 23.06.2013 01:09)
Ссылка на исходное сообщение А вот какой смысл программисты вкладывали в выражение «Уровень значимости равен 0.05» действительно остаётся непонятным.

Смысл предельно ясен. Для того, чтобы написать в результатах вот это smile.gif:

4. Решение: «Нулевая гипотеза принимается»
Den-N Отправлен 23.06.2013 02:18
  Любой статистический критерий это - математический метод, позволяющий количественно рассчитать Р. Для того чтобы быть хорошим исследователем-практиком вовсе необязательно знать собственно математический метод, т.к. есть очень сложные методы для понимания которых нужно быть именно математиком. Но хороший исследователь должен уметь правильно выбирать из всего многообразия существующих математических методов (стат. критериев) именно тот, который оптимален в данном конкретном случае. Для этого нужно быть больше чем просто практиком, но всё-же не нужно быть математиком (и это радует smile.gif ). Важно знать основные принципы выбора критерия + сильные и слабые стороны конкретного критерия. В хороших учебниках их пытаются расписать максимально понятным для нематематиков языком. Т.е. если вы, опираясь на такое руководство, пришли к выводу, что критерий Колмогорова-Смиронова и есть тот самый оптимальный критерий для вашей задачи, типа данных и объёмов выборок, то ему в любой программе нужно просто "скормить" сырые данные (и только их), чтобы он выдал Р.

Проблема выбора оптимального критерия намного важнее каких-то технических деталей реализации расчётного алгоритма конкретного метода и даже того точные или асимптотические оценки выдаёт программа. Т.е сначала выбираем лучший метод, а уже потом лучшую программу с ним.

Что касается стат. проверки гипотез, то тут действительно есть и путаница и недопонимание даже у авторов учебников.
nattali80 Отправлен 23.06.2013 01:18
  Большое спасибо за разъяснения! Они усложнили и дополнили моё представление. Буду осмыслять.

(Den-N @ 23.06.2013 02:09)
Почему вам не понятно как считает R - "остаётся непонятным", т.к. в первом посте вы писали, что разбирались по хэлпу. Вот цитата оттуда:

Из неё следует, что для вашего случая (two-sample, two-sided, произведение объёмов выборок меньше 10 тыс.) по умолчанию рассчитывается точное значение р.

Да, они это пишут. Но они не пишут, по какой формуле и какому принципу было рассчитано это точное p-value. Вот это и не понятно.

Я предполагаю, что, возможно, этот принцип настолько общий, что его "не нужно" объяснять. Но вот мне это, увы, пока не понятно. Собственно этот пункт (как в R получают точное значение p-value) остается последним значительным непонятным моментом.
Посмотреть тему (откроется в новом окне)

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте  ·  Доска объявлений Board.com.ua  · 
--- сервер арендован в компании Hetzner Online, Германия ---
--- администрирование сервера: Intervipnet ---

Хеликон · Диаэм · ИнтерЛабСервис · Beckman Coulter · SkyGen · ОПТЭК · BIOCAD · Евроген · Синтол · БиоЛайн · Sartorius · Химэксперт · СибЭнзим · Tecan · Даниес · НПП "ТРИС" · Биалекса · ФизЛабПрибор · Genotek · АТГ Сервис Ген · Биоген-Аналитика
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 21.10.21 12:11
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft