Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 

Щёлкните, чтобы внести в Избранные Темы* Можно ли эти данные считать нормально-распределенными? -- ANOVA, проверка на нормальность --
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* Схема · [ Стандартный ] · +Перв.сообщ.


 
Добавить сообщение в темуСоздать новую темуСоздать голосование
Участник оффлайн! nattali80
Участник



 прочитанное сообщение 05.12.2014 15:09     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #1 множественное цитирование

Вопрос по проведенному анализу ANOVA и проверке данных на нормальность.
Этот анализ и график box plot приводила в другой теме: http://molbiol.ru/forums/index.php?showtopic=551790,
но там уже много всего, а вопрос сейчас конкретный.

По данным, описанным в теме по ссылке (скрипт в приложении) где, r-vult - среднее число птиц учтенных за 15-мин интервал времени, hours – время, month - месяц ) я сделала анализ ANOVA и TukeyHSD. С целью – выявить различия между месяцами (просто по медиане и разбросу, без учета формы кривых активности)
Однако, потом провела проверку данных (r_vult) на нормальность и тест shapiro показал, что r_vult (по которому делала дисперсионный анализ) имеет ненормальное распределение:
> shapiro.test(r_vult)
Shapiro-Wilk normality test

data:  r_vult
W = 0.8018, p-value < 2.2e-16


Но при этом другой метод проверки на нормальность:
qqnorm(r_vult)
qqline(r_vult,ltr_vult=2)

Показал такой график (в приложении).
По этому методу, чем ближе все данные к прямой, тем более это распределение можно считать нормальным.
При этом на графике - основная часть данных лежит ровно на прямой. Почему получилась длинная линия с "r_vult=0" не понятно, а отличие от нормальности, как я думаю, - дают выбросы (небольшие в процентном отношении) в конце.

И вот параметры данных:
summary(r_vult)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  0.000   1.912   3.125   3.661   4.918  28.750


Как я думаю, они тоже говорят о нормальности, поскольку значение Min и Max не выходят за пределы выражения (определенного в книге Crawley,348 как "выброс": "This is useful in the detection of outliers: a good rule of thumb is that an outlier is a value that is more than 1.5 times the interquartile range above the third quartile or below the first quartile"


Значение 1.5*( 3rd Qu.-1st Qu) = 1.5 ( 4.918 - 1.912) = 4.509

1st Qu.- 4.509 намного меньше, чем Min (то есть снизу не имеем выбросов)
3rd Qu+ 4.509 = 33.259 (что больше, чем Max, т.е и сверху не имеем значимых выбросов (хотя и на графике проверки нормальности, и на box plot, построенных по r_vult, он показывает круглыми точками то, что считает, видимо, выбросами. И именно из-за них не дает нормальности в shapiro-test) rolleyes.gif



Мой вопрос - можно ли в этом случае использовать ANOVA (ведь его можно использовать только для нормально распределенных данных)? Например, просто удалив из данных эти выбросы (ведь тогда распределение окажется нормальным)?

Правильно ли я рассуждаю при проверке на нормальность ?

Сообщение было отредактировано nattali80 - 05.12.2014 15:58

Картинки:
картинка: test_normality_r_vult.jpeg
test_normality_r_vult.jpeg — (49.69к)   

картинка: correct_result2.jpeg
correct_result2.jpeg — (64.23к)   



Файл/ы:

скачать файл Amarais_daily_activity.txt
размер: 23.19к
кол-во скачиваний: 256


guest: great
IP-штамп: frj5GEfdEWR5M
гость



 прочитанное сообщение Сообщение на английском  31.10.2018 18:27     Сообщение для модератора       
Цитировать Поместить сообщение в колонку новостей  URL #2 множественное цитирование

Much obliged to you for setting aside an ideal opportunity to distribute this data extremely valuable!
http://www.world-dating-partners.com

*




Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.
Имя:

 преобразовывать смайлики · показать смайлики
Назначение кнопок:

   Поблагодарить автора сообщения — поблагодарить автора
   Удалить сообщение — удалить
   Редактировать сообщение — редактировать
   Поместить сообщение в колонку новостей — поместить в колонку новостей
   Цитировать — цитировать сообщение
   не входит в цитирование/входит в цитирование — цитировать несколько
   Отметить СПАМ-сообщение — обозначить спам
   Сообщение для модератора — связь с модератором
   Участник онлайн!/Участник оффлайн! — автор онлайн/оффлайн
   Фотография — фотография автора

   - остальные обозначения -
 
   *
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема »
Быстрый ответДобавить сообщение в темуСоздать новую тему

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте  ·  Доска объявлений Board.com.ua  · 
--- сервер арендован в компании Hetzner Online, Германия ---
--- администрирование сервера: Intervipnet ---

Хеликон · Диаэм · ИнтерЛабСервис · Beckman Coulter · SkyGen · ОПТЭК · BIOCAD · Евроген · Синтол · БиоЛайн · Sartorius · Химэксперт · СибЭнзим · Tecan · Даниес · НПП "ТРИС" · Биалекса · ФизЛабПрибор · Genotek · АТГ Сервис Ген · Биоген-Аналитика
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 13.12.19 03:20
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft