Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 

Щёлкните, чтобы внести в Избранные Темы* Логистическая регрессия -- treatment effect? --
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* Схема · [ Стандартный ] · +Перв.сообщ.


 
Добавить сообщение в темуСоздать новую темуСоздать голосование
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 29.10.2014 17:19     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #1 множественное цитирование

А есть ли теоретическая предпосылка/прецедент для использования логистической регрессии с групповой принадлежностью (=определленной экспериментатором) в качестве зависимой переменной? Скажем - есть 2 группы, контроль и обработанные. Померяно много чего (параметр 1, 2, 3 и т.д.). Логистическая регрессия с - внимание - группой (=зависимой переменной) и параметрами 1, 2, 3.. (=независимые переменные) выбирает параметр 2 и 3 как достоверно влияющие на групповую принадлежность. После чего делается вывод о том, что в группе А параметры 2 и 3 достоверно меняются (в соответствующем направлении определенном odds ratio)...

Чем такой подход неправомерен (если игнорировать саму идею зависимых и независимых переменныхsmile.gif)?

Сообщение было отредактировано elenag1999 - 29.10.2014 18:36
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 30.10.2014 10:03     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #2 множественное цитирование

(elenag1999 @ 29.10.2014 17:19)
Ссылка на исходное сообщение  
Чем такой подход неправомерен (если игнорировать саму идею зависимых и независимых переменныхsmile.gif)?


Нормальный подход и предполагает, что данные описывает регрессионная модель. (а все эти дисперсионные анализы от привычки, и невозможности когда то эффективно считать)
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 30.10.2014 18:07     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #3 множественное цитирование

вот и мне так кажетсяsmile.gif
тот же вопрос кинула на ResearchGate - отличные ответы, посмотрите кому интересно: https://www.researchgate.net/post/Can_logis...sponse_variable

Сообщение было отредактировано elenag1999 - 30.10.2014 18:12
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 30.10.2014 18:56     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #4 множественное цитирование

(elenag1999 @ 30.10.2014 18:07)
Ссылка на исходное сообщение  вот и мне так кажетсяsmile.gif
тот же вопрос кинула на ResearchGate - отличные ответы, посмотрите кому интересно: https://www.researchgate.net/post/Can_logis...sponse_variable


хитрый планТМ smile.gif этож надо региться или там, или в мордокниге smile.gif
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 30.10.2014 19:02     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #5 множественное цитирование

Выскажусь прежде чем схожу по ссылке посмотреть что вам умного посоветовали smile.gif

Думаю, что игнорировать зависимость/независимость переменных неправильно. Ведь и когда мы строим обычную регрессию мы чётко различаем "у по х" или "х по у", и даже функции получаются совсем разные... Вот мы сейчас упрекаем предшественников в том, что они выворачивали проблему сравнений наизнанку, когда по-сути зависимые переменные анализировали как групповые факторы и всё считали t-критерием и дисперсионным анализом (ну или их непараметрическими аналогами). Если же мы будем сейчас так же выворачивать наизнанку проблему с группами, искусственно делая их зависимыми переменными и обсчитывая логистической регрессией, то чем мы лучше?

Считаю, что если задачу в принципе можно сформулировать в терминах прогноза, то аппарат логистической регрессиии, в т.ч. множественной уместен и необходим. Тогда строим модель для прогноза. Если же нет, то правильнее будет использовать ANOVA или MANOVA для поиска собственно межгрупповых различий, или методы дискриминантного анализа для выявления особенностей для максимального разделения групп и построения дискриминантных ключей.
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 30.10.2014 22:10     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #6 множественное цитирование

да ничем мы не лучше! smile.gif

мультивариантный анализ вполне проходит, но полного удовлетворения не приносит... поскольку основная задача не определить переменные достоверно связанные с "группами", а найти их степень влияния на вероятность принадлежности к той или иной группе.
MANOVA не годится (данные несбалансированы, негомогенны и т. д.), а PERMANOVA, CHAID и PLS (+PLS-DA) - вполне. Но логистическая регрессия красивее, особенно odds ratio...

Прошу прощения за ссылку, про региться я не подумала.
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 31.10.2014 18:01     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #7 множественное цитирование

(Den-N @ 30.10.2014 19:02)
Ссылка на исходное сообщение  
Считаю, что если задачу в принципе можно сформулировать в терминах прогноза, то аппарат логистической регрессиии, в т.ч. множественной уместен и необходим. Тогда строим модель для прогноза. Если же нет, то правильнее будет использовать ANOVA или MANOVA для поиска собственно межгрупповых различий, или методы дискриминантного анализа для выявления особенностей для максимального разделения групп и построения дискриминантных ключей.


1) Да, у логистической регрессии проблема с мультиколинеарностью. В неё вообще лучше отправлять результаты PCA преобразования исходных данных. Тогда она пожалуй ничем не будет отличаться от дискриминантного многомерного анализа.

Хотя обычный линейный многомерный дискриминантный анализ конечно как средство анализа хорош.

2) Можно еще строить байесовскую сеть (если достаточно данных). Она же даёт возможность и задавать модели сети любые "вопросы" (сочетания известных параметров) о наиболее ожидаемом поведении системы.
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 31.10.2014 18:16     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #8 множественное цитирование

с мультиколлинеарностью как раз осложнений нет и PCA неактуально (нужны значения самих переменных а не латентные преобразования).

И дискриминантный анализ сделать не проблема... который в принципе упирается все в ту же дилемму - классификация вместо регрессии??, и в необходимость обоснования использования независимой бинарной переменной (treatment) в качестве зависимой бинарной переменной.

проблема-то существует...
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 01.11.2014 04:34     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #9 множественное цитирование

(elenag1999 @ 31.10.2014 01:10)
Ссылка на исходное сообщение задача не определить переменные достоверно связанные с "группами", а найти их степень влияния на вероятность принадлежности к той или иной группе.

Тогда именно логистическая регрессия и нужна!
Из известных мне пакетов с графическим интерфейсом она лучше всего реализована в MedCalс. В ознакомительной двухнедельной версии ничего не урезано и помощь хорошая: http://www.medcalc.org/manual/logistic_regression.php . Считает сразу и значимость, и показатели диагностической эффективности, включая площадь под ROC-кривой, сама пересчитывает коэффициенты в отношения шансов и строит для них 95% ДИ.

Сообщение было отредактировано Den-N - 01.11.2014 04:40
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 01.11.2014 12:22     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #10 множественное цитирование

Спасибо! Вот и я склоняюсь к тому...
В MedCalc и правда славненько так выводится табличка со всем необходимым. Но, в принципе, много пакетов считают логистическую регрессию достойно.

А вот что ищу, но пока безрезультатно, так это возможность Mixed models в логистической регрессии. Не попадалось?

Den-N: А что вы думаете по поводу Optimal discriminant analysis (http://en.wikipedia.org/wiki/Optimal_discriminant_analysis). Метод чрезвычайно мало используется, хотя описание довольно привлекательно.
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 01.11.2014 19:52     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #11 множественное цитирование

(elenag1999 @ 01.11.2014 12:22)
Ссылка на исходное сообщение  

Den-N: А что вы думаете по поводу Optimal discriminant analysis (http://en.wikipedia.org/wiki/Optimal_discriminant_analysis). Метод чрезвычайно мало используется, хотя описание довольно привлекательно.


Какое описание?! Исходная статья авторов не доступна, а в интернетах какой то бред извините написан и маркетинговая классификация в стиле "китайского императора" методов ML по второй ссылке со страницы. smile.gif

Дискриминантный анализ это такой же метод перепроецирования данных как и PCA, только критерий вращения вводимых ортогональных осей забрать максимум дисперсии между разделяемыми группами. Там нет рыбы деревьев smile.gif
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 01.11.2014 20:05     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #12 множественное цитирование

(elenag1999 @ 01.11.2014 12:22)
Ссылка на исходное сообщение 

А вот что ищу, но пока безрезультатно, так это возможность Mixed models в логистической регрессии. Не попадалось?




Например вот такое есть

http://cran.r-project.org/web/packages/CLME/CLME.pdf
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 01.11.2014 20:17     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #13 множественное цитирование

отмахнуться легко, а подумать? со статьями там все не так плохо: http://scholar.google.com/citations?user=7nmb-u4AAAAJ&hl=sv

и судя пo описанию метода, ортогональных осей (или других вариантов вращения, как в линейном дискриминантном анализе) там нет...а деревья естьsmile.gif
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 01.11.2014 20:51     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #14 множественное цитирование

(elenag1999 @ 01.11.2014 20:17)
Ссылка на исходное сообщение  отмахнуться легко, а подумать? со статьями там все не так плохо: http://scholar.google.com/citations?user=7nmb-u4AAAAJ&hl=sv

и судя пo описанию метода, ортогональных осей (или других вариантов вращения, как в линейном дискриминантном анализе) там нет...а деревья естьsmile.gif



Мда --- "кто ж его посадит, он же памятник"ТМ smile.gif Это вообще не метод, а журнал? smile.gif

A guidebook with software for Windows. Washington DC: American Psychological Association

Optimal Data Analysis (ODA) is a multidisciplinary journal specializing in maximum-
accuracy methods, which together are subsumed as constituents of the optimal data
analysis (ODA) paradigm. Articles published in ODA are parsed into sections. Invited articles
are written in response to the Editor's invitation. Review articles present reviews of theory,
method, or empirical findings relating to the ODA paradigm. Method articles discuss
technical aspects of optimal or heuristic algorithms and analytic processes. Versus articles

Нашел в журнале и метод, обычные деревья. И чем "прямоугольные" границы между группами разделяемыми лучше "плоскостей" LDA (и зачем вообще это называть дискриминантным анализом) осталось для меня секретом smile.gif

Кроме того все эти деревья работают только в "областях пространства возможных значений данных" обильно покрытых этими самыми данными. В "отдалении от реальных замеров" их прогностическая сила стремиться к нулю. Это методы по определению крайне слабые в экстраполяции frown.gif
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 01.11.2014 22:16     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #15 множественное цитирование

Optimal Data Analysis - журнал и софт. Optimal Discriminant Analysis - метод, с 2мя типами моделей CТА (Classification tree analysis) и UniODА (Univariate ODA), cчитают много чего, включая odds ratio. Критических анализов не нашла, особо хвалебных тоже, но используются оба весьма редко.

В отдалении от реальных замеров, ценность любой прогностической силы сомнительнаsmile.gif Мне любопытно сравнить с той же логистической регрессией и другими алгоритмами классификации (CHAID...), попробовать надо.
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 02.11.2014 18:20     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #16 множественное цитирование

(elenag1999 @ 01.11.2014 22:16)
Ссылка на исходное сообщение  Optimal Data Analysis - журнал и софт. Optimal Discriminant Analysis - метод, с 2мя типами моделей CТА (Classification tree analysis) и UniODА (Univariate ODA), cчитают много чего, включая odds ratio. Критических анализов не нашла, особо хвалебных тоже, но используются оба весьма редко.

В отдалении от реальных замеров, ценность любой прогностической силы сомнительнаsmile.gif Мне любопытно сравнить с той же логистической регрессией и другими алгоритмами классификации (CHAID...), попробовать надо.


1) Проводить границу по одному показателю эквивалентно дереву решений. Получающие границы между разделяемыми группами по крайней мере это подмножество возможных границ дерева.

Если структура модели отвечает той системе которая выдала на гора оцениваемый датасет, то всё в порядке и с экстраполяцией в области где данных нет.

А интерполяцию обеспечивают вообще любые разумные подходы без каких либо претензий на знание того что там генерировало данные. Собственно весь ажиотаж вокруг бигбигдата обусловлен казусом, когда данные таки насыщают пространство возможных состояний прогнозируемой модели и начинает работать тупая интерполяция.

2) Ну так сделайте семплер, нагенерите данных и посмотрите насколько оно ошибается smile.gif Сейчас это довольно просто сделать.
Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 02.11.2014 19:36     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #17 множественное цитирование

в процессе...
мне не кажется, что бивариатная логистическая регрессия это случай CLМЕ, но я внимательно не смотрела.
спасибо.
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 04.11.2014 19:32     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #18 множественное цитирование

(elenag1999 @ 01.11.2014 15:22)
Ссылка на исходное сообщение
А вот что ищу, но пока безрезультатно, так это возможность Mixed models в логистической регрессии. Не попадалось?

Нет, за отсутствием необходимости не копал глубоко...
(elenag1999 @ 01.11.2014 15:22)
Ссылка на исходное сообщение
Den-N: А что вы думаете по поводу Optimal discriminant analysis (http://en.wikipedia.org/wiki/Optimal_discriminant_analysis). Метод чрезвычайно мало используется, хотя описание довольно привлекательно.

Информация о всяких нелинейных и прочее дискриминантных анализах периодически мелькает, но действительно какого-то популярного метода не встречал, да и под оптимальностью тоже можно много чего понимать... Я знаком и использовал метод оптимального шкалирования применительно к анализу главных компонент (CATPCA, Gifi transformations). По этой теме публикаций достаточно, метод есть в двух пакетах: в составе SPSS и в пакете homals для R. Последний очень гибок и позволяет использовать преобразование Gifi (линеаризует многомерные связи количественных, порядковых и качественных показателей) в том числе и для решения задач дискриминации и прогноза (см. подшитую статью, раздел 4.2), но я пока не понял как полученное "оптимальное" решение представить в виде формулы, ключей и т.п.

Сообщение было отредактировано Den-N - 04.11.2014 19:36

Файл/ы:

скачать файл homals.pdf
размер: 354.33к
кол-во скачиваний: 180


Участник оффлайн! elenag1999
Постоянный участник



 прочитанное сообщение 04.11.2014 21:10     Сообщение для модератора         Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #19 множественное цитирование

спасибо - на первый взгляд очень подходяще!
guest: great
IP-штамп: frj5GEfdEWR5M
гость



 прочитанное сообщение Сообщение на английском  31.10.2018 18:30     Сообщение для модератора       
Цитировать Поместить сообщение в колонку новостей  URL #20 множественное цитирование

Much obliged to you for setting aside an ideal opportunity to distribute this data extremely valuable!
http://www.thebigjournal.com

Это СПАМ!
Это сообщение — спам.
Den-N
Участник оффлайн! wendywilson123




 прочитанное сообщение Сообщение на английском  27.11.2018 09:20     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #21 множественное цитирование

A derivative of HeLa, the first aneuploid, epithelial-like line derived from human tissue and maintained by serial subculture. Identified as a contaminant in a number of subsequently derived lines, due to poor culture techniques.
Участник оффлайн! olseneduard




 прочитанное сообщение Сообщение на английском  26.03.2019 17:25     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #22 множественное цитирование

Air conditioners are irreplaceable for us nearly every season. They make our house warm in the winter and cool in the summer. It is almost impossible to think of our house without an air conditioner. Although they are an essential part of our life, high high costs of having an air conditioner might push us back. Nevertheless, you can get the best air conditioning service here in Scottsdale. We offer you the best solution to meet your demands and relevant to your budget. AFR Dynamics AC service Scottsdale AZ is helping you to deal with this kind of issues.

For more: https://afrdynamics.com/scottsdale-az/

*




Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.
Имя:

 преобразовывать смайлики · показать смайлики
Назначение кнопок:

   Поблагодарить автора сообщения — поблагодарить автора
   Удалить сообщение — удалить
   Редактировать сообщение — редактировать
   Поместить сообщение в колонку новостей — поместить в колонку новостей
   Цитировать — цитировать сообщение
   не входит в цитирование/входит в цитирование — цитировать несколько
   Отметить СПАМ-сообщение — обозначить спам
   Сообщение для модератора — связь с модератором
   Участник онлайн!/Участник оффлайн! — автор онлайн/оффлайн
   Фотография — фотография автора

   - остальные обозначения -
 
   *
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема »
Быстрый ответДобавить сообщение в темуСоздать новую тему

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте  ·  Доска объявлений Board.com.ua  · 
--- сервер арендован в компании Hetzner Online, Германия ---
--- администрирование сервера: Intervipnet ---

Хеликон · Диаэм · ИнтерЛабСервис · Beckman Coulter · SkyGen · ОПТЭК · BIOCAD · Евроген · Синтол · БиоЛайн · Sartorius · Химэксперт · СибЭнзим · Tecan · Даниес · НПП "ТРИС" · Биалекса · ФизЛабПрибор · Genotek · АТГ Сервис Ген · Биоген-Аналитика
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 19.11.19 11:32
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft