molbiol.ru -> Подходы к анализу смешанного распределения

> Все форумы > Тематические форумы > Биофизика и матметоды в биологии

Zbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ

Правила FAQ* Поиск* Участники* Календарь* Избранные темы* Форум Форумов*

Темы за 24 часа [ Вход* | Регистрация* ]

Форум:

* Подходы к анализу смешанного распределения
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* Схема · [ Стандартный ] · +Перв.сообщ.

amaxa

12.01.2015 18:31

URL #1

(Den-N @ 09.01.2015 19:15)

2) С логарифмированием сложнее. Сама природа данных, процессов, которые их порождают могут быть такими, что нормального распределения быть не может. Например, даже чисто теоретически необоснованно ждать нормального распределения от площади: т.к. при увеличении длины и ширины на 1 ед., площадь увеличится на 1 ед², при увеличении на 2 - на 4, при увеличении на 3 - на 9 и т.д. Т.е. при варьировании по нормальному закону длины и ширины, в распределении соответствующих площадей появится положительная асимметрия - хвост справа будет длиннее. А вот для квадратного корня из площади ждать нормального распределения логично, т.е. для площадей показателем более "отвечающим природе данных" будет квадратный корень из неё. Аналогично, для объёмов это будет кубический корень. Для многих же процессов в природе такой функцией является логарифм (почитайте про логнормальное распределение). Это все скорости, процессы во времени, активности, концентрации, численности организмов и многое другое. К сожалению, необходимость логарифмирования не всегда очевидна и здесь возможны некие ошибки анализа, порождаемые так называемым "эффектом шкалы", поскольку разные статистические техники по-разному обрабатывают шкалы. Чтобы избежать таких ошибок я всегда смотрю исходные распределения, остатки регресии, распределения главных компонент - чтобы обнаружить возможную асимметрию и либо (1) бороться с ней преобразованием исходных данных, либо (2) использовать более устойчивые техники, например, ранговые.

Вопрос для отдельной темы, но не хочется создавать её. А какие есть подходы к анализу смешанного распределения? Непараметрика там, вроде, не поможет. Как с ним быть (Ваш опыт). Где можно о нем почитать? Заранее благодарен за ответ и помощь.

Den-N
Постоянный участник

12.01.2015 22:19

URL #2

Смотря что понимать под анализом.
1) Если сравнивать группы с такими распределениями, то всё плохо, т.к. при неоднородных группах мы думаем, что сравниваем средние, а на самом деле и неявно - соотношение групп по показателю, вносящему неоднородность. Тот же парадокс Симпсона, только не для корреляции, а для задачи сравнения групп - можно прийти к прямо противоположному выводу. Если повезёт - увидим на гистограмме би- или полимодальность или выбросы. Но может и не повезти - и положительный, и отрицательный эксцесс может появляться ввиду неоднородности, но гистограмма будет вполне симметричной и даже колоколообразной... Лично у меня здесь опыт небольшой: лишь однажды на медицинских данных в задаче сравнения увидели отчётливую бимодальность и поняли, что просто средние сравнивать нельзя, т.к. имеем дело с какими-то двумя подгруппами, источник появления которых врач не смог даже предположить. Поэтому сравнивали группы: а) по доле пациентов в подгруппах (не отличалась значимо), и б) - по средним в подгруппах отдельно.
Если же нет уверенности, что выборка неоднородна, наверное как раз порядковая непараметрика и подойдёт, ну и ресэмплинг-техники однозначно.
2) Если анализировать сами распределения, то видится 2 подхода: разделение смеси распределений и проверка на выбросы.
Своим скепсисом по части выбросов делился здесь:
http://molbiol.ru/forums/index.php?showtopic=551548
Разделение смеси обсуждали здесь:
http://forum.disser.ru/index.php?showtopic...20analysis&st=0

Поблагодарили (1): amaxa

guest: great
IP-штамп: frj5GEfdEWR5M
гость

31.10.2018 18:06

URL #3

This is actually the kind of information I have been trying to find. Thank you for writing this information.

guest: great
IP-штамп: frj5GEfdEWR5M
гость

31.10.2018 18:16

URL #4

This is actually the kind of information I have been trying to find. Thank you for writing this information.
http://www.foodandfoodtrips.com

guest: 123
IP-штамп: frJhOCvSv9ICE
гость

31.05.2022 09:11

URL #5

SINCE LAUNCHING AMB CASINO HIS INVASION OF UKRAINE, RUSSIA'S FC SLOT PRESIDENT VLADIMIR PUTIN 88KTC HAS FACED AN UNPRECEDENTED 11HILO GLOBAL RESPONSE, FROM CULTURAL BOYCOTTS TO 123GOAL COUNTRIES RADICALLY 123VEGA TRANSFORMING THEIR ALLBET FOREIGN POLICIES. BUT THE สูตรสล็อต LONGER THE CONFLICT CANDY BURST GOES ON, THE MORE SIGNS THERE ปั่นสล็อต ARE OF DIVISIONS.

guest: 123
IP-штамп: frXqkB4MpP2jQ
гость

08.06.2022 12:45

URL #6

South Korea 123VEGA and the US launched WAZDAN eight missiles WM CASINO on Monday, in AFFILIATE response to a ลิงค์รับทรัพย์ volley of ballistic missiles fired by North Korea the 123GOAL previous day. It comes 88KTC as Pyongyang continues FC SLOT to escalate its AMB CASINO missile tests. South 11HILO Korea's president Yoon Suk-yeol.

guest: 123
IP-штамп: frAWeMdOsBSXM
гость

11.06.2022 10:47

URL #7

Saxon Mullins 123VEGA says she once had PRAGMATIC PLAY romantic dreams of what her 'first time' would ICONIC GAMING be like. In none was หวยปิงปอง she paralysed by fear in a Sydney ปั่นสล็อต alleyway, aged 18, with a 123GOAL man she had met only minutes earlier. Ms 88KTC Mullins has always maintained FC SLOT this incident - in 2013 - was rape. It spurred AMB CASINO her to push for legal 11HILO reform in Australia, after a long court battle ended with a judge finding the man involved did not realise she hadn't consented to sex.

Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.

Имя:

Отправка сообщений использует JavaScript операции. В вашем броузере не
установлено/отключено выполнение JavaScript программ. Используйте Netscape Navigator
или Internet Explorer (не ранее 3 версии); убедитесь, что выполнение JavaScript
программ разрешено в настройках вашего броузера.