Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
reggga |
|
Den-N Постоянный участник |
|
reggga |
|
PS2004R Постоянный участник |
(reggga @ 14.04.2011 16:43) Мне нужно нормировать, т.е. сделать так, чтобы все значения параметров находились примерно в одном интервале. Значит, нужно выбрать не Normal, а какую-то другую функцию? Нормировка Нормировка - это корректировка ряда (вектора) значений (обычно представляющих набор измерений, например, переменная, хранящая рост людей, выраженный в дюймах) в соответствии с некоторыми функциями преобразования, с целью сделать их более удобными для сравнения. Например, разделив эти значения на 2.54, мы получим измерения роста в метрической системе. Нормировка данных: 1. требуется, когда несовместимость единиц измерений переменных может отразиться на результатах (например, вычисления, основанные на смешанных произведениях), и 2. рекомендуется в тех случаях, когда итоговые отчеты могут быть улучшены, если выразить результаты в определенных понятных/совместимых единицах (например, значение времени реакции, записанное в миллисекундах, будет легче интерпретировать, чем число тактов процесора, в которых изначально были получены данные медицинского эксперимента). Заметим, что этот термин не связан с термином нормальное распределение. См. также Стандартизация. по вашему описанию Вам нужна нормализация она фактически из двух операций состоит center: a logical value indicating whether the variables should be shifted to be zero centered. Alternately, a vector of length equal the number of columns of ‘x’ can be supplied. The value is passed to ‘scale’. scale.: a logical value indicating whether the variables should be scaled to have unit variance before the analysis takes place. The default is ‘FALSE’ for consistency with S, but in general scaling is advisable. Alternatively, a vector of length equal the number of columns of ‘x’ can be supplied. The value is passed to ‘scale’.
|
Den-N Постоянный участник |
(reggga @ 14.04.2011 19:43) Мне нужно нормировать, т.е. сделать так, чтобы все значения параметров находились примерно в одном интервале. Значит, нужно выбрать не Normal, а какую-то другую функцию? Значит действительно нужна нормировка. Формулу вы должны задавать сами - это можно сделать в нижнем поле формы, которая открывается по двойному клику на названии новой переменной в шапке таблицы. На русском почитайте про нормировки, например здесь: |
PS2004R Постоянный участник |
(Den-N @ 14.04.2011 18:19) Значит действительно нужна нормировка. Формулу вы должны задавать сами - это можно сделать в нижнем поле формы, которая открывается по двойному клику на названии новой переменной в шапке таблицы. На русском почитайте про нормировки, например здесь: осталось только определить чем стандартная шкала от нормализации отличается PS результат измерения -> оценка -> сравнение различных измерений между собой, или например суммирование с получением интегральной оценки некоего объекта. шкала переводящая результат измерения в оценку вводится объективно только в случае когда есть некая общая для всех измерений переменная отражающая природу оного интегрального показателя напрямую. Сообщение было отредактировано PS2004R - 14.04.2011 19:01 |
reggga |
Сообщение было отредактировано reggga - 14.04.2011 19:55 |
PS2004R Постоянный участник |
(reggga @ 14.04.2011 19:48) покажите данные, раз Вы хотите сравнить некие x и y x_i = x_1, x_2 .... x_i .... x_n_x y_i = y_1, y_2 .... y_i .... y_n_y только укажите что такое за показатель x и что такое показатель y. Зависимы ли x и y? |
reggga |
На всякий случай, прилагаю таблицу Excel c данными. Она довольно большая. Что означают названия параметров, в данном случае для вас не имеет большого значения. |
PS2004R Постоянный участник |
(reggga @ 15.04.2011 19:30) На всякий случай, прилагаю таблицу Excel c данными. Она довольно большая. Что означают названия параметров, в данном случае для вас не имеет большого значения. Судя из таблицы Вы хотите отобразить временной ряд многомерный? И проблема в том, что нужно иметь столько "осей у" сколько показателей, что бы для каждого показателя был своя "оптимальная шкала"? Сейчас посмотрим... > summary(data, digits = 6) Time AI_ASAK_C311_AG_VL_F_CV AI_ASAK_C311_AL2O3_VL_F_CV 00:01 : 1 Min. :12.8200 Min. :14.2700 00:02 : 1 1st Qu.:13.1970 1st Qu.:14.2964 00:03 : 1 Median :13.6278 Median :14.3299 00:04 : 1 Mean :13.5594 Mean :14.3412 00:05 : 1 3rd Qu.:13.9126 3rd Qu.:14.3709 00:06 : 1 Max. :14.2000 Max. :14.4700 (Other):354 AI_ASAK_C311_AP.NF_VL_F_CV AI_ASAK_C311_AP_VL_F_CV AI_ASAK_C311_GS_VL_F_CV Min. :71.6900 Min. :33.7600 Min. :0.770000 1st Qu.:72.0795 1st Qu.:34.1778 1st Qu.:0.918846 Median :72.4681 Median :34.4401 Median :0.964779 Mean :72.9758 Mean :34.3577 Mean :0.952872 3rd Qu.:73.8775 3rd Qu.:34.5061 3rd Qu.:1.015711 Max. :75.2900 Max. :35.0160 Max. :1.070000 AI_ASAK_C311_NF_VL_F_CV AI_ASAK_C311_P2O5_VL_F_CV AI_ASAK_C311_PSP_VL_F_CV Min. :37.4980 Min. :13.8100 Min. :6.52000 1st Qu.:37.9019 1st Qu.:13.9806 1st Qu.:7.41212 Median :38.0526 Median :14.0842 Median :8.28188 Mean :38.6171 Mean :14.0532 Mean :7.91526 3rd Qu.:39.3984 3rd Qu.:14.1148 3rd Qu.:8.42307 Max. :40.8800 Max. :14.3220 Max. :8.55000 AI_ASAK_C311_SF_VL_F_CV AI_ASAK_C311_SUMM_VL_F_CV AI_ASAK_C311_TM_VL_F_CV Min. :2.71000 Min. :99.7220 Min. :1.64000 1st Qu.:2.75912 1st Qu.:99.8131 1st Qu.:1.64000 Median :2.79587 Median :99.8562 Median :1.64810 Mean :2.78801 Mean :99.8457 Mean :1.65437 3rd Qu.:2.82252 3rd Qu.:99.8900 3rd Qu.:1.66345 Max. :2.83000 Max. :99.8900 Max. :1.70063 AI_ASAK_C312_AG_VL_F_CV AI_ASAK_C312_AL2O3_VL_F_CV AI_ASAK_C312_AP.NF_VL_F_CV Min. :0 Min. :0 Min. :0 1st Qu.:0 1st Qu.:0 1st Qu.:0 Median :0 Median :0 Median :0 Mean :0 Mean :0 Mean :0 3rd Qu.:0 3rd Qu.:0 3rd Qu.:0 Max. :0 Max. :0 Max. :0 AI_ASAK_C312_AP_VL_F_CV AI_ASAK_C312_GS_VL_F_CV AI_ASAK_C312_NF_VL_F_CV Min. :0 Min. :0 Min. :0 1st Qu.:0 1st Qu.:0 1st Qu.:0 Median :0 Median :0 Median :0 Mean :0 Mean :0 Mean :0 3rd Qu.:0 3rd Qu.:0 3rd Qu.:0 Max. :0 Max. :0 Max. :0 AI_ASAK_C312_P2O5_VL_F_CV AI_ASAK_C312_PSP_VL_F_CV AI_ASAK_C312_SF_VL_F_CV Min. :0 Min. :0 Min. :0 1st Qu.:0 1st Qu.:0 1st Qu.:0 Median :0 Median :0 Median :0 Mean :0 Mean :0 Mean :0 3rd Qu.:0 3rd Qu.:0 3rd Qu.:0 Max. :0 Max. :0 Max. :0 AI_ASAK_C312_SUMM_VL_F_CV AI_ASAK_C312_TM_VL_F_CV AI_ASAK_K34_AG_VL_F_CV Min. :100 Min. :0 Min. :0.540000 1st Qu.:100 1st Qu.:0 1st Qu.:0.828104 Median :100 Median :0 Median :1.128724 Mean :100 Mean :0 Mean :1.073986 3rd Qu.:100 3rd Qu.:0 3rd Qu.:1.347500 Max. :100 Max. :0 Max. :1.400000 и т.д. Для каждого показателя у Вас есть максимум и минимум. Формула приведения: отнимаем минимум и делим на (максимум - минимум). Получаем от 0 до 1. Хотя лучше просто построить графики в программном обеспечении которое умеет многомерные временные ряды рисовать. PS коэффициенты для расчета CODE > as.vector(apply(data[,-1],2,min)) [1] 12.8199997 14.2700005 71.6900024 33.7599983 0.7700000 37.4979996 [7] 13.8100004 6.5200000 2.7100000 99.7220001 1.6400000 0.0000000 [13] 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 [19] 0.0000000 0.0000000 100.0000000 0.0000000 0.5400000 96.8799973 [25] 94.4199982 1.4600000 38.6199989 0.4438333 0.4100000 99.5400009 [31] 0.9700000 98.6399994 96.3799973 2.2700000 39.4199982 0.3700000 [37] 0.3400000 100.3300018 0.0000000 20.7529415 0.0000000 0.0000000 [43] 0.0000000 0.0000000 0.7900000 0.0000000 0.0000000 0.0000000 [49] 0.0000000 0.0000000 20.9494117 0.0000000 0.0000000 0.0000000 [55] 0.0000000 0.7600000 0.0000000 0.0000000 0.0000000 0.0000000 > as.vector(apply(data[,-1],2,max))-as.vector(apply(data[,-1],2,min)) [1] 1.38000012 0.19999981 3.59999848 1.25600281 0.30000007 3.38200150 [7] 0.51199951 2.03000021 0.11999989 0.16799927 0.06062506 0.00000000 [13] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 [19] 0.00000000 0.00000000 0.00000000 0.00000000 0.85999995 1.37000275 [25] 2.37000275 1.00999999 0.97000122 0.10616669 0.34999999 0.19599825 [31] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 [37] 0.00000000 0.00000000 0.00000000 0.91705855 0.00000000 0.00000000 [43] 0.00000000 0.00000000 0.80257981 0.00000000 0.00000000 0.00000000 [49] 0.00000000 0.00000000 0.86058774 0.00000000 0.00000000 0.00000000 [55] 0.00000000 0.56764709 0.00000000 0.00000000 0.00000000 0.00000000 > Сообщение было отредактировано PS2004R - 15.04.2011 21:42 |
reggga |
Сообщение было отредактировано reggga - 16.04.2011 23:52 |
PS2004R Постоянный участник |
(reggga @ 16.04.2011 23:50) Я извиняюсь, но дело в том, что я ещё очень плохо разбираюсь в этой программе... Не могли бы вы пояснить неразумному человеку этот код, и куда, собственно, его вставлять?)) Если не очень затруднит... Плииз! У Вас Ексель? В присланной ексель таблице, отнять коэффициент из первой таблицы от всех строк соответствующего столбца, и поделить на коэффициент для этого же столбца из второй таблицы. Ну или сразу в экселе найдите минимум и максимум каждого столбца, который потом хотите отобразить, и воспользуйтесь уже приведившейся формулой. Могу посчитать Ваши данные за Вас. summary(apply(data[,-1],2,function(x) {(x-min(x))/(max(x)-min(x))})) CODE AI_ASAK_C311_AG_VL_F_CV AI_ASAK_C311_AL2O3_VL_F_CV AI_ASAK_C311_AP.NF_VL_F_CV Min. :0.0000 Min. :0.0000 Min. :0.0000 1st Qu.:0.2732 1st Qu.:0.1319 1st Qu.:0.1082 Median :0.5854 Median :0.2996 Median :0.2161 Mean :0.5358 Mean :0.3562 Mean :0.3572 3rd Qu.:0.7917 3rd Qu.:0.5044 3rd Qu.:0.6076 Max. :1.0000 Max. :1.0000 Max. :1.0000 AI_ASAK_C311_AP_VL_F_CV AI_ASAK_C311_GS_VL_F_CV AI_ASAK_C311_NF_VL_F_CV Min. :0.0000 Min. :0.0000 Min. :0.0000 1st Qu.:0.3326 1st Qu.:0.4962 1st Qu.:0.1194 Median :0.5415 Median :0.6493 Median :0.1640 Mean :0.4759 Mean :0.6096 Mean :0.3309 3rd Qu.:0.5940 3rd Qu.:0.8190 3rd Qu.:0.5619 Max. :1.0000 Max. :1.0000 Max. :1.0000 AI_ASAK_C311_P2O5_VL_F_CV AI_ASAK_C311_PSP_VL_F_CV AI_ASAK_C311_SF_VL_F_CV Min. :0.0000 Min. :0.0000 Min. :0.0000 1st Qu.:0.3331 1st Qu.:0.4395 1st Qu.:0.4093 Median :0.5356 Median :0.8679 Median :0.7156 Mean :0.4749 Mean :0.6873 Mean :0.6501 3rd Qu.:0.5952 3rd Qu.:0.9375 3rd Qu.:0.9376 Max. :1.0000 Max. :1.0000 Max. :1.0000 AI_ASAK_C311_SUMM_VL_F_CV AI_ASAK_C311_TM_VL_F_CV AI_ASAK_C312_AG_VL_F_CV Min. :0.0000 Min. :0.0000 Min. : NA 1st Qu.:0.5423 1st Qu.:0.0000 1st Qu.: NA Median :0.7986 Median :0.1336 Median : NA Mean :0.7362 Mean :0.2370 Mean :NaN 3rd Qu.:1.0000 3rd Qu.:0.3868 3rd Qu.: NA Max. :1.0000 Max. :1.0000 Max. : NA NA's :360 ........ Файл/ы:
|
reggga |
Вы то сами где эту формулу записывали, в Excel? Мне же нужен не только результат, мне нужно понять, как это всё своими ручками сделать )) (PS2004R @ 17.04.2011 16:16) В присланной ексель таблице, отнять коэффициент из первой таблицы от всех строк соответствующего столбца, и поделить на коэффициент для этого же столбца из второй таблицы. Что вы имеете в виду под первой и второй таблицей? Сообщение было отредактировано reggga - 17.04.2011 20:31 |
PS2004R Постоянный участник |
(reggga @ 17.04.2011 20:30) Вы то сами где эту формулу записывали, в Excel? Мне же нужен не только результат, мне нужно понять, как это всё своими ручками сделать )) Что вы имеете в виду под первой и второй таблицей? Ну слава Координатору, результат уже есть... острота спала. Можно неторопливо рассказать дальше. Я рассчитываю в среде статистических расчетов R. Эти возможности доступны из используемого Вами статпакета. Как использовать написано по ссылке: Про эксель я сказал, поскольку подозреваю что в электронных таблицах Вы наверняка посчитаете быстрее и увереннее. Таблицы коэффициентов упрощающие расчет формулы указаны в письме, тут больше затрудняюсь дистанционно помочь. |
reggga |
Я прошла по указанным ссылкам и немного почитала про язык R. При желании в нем, конечно, можно разобраться. Только похоже, что этот язык поддерживается пакетом Statistica версии 9.0 и выше, а у меня версия 8.0 (( Когда я вхожу в меню Statistics->Advanced Linear/Nonlinear Models, там нет графика под названием Custom R Non-Linear Time Series, как это показано на сайте statsoft.com На русской версии этого сайта написано, что поддержка языка R - это одна из дополнительных возможностей Statistica 9 Может, можно написать на Statistica Visual Basic? Вы умеете на нем работать? Сообщение было отредактировано reggga - 18.04.2011 19:23 |
PS2004R Постоянный участник |
(reggga @ 18.04.2011 18:17) Писал в ?2002? году бутстреп на бейсике статистики. _Очень_ многословный язык, других подробностей не помню. В страшном сне не могу рекомендовать студенту писать на этом учебную работу. Если Статистика не обязательна к использованию пишите на R. Это практически стандарт у статистиков. Кроме того появляется повод оформить работу студенческую с помощью Sweave или odfWeave. |
reggga |
|
PS2004R Постоянный участник |
(reggga @ 20.04.2011 16:48) А вы не подскажете, случайно, чем нормировка отличается от стандартизации? Просто я нашла простой способ стандартизировать переменные )) А в какой науке? Это ведь просто слова. Если статистика... 1. Нормировка? Это от нормировать? Ну так стандартное отклонение --- нормальное отклонение. Единица измерения у стандартной шкалы это стандартное отклонение вариационного ряда для которого вводится шкала. 2. Отдельно существует операция центрирование ряда. Обе операции примеренные вместе называются автошкалированием. Или стандартизация данных. Что лучше для размещения на графике вопрос --- в одном случае пространство оси показателя использовано полностью в другом есть связь между показателями через одинаковый визуальный размер стандартного отклонения. |
psychologist |
у меня есть массив данных мне надо сравнить выборки по критерию хи квадрат делаю так после выходит такое окно и как мне теперь с ним работать,чтобы -таки воспользоваться данным критерием |
bubnilkin Участник |
есть вопрос по этой же теме ставил несколько экспериментов (>10) по определению концентрации (мг/мл) белка в сыворотках мышей (>400) методикой ИФА. Каждый раз на 96-луночной плате (>10 плат) было по ~35 сывороток в дублях + контрольную сыворотку. Контрольная сыворотка (КС) ставится для того, чтобы удостовериться, что каждый раз измеряем допустимо одинаково. Естественно получили диапазон значений для КС. Вопрос: надо ли _стандартизовать_ z_i = (y_i - mean(y_i))/sd(y_i) значения концентраций на разных платах перед статобработкой? если да, то почему? ведь, если у одной мыши концентрация 1 мг/мл а у другой 17 мг/мл значит так и есть... (насколько я понимаю, то z-scores помогают понять, сколько %-ов наблюдений в пределах одной/двух/трёх сигм и сделать вывод о принадлежности к нормальному распределению...) Сообщение было отредактировано bubnilkin - 29.01.2018 12:47
|
Den-N Постоянный участник |
(bubnilkin @ 29.01.2018 15:42) Здравствуйте, есть вопрос по этой же теме ставил несколько экспериментов (>10) по определению концентрации (мг/мл) белка в сыворотках мышей (>400) методикой ИФА. Каждый раз на 96-луночной плате (>10 плат) было по ~35 сывороток в дублях + контрольную сыворотку. Контрольная сыворотка (КС) ставится для того, чтобы удостовериться, что каждый раз измеряем допустимо одинаково. Естественно получили диапазон значений для КС. Вопрос: надо ли _стандартизовать_ z_i = (y_i - mean(y_i))/sd(y_i) значения концентраций на разных платах перед статобработкой? если да, то почему? ведь, если у одной мыши концентрация 1 мг/мл а у другой 17 мг/мл значит так и есть... (насколько я понимаю, то z-scores помогают понять, сколько %-ов наблюдений в пределах одной/двух/трёх сигм и сделать вывод о принадлежности к нормальному распределению...) Странно, что никто не отвечает: ИФА очень распространён. К сожалению ваша проблема относится не только к статистике, но и к конкретному методу. Я руками ИФА не работал, литературу по этому методу не начитывал. Поэтому могу поделиться только своими мыслями и небольшим опытом анализа таких данных. (1) Раз методикой прописана постановка КС, должен быть и какой-то показатель для контроля того, что "измеряем допустимо одинаково", а по-хорошему должна быть прописана и процедура приведения измерений к сопоставимому виду, если этот показатель выходит за какие-то границы. (2) Очень сомневаюсь, что применительно к ИФА речь идёт о стандартизации в статистическом смысле этого термина, т.к. это действительно будет глупостью. Скорее всего под стандартизацией у вас понимается некая процедура приведения сырых данных к сопоставимому масштабу. Например, все значения на планшете можно пересчитать в % от КС. Когда-то скачивал толстую книжку по ELISA, если найду - выложу. Но вообще нужно читать в статьях как люди описывают этот этап. В хороших англоязычных статьях всё прописывают очень подробно.
|
bubnilkin Участник |
|
biostatleo |
Вы пишите: "есть вопрос по этой же теме". Однако на этой странице за 7 лет обсуждалась не одна конкретная тема. Поэтому для получения более продуктивных ответов, рекомендую Вам заново сформулировать свой вопрос. Особенно опишите подробнее, какие методы статистического анализа Вы предполагаете далее использовать. Поскольку процедура стандартизации связана с методами анализа. Желаю успеха! |
guest: 123 IP-штамп: frJhOCvSv9ICE гость |
|
guest: 123 IP-штамп: fr4iy3.kHUw02 гость |
|
guest: 123 IP-штамп: frAWeMdOsBSXM гость |
|
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |