Rambler's Top100
Лёгкая версия форума* Виртуальная клавиатура  English  
Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы
Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Междисциплинарный биологический онлайн-журналZbio-wiki

NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ


Темы за 24 часа  [ Вход* | Регистрация* ]  
   



Форум: 
 

Щёлкните, чтобы внести в Избранные Темы* Программа Statistica 8 -- Нормировка данных --
Операции: Хочу стать куратором* · Подписаться на тему* · Отправить страницу по e-mail · Версия для печати*
Внешний вид:* Схема · [ Стандартный ] · +Перв.сообщ.


 
Добавить сообщение в темуСоздать новую темуСоздать голосование
Участник оффлайн! reggga




 прочитанное сообщение 12.04.2011 23:42     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #1 множественное цитирование

Здравствуйте! Я недавно начала пользоваться программой Statistica. Мне нужно нормировать значения в таблице данных. Подскажите, пожалуйста, как это сделать. Саму функцию Normal я нашла, а какие в ней нужно прописывать параметры не знаю. confused.gif
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 14.04.2011 14:16     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #2 множественное цитирование

Для начала почитайте и разберитесь что вам нужно сделать с данными: нормировать или нормализовать.
Участник оффлайн! reggga




 прочитанное сообщение 14.04.2011 16:43     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #3 множественное цитирование

Мне нужно нормировать, т.е. сделать так, чтобы все значения параметров находились примерно в одном интервале. Значит, нужно выбрать не Normal, а какую-то другую функцию?
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 14.04.2011 18:02     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #4 множественное цитирование

(reggga @ 14.04.2011 16:43)
Ссылка на исходное сообщение  Мне нужно нормировать, т.е. сделать так, чтобы все значения параметров находились примерно в одном интервале. Значит, нужно выбрать не Normal, а какую-то другую функцию?


Нормировка

Нормировка - это корректировка ряда (вектора) значений (обычно представляющих набор измерений, например, переменная, хранящая рост людей, выраженный в дюймах) в соответствии с некоторыми функциями преобразования, с целью сделать их более удобными для сравнения. Например, разделив эти значения на 2.54, мы получим измерения роста в метрической системе. Нормировка данных:

1.

требуется, когда несовместимость единиц измерений переменных может отразиться на результатах (например, вычисления, основанные на смешанных произведениях), и
2.

рекомендуется в тех случаях, когда итоговые отчеты могут быть улучшены, если выразить результаты в определенных понятных/совместимых единицах (например, значение времени реакции, записанное в миллисекундах, будет легче интерпретировать, чем число тактов процесора, в которых изначально были получены данные медицинского эксперимента).

Заметим, что этот термин не связан с термином нормальное распределение. См. также Стандартизация.

http://www.statsoft.ru/home/portal/glossar...rmalization.htm

по вашему описанию Вам нужна нормализация

она фактически из двух операций состоит

center: a logical value indicating whether the variables should be
shifted to be zero centered. Alternately, a vector of length
equal the number of columns of ‘x’ can be supplied. The
value is passed to ‘scale’.

scale.: a logical value indicating whether the variables should be
scaled to have unit variance before the analysis takes place.
The default is ‘FALSE’ for consistency with S, but in general
scaling is advisable. Alternatively, a vector of length
equal the number of columns of ‘x’ can be supplied. The
value is passed to ‘scale’.

Всего благодарностей: 3Поблагодарили (3): Plamen1986, FUA, bubnilkin
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 14.04.2011 18:19     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #5 множественное цитирование

(reggga @ 14.04.2011 19:43)
Ссылка на исходное сообщение  Мне нужно нормировать, т.е. сделать так, чтобы все значения параметров находились примерно в одном интервале. Значит, нужно выбрать не Normal, а какую-то другую функцию?

Значит действительно нужна нормировка. Формулу вы должны задавать сами - это можно сделать в нижнем поле формы, которая открывается по двойному клику на названии новой переменной в шапке таблицы. На русском почитайте про нормировки, например здесь:
http://psytest.wordpress.com/data_treatmen...tion_indicator/
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 14.04.2011 18:38     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #6 множественное цитирование

(Den-N @ 14.04.2011 18:19)
Ссылка на исходное сообщение  Значит действительно нужна нормировка. Формулу вы должны задавать сами - это можно сделать в нижнем поле формы, которая открывается по двойному клику на названии новой переменной в шапке таблицы. На русском почитайте про нормировки, например здесь:
http://psytest.wordpress.com/data_treatmen...tion_indicator/


осталось только определить чем стандартная шкала от нормализации отличается


PS

результат измерения -> оценка -> сравнение различных измерений между собой, или например суммирование с получением интегральной оценки некоего объекта.

шкала переводящая результат измерения в оценку вводится объективно только в случае когда есть некая общая для всех измерений переменная отражающая природу оного интегрального показателя напрямую.

Сообщение было отредактировано PS2004R - 14.04.2011 19:01
Участник оффлайн! reggga




 прочитанное сообщение 14.04.2011 19:48     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #7 множественное цитирование

Я почитала про нормировку и про нормализацию, и мне кажется, что всё-таки нужна нормировка, т.к. при нормализации не должно быть повторяющихся значений, а у меня они очень даже встречаются! Только у меня не получается правильно записать формулу для нормировки. Пожалуйста, помогите!!!! shuffle.gif

Сообщение было отредактировано reggga - 14.04.2011 19:55
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 15.04.2011 16:30     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #8 множественное цитирование

(reggga @ 14.04.2011 19:48)
Ссылка на исходное сообщение  Пожалуйста, помогите!!!! shuffle.gif


покажите данные, раз Вы хотите сравнить некие x и y

x_i = x_1, x_2 .... x_i .... x_n_x

y_i = y_1, y_2 .... y_i .... y_n_y


только укажите что такое за показатель x и что такое показатель y. Зависимы ли x и y?
Участник оффлайн! reggga




 прочитанное сообщение 15.04.2011 19:30     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #9 множественное цитирование

У меня много показателей, и по идее они не зависимы друг от друга. Моя цель - по возможности выявить неочевидные закономерности, построив график изменения параметров. Но, т.к. диапазоны изменения показателей сильно различаются, на графике плохо видны зависимости. Поэтому и надо сделать нормировку.

На всякий случай, прилагаю таблицу Excel c данными. Она довольно большая.
Что означают названия параметров, в данном случае для вас не имеет большого значения.

Данные.xls
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 15.04.2011 20:39     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #10 множественное цитирование

(reggga @ 15.04.2011 19:30)
Ссылка на исходное сообщение 

На всякий случай, прилагаю таблицу Excel c данными.  Она довольно большая.
Что означают названия параметров, в данном случае для вас не имеет большого значения.

Данные.xls


Судя из таблицы Вы хотите отобразить временной ряд многомерный? И проблема в том, что нужно иметь столько "осей у" сколько показателей, что бы для каждого показателя был своя "оптимальная шкала"?

Сейчас посмотрим...

> summary(data, digits = 6)
Time AI_ASAK_C311_AG_VL_F_CV AI_ASAK_C311_AL2O3_VL_F_CV
00:01 : 1 Min. :12.8200 Min. :14.2700
00:02 : 1 1st Qu.:13.1970 1st Qu.:14.2964
00:03 : 1 Median :13.6278 Median :14.3299
00:04 : 1 Mean :13.5594 Mean :14.3412
00:05 : 1 3rd Qu.:13.9126 3rd Qu.:14.3709
00:06 : 1 Max. :14.2000 Max. :14.4700
(Other):354
AI_ASAK_C311_AP.NF_VL_F_CV AI_ASAK_C311_AP_VL_F_CV AI_ASAK_C311_GS_VL_F_CV
Min. :71.6900 Min. :33.7600 Min. :0.770000
1st Qu.:72.0795 1st Qu.:34.1778 1st Qu.:0.918846
Median :72.4681 Median :34.4401 Median :0.964779
Mean :72.9758 Mean :34.3577 Mean :0.952872
3rd Qu.:73.8775 3rd Qu.:34.5061 3rd Qu.:1.015711
Max. :75.2900 Max. :35.0160 Max. :1.070000

AI_ASAK_C311_NF_VL_F_CV AI_ASAK_C311_P2O5_VL_F_CV AI_ASAK_C311_PSP_VL_F_CV
Min. :37.4980 Min. :13.8100 Min. :6.52000
1st Qu.:37.9019 1st Qu.:13.9806 1st Qu.:7.41212
Median :38.0526 Median :14.0842 Median :8.28188
Mean :38.6171 Mean :14.0532 Mean :7.91526
3rd Qu.:39.3984 3rd Qu.:14.1148 3rd Qu.:8.42307
Max. :40.8800 Max. :14.3220 Max. :8.55000

AI_ASAK_C311_SF_VL_F_CV AI_ASAK_C311_SUMM_VL_F_CV AI_ASAK_C311_TM_VL_F_CV
Min. :2.71000 Min. :99.7220 Min. :1.64000
1st Qu.:2.75912 1st Qu.:99.8131 1st Qu.:1.64000
Median :2.79587 Median :99.8562 Median :1.64810
Mean :2.78801 Mean :99.8457 Mean :1.65437
3rd Qu.:2.82252 3rd Qu.:99.8900 3rd Qu.:1.66345
Max. :2.83000 Max. :99.8900 Max. :1.70063

AI_ASAK_C312_AG_VL_F_CV AI_ASAK_C312_AL2O3_VL_F_CV AI_ASAK_C312_AP.NF_VL_F_CV
Min. :0 Min. :0 Min. :0
1st Qu.:0 1st Qu.:0 1st Qu.:0
Median :0 Median :0 Median :0
Mean :0 Mean :0 Mean :0
3rd Qu.:0 3rd Qu.:0 3rd Qu.:0
Max. :0 Max. :0 Max. :0

AI_ASAK_C312_AP_VL_F_CV AI_ASAK_C312_GS_VL_F_CV AI_ASAK_C312_NF_VL_F_CV
Min. :0 Min. :0 Min. :0
1st Qu.:0 1st Qu.:0 1st Qu.:0
Median :0 Median :0 Median :0
Mean :0 Mean :0 Mean :0
3rd Qu.:0 3rd Qu.:0 3rd Qu.:0
Max. :0 Max. :0 Max. :0

AI_ASAK_C312_P2O5_VL_F_CV AI_ASAK_C312_PSP_VL_F_CV AI_ASAK_C312_SF_VL_F_CV
Min. :0 Min. :0 Min. :0
1st Qu.:0 1st Qu.:0 1st Qu.:0
Median :0 Median :0 Median :0
Mean :0 Mean :0 Mean :0
3rd Qu.:0 3rd Qu.:0 3rd Qu.:0
Max. :0 Max. :0 Max. :0

AI_ASAK_C312_SUMM_VL_F_CV AI_ASAK_C312_TM_VL_F_CV AI_ASAK_K34_AG_VL_F_CV
Min. :100 Min. :0 Min. :0.540000
1st Qu.:100 1st Qu.:0 1st Qu.:0.828104
Median :100 Median :0 Median :1.128724
Mean :100 Mean :0 Mean :1.073986
3rd Qu.:100 3rd Qu.:0 3rd Qu.:1.347500
Max. :100 Max. :0 Max. :1.400000

и т.д.

Для каждого показателя у Вас есть максимум и минимум. Формула приведения: отнимаем минимум и делим на (максимум - минимум). Получаем от 0 до 1.

Хотя лучше просто построить графики в программном обеспечении которое умеет многомерные временные ряды рисовать.

PS коэффициенты для расчета
CODE

> as.vector(apply(data[,-1],2,min))
[1]  12.8199997  14.2700005  71.6900024  33.7599983   0.7700000  37.4979996
[7]  13.8100004   6.5200000   2.7100000  99.7220001   1.6400000   0.0000000
[13]   0.0000000   0.0000000   0.0000000   0.0000000   0.0000000   0.0000000
[19]   0.0000000   0.0000000 100.0000000   0.0000000   0.5400000  96.8799973
[25]  94.4199982   1.4600000  38.6199989   0.4438333   0.4100000  99.5400009
[31]   0.9700000  98.6399994  96.3799973   2.2700000  39.4199982   0.3700000
[37]   0.3400000 100.3300018   0.0000000  20.7529415   0.0000000   0.0000000
[43]   0.0000000   0.0000000   0.7900000   0.0000000   0.0000000   0.0000000
[49]   0.0000000   0.0000000  20.9494117   0.0000000   0.0000000   0.0000000
[55]   0.0000000   0.7600000   0.0000000   0.0000000   0.0000000   0.0000000
> as.vector(apply(data[,-1],2,max))-as.vector(apply(data[,-1],2,min)) [1] 1.38000012 0.19999981 3.59999848 1.25600281 0.30000007 3.38200150
[7] 0.51199951 2.03000021 0.11999989 0.16799927 0.06062506 0.00000000
[13] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
[19] 0.00000000 0.00000000 0.00000000 0.00000000 0.85999995 1.37000275
[25] 2.37000275 1.00999999 0.97000122 0.10616669 0.34999999 0.19599825
[31] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
[37] 0.00000000 0.00000000 0.00000000 0.91705855 0.00000000 0.00000000
[43] 0.00000000 0.00000000 0.80257981 0.00000000 0.00000000 0.00000000
[49] 0.00000000 0.00000000 0.86058774 0.00000000 0.00000000 0.00000000
[55] 0.00000000 0.56764709 0.00000000 0.00000000 0.00000000 0.00000000
>


Сообщение было отредактировано PS2004R - 15.04.2011 21:42
Участник оффлайн! reggga




 прочитанное сообщение 16.04.2011 23:50     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #11 множественное цитирование

Я извиняюсь, но дело в том, что я ещё очень плохо разбираюсь в этой программе... Не могли бы вы пояснить неразумному человеку этот код, и куда, собственно, его вставлять?)) Если не очень затруднит... Плииз! eek.gif

Сообщение было отредактировано reggga - 16.04.2011 23:52
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 17.04.2011 15:16     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #12 множественное цитирование

(reggga @ 16.04.2011 23:50)
Ссылка на исходное сообщение  Я извиняюсь, но дело в том, что я ещё очень плохо разбираюсь в этой программе... Не могли бы вы пояснить неразумному человеку этот код, и куда, собственно, его вставлять?)) Если не очень затруднит... Плииз! eek.gif


У Вас Ексель?

В присланной ексель таблице, отнять коэффициент из первой таблицы от всех строк соответствующего столбца, и поделить на коэффициент для этого же столбца из второй таблицы.

Ну или сразу в экселе найдите минимум и максимум каждого столбца, который потом хотите отобразить, и воспользуйтесь уже приведившейся формулой.

Могу посчитать Ваши данные за Вас.

summary(apply(data[,-1],2,function(x) {(x-min(x))/(max(x)-min(x))}))

CODE

AI_ASAK_C311_AG_VL_F_CV AI_ASAK_C311_AL2O3_VL_F_CV AI_ASAK_C311_AP.NF_VL_F_CV
Min.   :0.0000          Min.   :0.0000             Min.   :0.0000            
1st Qu.:0.2732          1st Qu.:0.1319             1st Qu.:0.1082            
Median :0.5854          Median :0.2996             Median :0.2161            
Mean   :0.5358          Mean   :0.3562             Mean   :0.3572            
3rd Qu.:0.7917          3rd Qu.:0.5044             3rd Qu.:0.6076            
Max.   :1.0000          Max.   :1.0000             Max.   :1.0000            
                                                                             
AI_ASAK_C311_AP_VL_F_CV AI_ASAK_C311_GS_VL_F_CV AI_ASAK_C311_NF_VL_F_CV
Min.   :0.0000          Min.   :0.0000          Min.   :0.0000        
1st Qu.:0.3326          1st Qu.:0.4962          1st Qu.:0.1194        
Median :0.5415          Median :0.6493          Median :0.1640        
Mean   :0.4759          Mean   :0.6096          Mean   :0.3309        
3rd Qu.:0.5940          3rd Qu.:0.8190          3rd Qu.:0.5619        
Max.   :1.0000          Max.   :1.0000          Max.   :1.0000        
                                                                       
AI_ASAK_C311_P2O5_VL_F_CV AI_ASAK_C311_PSP_VL_F_CV AI_ASAK_C311_SF_VL_F_CV
Min.   :0.0000            Min.   :0.0000           Min.   :0.0000        
1st Qu.:0.3331            1st Qu.:0.4395           1st Qu.:0.4093        
Median :0.5356            Median :0.8679           Median :0.7156        
Mean   :0.4749            Mean   :0.6873           Mean   :0.6501        
3rd Qu.:0.5952            3rd Qu.:0.9375           3rd Qu.:0.9376        
Max.   :1.0000            Max.   :1.0000           Max.   :1.0000        
                                                                         
AI_ASAK_C311_SUMM_VL_F_CV AI_ASAK_C311_TM_VL_F_CV AI_ASAK_C312_AG_VL_F_CV
Min.   :0.0000            Min.   :0.0000          Min.   : NA            
1st Qu.:0.5423            1st Qu.:0.0000          1st Qu.: NA            
Median :0.7986            Median :0.1336          Median : NA            
Mean   :0.7362            Mean   :0.2370          Mean   :NaN            
3rd Qu.:1.0000            3rd Qu.:0.3868          3rd Qu.: NA            
Max.   :1.0000            Max.   :1.0000          Max.   : NA            
                                                  NA's   :360            
........



Файл/ы:

скачать файл data_out.rar
размер: 66.4к
кол-во скачиваний: 137


Участник оффлайн! reggga




 прочитанное сообщение 17.04.2011 20:30     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #13 множественное цитирование

Мне бы надо прописать эту формулу именно в программе Statistica. Если я её записываю в выпадающей форме в виде summary(apply(data[,-1],2,function(x) {(x-min(x))/(max(x)-min(x))})), выдаётся ошибка. Там в функциях min и max нужно прописать в скобках из каких двух значений выбирается мин или макс

Вы то сами где эту формулу записывали, в Excel?
Мне же нужен не только результат, мне нужно понять, как это всё своими ручками сделать ))


(PS2004R @ 17.04.2011 16:16)
Ссылка на исходное сообщение 

В присланной ексель таблице, отнять коэффициент из первой таблицы от всех строк соответствующего столбца, и поделить на коэффициент для этого же столбца из второй таблицы.



Что вы имеете в виду под первой и второй таблицей?

Сообщение было отредактировано reggga - 17.04.2011 20:31
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 18.04.2011 17:18     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #14 множественное цитирование

(reggga @ 17.04.2011 20:30)
Ссылка на исходное сообщение 
Вы то сами где эту формулу записывали, в Excel?
Мне же нужен не только результат, мне нужно понять, как это всё своими ручками сделать ))
Что вы имеете в виду под первой и второй таблицей?


Ну слава Координатору, результат уже есть... острота спала. smile.gif Можно неторопливо рассказать дальше.

Я рассчитываю в среде статистических расчетов R. http://cran.r-project.org/

Эти возможности доступны из используемого Вами статпакета. Как использовать написано по ссылке:
http://www.statsoft.com/solutions/r-language-platform/

Про эксель я сказал, поскольку подозреваю что в электронных таблицах Вы наверняка посчитаете быстрее и увереннее.

Таблицы коэффициентов упрощающие расчет формулы указаны в письме, тут больше затрудняюсь дистанционно помочь.
Участник оффлайн! reggga




 прочитанное сообщение 18.04.2011 18:17     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #15 множественное цитирование

Вы правы, в экселе, конечно, намного проще. Дело в том, что я пишу курсовую и мне очень желательно всё-таки попытаться сделать это с помощью инструментов Statistica.

Я прошла по указанным ссылкам и немного почитала про язык R. При желании в нем, конечно, можно разобраться. Только похоже, что этот язык поддерживается пакетом Statistica версии 9.0 и выше, а у меня версия 8.0 (( Когда я вхожу в меню Statistics->Advanced Linear/Nonlinear Models, там нет графика под названием Custom R Non-Linear Time Series, как это показано на сайте statsoft.com На русской версии этого сайта написано, что поддержка языка R - это одна из дополнительных возможностей Statistica 9

Может, можно написать на Statistica Visual Basic? Вы умеете на нем работать?

Сообщение было отредактировано reggga - 18.04.2011 19:23
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 18.04.2011 20:19     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #16 множественное цитирование

(reggga @ 18.04.2011 18:17)
Ссылка на исходное сообщение  
Может, можно написать на Statistica Visual Basic? Вы умеете на нем работать?


Писал в ?2002? году бутстреп на бейсике статистики. _Очень_ многословный язык, других подробностей не помню. В страшном сне не могу рекомендовать студенту писать на этом учебную работу.

Если Статистика не обязательна к использованию пишите на R. Это практически стандарт у статистиков. Кроме того появляется повод оформить работу студенческую с помощью Sweave или odfWeave.
Участник оффлайн! reggga




 прочитанное сообщение 20.04.2011 16:48     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #17 множественное цитирование

А вы не подскажете, случайно, чем нормировка отличается от стандартизации? Просто я нашла простой способ стандартизировать переменные ))
Участник оффлайн! PS2004R
Постоянный участник



 прочитанное сообщение 21.04.2011 11:37     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #18 множественное цитирование

(reggga @ 20.04.2011 16:48)
Ссылка на исходное сообщение  А вы не подскажете, случайно, чем нормировка отличается от стандартизации? Просто я нашла простой способ стандартизировать переменные ))


А в какой науке? Это ведь просто слова. Если статистика...

1. Нормировка? Это от нормировать? Ну так стандартное отклонение --- нормальное отклонение.

Единица измерения у стандартной шкалы это стандартное отклонение вариационного ряда для которого вводится шкала.

2. Отдельно существует операция центрирование ряда.

Обе операции примеренные вместе называются автошкалированием. Или стандартизация данных.

Что лучше для размещения на графике вопрос --- в одном случае пространство оси показателя использовано полностью в другом есть связь между показателями через одинаковый визуальный размер стандартного отклонения.
Участник оффлайн! psychologist




 прочитанное сообщение 09.04.2012 20:14     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #19 множественное цитирование

Помогите, пожалуйста, также со статистикой 8

у меня есть массив данных
user posted image

мне надо сравнить выборки по критерию хи квадрат
делаю так
user posted image

после выходит такое окно
user posted image
и как мне теперь с ним работать,чтобы -таки воспользоваться данным критериемsmile.gif
Участник оффлайн! bubnilkin
Участник



 прочитанное сообщение 29.01.2018 12:42     Сообщение для модератора         Личное письмо
Цитировать Поместить сообщение в колонку новостей  URL #20 множественное цитирование

Здравствуйте,

есть вопрос по этой же теме

ставил несколько экспериментов (>10) по определению концентрации (мг/мл) белка в сыворотках мышей (>400) методикой ИФА. Каждый раз на 96-луночной плате (>10 плат) было по ~35 сывороток в дублях + контрольную сыворотку. Контрольная сыворотка (КС) ставится для того, чтобы удостовериться, что каждый раз измеряем допустимо одинаково. Естественно получили диапазон значений для КС.

Вопрос:
надо ли _стандартизовать_

z_i = (y_i - mean(y_i))/sd(y_i)

значения концентраций на разных платах перед статобработкой?

если да, то почему?
ведь, если у одной мыши концентрация 1 мг/мл а у другой 17 мг/мл значит так и есть...


(насколько я понимаю, то z-scores помогают понять, сколько %-ов наблюдений в пределах одной/двух/трёх сигм и сделать вывод о принадлежности к нормальному распределению...) wall.gif confused.gif

Сообщение было отредактировано bubnilkin - 29.01.2018 12:47

Всего благодарностей: 1Поблагодарили (1): biostatleo
Участник оффлайн! Den-N
Постоянный участник



 прочитанное сообщение 08.02.2018 23:25     Сообщение для модератора         Личное письмо  Отправить e-mail
Цитировать Поместить сообщение в колонку новостей  URL #21 множественное цитирование

(bubnilkin @ 29.01.2018 15:42)
Ссылка на исходное сообщение  Здравствуйте,

есть вопрос по этой же теме

ставил несколько экспериментов (>10) по определению концентрации (мг/мл) белка в сыворотках мышей (>400) методикой ИФА. Каждый раз на 96-луночной плате (>10 плат) было по ~35 сывороток в дублях + контрольную сыворотку. Контрольная сыворотка  (КС) ставится для того, чтобы удостовериться, что каждый раз измеряем допустимо одинаково. Естественно получили диапазон значений для КС.

Вопрос:
надо ли _стандартизовать_
z_i = (y_i - mean(y_i))/sd(y_i)
значения концентраций на разных платах перед статобработкой?
если да, то почему?
ведь, если у одной мыши концентрация 1 мг/мл а у другой 17 мг/мл значит так и есть...
(насколько я понимаю, то z-scores помогают понять, сколько %-ов наблюдений в пределах одной/двух/трёх сигм и сделать вывод о принадлежности к нормальному распределению...) wall.gif  confused.gif

Странно, что никто не отвечает: ИФА очень распространён. К сожалению ваша проблема относится не только к статистике, но и к конкретному методу. Я руками ИФА не работал, литературу по этому методу не начитывал. Поэтому могу поделиться только своими мыслями и небольшим опытом анализа таких данных.
(1) Раз методикой прописана постановка КС, должен быть и какой-то показатель для контроля того, что "измеряем допустимо одинаково", а по-хорошему должна быть прописана и процедура приведения измерений к сопоставимому виду, если этот показатель выходит за какие-то границы.
(2) Очень сомневаюсь, что применительно к ИФА речь идёт о стандартизации в статистическом смысле этого термина, т.к. это действительно будет глупостью. Скорее всего под стандартизацией у вас понимается некая процедура приведения сырых данных к сопоставимому масштабу. Например, все значения на планшете можно пересчитать в % от КС.
Когда-то скачивал толстую книжку по ELISA, если найду - выложу. Но вообще нужно читать в статьях как люди описывают этот этап. В хороших англоязычных статьях всё прописывают очень подробно.

Всего благодарностей: 1Поблагодарили (1): bubnilkin
Участник оффлайн! bubnilkin
Участник



 прочитанное сообщение 10.02.2018 20:29     Сообщение для модератора         Личное письмо
Цитировать Поместить сообщение в колонку новостей  URL #22 множественное цитирование

Den-N, благодарю за прояснение.
Участник оффлайн! biostatleo




 прочитанное сообщение 14.02.2018 19:07     Сообщение для модератора         Фотография  Личное письмо  Отправить e-mail  Web-адрес
Цитировать Поместить сообщение в колонку новостей  URL #23 множественное цитирование

Коллега, привет!

Вы пишите: "есть вопрос по этой же теме".
Однако на этой странице за 7 лет обсуждалась не одна конкретная тема. Поэтому для получения более продуктивных ответов, рекомендую Вам заново сформулировать свой вопрос. Особенно опишите подробнее, какие методы статистического анализа Вы предполагаете далее использовать. Поскольку процедура стандартизации связана с методами анализа.

Желаю успеха!

*




Кнопка "Транслит" перекодирует
текст из транслита в кирилицу.
Правила перекодировки здесь;
текст в квадратных скобках'[]'
не преобразуется.
Имя:

 преобразовывать смайлики · показать смайлики
Назначение кнопок:

   Поблагодарить автора сообщения — поблагодарить автора
   Удалить сообщение — удалить
   Редактировать сообщение — редактировать
   Поместить сообщение в колонку новостей — поместить в колонку новостей
   Цитировать — цитировать сообщение
   не входит в цитирование/входит в цитирование — цитировать несколько
   Отметить СПАМ-сообщение — обозначить спам
   Сообщение для модератора — связь с модератором
   Участник онлайн!/Участник оффлайн! — автор онлайн/оффлайн
   Фотография — фотография автора

   - остальные обозначения -
 
   *
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема »
Быстрый ответДобавить сообщение в темуСоздать новую тему

Rambler   molbiol.ru - методы, информация и программы для молекулярных биологов              

 ·  Викимарт - все интернет-магазины в одном месте  ·  Доска объявлений Board.com.ua  · 
--- сервер арендован в компании Hetzner Online, Германия ---
--- администрирование сервера: Intervipnet ---

Хеликон · Диаэм · ИнтерЛабСервис · Beckman Coulter · SkyGen · ОПТЭК · BIOCAD · Евроген · Синтол · БиоЛайн · Sartorius · Химэксперт · СибЭнзим · Tecan · Даниес · НПП "ТРИС" · Биалекса · ФизЛабПрибор · Genotek · АТГ Сервис Ген · Биоген-Аналитика
Ваш форум  ·  redactor@molbiol.ru  ·  реклама  ·  Дата и время: 22.06.18 08:54
Bridged By IpbWiki: Integration Of Invision Power Board and MediaWiki © GlobalSoft