Molbiol.ru | О проекте | Справочник | Методы | Растворы | Расчёты | Литература | Орг.вопросы Web | Фирмы | Coffee break | Картинки | Работы и услуги | Биржа труда | Zbio-wiki NG SEQUENCING · ЖИЗНЬ РАСТЕНИЙ · БИОХИМИЯ · ГОРОДСКИЕ КОМАРЫ · А.А.ЛЮБИЩЕВ · ЗООМУЗЕЙ Темы за 24 часа [ Вход* | Регистрация* ] Форум: | |
Ulvhare |
Довожу до ума методику измерения целлюлазной активности в пробах из кишечника мелких млеков. Пробы экстрагируются в глицерине или буфере, затем (с разбавлением) инкубируются в присутствии МУФ-Ц, мерится на флуориметре. По количеству получающегося МУФ определяется активность. Текущая задача - оценить влияние экстрагента и концентрации химуса в измерительной кювете. Таблица в прицепе: sample - номер пробирки C_chym - концентрация химуса в кювете cbha - целлобиогидролазная активность Все пробы взяты из слепой кишки одного и того же зверя (здесь - домашний кролик), 10 пробирок - в глицерин, 10 - в буфер. Из каждой пробирки по 3 разведения. Разбросы значений cbha велики, т.к. целлюлазы не плавают в растворе, а сидят эдакими тяжами на микросимбионтах кишечника, которые в свою очередь сидят на частичках химуса, и сколько этих частичек попало в пробирку - случайный процесс. Но усреднённо метод работает (мне важно, сколько целлюлозы на зверя гидролизуется, точнее, сколько целлобиозы образуется). Предполагал делать дисперсионный анализ для проверки влияния экстрагента и Спирменовскую корреляцию для проверки влияния разведения. Однако неясно, как учитывать повторности, точнее, зависимость выборок. Посоветовали изучить теорию по теме "Experimental design", чем сейчас и занимаюсь, но как-то это похоже на стрельбу из пушки по воробьям, там в основном про многофакторные эксперименты и построение и подгонку множества (!) моделей. Подозреваю, что для моего случая есть варианты попроще. См. также Файл/ы:
|
PS2004R Постоянный участник |
Под логарифм проситься cbha |
Den-N Постоянный участник |
Если задача сейчас - только оценка влияния факторов, то можно ограничиться многофакторным дисперсионным анализом (Factorial ANOVA). Модель следующая. Отклик (зависимая переменная) - cbha (удобно умножить на 100000, на рез-ты повлияет только в лучшую сторону). Независимые факторы и их взаимодействия: 0) Если у вас несколько кроликов, то вводим фактор (и столбец) "Индивид" и помещаем туда метки для животных. Данный фактор позволит выразить и оценить изменчивость, привносимую индивидуальными различиями животных. Фактор случайный (Random), т.к. для аналогичного эксперимента ваши коллеги в другой стране не смогут использовать ваших кроликов, и возьмут из генеральной совокупности каких-то других случайных особей. У вас сейчас этого фактора нет, поэтому пронумеровал его как (0). 1) От каждого кролика материал делится на 2 части, имеем фактор "Среда" с двумя градациями: "Буфер" и Глицерин". Позволяет выразить и оценить изменчивость, привносимую выбором среды. Фактор фиксированный (Fixed), т.к. полностью находится под вашим контролем. 2). Каждая часть разливается по 10 пробиркам. Имеем фактор "Пробирка". Позволяет выразить и оценить изменчивость, привносимую этапом деления материала на части и каких-то микроусловий в пробирке (вам виднее каких). Фактор случайный. Также фактор является иерархическим, вложенным (nested) и вложен в фактор "Среда", т.к. для каждой среды - свои 10 пробирок. Такой фактор обозначается Пробирка(Среда) - пробирка внутри среды. Межу этими факторами невозможно взаимодействие. Поскольку фактор Пробирка(Среда) выражен, в анализе будет учтён зависимый характер результатов, полученных из одной пробирки (хотя и на разных концентрациях). 3). Концентрация химуса. Выражает влияние концентрации. Имеет 3 градации. Фактор фиксированный. Удобно умножить на 100. 4) Взаимодействие факторов (Среда х Концентрация). Выражает особенности сочетанного эффекта градаций двух факторов. Эффект фиксированный, т.к. входящие в него факторы такие. Если профили средних значений отклика для двух сред проходят параллельно - взаимодействия нет. Про взаимодействия факторов нужно читать хотя бы на примере двухфакторного дисп. анализа. 5) Взаимодействие факторов (Пробирка(Среда) х Концентрация). Случайное. Самостоятельного интереса не представляет, но позволяет грамотно разложить всю имеющуюся в дисперсионном комплекса изменчивость (дисперсию) на части. В R я этот комплекс быстро не задам, но результаты должны быть очень близки к тем, что прикрепил по F и P. Откомментирую их потом. Картинки: Image_2.png — (12.14к)
|
Ulvhare |
По теории решил пойти с начала, с вводной книжки Козлова (Планирование экологических исследований, 2014) "для научных сотрудников младшего возраста", очередной раз перечитать Мастицкого и Шитикова (2014), а также Шитикова и Розенберга (2013), по крайней мере, 4-ю главу. Попытки с места в карьер освоить англоязычные ресурсы не удались - не хватает базы. Монтгомери в переводе постараюсь добыть, но если закопаюсь в теорию и анализ вместо выполнения плана по статьям, это грозит санкциями ;-) По практике - думаю, что смогу такую модель поглядеть в R, т.к., что есть что вы мне любезно объяснили. Насколько я могу интерпретировать вашу таблицу, мои предварительные выводы по графикам подтверждаются - значимым фактором является концентрация, экстрагент (среда) напрямую на активность не влияет. На днях выложу сюда свои результаты, тогда и сверимся. Ещё раз благодарю за развёрнутый ответ! |
Den-N Постоянный участник |
Книги Монтгомери (почему-то не всеми браузерами открывается корректно) По поводу дисперсионного анализа в R - это беда. aov не понимает фиксированных и случайных факторов, lm не понимает вложенных, т.е. средние квадраты не так раскладываются и не на то делятся... В lme не получилось за 3 подхода в разное время разобраться со структурами Error() или (1|x), и всё равно получается не всё так как в книжках. Есть надежды на пакет EMSaov, но пока он работает только с равномерными комплексами. И это в то время как в SPSS, а позднее в Statistica (старше версии 6) это легко было сделать уже десятилетия назад. Буду признателен всем, кто научит получить для этих данных нужную табличку традиционными пакетами R. В ваших данных я умножил концентрации на 1000 (стало 5, 10, 15), а отклик на 100000 (первое наблюдение 22,68041). Поскольку пакет использует команду type, заменил на tp. >library(EMSaov) >res<-EMSanova(cbha~sample+tp+conc,data=rabbit, type=c("R","F", "F"),nested=c("tp",NA, NA), level=c(3,1,1)) > res # прикрепил картинкой Авторы пакета сделали хорошую работу, но опять не доработали. Параметр level не всегда очевиден, скорее вносится как-то интуитивно. Ну типа, каждой концентарции было по одной, каждого типа среды - по одному, а вот пробирок на тип - 3. Хотя как-то же программисты коммерческого софта обходятся без этих уровней, да и мне чтобы расписать ожидаемые средних квадратов они не нужны, нужно только число градаций факторов. Ну да ладно... Сообщение было отредактировано Den-N - 20.12.2018 08:09 Картинки: Image_1.png — (6.84к)
|
Den-N Постоянный участник |
1) Можно видеть, что результаты Statistica и EMSanova идентичны. Но в первом случае видно, что остаток модели (Residual) является в действительности взаимодействием факторов. Для этого эффекта нельзя получить F-критерий и р, т.к. его не с чем соотнести. Этот остаток складывается из взаимодействия факторов sample(tp)*conc (то же что и sample(tp*conc)) и ошибки измерения cbha - сейчас они нераздельны, не понятно что больше. Если бы вы измеряли каждый свой вариант хотя бы дважды, то ошибку приборного измерения можно было бы выразить, и появился бы ещё один MS, на который бы разделили эффект этого взаимодействия с получением для него F и р. Но это всё не слишком принципиально. 2) Раз вы ставите методику, то с точки зрения метрологии важно чтобы нужные эффекты были статистически значимыми, ненужные - нет. Судя по значению F-критерия, самый сильный эффект в модели - влияние на отклик концентрации; это хорошо. Другой значимый эффект - пробирка внутри типа среды. Это - плохо, т.к. на результат значимо влияет абсолютно случайный фактор. С этим нужно разбираться: смотреть данные, строить графики... Мне кажется, что эту значимость натянула первая пробирка (22,6804; 74,8936; 82,1978), и даже 74,8936, которое скорее всего является выбросом (outlier). Если это будет повторяться, то с такими вещами можно бороться "запретительными" методами, скажем описать в методике, что "за пригодные для последующего анализа принимаются результаты, которые..." (лежат в таком-то диапазоне, не выделяются более чем на... и т.п. - обсудите с коллегами - подскажут). А остальное бракуется. Так повысите точность. 3) также для методики важна "подконтрольность" системы. Всякие взаимодействия - неаддитивные и не всегда легко прогнозируемые эффекты. Раз взаимодействия факторов незначимы - это хорошо. Также для моделирования желательна линейность отклика. В требованиях к разработке фармакологических методик это даже, слышал, прописано. Для этих данных всё линейно; это тоже очень хорошо, но не мешало бы доказать линейность отдельно... 4) Вам говорили про множество моделей и это так. Но сложность возрастает. Например, мы можем не включать в окончательную модель статистически незначимые эффекты и рассматривать их просто как реплики. Мне это не нравится, но так делают и логика в этом есть. Получим уже другую модель. Включаем стадию проверки на выбросы (статистическую или какую-то эмпирическую) - получаем на выходе другие данные и другую модель. Также, если мы учтём, что концентрация - не качественный фактор с тремя градациями, а количественный, то можем отмоделировать зависимость от концентрации в ходе ковариационного анализа - уже другие модели. 5). И последнее. по результатам anova можно рассчитать компоненты дисперсии, т.е. выразить напрямую в % какую часть изменчивости (дисперсии) обусловливают все члены модели. По результатам пакета EMSaov это легко сделать вручную по Expected MS (EMS). Например, видно, что средний квадрат эффекта концентрации складывается из эффекта Error и 20 conc. Значит "чистый" эффект conc равен (2694,8895-54,45440)/20. Проверить правильность работы пакета в этой части ещё не успел, там не везде дисперсии, для фиксированных факторов - квадратичные формы, но доверимся пока авторам пакета. Такие "чистые" эффекты факторов и взаимодействий суммируются, это - 100%. Далее рассчитываются вклады каждого чистого эффекта в %. Если окажется, что какой-то неглавный член ответственен, скажем, за 50% шума данных, то желательно нагрузить этот фактор дополнительными измерениями, градациями. Или, скажем, если что-то шумит совсем мало, можно пробовать снять с этого фактора часть измерений - может это сильно удешевит/ускорит анализ практически без ущерба для точности метода. Например, может лучше ставить не 10, а 3 пробирки, но в каждой определять не 3, а 5 концентраций. Вряд ли это ваши цифры, привёл просто для примера того, что над постановкой методики "с умом" можно работать и долго, и нудно. Причём в самый разгар работы вам могут сказать, что самый черновой вариант методики начальство уже само упростило и даже валидировало, а если по ней не получается работать, так это потому что "у вас руки кривые" и "ждите инспектора"... Сообщение было отредактировано Den-N - 20.12.2018 07:54
|
PS2004R Постоянный участник |
Это остатки модели. Картинки: _________________2018_12_20_20_11_15.png — (26.29к)
|
bandar sbobet |
|
mongjihyo |
|
MarkMalin |
Предполагается, что у растительноядных млекопитающих, в том числе грызунов, специализированных к питанию дефицитными по содержанию белка зелеными и подземными частями растений, важную роль в питании и пищеварении играет диазотрофно-целлюлолитический комплекс микроорганизмов. Однако до сих пор закономерности функционирования этого важнейшего звена внутренних цепей питания у млекопитающих практически не исследованы. Сообщение было отредактировано MarkMalin - 23.04.2019 21:33 |
Ulvhare |
(MarkMalin @ 23.04.2019 22:32) Актуальность темы. Известно, что не только крупные растительноядные млекопитающие, но и некоторые мышевидные грызуны, например полёвки, способны к высокоэффективному усвоению вегетативных частей растений, характеризующихся низкой питательной ценностью... Это из моего диссера. И чо? Да, я всё ещё копаю эту тему со всех сторон. |
vananh01 |
|
guest: 123 IP-штамп: frJhOCvSv9ICE гость |
|
guest: 123 IP-штамп: frXqkB4MpP2jQ гость |
|
guest: 123 IP-штамп: frpYd0YygcNIA гость |
|
guest: 123 IP-штамп: frAWeMdOsBSXM гость |
|
« Предыдущая тема · Биофизика и матметоды в биологии · Следующая тема » |