Ach, možná bych zde mohl zkusit vyřešit reálný problém, který mi nastal s jiným případem a neumím se z něj hnout.
Třeba narazím na někoho moudřejšího:
Je to opět o Rku a glm, lépe řečeno glmm, nejlépe řečeno o glmmPQL funkci.
Vychází mi tam rozpor, který si nejsem schopen vysvětlit, ale rád bych mu přišel na kloub kvůli interpretaci dat.
O co jde:
Potřebuji zjistit rozdíl působení dávky na teratogenitu (vliv na vývojové vady).
V každé skupině o různé dávce je několik samic a z nich jsou spočtena embrya s a bez vady.
Celé se mi to tváří jako obdoba kontingenčních tabulek s tím, že samice jsou random faktor.
Zadal jsem to jako počet jedinců (N) ~ dávka * přítomnost poruch, random = samice (dobře, zápis je trochu jinak, ale rámcově).
Vyhodí mi to klasickou tabulku ve složení:
dávka1 estimation1 .... p1
dávka2 estimation2 ... p2
poruchyAno estimation3 ... p3
dávka1:poruchyAno estimation4 ... p4
dávka2:poruchyAno estimation5 ... p5
A teď několik otázek pro tento případ glmm:
Dávky jsou hádám strovnávány s kontrolou, poruchyAno s poruchamiNe, ale s čím jsou srovnávány interkace - dle všeho to není srovnání v rámci dávky, když tento údaj chybí pro kontrolu (narozdíl od toho pseudoproblému, o kterém jsem psal níže).
Podobný problém je s dávkami - určitě to není jen srovnání počtů embryí, jelikož pak by nebyl moc důvod, aby u jednotlivých znaků tady vycházely nějaké závratné rozdíly.
A z toho plyne další má nově nabytá nejistota: Co je směrodatné pro daný problém? Dávky, nebo interakce?
Pokud porovnávám čísla, tak bych jsou případy, že to první, nicméně mám tam několik krajních, kde se to jeví spíše jako to druhé. Ve většině případů, kde je průkaznost v Dávkávh, je průkaznost i v Interakcích (popř. je to těsně pod hladinou průkaznosti) a naopak.
Každopádně v extrémním případu, kde není ani u jednoho embrya nalezena porucha, vycházejí všechny Dávky průkazně a všechny interakce s P = 1. A já se svou (ne)znalostí nejsem s to přijít na to proč. |