Próbuję zrozumieć sposób, w jaki analiza GSVA działa za kulisami i zastanawiałem się, czy istnieje sposób, aby zrozumieć to bardziej intuicyjnie przez cały proces.
Więc na początku zgodnie z artykuł zaczyna się od oceny, czy gen i jest silnie lub słabo wyrażany w próbce j w kontekście rozkładu populacji próbki. Korzystają z tych oszacowań jądra skumulowanych funkcji gęstości aby przekształcić wartości początkowe, aby nie wpływały na nie problematyczne intensywności.
Po tej „transformacji” i następującej po niej normalizacji, GSVA oblicza wyniki wzbogacenia używając metody Kołmogorowa-Smirnowa (KS) jak losowo statystyka chodu .
Jak wiem, Kołmogorow-Smirnow sprawdza różnice w rozkładach. Które dystrybucje sprawdza? Zestaw genów jest przeciwko wszystkim innym genom? A jaka jest rola chodu przypadkowego?
Czy istnieje jakiś intuicyjny sposób zrozumienia tego rodzaju zjawiska Kołmogorowa-Smirnowa (KS), na przykład statystyki chodu przypadkowego? Jak to właściwie działa? Która z nich jest zerowa, a jaka hipoteza alternatywna w tym przypadku?