Współpraca
Cena
500zł
Długość realizacji
14-21 dni
Schemat współpracy
Zaliczka (100zł)
Gdy zdecydujecie, że chcecie, abym przygotował dla was analizę do pracy, piszecie do mnie i wpłacacie zaliczkę. Dzięki temu rezerwujecie sobie miejsce, a ja wiem, że jesteście zdecydowani.
Dysk Google
Podajecie mi swój mail do Gmaila i dodaję was do folderu na Dysku Google, na którym będziemy wymieniać się plikami.
Materiały
Wysyłacie mi materiały: czcionkę, styl cytowania/raportowania, temat pracy, cel pracy, hipotezy, pytania badawcze, metryczkę, kwestionariusze i opis narzędzi, których używaliście, a do tego podajecie termin realizacji.
Poprawki
Przejrzę wasze materiały i zacznę pracować nad arkuszem. Następnie zaznaczę podejrzane wartości (np. masa ciała 130kg), błędy w kodowaniu oraz wszystko, czego nie rozumiem w waszych danych. Wyślę wam plik z rzeczami do poprawy i będziemy ustalać, jak to poprawić.
Zapłata (400zł)
Dopłacacie resztę kwoty, a ja wysyłam wam raport i nagranie.
Raport (nagranie)
Tworzę raport z wynikami i nagrywam film, w którym tłumaczę, co wyszło z danych, jak interpretować wykresy i tabelki oraz jak je wykorzystać w pracy.
1. Zaliczka
Trochę się zastanawiałem, jak rozwiązać dwa problemy:
- Mam ograniczoną liczbę miejsc, więc muszę jasno ustalić, komu będę robił statystykę do pracy.
- Chcę uniknąć sytuacji, w której ktoś pisze, że jest zainteresowany, ja wpisuję go na listę, odmawiam innym, a po miesiącu ta osoba się wycofuje, tłumacząc, że „chciała się tylko zorientować, jak to działa, ale to nie było na poważnie”. Efekt? Ktoś inny stracił miejsce.
Dlatego doszedłem do wniosku, że zrobię to w taki sposób: mam np. 5 miejsc i pierwsze 5 osób, które dogada się ze mną i wpłaci zaliczkę, zostaje przyjęte.
2. Dysk Google
Musimy jakoś wymieniać się materiałami i zastanawiałem się, czy zrobić to przez folder na Dysku Google, czy przez maila. Problem z mailem jest taki, że ma niski limit wielkości załączników, więc nagrania i tak musiałbym wrzucać na Dysk. Do tego pliki byłyby porozrzucane po różnych wiadomościach, a na Dysku można je wygodnie umieścić w jednym folderze.
Dlatego finalnie zdecydowałem się na Dysk Google. Jednak żebym mógł udzielić dostępu do edycji tylko Wam, a nie każdej osobie posiadającej link, potrzebuję od Was adresu Gmail.
3. Materiały
Zachęcam do obejrzenia filmu nr 2 (Materiały) — tam jest lepiej wyjaśnione i pokazane przygotowanie materiałów.
Aby przeprowadzić sensowną analizę, potrzebuję od Was kilku informacji:
- Co mam analizować? — temat pracy, cel, hipotezy i pytania badawcze.
- Na kim odbyło się badanie? — opis grupy badawczej.
- Na co patrzę, otwierając arkusz? — metryczka, ankiety, kwestionariusze oraz opis użytych narzędzi badawczych.
1. Co mam analizować?
Przypuśćmy, że nagrałem się, jak rzucam monetą, a ona zamiast polecieć na którąś ze stron, stanęła na kancie. Coś ciekawego – nie zdarza się to zbyt często. A teraz wyobraźcie sobie, że nagrywam się tak od piętnastu minut i udało mi się to zrobić przy 137 próbie... Zmienia to perspektywę – nagle wcale nie wydaje się to takie specjalne.
Podobnie jest w statystyce. Zazwyczaj, kiedy przeprowadzamy test (np. test t Studenta), ma on 5% szans na wynik pozytywny wyłącznie z przypadku – taką wylosowaliśmy grupę i tyle. Pytanie: co się stanie, gdy przeprowadzimy 20 takich testów, z których każdy ma 5% szans na wynik pozytywny z przypadku? Nagle szansa, że przynajmniej jeden z nich będzie pozytywny, wynosi 64%!!! To, że coś mało prawdopodobnego zdarzy się przy dużej liczbie prób, wcale nie jest mało prawdopodobne.
Z tego powodu, analizując dane, powinniśmy wykonywać tylko tyle testów, ile jest konieczne do odpowiedzenia na postawione hipotezy i pytania badawcze. Testując wszystko ze wszystkim, szansa, że przy jednym z dziesiątek testów magiczne p<.05 wyskoczy „przypadkiem”, jest praktycznie pewna.
Znając temat pracy, cel, hipotezy i pytania badawcze oraz dokładnie rozumiejąc, co chcieliście sprawdzić, przeprowadzając to badanie, mogę dobrać tylko te testy, które rzeczywiście weryfikują wasze założenia. Dzięki temu unikamy sytuacji, w której testuje się „na oślep”, aż coś przypadkiem wyjdzie — czyli tzw. p-hackingu.
2. Na kim odbyło się badanie?
Załóżmy, że policzyłem średnią wieku i wyszło 42 lata. Niby nic niezwykłego. Ale jeśli dodamy, że badanie dotyczyło studentów, to od razu coś zaczyna nie grać. Najpewniej gdzieś popełniłem błąd — np. wgrałem zły arkusz do programu albo pomyliłem się w kodzie. Gdybym jednak nie znał informacji o badanej grupie, uznałbym, że średnia wieku 42 lata brzmi całkiem sensownie i nawet bym się nad tym nie zastanawiał.
Wiedząc, na jakiej grupie odbywało się badanie, jestem w stanie określić, czy wynik, który dostałem, jest realny, czy jednak coś tutaj poszło nie tak.
3. Na co patrzę, otwierając arkusz?
Podobnie jak w poprzednim przykładzie, jeśli otwieram arkusz i widzę same liczby bez żadnego kontekstu, trudno jest z nimi zrobić coś sensownego. Załóżmy, że trafiam na kolumnę „I_Th3”. Na pierwszy rzut oka (pomijając, że sam to wymyśliłem) nic mi to nie mówi. Widzę wartości 22, 31, 19 – ale nie wiem, jak zostały zmierzone ani w jakich jednostkach: w centymetrach, stopniach, czy jeszcze inaczej. W takiej sytuacji nawet jeśli chciałbym coś z tym policzyć, nie mam pojęcia, jaką analizę wybrać i czy wynik w ogóle miałby sens.
Natomiast jeśli dostanę informację, że chodzi o pomiar krzywizny kręgosłupa na poziomie Th3 przy użyciu inklinometru, to sprawa wygląda zupełnie inaczej. Wiem, że jednostką są stopnie i jeśli nagle pojawia się wynik 122, to od razu mogę podejrzewać błąd przy wprowadzaniu danych (albo że ktoś w drodze na badanie zaliczył czołówkę z tirem, jadąc rowerem). Dzięki temu wiem też, że mogę np. sprawdzić korelację kąta na poziomie Th3 z występowaniem dolegliwości bólowych pleców.
Wiedząc, co chcieliście zbadać, na kim to zbadaliście i w jaki sposób, jestem w stanie sobie wyobrazić, jak wyglądało od początku do końca Wasze badanie i wiem, jakich wyników mniej więcej mogę się spodziewać. Dzięki temu łatwo mi dobrać adekwatne analizy, a kiedy dostanę ich wyniki, wiem, czy są one realne, czy jednak coś po drodze poszło nie tak, a to minimalizuje szansę, że popełnię błąd i go nie wyłapię.
Tak więc do przeprowadzenia analizy statystycznej będę potrzebował:
- Czcionkę
- Styl cytowania/raportowania
- Temat pracy
- Cel pracy
- Hipotezy
- Pytania badawcze
- Opis badanej grupy
- Opis kolumn
Kiedy przygotujecie pliki, wstawiacie je do folderu na Dysku Google, a ja zabieram się do działania.
Przykład
4. Poprawki
Po otrzymaniu od Was materiałów przejrzę arkusz pod kątem brakujących wartości (np. brak wzrostu u osoby nr 3) oraz podejrzanie wysokich lub niskich wyników (np. waga 652 kg albo 6,52 kg — być może miało być 65,2 kg, ale ktoś pominął przecinek lub wstawił go w złym miejscu). Dodatkowo sprawdzę opis badania, który mi przekażecie, i upewnię się, że wszystko jest dla mnie jasne.
Jeśli znajdę błędy w arkuszu, wartości budzące wątpliwości albo coś, czego nie jestem pewien w opisie badania, przygotuję plik Excel (.xlsx), w którym oznaczę kolorem komórki zawierające podejrzane wartości, a do tego dołączę notatkę opisującą w punktach, w których komórkach występują te nieprawidłowości oraz czego nie rozumiem w opisie badania.
Postaracie się poprawić arkusz (np. może po prostu wartości zostały błędnie przepisane z ankiet), a jeśli nie będzie to możliwe, wspólnie ustalimy, co z nimi zrobić.
Jak już ustalimy finalną wersję arkusza i pytań badawczych, zabieram się za tworzenie analizy.
5. Zapłata
Nie chcę za kimś chodzić i przypominać, że miał mi zapłacić, dlatego końcowy raport przesyłam dopiero po uiszczeniu pełnej kwoty.
6. Raport (nagranie)
Zachęcam do obejrzenia filmu nr 3 (Raport) — tam jest dokładniej wyjaśnione.
W raporcie skupię się na tym, żeby opisać grupę, analizę danych oraz wyniki tak, żeby były praktycznie gotowe do wklejenia do pracy. Tak więc wszystko będzie skondensowane, bez wyjaśnień, jak działają dane analizy, co one oznaczają, a raport napiszę typowo formalnym językiem.
Natomiast w nagraniu skupię się, żeby jak najprościej i najbardziej intuicyjnie wyjaśnić, co zrobiłem, dlaczego akurat wybrałem te analizy i co mi wyszło.
Schemat
Materiał i metoda
- Metody
- Opis zastosowanego oprogramowania
- Opis zatosowanych metod statystycznych wraz z wyjśnieniem wyboru
- Opis weryfikacji założeń(normalność, liniowość, jednorodność wariancji etc.) oraz co zrobiłem z obserwacjami odstającymi i brakującymi danymi
Wyniki
-
Opis grupy
- Tutaj dodam wykresy, tabelki i opis grupy, na której wykonaliście badania (wiek, wzrost, waga, BMI, wykształcenie, miejsce zamieszkania etc.)
- Analiza 1 (np. regresja liniowa)
- Wizualizacja
- Opis wyników
- Analiza 2 (np. ANOVA)
- Wizualizacja
- Opis wyników



