CVA - Kąt protrakcji głowy (ang. Craniovertebral angle)

NDI - Wskaźnik niepełnosprawności spowodowanej dolegliwościami bólowymi części szyjnej kręgosłupa (ang. Neck disability index)

CCC - Współczynnik zgodności Lin’a (ang. Lin’s Concordance Correlation Coefficient)

CI - Przedział ufności (ang. Confidence interval)

IQR - Rozstęp międzykwartylowy (ang. Interquartile range)

Materiał i metoda

Metoda

Wszystkie analizy statystyczne przeprowadzono w języku programowania R (wersja 4.5.2)[1], z wykorzystaniem następujących pakietów: blandr[2] (analiza zgodności metod pomiarowych zgodnie z procedurą Blanda i Altmana), DescTools[3] (obliczenie współczynnika zgodności Lin’a (CCC)), flexplot[4,5] (graficzna weryfikacja założeń modeli) oraz tidyverse[6] (manipulacja danymi i przygotowanie finalnych wizualizacji). Do oceny zgodności pomiarów uzyskanych metodą fotogrametrii i inklinometrii zastosowano metodę Blanda–Altmana oraz współczynnik CCC[7-9]. Korelację pomiędzy kątem CVA zmierzonym inklinometrem, a wynikiem NDI, oraz pomiędzy kątem CVA zmierzonym metodą fotogrametryczną a NDI, obliczono przy użyciu korelacji rang Spearmana. Obserwacje odstające identyfikowano metodami graficznymi oraz przy użyciu wskaźników statystycznych, takich jak odległość Cooka, wartości dźwigni (leverage, h) oraz reszty studentyzowane[10]. W przypadku gdy obserwacje odstające nie wynikały z błędów w kodowaniu i nie mogły zostać poprawione, wykonano analizy z ich uwzględnieniem oraz po ich usunięciu. Jeśli wyniki obu analiz różniły się istotnie, zaprezentowano obie wersje. Normalność rozkładu reszt zweryfikowano przy użyciu histogramu, wykresu Q–Q oraz testu Shapiro–Wilka[11]. Homoskedastyczność sprawdzono za pomocą wykresu lokalizacji i rozproszenia oraz testu Breuscha–Pagana[12]. Założenie liniowości oceniono na podstawie naniesionej na wykres linii LOESS oraz analizy wykresu reszt po dopasowaniu modelu[12]. W przypadku niespełnienia któregokolwiek z założeń zastosowano odpowiednie testy nieparametryczne. Jako poziom istotności statystycznej przyjęto p≤0,05, a wszystkie wykonane testy były obustronne.

Wyniki

Statystyki opisowe

Analiza charakterystki grupy wykazała, że kobiety i mężczyźni byli jednorodni pod względem wieku (W=295; p=0,21), natomiast różnili się pod względem wzrostu (t=-3,40; p=0,002), wagi (t=-9,55; p<0,001) oraz BMI (t=-5,37 p<0,001) (tab. 1).

Tabela 1. Statystyki opisowe — wiek, wzrost, waga, BMI.
N Me Min Max Q1 Q3 SD
Wiek (lata); W=295; p=0,21
Wszyscy 55 21,31 22,00 19,0 24,0 20,00 22,00 1,62
Kobiety 32 21,06 21,00 19,0 24,0 20,00 22,00 1,61
Mężczyźni 23 21,65 22,00 19,0 24,0 20,50 22,50 1,61
Wzrost (cm); t=-3,40; p=0,002
Wszyscy 55 169,22 169,00 156,0 188,0 165,00 174,00 6,34
Kobiety 32 166,91 167,00 156,0 178,0 163,00 170,00 5,24
Mężczyźni 23 172,43 174,00 159,0 188,0 169,00 176,00 6,42
Waga (kg); t=-9,55; p<0,001
Wszyscy 55 65,95 65,00 47,0 94,0 59,00 72,50 10,07
Kobiety 32 59,22 60,00 47,0 71,0 54,75 64,00 6,19
Mężczyźni 23 75,30 73,00 65,0 94,0 71,50 78,50 6,14
BMI (kg/m²); t=-5,37; p<0,001
Wszyscy 55 23,05 22,20 15,5 31,0 20,75 25,45 3,43
Kobiety 32 21,33 21,35 15,5 26,7 19,55 22,50 2,73
Mężczyźni 23 25,43 25,40 21,5 31,0 23,10 27,50 2,84
N - liczba obserwacji; X̄ - średnia; Me - mediana; Min - wartość minimalna; Max - wartość maksymalna; Q1 – dolny kwartyl; Q3 – górny kwartyl; SD – odchylenie standardowe

W badanej grupie (n=55) dominowały osoby z wykształceniem średnim ogólnokształcącym (80,0%). Wykształcenie wyższe posiadało 9,1% uczestników, natomiast średnie techniczne 10,9%. Nie odnotowano osób z wykształceniem zasadniczym zawodowym. W grupie kobiet (n=32) większość również posiadała wykształcenie średnie ogólnokształcące (75,0%), 9,4% miało wykształcenie wyższe, a 15,6% średnie techniczne. Wśród mężczyzn (n=23) najczęściej występowało wykształcenie średnie ogólnokształcące (87,0%), 8,7% miało wykształcenie wyższe, a 4,3% średnie techniczne. W obu podgrupach nie odnotowano osób z wykształceniem zasadniczym zawodowym (tab. 2).

Tabela 2. Statystyki opisowe — rozkład wykształcenia.
Wszyscy
(N = 55)
Płeć
Kobiety
(n = 32)
Mężczyźni
(n = 23)
Wyższe 5 ( 9,1%) 3 ( 9,4%) 2 ( 8,7%)
Średnie ogólnokształcące 44 (80,0%) 24 (75,0%) 20 (87,0%)
Średnie techniczne 6 (10,9%) 5 (15,6%) 1 ( 4,3%)
Zasadnicze zawodowe 0 ( 0,0%) 0 ( 0,0%) 0 ( 0,0%)

Największą grupę w badanej próbie stanowiły osoby niepracujące (33 osoby). Spośród osób zatrudnionych najczęściej wskazywano zawody związane z obsługą klienta lub usługami – w tym kelner (8 osób) oraz kasjer (3 osoby). Pozostałe zawody występowały pojedynczo i obejmowały m.in. trenera personalnego, barmana, kuriera, masażystkę, pomoc kuchenną, rozdawanie ulotek, sekretarkę, sprzedawcę oraz kierowcę Ubera (ryc. 1).

Kąt protrakcji głowy

Tabela 3. Porównanie wyników CVA mierzonego dwiema metodami(inklinometr, fotogrametra)
N Me Min Max Q1 Q3 SD
Inklinometr (°)
Wszyscy 55 29,95 30,0 17 49 24,00 35 7,20
Kobiety 32 29,41 29,5 17 48 24,00 34 7,09
Mężczyźni 23 30,70 31,0 19 49 25,00 36 7,44
Fotogrametria (°)
Wszyscy 55 35,11 34,0 21 54 30,00 41 7,23
Kobiety 32 34,50 34,0 21 53 29,75 41 7,51
Mężczyźni 23 35,96 36,0 25 54 31,00 40 6,89
N - liczba obserwacji; X̄ - średnia; Me - mediana; Min - wartość minimalna; Max - wartość maksymalna; Q1 – dolny kwartyl; Q3 – górny kwartyl; SD – odchylenie standardowe

Zgodność inklinometru ze zdjęciem

CCC
CCC(df$zdjecie, df$inklinometr)$rho.c
#>         est    lwr.ci    upr.ci
#> 1 0,7607444 0,6697612 0,8292248

Zgodność pomiarów uzyskanych za pomocą inklinometru i metody fotograficznej oceniono przy użyciu współczynnika zgodności CCC. Analiza przeprowadzona dla wszystkich obserwacji (n=55) wykazała zgodność pomiarów na poziomie (CCC=0,76; 95% CI: 0,67–0,83). Wartość ta wskazuje na umiarkowaną zgodność, jednak należy podkreślić, że brak jest powszechnie przyjętych kryteriów interpretacji współczynnika CCC[13]. Na (ryc. 2) przedstawiono zależność pomiędzy wartościami uzyskanymi obiema metodami pomiaru.

Analiza Blanda Altmana
bland_altman_results = blandr.statistics(df$zdjecie, df$inklinometr)
bland_altman_results
#> Bland-Altman Statistics
#> =======================
#> t = 18,574, df = 54, p-value = < 2,2e-16
#> alternative hypothesis: true bias is not equal to 0
#> 
#> =======================
#> Number of comparisons:  55 
#> Maximum value for average measures:  51,5 
#> Minimum value for average measures:  19 
#> Maximum value for difference in measures:  11 
#> Minimum value for difference in measures:  0 
#> 
#> Bias:  5,163636 
#> Standard deviation of bias:  2,061675 
#> 
#> Standard error of bias:  0,2779962 
#> Standard error for limits of agreement:  0,4779837 
#> 
#> Bias:  5,163636 
#> Bias- upper 95% CI:  5,720985 
#> Bias- lower 95% CI:  4,606287 
#> 
#> Upper limit of agreement:  9,20452 
#> Upper LOA- upper 95% CI:  10,16282 
#> Upper LOA- lower 95% CI:  8,24622 
#> 
#> Lower limit of agreement:  1,122753 
#> Lower LOA- upper 95% CI:  2,081052 
#> Lower LOA- lower 95% CI:  0,1644532 
#> 
#> =======================
#> Derived measures:  
#> Mean of differences/means:  16,58676 
#> Point estimate of bias as proportion of lowest average:  27,17703 
#> Point estimate of bias as proportion of highest average 10,02648 
#> Spread of data between lower and upper LoAs:  8,081767 
#> Bias as proportion of LoA spread:  63,89242 
#> 
#> =======================
#> Bias: 
#>  5,163636  ( 4,606287  to  5,720985 ) 
#> ULoA: 
#>  9,20452  ( 8,24622  to  10,16282 ) 
#> LLoA: 
#>  1,122753  ( 0,1644532  to  2,081052 )

Dodatkowo przeprowadzono analizę zgodności z wykorzystaniem metody Blanda–Altmana. Liczba par pomiarów wynosiła (n=55). Średnia różnica pomiędzy pomiarami wyniosła 5,16 (95% CI: 4,61–5,72), przy odchyleniu standardowym różnicy wynoszącym 2,06 oraz błędzie standardowym równym 0,28. Górna granica zgodności (Upper Limit of Agreement, ULoA) wyniosła 9,20 (95% CI: 8,25–10,16), a dolna granica zgodności (Lower Limit of Agreement, LLoA) 1,12 (95% CI: 1,16–2,08). Test t wykazał istotne statystycznie odchylenie średniej różnicy od zera (t = 18,57; p<0,001), co wskazuje na występowanie systematycznego odchylenia pomiędzy metodami pomiarowymi. Wyniki przedstawiono graficznie na wykresie Blanda–Altmana, na którym zaznaczono linię średniej różnicy oraz granice zgodności wraz z ich przedziałami ufności (ryc. 3). Analiza wskazuje, że pomiary uzyskane inklinometrem systematycznie różnią się od pomiarów fotogrametrycznych, przy zachowaniu względnie stałego rozrzutu różnic w całym zakresie.

CCC oraz analiza Blanda–Altmana wskazują, że różnice pomiędzy pomiarami uzyskanymi metodą fotogrametryczną i inklinometryczną mają charakter stały (addytywny), bez oznak heteroskedastyczności ani zależności liniowej lub nieliniowej pomiędzy metodami.

Model

W celu skorygowania systematycznych różnic pomiędzy metodami wykorzystano średnią różnicę uzyskaną w analizie Blanda–Altmana (5,16), którą zaokrąglono do dokładności pomiaru (5°) i dodano do wartości kątów uzyskanych inklinometrem. Po wprowadzeniu korekty współczynnik zgodności znacząco wzrósł (CCC=0,96; 95% CI: 0,93–0,98), co wskazuje na wysoką zgodność pomiędzy metodami(ryc. 4).

CCC po korekcie
CCC(df_model$zdjecie, df_model$inklinometr)$rho.c
#>         est    lwr.ci    upr.ci
#> 1 0,9589235 0,9306488 0,9758149

Analiza Blanda–Altmana po korekcji również potwierdziła poprawę zgodności. Średnia różnica pomiędzy pomiarami wyniosła 0,16 (95% CI: –0,39 do 0,72), przy odchyleniu standardowym średniej różnicy 2,06 i błędzie standardowym 0,28. Górna granica zgodności wyniosła 4,20 (95% CI: 3,25–5,16), a dolna granica zgodności –3,88 (95% CI: –4,84 do –2,92). Test t nie wykazał istotnego statystycznie odchylenia średniej różnicy od zera (t=0,59; p=0,56), co potwierdza brak systematycznego błędu pomiarowego po dokonaniu korekty(ryc. 5).

Analiza Blanda Altmana po korekcie
bland_altman_results_model = blandr.statistics(df_model$zdjecie, df_model$inklinometr)
bland_altman_results_model
#> Bland-Altman Statistics
#> =======================
#> t = 0,58863, df = 54, p-value = 0,5586
#> alternative hypothesis: true bias is not equal to 0
#> 
#> =======================
#> Number of comparisons:  55 
#> Maximum value for average measures:  54 
#> Minimum value for average measures:  21,5 
#> Maximum value for difference in measures:  6 
#> Minimum value for difference in measures:  -5 
#> 
#> Bias:  0,1636364 
#> Standard deviation of bias:  2,061675 
#> 
#> Standard error of bias:  0,2779962 
#> Standard error for limits of agreement:  0,4779837 
#> 
#> Bias:  0,1636364 
#> Bias- upper 95% CI:  0,7209853 
#> Bias- lower 95% CI:  -0,3937125 
#> 
#> Upper limit of agreement:  4,20452 
#> Upper LOA- upper 95% CI:  5,16282 
#> Upper LOA- lower 95% CI:  3,24622 
#> 
#> Lower limit of agreement:  -3,877247 
#> Lower LOA- upper 95% CI:  -2,918948 
#> Lower LOA- lower 95% CI:  -4,835547 
#> 
#> =======================
#> Derived measures:  
#> Mean of differences/means:  0,4438525 
#> Point estimate of bias as proportion of lowest average:  0,7610994 
#> Point estimate of bias as proportion of highest average 0,3030303 
#> Spread of data between lower and upper LoAs:  8,081767 
#> Bias as proportion of LoA spread:  2,02476 
#> 
#> =======================
#> Bias: 
#>  0,1636364  ( -0,3937125  to  0,7209853 ) 
#> ULoA: 
#>  4,20452  ( 3,24622  to  5,16282 ) 
#> LLoA: 
#>  -3,877247  ( -4,835547  to  -2,918948 )

Analiza zgodności wykazała, że pomiary inklinometru systematycznie różnią się od pomiarów fotogrametrycznych o około 5° (Fotogrametria ≈ Inklinometr + 5°); po uwzględnieniu tej korekty zgodność między metodami była wysoka (CCC=0,96), a analiza Blanda–Altmana nie wykazała istotnego systematycznego błędu pomiarowego. 

Korelacja między CVA a NDI

Rozkład wartości wskaźnika NDI miał charakter rozkładu z nadmiarem zer (zero inflated distribution) — ponad połowa wyników przyjmowała wartość 0 (mediana=0,0; IQR=0,0–14,0). Rozkład zmiennej przedstawiono na (ryc. 6).

Korelacja NDI~Inklinometr
cor.test(df$ndi_sum, df$inklinometr, method = "spearman")
#> 
#>  Spearman's rank correlation rho
#> 
#> data:  df$ndi_sum and df$inklinometr
#> S = 12111, p-value = 7,633e-06
#> alternative hypothesis: true rho is not equal to 0
#> sample estimates:
#>       rho 
#> 0,5630799

Analiza korelacji rang Spearmana wykazała umiarkowaną dodatnią zależność pomiędzy wartościami CVA a wynikiem NDI (ρ=0,56; p<0,001), co wskazuje, że większe wartości NDI wiązały się z mniejszym kątem CVA(ryc. 7).

Korelacja NDI~Fotogrametria
cor.test(df$ndi_sum, df$zdjecie, method = "spearman")
#> 
#>  Spearman's rank correlation rho
#> 
#> data:  df$ndi_sum and df$zdjecie
#> S = 14576, p-value = 0,000255
#> alternative hypothesis: true rho is not equal to 0
#> sample estimates:
#>       rho 
#> 0,4741827

Analiza korelacji rang Spearmana wykazała umiarkowaną dodatnią zależność pomiędzy wartościami CVA a wynikiem NDI (ρ=0,47; p<0,001), co wskazuje, że większe wartości NDI wiązały się z mniejszym kątem CVA(ryc. 8).

Siła korelacji pomiędzy wynikiem NDI a CVA była nieco wyższa w przypadku pomiarów uzyskanych inklinometrem (ρ=0,56) niż przy użyciu fotogrametrii (ρ=0,47). Obie zależności wskazują, że większy kąt CVA wiązał się z większym nasileniem niepełnosprawności wynikającej z dolegliwości bólowych odcinka szyjnego kręgosłupa.

Literatura

  1. R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2025. Available from: https://www.R-project.org
  2. Datta D. blandr: A Bland-Altman Method Comparison Package for R. Version 0.6.0. Zenodo; 2017. doi:10.5281/zenodo.824514. Available from: https://github.com/deepankardatta/blandr
  3. Revelle W. psych: Procedures for Psychological, Psychometric, and Personality Research. Version 2.5.6. Evanston, IL: Northwestern University; 2025. Available from: https://CRAN.R-project.org/package=psych
  4. Wickham H, Averick M, Bryan J, et al. Welcome to the tidyverse. J Open Source Softw. 2019;4(43):1686. doi:10.21105/joss.01686
  5. Iannone R, Cheng J, Schloerke B, et al. gt: Easily Create Presentation-Ready Display Tables. Version 1.1.0. 2025. doi:10.32614/CRAN.package.gt. Available from: https://CRAN.R-project.org/package=gt
  6. Wickham H, Averick M, Bryan J, et al. Welcome to the tidyverse. J Open Source Softw. 2019;4(43):1686. doi:10.21105/joss.01686
  7. Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet. 1986;1(8476):307-310.
  8. Lin LI. A concordance correlation coefficient to evaluate reproducibility. Biometrics. 1989;45(1):255-268.
  9. Kopp-Schneider A, Hielscher T. How to evaluate agreement between quantitative measurements. Radiother Oncol. 2019;141:321-326. doi:10.1016/j.radonc.2019.09.004
  10. Judd CM, McClelland GH, Ryan CS. Data Analysis: A Model Comparison approach To Regression, ANOVA, and Beyond, Third Edition. Routledge; 2017:316-328.
  11. Habibzadeh F. Data Distribution: Normal or Abnormal? J Korean Med Sci. 2024;39(3):e35. doi:10.3346/jkms.2024.39.e35
  12. Hickey GL, Kontopantelis E, Takkenberg JJM, Beyersdorf F. Statistical primer: checking model assumptions with regression diagnostics. Interact Cardiovasc Thorac Surg. 2019;28(1):1-8. doi:10.1093/icvts/ivy207
  13. Wadoux AMJC, Minasny B. Some limitations of the concordance correlation coefficient to characterise model accuracy. Ecological Informatics. 2024;83:102820. doi:10.1016/j.ecoinf.2024.102820