CVA - Kąt protrakcji głowy (ang. Craniovertebral angle)

NDI - Wskaźnik niepełnosprawności spowodowanej dolegliwościami bólowymi części szyjnej kręgosłupa (ang. Neck disability index)

CCC - Współczynnik zgodności Lin’a (ang. Lin’s Concordance Correlation Coefficient)

CI - Przedział ufności (ang. Confidence interval)

IQR - Rozstęp międzykwartylowy (ang. Interquartile range)

Materiał i metoda

Metoda

Wszystkie analizy statystyczne przeprowadzono w języku programowania R (wersja 4.5.2)[1], z wykorzystaniem następujących pakietów: blandr[2] (analiza zgodności metod pomiarowych zgodnie z procedurą Blanda i Altmana), DescTools[3] (obliczenie współczynnika zgodności Lin’a (CCC)), flexplot[4,5] (graficzna weryfikacja założeń modeli) oraz tidyverse[6] (manipulacja danymi i przygotowanie finalnych wizualizacji). Do oceny zgodności pomiarów uzyskanych metodą fotogrametrii i inklinometrii zastosowano metodę Blanda–Altmana oraz współczynnik CCC[7-9]. Korelację pomiędzy kątem CVA zmierzonym inklinometrem, a wynikiem NDI, oraz pomiędzy kątem CVA zmierzonym metodą fotogrametryczną a NDI, obliczono przy użyciu korelacji rang Spearmana. Obserwacje odstające identyfikowano metodami graficznymi oraz przy użyciu wskaźników statystycznych, takich jak odległość Cooka, wartości dźwigni (leverage, h) oraz reszty studentyzowane[10]. W przypadku gdy obserwacje odstające nie wynikały z błędów w kodowaniu i nie mogły zostać poprawione, wykonano analizy z ich uwzględnieniem oraz po ich usunięciu. Jeśli wyniki obu analiz różniły się istotnie, zaprezentowano obie wersje. Normalność rozkładu reszt zweryfikowano przy użyciu histogramu, wykresu Q–Q oraz testu Shapiro–Wilka[11]. Homoskedastyczność sprawdzono za pomocą wykresu lokalizacji i rozproszenia oraz testu Breuscha–Pagana[12]. Założenie liniowości oceniono na podstawie naniesionej na wykres linii LOESS oraz analizy wykresu reszt po dopasowaniu modelu[12]. W przypadku niespełnienia któregokolwiek z założeń zastosowano odpowiednie testy nieparametryczne. Jako poziom istotności statystycznej przyjęto p≤0,05, a wszystkie wykonane testy były obustronne.

Wyniki

Statystyki opisowe

Analiza charakterystki grupy wykazała, że kobiety i mężczyźni byli jednorodni pod względem wieku (W=295; p=0,21), natomiast różnili się pod względem wzrostu (t=-3,40; p=0,002), wagi (t=-9,55; p<0,001) oraz BMI (t=-5,37 p<0,001) (tab. 1).

Tabela 1. Statystyki opisowe — wiek, wzrost, waga, BMI.
	N	X̄	Me	Min	Max	Q1	Q3	SD
Wiek (lata); W=295; p=0,21
Wszyscy	55	21,31	22,00	19,0	24,0	20,00	22,00	1,62
Kobiety	32	21,06	21,00	19,0	24,0	20,00	22,00	1,61
Mężczyźni	23	21,65	22,00	19,0	24,0	20,50	22,50	1,61
Wzrost (cm); t=-3,40; p=0,002
Wszyscy	55	169,22	169,00	156,0	188,0	165,00	174,00	6,34
Kobiety	32	166,91	167,00	156,0	178,0	163,00	170,00	5,24
Mężczyźni	23	172,43	174,00	159,0	188,0	169,00	176,00	6,42
Waga (kg); t=-9,55; p<0,001
Wszyscy	55	65,95	65,00	47,0	94,0	59,00	72,50	10,07
Kobiety	32	59,22	60,00	47,0	71,0	54,75	64,00	6,19
Mężczyźni	23	75,30	73,00	65,0	94,0	71,50	78,50	6,14
BMI (kg/m²); t=-5,37; p<0,001
Wszyscy	55	23,05	22,20	15,5	31,0	20,75	25,45	3,43
Kobiety	32	21,33	21,35	15,5	26,7	19,55	22,50	2,73
Mężczyźni	23	25,43	25,40	21,5	31,0	23,10	27,50	2,84
N - liczba obserwacji; X̄ - średnia; Me - mediana; Min - wartość minimalna; Max - wartość maksymalna; Q1 – dolny kwartyl; Q3 – górny kwartyl; SD – odchylenie standardowe

W badanej grupie (n=55) dominowały osoby z wykształceniem średnim ogólnokształcącym (80,0%). Wykształcenie wyższe posiadało 9,1% uczestników, natomiast średnie techniczne 10,9%. Nie odnotowano osób z wykształceniem zasadniczym zawodowym. W grupie kobiet (n=32) większość również posiadała wykształcenie średnie ogólnokształcące (75,0%), 9,4% miało wykształcenie wyższe, a 15,6% średnie techniczne. Wśród mężczyzn (n=23) najczęściej występowało wykształcenie średnie ogólnokształcące (87,0%), 8,7% miało wykształcenie wyższe, a 4,3% średnie techniczne. W obu podgrupach nie odnotowano osób z wykształceniem zasadniczym zawodowym (tab. 2).

Tabela 2. Statystyki opisowe — rozkład wykształcenia.
	Wszyscy (N = 55)	Płeć
	Wszyscy (N = 55)	Kobiety (n = 32)	Mężczyźni (n = 23)
Wyższe	5 ( 9,1%)	3 ( 9,4%)	2 ( 8,7%)
Średnie ogólnokształcące	44 (80,0%)	24 (75,0%)	20 (87,0%)
Średnie techniczne	6 (10,9%)	5 (15,6%)	1 ( 4,3%)
Zasadnicze zawodowe	0 ( 0,0%)	0 ( 0,0%)	0 ( 0,0%)

Największą grupę w badanej próbie stanowiły osoby niepracujące (33 osoby). Spośród osób zatrudnionych najczęściej wskazywano zawody związane z obsługą klienta lub usługami – w tym kelner (8 osób) oraz kasjer (3 osoby). Pozostałe zawody występowały pojedynczo i obejmowały m.in. trenera personalnego, barmana, kuriera, masażystkę, pomoc kuchenną, rozdawanie ulotek, sekretarkę, sprzedawcę oraz kierowcę Ubera (ryc. 1).

Kąt protrakcji głowy

Tabela 3. Porównanie wyników CVA mierzonego dwiema metodami(inklinometr, fotogrametra)
	N	X̄	Me	Min	Max	Q1	Q3	SD
Inklinometr (°)
Wszyscy	55	29,95	30,0	17	49	24,00	35	7,20
Kobiety	32	29,41	29,5	17	48	24,00	34	7,09
Mężczyźni	23	30,70	31,0	19	49	25,00	36	7,44
Fotogrametria (°)
Wszyscy	55	35,11	34,0	21	54	30,00	41	7,23
Kobiety	32	34,50	34,0	21	53	29,75	41	7,51
Mężczyźni	23	35,96	36,0	25	54	31,00	40	6,89
N - liczba obserwacji; X̄ - średnia; Me - mediana; Min - wartość minimalna; Max - wartość maksymalna; Q1 – dolny kwartyl; Q3 – górny kwartyl; SD – odchylenie standardowe

Zgodność inklinometru ze zdjęciem

CCC

CCC(df$zdjecie, df$inklinometr)$rho.c
#>         est    lwr.ci    upr.ci
#> 1 0,7607444 0,6697612 0,8292248

Zgodność pomiarów uzyskanych za pomocą inklinometru i metody fotograficznej oceniono przy użyciu współczynnika zgodności CCC. Analiza przeprowadzona dla wszystkich obserwacji (n=55) wykazała zgodność pomiarów na poziomie (CCC=0,76; 95% CI: 0,67–0,83). Wartość ta wskazuje na umiarkowaną zgodność, jednak należy podkreślić, że brak jest powszechnie przyjętych kryteriów interpretacji współczynnika CCC[13]. Na (ryc. 2) przedstawiono zależność pomiędzy wartościami uzyskanymi obiema metodami pomiaru.

Analiza Blanda Altmana

bland_altman_results = blandr.statistics(df$zdjecie, df$inklinometr)
bland_altman_results
#> Bland-Altman Statistics
#> =======================
#> t = 18,574, df = 54, p-value = < 2,2e-16
#> alternative hypothesis: true bias is not equal to 0
#> 
#> =======================
#> Number of comparisons:  55 
#> Maximum value for average measures:  51,5 
#> Minimum value for average measures:  19 
#> Maximum value for difference in measures:  11 
#> Minimum value for difference in measures:  0 
#> 
#> Bias:  5,163636 
#> Standard deviation of bias:  2,061675 
#> 
#> Standard error of bias:  0,2779962 
#> Standard error for limits of agreement:  0,4779837 
#> 
#> Bias:  5,163636 
#> Bias- upper 95% CI:  5,720985 
#> Bias- lower 95% CI:  4,606287 
#> 
#> Upper limit of agreement:  9,20452 
#> Upper LOA- upper 95% CI:  10,16282 
#> Upper LOA- lower 95% CI:  8,24622 
#> 
#> Lower limit of agreement:  1,122753 
#> Lower LOA- upper 95% CI:  2,081052 
#> Lower LOA- lower 95% CI:  0,1644532 
#> 
#> =======================
#> Derived measures:  
#> Mean of differences/means:  16,58676 
#> Point estimate of bias as proportion of lowest average:  27,17703 
#> Point estimate of bias as proportion of highest average 10,02648 
#> Spread of data between lower and upper LoAs:  8,081767 
#> Bias as proportion of LoA spread:  63,89242 
#> 
#> =======================
#> Bias: 
#>  5,163636  ( 4,606287  to  5,720985 ) 
#> ULoA: 
#>  9,20452  ( 8,24622  to  10,16282 ) 
#> LLoA: 
#>  1,122753  ( 0,1644532  to  2,081052 )

Dodatkowo przeprowadzono analizę zgodności z wykorzystaniem metody Blanda–Altmana. Liczba par pomiarów wynosiła (n=55). Średnia różnica pomiędzy pomiarami wyniosła 5,16 (95% CI: 4,61–5,72), przy odchyleniu standardowym różnicy wynoszącym 2,06 oraz błędzie standardowym równym 0,28. Górna granica zgodności (Upper Limit of Agreement, ULoA) wyniosła 9,20 (95% CI: 8,25–10,16), a dolna granica zgodności (Lower Limit of Agreement, LLoA) 1,12 (95% CI: 1,16–2,08). Test t wykazał istotne statystycznie odchylenie średniej różnicy od zera (t = 18,57; p<0,001), co wskazuje na występowanie systematycznego odchylenia pomiędzy metodami pomiarowymi. Wyniki przedstawiono graficznie na wykresie Blanda–Altmana, na którym zaznaczono linię średniej różnicy oraz granice zgodności wraz z ich przedziałami ufności (ryc. 3). Analiza wskazuje, że pomiary uzyskane inklinometrem systematycznie różnią się od pomiarów fotogrametrycznych, przy zachowaniu względnie stałego rozrzutu różnic w całym zakresie.

CCC oraz analiza Blanda–Altmana wskazują, że różnice pomiędzy pomiarami uzyskanymi metodą fotogrametryczną i inklinometryczną mają charakter stały (addytywny), bez oznak heteroskedastyczności ani zależności liniowej lub nieliniowej pomiędzy metodami.

Model

W celu skorygowania systematycznych różnic pomiędzy metodami wykorzystano średnią różnicę uzyskaną w analizie Blanda–Altmana (5,16), którą zaokrąglono do dokładności pomiaru (5°) i dodano do wartości kątów uzyskanych inklinometrem. Po wprowadzeniu korekty współczynnik zgodności znacząco wzrósł (CCC=0,96; 95% CI: 0,93–0,98), co wskazuje na wysoką zgodność pomiędzy metodami(ryc. 4).

CCC po korekcie

CCC(df_model$zdjecie, df_model$inklinometr)$rho.c
#>         est    lwr.ci    upr.ci
#> 1 0,9589235 0,9306488 0,9758149

Analiza Blanda–Altmana po korekcji również potwierdziła poprawę zgodności. Średnia różnica pomiędzy pomiarami wyniosła 0,16 (95% CI: –0,39 do 0,72), przy odchyleniu standardowym średniej różnicy 2,06 i błędzie standardowym 0,28. Górna granica zgodności wyniosła 4,20 (95% CI: 3,25–5,16), a dolna granica zgodności –3,88 (95% CI: –4,84 do –2,92). Test t nie wykazał istotnego statystycznie odchylenia średniej różnicy od zera (t=0,59; p=0,56), co potwierdza brak systematycznego błędu pomiarowego po dokonaniu korekty(ryc. 5).

Analiza Blanda Altmana po korekcie

bland_altman_results_model = blandr.statistics(df_model$zdjecie, df_model$inklinometr)
bland_altman_results_model
#> Bland-Altman Statistics
#> =======================
#> t = 0,58863, df = 54, p-value = 0,5586
#> alternative hypothesis: true bias is not equal to 0
#> 
#> =======================
#> Number of comparisons:  55 
#> Maximum value for average measures:  54 
#> Minimum value for average measures:  21,5 
#> Maximum value for difference in measures:  6 
#> Minimum value for difference in measures:  -5 
#> 
#> Bias:  0,1636364 
#> Standard deviation of bias:  2,061675 
#> 
#> Standard error of bias:  0,2779962 
#> Standard error for limits of agreement:  0,4779837 
#> 
#> Bias:  0,1636364 
#> Bias- upper 95% CI:  0,7209853 
#> Bias- lower 95% CI:  -0,3937125 
#> 
#> Upper limit of agreement:  4,20452 
#> Upper LOA- upper 95% CI:  5,16282 
#> Upper LOA- lower 95% CI:  3,24622 
#> 
#> Lower limit of agreement:  -3,877247 
#> Lower LOA- upper 95% CI:  -2,918948 
#> Lower LOA- lower 95% CI:  -4,835547 
#> 
#> =======================
#> Derived measures:  
#> Mean of differences/means:  0,4438525 
#> Point estimate of bias as proportion of lowest average:  0,7610994 
#> Point estimate of bias as proportion of highest average 0,3030303 
#> Spread of data between lower and upper LoAs:  8,081767 
#> Bias as proportion of LoA spread:  2,02476 
#> 
#> =======================
#> Bias: 
#>  0,1636364  ( -0,3937125  to  0,7209853 ) 
#> ULoA: 
#>  4,20452  ( 3,24622  to  5,16282 ) 
#> LLoA: 
#>  -3,877247  ( -4,835547  to  -2,918948 )

Analiza zgodności wykazała, że pomiary inklinometru systematycznie różnią się od pomiarów fotogrametrycznych o około 5° (Fotogrametria ≈ Inklinometr + 5°); po uwzględnieniu tej korekty zgodność między metodami była wysoka (CCC=0,96), a analiza Blanda–Altmana nie wykazała istotnego systematycznego błędu pomiarowego.

Korelacja między CVA a NDI

Rozkład wartości wskaźnika NDI miał charakter rozkładu z nadmiarem zer (zero inflated distribution) — ponad połowa wyników przyjmowała wartość 0 (mediana=0,0; IQR=0,0–14,0). Rozkład zmiennej przedstawiono na (ryc. 6).

Korelacja NDI~Inklinometr

cor.test(df$ndi_sum, df$inklinometr, method = "spearman")
#> 
#>  Spearman's rank correlation rho
#> 
#> data:  df$ndi_sum and df$inklinometr
#> S = 12111, p-value = 7,633e-06
#> alternative hypothesis: true rho is not equal to 0
#> sample estimates:
#>       rho 
#> 0,5630799

Analiza korelacji rang Spearmana wykazała umiarkowaną dodatnią zależność pomiędzy wartościami CVA a wynikiem NDI (ρ=0,56; p<0,001), co wskazuje, że większe wartości NDI wiązały się z mniejszym kątem CVA(ryc. 7).

Korelacja NDI~Fotogrametria

cor.test(df$ndi_sum, df$zdjecie, method = "spearman")
#> 
#>  Spearman's rank correlation rho
#> 
#> data:  df$ndi_sum and df$zdjecie
#> S = 14576, p-value = 0,000255
#> alternative hypothesis: true rho is not equal to 0
#> sample estimates:
#>       rho 
#> 0,4741827

Analiza korelacji rang Spearmana wykazała umiarkowaną dodatnią zależność pomiędzy wartościami CVA a wynikiem NDI (ρ=0,47; p<0,001), co wskazuje, że większe wartości NDI wiązały się z mniejszym kątem CVA(ryc. 8).

Siła korelacji pomiędzy wynikiem NDI a CVA była nieco wyższa w przypadku pomiarów uzyskanych inklinometrem (ρ=0,56) niż przy użyciu fotogrametrii (ρ=0,47). Obie zależności wskazują, że większy kąt CVA wiązał się z większym nasileniem niepełnosprawności wynikającej z dolegliwości bólowych odcinka szyjnego kręgosłupa.

Literatura

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2025. Available from: https://www.R-project.org
Datta D. blandr: A Bland-Altman Method Comparison Package for R. Version 0.6.0. Zenodo; 2017. doi:10.5281/zenodo.824514. Available from: https://github.com/deepankardatta/blandr
Revelle W. psych: Procedures for Psychological, Psychometric, and Personality Research. Version 2.5.6. Evanston, IL: Northwestern University; 2025. Available from: https://CRAN.R-project.org/package=psych
Wickham H, Averick M, Bryan J, et al. Welcome to the tidyverse. J Open Source Softw. 2019;4(43):1686. doi:10.21105/joss.01686
Iannone R, Cheng J, Schloerke B, et al. gt: Easily Create Presentation-Ready Display Tables. Version 1.1.0. 2025. doi:10.32614/CRAN.package.gt. Available from: https://CRAN.R-project.org/package=gt
Wickham H, Averick M, Bryan J, et al. Welcome to the tidyverse. J Open Source Softw. 2019;4(43):1686. doi:10.21105/joss.01686
Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet. 1986;1(8476):307-310.
Lin LI. A concordance correlation coefficient to evaluate reproducibility. Biometrics. 1989;45(1):255-268.
Kopp-Schneider A, Hielscher T. How to evaluate agreement between quantitative measurements. Radiother Oncol. 2019;141:321-326. doi:10.1016/j.radonc.2019.09.004
Judd CM, McClelland GH, Ryan CS. Data Analysis: A Model Comparison approach To Regression, ANOVA, and Beyond, Third Edition. Routledge; 2017:316-328.
Habibzadeh F. Data Distribution: Normal or Abnormal? J Korean Med Sci. 2024;39(3):e35. doi:10.3346/jkms.2024.39.e35
Hickey GL, Kontopantelis E, Takkenberg JJM, Beyersdorf F. Statistical primer: checking model assumptions with regression diagnostics. Interact Cardiovasc Thorac Surg. 2019;28(1):1-8. doi:10.1093/icvts/ivy207
Wadoux AMJC, Minasny B. Some limitations of the concordance correlation coefficient to characterise model accuracy. Ecological Informatics. 2024;83:102820. doi:10.1016/j.ecoinf.2024.102820