• My

Walidacja modelu eksploracji danych w porównaniu z tradycyjnymi metodami szacowania wieku zębów wśród koreańskiej młodzieży i młodych dorosłych

Dziękujemy za odwiedzenie Nature.com.Wersja przeglądarki, której używasz, obsługuje ograniczoną obsługę CSS.Aby uzyskać najlepsze rezultaty, zalecamy użycie nowszej wersji przeglądarki (lub wyłączenie trybu zgodności w przeglądarce Internet Explorer).W międzyczasie, aby zapewnić ciągłe wsparcie, wyświetlamy witrynę bez stylizacji i JavaScript.
Zęby są uważane za najdokładniejszy wskaźnik wieku organizmu człowieka i często wykorzystywane są w kryminalistycznej ocenie wieku.Naszym celem było zweryfikowanie szacunków dotyczących wieku zębów w oparciu o eksplorację danych, porównując dokładność szacunków i skuteczność klasyfikacji progu 18 lat z tradycyjnymi metodami i szacunkami wieku opartymi na eksploracji danych.W sumie zebrano 2657 panoramicznych zdjęć rentgenowskich od obywateli Korei i Japonii w wieku od 15 do 23 lat.Podzielono je na zestaw treningowy zawierający 900 radiogramów koreańskich oraz zestaw testowy wewnętrzny zawierający 857 radiogramów japońskich.Porównaliśmy dokładność i efektywność klasyfikacji metod tradycyjnych z zestawami testowymi modeli eksploracji danych.Dokładność tradycyjnej metody na wewnętrznym zestawie testowym jest nieco wyższa niż w przypadku modelu eksploracji danych, a różnica jest niewielka (średni błąd bezwzględny <0,21 roku, błąd średniokwadratowy <0,24 roku).Skuteczność klasyfikacji dla 18-letniego okresu granicznego jest również podobna w przypadku tradycyjnych metod i modeli eksploracji danych.Zatem tradycyjne metody można zastąpić modelami eksploracji danych podczas przeprowadzania kryminalistycznej oceny wieku na podstawie dojrzałości drugich i trzecich zębów trzonowych u koreańskiej młodzieży i młodych dorosłych.
Ocena wieku zębów jest szeroko stosowana w medycynie sądowej i stomatologii dziecięcej.W szczególności, ze względu na wysoką korelację pomiędzy wiekiem chronologicznym a rozwojem uzębienia, ocena wieku według etapów rozwoju uzębienia jest ważnym kryterium oceny wieku dzieci i młodzieży1,2,3.Jednak w przypadku młodych ludzi szacowanie wieku zębowego na podstawie dojrzałości zębów ma swoje ograniczenia, ponieważ wzrost zębów jest prawie całkowity, z wyjątkiem trzecich zębów trzonowych.Celem prawnym ustalania wieku młodych ludzi i nastolatków jest dostarczenie dokładnych szacunków i dowodów naukowych potwierdzających, czy osiągnęli oni pełnoletność.W praktyce medyczno-prawnej młodzieży i młodych dorosłych w Korei wiek szacowano metodą Lee, a na podstawie danych Oh i wsp. przewidywano próg prawny wynoszący 18 lat.
Uczenie maszynowe to rodzaj sztucznej inteligencji (AI), która wielokrotnie uczy się i klasyfikuje duże ilości danych, samodzielnie rozwiązuje problemy i steruje programowaniem danych.Uczenie maszynowe może odkrywać przydatne ukryte wzorce w dużych ilościach danych6.Natomiast metody klasyczne, pracochłonne i czasochłonne, mogą mieć ograniczenia w przypadku dużych ilości złożonych danych, które trudno przetworzyć ręcznie7.Dlatego w ostatnim czasie przeprowadzono wiele badań z wykorzystaniem najnowocześniejszych technologii komputerowych, aby zminimalizować błędy ludzkie i efektywnie przetwarzać dane wielowymiarowe8,9,10,11,12.W szczególności głębokie uczenie się jest szeroko stosowane w analizie obrazów medycznych i donoszono, że różne metody szacowania wieku poprzez automatyczną analizę zdjęć rentgenowskich poprawiają dokładność i skuteczność szacowania wieku13,14,15,16,17,18,19,20 .Na przykład Halabi i wsp. 13 opracowali algorytm uczenia maszynowego oparty na splotowych sieciach neuronowych (CNN) w celu oszacowania wieku szkieletu na podstawie radiogramów dłoni dzieci.W tym badaniu zaproponowano model, który stosuje uczenie maszynowe do obrazów medycznych i pokazano, że metody te mogą poprawić dokładność diagnostyczną.Li i wsp.14 oszacowali wiek na podstawie zdjęć rentgenowskich miednicy przy użyciu głębokiego uczenia CNN i porównali je z wynikami regresji przy użyciu oceny etapu kostnienia.Odkryli, że model głębokiego uczenia się CNN wykazał taką samą skuteczność szacowania wieku, jak tradycyjny model regresji.Badanie Guo i wsp. [15] oceniło skuteczność klasyfikacji tolerancji wiekowej technologii CNN w oparciu o ortofotomapy zębów, a wyniki modelu CNN wykazały, że ludzie osiągali lepsze wyniki w zakresie klasyfikacji wieku.
Większość badań dotyczących szacowania wieku przy użyciu uczenia maszynowego wykorzystuje metody głębokiego uczenia się13,14,15,16,17,18,19,20.Szacuje się, że szacowanie wieku w oparciu o głębokie uczenie się jest dokładniejsze niż metody tradycyjne.Podejście to daje jednak niewielkie możliwości przedstawienia podstaw naukowych do szacunków wieku, takich jak wskaźniki wieku stosowane w szacunkach.Istnieje również spór prawny dotyczący tego, kto przeprowadza kontrole.Dlatego też szacowanie wieku w oparciu o głębokie uczenie się jest trudne do zaakceptowania przez władze administracyjne i sądowe.Eksploracja danych (DM) to technika umożliwiająca odkrycie nie tylko oczekiwanych, ale także nieoczekiwanych informacji, co stanowi metodę odkrywania przydatnych korelacji między dużymi ilościami danych6,21,22.Uczenie maszynowe jest często wykorzystywane w eksploracji danych, a zarówno eksploracja danych, jak i uczenie maszynowe wykorzystują te same kluczowe algorytmy do odkrywania wzorców w danych.Oszacowanie wieku na podstawie rozwoju zębów opiera się na ocenie dojrzałości zębów docelowych dokonanej przez lekarza, a ocena ta wyraża się jako etap rozwoju każdego zęba docelowego.DM można wykorzystać do analizy korelacji pomiędzy etapem oceny stanu uzębienia a rzeczywistym wiekiem i może zastąpić tradycyjną analizę statystyczną.Dlatego też, jeśli zastosujemy techniki DM do szacowania wieku, możemy wdrożyć uczenie maszynowe w kryminalistycznym szacowaniu wieku, nie martwiąc się o odpowiedzialność prawną.Opublikowano kilka badań porównawczych na temat możliwych alternatyw dla tradycyjnych metod manualnych stosowanych w praktyce sądowej i metod określania wieku zębów opartych na EBM.Shen i wsp.23 wykazali, że model DM jest dokładniejszy niż tradycyjna formuła Camerera.Galibourg i wsp.24 zastosowali różne metody DM do przewidywania wieku według kryterium Demirdjiana25, a wyniki pokazały, że metoda DM przewyższa metody Demirdjiana i Willemsa w szacowaniu wieku populacji francuskiej.
Do oszacowania wieku zębowego koreańskiej młodzieży i młodych dorosłych w koreańskiej praktyce sądowej powszechnie stosuje się metodę 4 Lee.Metoda ta wykorzystuje tradycyjną analizę statystyczną (taką jak regresja wielokrotna) w celu zbadania związku między koreańskimi uczestnikami a wiekiem chronologicznym.W niniejszym badaniu metody szacowania wieku uzyskane przy użyciu tradycyjnych metod statystycznych określa się jako „metody tradycyjne”.Metoda Lee jest metodą tradycyjną, a jej dokładność została potwierdzona przez Oh i wsp.5;jednakże możliwość zastosowania szacowania wieku na podstawie modelu DM w koreańskiej praktyce kryminalistycznej jest nadal wątpliwa.Naszym celem była naukowa walidacja potencjalnej przydatności szacowania wieku w oparciu o model DM.Celem tego badania było (1) porównanie dokładności dwóch modeli DM w szacowaniu wieku zębowego oraz (2) porównanie skuteczności klasyfikacji 7 modeli DM w wieku 18 lat z wynikami uzyskanymi tradycyjnymi metodami statystycznymi. i trzecie zęby trzonowe w obu szczękach.
Średnie i odchylenia standardowe wieku chronologicznego według etapu i rodzaju zęba pokazano online w tabeli dodatkowej S1 (zestaw treningowy), tabeli dodatkowej S2 (zestaw testów wewnętrznych) i tabeli dodatkowej S3 (zestaw testów zewnętrznych).Wartości kappa dla rzetelności wewnątrz- i międzyobserwatorskiej uzyskane ze zbioru uczącego wyniosły odpowiednio 0,951 i 0,947.Wartości P i 95% przedziały ufności dla wartości kappa pokazano w dodatkowej tabeli online S4.Wartość kappa zinterpretowano jako „prawie idealną”, zgodną z kryteriami Landisa i Kocha26.
Porównując średni błąd bezwzględny (MAE), tradycyjna metoda nieznacznie przewyższa model DM dla wszystkich płci oraz w zewnętrznym zestawie testów męskich, z wyjątkiem perceptronu wielowarstwowego (MLP).Różnica pomiędzy modelem tradycyjnym a modelem DM na wewnętrznym zestawie testów MAE wynosiła 0,12–0,19 roku dla mężczyzn i 0,17–0,21 lat dla kobiet.W przypadku baterii testu zewnętrznego różnice są mniejsze (0,001–0,05 roku dla mężczyzn i 0,05–0,09 lat dla kobiet).Dodatkowo pierwiastek błędu średniokwadratowego (RMSE) jest nieco niższy niż w metodzie tradycyjnej, z mniejszymi różnicami (0,17–0,24, 0,2–0,24 dla męskiego zestawu testów wewnętrznych i 0,03–0,07, 0,04–0,08 dla zewnętrznego zestawu testów).).MLP wykazuje nieco lepszą wydajność niż perceptron jednowarstwowy (SLP), z wyjątkiem przypadku żeńskiego zewnętrznego zestawu testowego.W przypadku MAE i RMSE zestaw testów zewnętrznych uzyskuje wyższe wyniki niż zestaw testów wewnętrznych dla wszystkich płci i modeli.Wszystkie MAE i RMSE przedstawiono w Tabeli 1 i na Rycinie 1.
MAE i RMSE modeli regresji tradycyjnej i data mining.Średni błąd bezwzględny MAE, pierwiastek błędu średniokwadratowego RMSE, perceptron jednowarstwowy SLP, perceptron wielowarstwowy MLP, tradycyjna metoda CM.
Skuteczność klasyfikacji (z punktem odcięcia wynoszącym 18 lat) modelu tradycyjnego i DM wykazano pod względem czułości, swoistości, dodatniej wartości predykcyjnej (PPV), ujemnej wartości predykcyjnej (NPV) i pola pod krzywą charakterystyki działania odbiornika (AUROC). 27 (tabela 2, rysunek 2 i rysunek uzupełniający 1 w Internecie).Pod względem czułości wewnętrznego zestawu testów metody tradycyjne wypadły najlepiej u mężczyzn, a gorzej u kobiet.Jednakże różnica w skuteczności klasyfikacji pomiędzy metodami tradycyjnymi i SD wynosi 9,7% dla mężczyzn (MLP) i tylko 2,4% dla kobiet (XGBoost).Wśród modeli DM regresja logistyczna (LR) wykazała większą czułość u obu płci.Jeśli chodzi o specyfikę wewnętrznego zestawu testów, zaobserwowano, że cztery modele SD wypadły dobrze w przypadku mężczyzn, podczas gdy model tradycyjny radził sobie lepiej w przypadku kobiet.Różnice w skuteczności klasyfikacji dla mężczyzn i kobiet wynoszą odpowiednio 13,3% (MLP) i 13,1% (MLP), co wskazuje, że różnica w skuteczności klasyfikacji pomiędzy modelami przekracza czułość.Spośród modeli DM, modele maszyny wektorów nośnych (SVM), drzewa decyzyjnego (DT) i lasu losowego (RF) wypadły najlepiej wśród mężczyzn, podczas gdy model LR uzyskał najlepsze wyniki wśród kobiet.AUROC modelu tradycyjnego i wszystkich modeli SD był większy niż 0,925 (k-najbliższego sąsiada (KNN) u mężczyzn), co świadczy o doskonałej skuteczności klasyfikacji w wyodrębnionych próbkach 18-letnich28.W przypadku zestawu testów zewnętrznych nastąpił spadek wydajności klasyfikacji pod względem czułości, swoistości i AUROC w porównaniu z zestawem testów wewnętrznych.Co więcej, różnica w czułości i swoistości pomiędzy skutecznością klasyfikacji najlepszych i najgorszych modeli wahała się od 10% do 25% i była większa niż różnica w zbiorze testów wewnętrznych.
Czułość i swoistość modeli klasyfikacji eksploracji danych w porównaniu z metodami tradycyjnymi z okresem odcięcia wynoszącym 18 lat.KNN k najbliższego sąsiada, maszyna wektorów nośnych SVM, regresja logistyczna LR, drzewo decyzyjne DT, las losowy RF, XGB XGBoost, perceptron wielowarstwowy MLP, tradycyjna metoda CM.
Pierwszym krokiem w tym badaniu było porównanie dokładności szacunków wieku zębowego uzyskanych na podstawie siedmiu modeli DM z tymi uzyskanymi za pomocą tradycyjnej regresji.MAE i RMSE oceniano w wewnętrznych zestawach testowych dla obu płci, a różnica między metodą tradycyjną a modelem DM wahała się od 44 do 77 dni w przypadku MAE i od 62 do 88 dni w przypadku RMSE.Chociaż tradycyjna metoda była w tym badaniu nieco dokładniejsza, trudno stwierdzić, czy tak niewielka różnica ma znaczenie kliniczne i praktyczne.Wyniki te wskazują, że dokładność szacowania wieku zębowego za pomocą modelu DM jest prawie taka sama jak w przypadku metody tradycyjnej.Bezpośrednie porównanie z wynikami poprzednich badań jest trudne, ponieważ w żadnym badaniu nie porównano dokładności modeli DM z tradycyjnymi metodami statystycznymi, w których zastosowano tę samą technikę rejestracji zębów w tym samym przedziale wiekowym, co w tym badaniu.Galibourg i wsp.24 porównali MAE i RMSE pomiędzy dwiema tradycyjnymi metodami (metoda Demirjiana25 i metoda Willemsa29) a 10 modelami DM w populacji francuskiej w wieku od 2 do 24 lat.Poinformowali, że wszystkie modele DM były dokładniejsze niż metody tradycyjne, z różnicami wynoszącymi 0,20 i 0,38 roku w MAE oraz 0,25 i 0,47 roku w RMSE w porównaniu odpowiednio z metodami Willemsa i Demirdjiana.Rozbieżność pomiędzy modelem SD a metodami tradycyjnymi wykazana w badaniu Halibourg uwzględnia liczne doniesienia30,31,32,33 mówiące, że metoda Demirdjiana nie pozwala dokładnie oszacować wieku zębowego w populacjach innych niż francuscy Kanadyjczycy, na których przeprowadzono badanie.W tym badaniu.Tai i wsp. 34 wykorzystali algorytm MLP do przewidywania wieku zębów na podstawie 1636 chińskich zdjęć ortodontycznych i porównali jego dokładność z wynikami metody Demirjiana i Willemsa.Poinformowali, że MLP ma większą dokładność niż metody tradycyjne.Różnica pomiędzy metodą Demirdjiana a metodą tradycyjną wynosi <0,32 roku, a metodą Willemsa – 0,28 roku, co jest zbliżone do wyników niniejszego badania.Wyniki poprzednich badań24,34 są również spójne z wynikami niniejszego badania, a dokładność szacowania wieku modelu DM i metody tradycyjnej jest podobna.Jednak na podstawie zaprezentowanych wyników można jedynie ostrożnie stwierdzić, że wykorzystanie modeli DM do szacowania wieku może zastąpić dotychczasowe metody ze względu na brak wcześniejszych badań porównawczych i referencyjnych.Aby potwierdzić wyniki uzyskane w tym badaniu, potrzebne są dalsze badania z wykorzystaniem większych próbek.
Wśród badań sprawdzających dokładność SD w szacowaniu wieku zębowego, niektóre wykazały większą dokładność niż nasze badanie.Stepanovsky i wsp. 35 zastosowali 22 modele SD do panoramicznych zdjęć rentgenowskich 976 mieszkańców Czech w wieku od 2,7 do 20,5 lat i przetestowali dokładność każdego modelu.Ocenili rozwój łącznie 16 lewych górnych i dolnych zębów stałych, stosując kryteria klasyfikacji zaproponowane przez Moorreesa i wsp. 36.MAE mieści się w zakresie od 0,64 do 0,94 roku, a RMSE w zakresie od 0,85 do 1,27 roku i jest dokładniejszy niż dwa modele DM użyte w tym badaniu.Shen i wsp.23 wykorzystali metodę Cameriere do oszacowania wieku zębowego siedmiu zębów stałych lewej żuchwy u mieszkańców wschodnich Chin w wieku od 5 do 13 lat i porównali go z wiekiem oszacowanym za pomocą regresji liniowej, SVM i RF.Wykazały, że wszystkie trzy modele DM charakteryzują się wyższą dokładnością w porównaniu do tradycyjnej formuły Cameriere.MAE i RMSE w badaniu Shena były niższe niż w modelu DM w tym badaniu.Zwiększona precyzja badań Stepanovsky’ego i in.35 oraz Shen i in.23 może wynikać z włączenia młodszych osób do prób badawczych.Ponieważ szacunki wieku uczestników z rozwijającymi się zębami stają się dokładniejsze w miarę wzrostu liczby zębów w trakcie rozwoju zębów, dokładność uzyskanej metody szacowania wieku może być zmniejszona, gdy uczestnicy badania są młodsi.Ponadto błąd MLP w szacowaniu wieku jest nieco mniejszy niż w przypadku SLP, co oznacza, że ​​MLP jest dokładniejsze niż SLP.Uważa się, że MLP jest nieco lepszy do szacowania wieku, prawdopodobnie ze względu na ukryte warstwy w MLP38.Istnieje jednak wyjątek dla zewnętrznej próby kobiet (SLP 1,45, MLP 1,49).Stwierdzenie, że MLP jest dokładniejsza w ocenie wieku niż SLP, wymaga dodatkowych badań retrospektywnych.
Porównano także skuteczność klasyfikacji modelu DM i metody tradycyjnej na progu 18 lat.Wszystkie testowane modele SD i metody tradycyjne na zbiorze testów wewnętrznych wykazały praktycznie akceptowalny poziom dyskryminacji dla 18-letniej próby.Czułość dla mężczyzn i kobiet wynosiła odpowiednio ponad 87,7% i 94,9%, a swoistość większa niż 89,3% i 84,7%.AUROC wszystkich testowanych modeli również przekracza 0,925.Zgodnie z naszą najlepszą wiedzą w żadnym badaniu nie sprawdzano skuteczności modelu DM w klasyfikacji 18-letniej na podstawie dojrzałości zębów.Możemy porównać wyniki tego badania z wydajnością klasyfikacji modeli głębokiego uczenia się na panoramicznych radiogramach.Guo i wsp.15 obliczyli skuteczność klasyfikacji modelu głębokiego uczenia się opartego na CNN i metody ręcznej opartej na metodzie Demirjiana dla określonego progu wiekowego.Czułość i swoistość metody manualnej wyniosła odpowiednio 87,7% i 95,5%, a czułość i swoistość modelu CNN przekroczyła odpowiednio 89,2% i 86,6%.Doszli do wniosku, że modele głębokiego uczenia się mogą zastąpić ocenę ręczną w klasyfikacji progów wiekowych lub przewyższać ją.Wyniki tego badania wykazały podobną skuteczność klasyfikacji;Uważa się, że klasyfikacja z wykorzystaniem modeli DM może zastąpić tradycyjne metody statystyczne służące do szacowania wieku.Spośród modeli najlepszym modelem był DM LR pod względem czułości dla próbki męskiej oraz czułości i swoistości dla próbki żeńskiej.LR zajmuje drugie miejsce pod względem specyfiki dla mężczyzn.Co więcej, LR jest uważany za jeden z bardziej przyjaznych dla użytkownika modeli DM35, jest mniej skomplikowany i trudny w obróbce.Na podstawie tych wyników uznano, że LR jest najlepszym modelem klasyfikacji odcięcia dla 18-latków w populacji koreańskiej.
Ogólnie rzecz biorąc, dokładność szacowania wieku lub wyników klasyfikacji na zewnętrznym zestawie testowym była słaba lub niższa w porównaniu z wynikami na wewnętrznym zestawie testowym.Niektóre raporty wskazują, że dokładność lub skuteczność klasyfikacji zmniejsza się, gdy szacunki wieku oparte na populacji koreańskiej stosuje się do populacji japońskiej5,39, co stwierdzono w niniejszym badaniu.Tę tendencję pogorszenia zaobserwowano także w modelu DM.Dlatego też, aby dokładnie oszacować wiek, nawet przy wykorzystaniu DM w procesie analizy, należy preferować metody oparte na danych populacji rodzimej, takie jak metody tradycyjne5,39,40,41,42.Ponieważ nie jest jasne, czy modele głębokiego uczenia się mogą wykazywać podobne trendy, potrzebne są badania porównujące dokładność i efektywność klasyfikacji przy użyciu tradycyjnych metod, modeli DM i modeli głębokiego uczenia się na tych samych próbach, aby potwierdzić, czy sztuczna inteligencja może przezwyciężyć te różnice rasowe w ograniczonym wieku.oceny.
Pokazujemy, że tradycyjne metody można zastąpić szacowaniem wieku w oparciu o model DM w praktyce sądowej szacowania wieku w Korei.Odkryliśmy także możliwość wdrożenia uczenia maszynowego do kryminalistycznej oceny wieku.Istnieją jednak wyraźne ograniczenia, takie jak niewystarczająca liczba uczestników tego badania, aby ostatecznie określić wyniki oraz brak wcześniejszych badań umożliwiających porównanie i potwierdzenie wyników tego badania.W przyszłości badania DM należy prowadzić na większej liczbie próbek i bardziej zróżnicowanych populacjach, aby poprawić ich praktyczną przydatność w porównaniu z metodami tradycyjnymi.Aby zweryfikować wykonalność wykorzystania sztucznej inteligencji do szacowania wieku w wielu populacjach, potrzebne są przyszłe badania w celu porównania dokładności i efektywności klasyfikacji modeli DM i głębokiego uczenia się z tradycyjnymi metodami w tych samych próbach.
W badaniu wykorzystano 2657 fotografii ortograficznych zebranych od dorosłych Koreańczyków i Japończyków w wieku od 15 do 23 lat.Koreańskie radiogramy podzielono na 900 serii treningowych (19,42 ± 2,65 lat) i 900 serii testów wewnętrznych (19,52 ± 2,59 lat).Zestaw szkoleniowy zebrano w jednej instytucji (Szpital St. Mary's w Seulu), a własny zestaw testowy w dwóch instytucjach (Szpital Stomatologiczny Uniwersytetu Narodowego w Seulu i Szpital Stomatologiczny Uniwersytetu Yonsei).Zebraliśmy także 857 radiogramów z innych danych populacyjnych (Iwate Medical University, Japonia) do testów zewnętrznych.Jako zestaw testów zewnętrznych wybrano zdjęcia rentgenowskie pacjentów japońskich (19,31 ± 2,60 lat).Dane zbierano retrospektywnie w celu analizy etapów rozwoju zębów na zdjęciach panoramicznych wykonanych podczas leczenia stomatologicznego.Wszystkie zebrane dane były anonimowe, z wyjątkiem płci, daty urodzenia i daty zdjęcia rentgenowskiego.Kryteria włączenia i wyłączenia były takie same jak w badaniach opublikowanych wcześniej 4 , 5 .Rzeczywisty wiek próbki obliczono, odejmując datę urodzenia od daty wykonania zdjęcia rentgenowskiego.Badaną grupę podzielono na dziewięć grup wiekowych.Rozkład wieku i płci przedstawiono w Tabeli 3. Badanie to przeprowadzono zgodnie z Deklaracją Helsińską i zatwierdzono przez Instytucjonalną Komisję Rewizyjną (IRB) Szpitala Najświętszej Marii Panny w Seulu Katolickiego Uniwersytetu Korei (KC22WISI0328).Ze względu na retrospektywny charakter tego badania nie można było uzyskać świadomej zgody od wszystkich pacjentów poddawanych badaniom radiograficznym w celach terapeutycznych.Szpital St. Mary's University w Seulu (IRB) odstąpił od wymogu świadomej zgody.
Stadia rozwojowe zębów trzonowych dwuszczękowych drugiego i trzeciego oceniano według kryteriów Demircana25.Wybrano tylko jeden ząb, jeśli po lewej i prawej stronie każdej szczęki stwierdzono ten sam typ zęba.Jeżeli zęby homologiczne po obu stronach znajdowały się na różnych etapach rozwoju, ze względu na niepewność co do szacowanego wieku wybierano ząb o niższym stopniu rozwoju.Dwóch doświadczonych obserwatorów oceniło sto losowo wybranych radiogramów ze zbioru uczącego, aby sprawdzić wiarygodność między obserwatorami po wstępnej kalibracji w celu określenia stopnia dojrzałości zębów.Wiarygodność wewnątrzobserwatora była oceniana dwukrotnie w odstępach trzymiesięcznych przez głównego obserwatora.
Płeć i etap rozwoju drugich i trzecich zębów trzonowych każdej szczęki w zestawie treningowym zostały oszacowane przez głównego obserwatora przeszkolonego z różnymi modelami DM, a rzeczywisty wiek przyjęto jako wartość docelową.Modele SLP i MLP, które są szeroko stosowane w uczeniu maszynowym, przetestowano w porównaniu z algorytmami regresji.Model DM łączy funkcje liniowe wykorzystując etapy rozwoju czterech zębów i łączy te dane w celu oszacowania wieku.SLP jest najprostszą siecią neuronową i nie zawiera warstw ukrytych.SLP działa w oparciu o transmisję progową pomiędzy węzłami.Model SLP w regresji jest matematycznie podobny do wielokrotnej regresji liniowej.W przeciwieństwie do modelu SLP, model MLP ma wiele ukrytych warstw z nieliniowymi funkcjami aktywacji.W naszych eksperymentach wykorzystaliśmy warstwę ukrytą zawierającą tylko 20 ukrytych węzłów z nieliniowymi funkcjami aktywacji.Użyj gradientu jako metody optymalizacji oraz MAE i RMSE jako funkcji straty, aby wytrenować nasz model uczenia maszynowego.Do zestawu testów wewnętrznych i zewnętrznych zastosowano najlepiej uzyskany model regresji i oszacowano wiek zębów.
Opracowano algorytm klasyfikacji, który wykorzystuje dojrzałość czterech zębów w zestawie uczącym do przewidywania, czy próbka ma 18 lat, czy nie.Aby zbudować model, wyprowadziliśmy siedem algorytmów uczenia maszynowego reprezentacji6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost i (7) MLP .LR jest jednym z najczęściej stosowanych algorytmów klasyfikacji44.Jest to algorytm nadzorowanego uczenia się, który wykorzystuje regresję do przewidywania prawdopodobieństwa przynależności danych do określonej kategorii od 0 do 1 i na podstawie tego prawdopodobieństwa klasyfikuje dane jako należące do bardziej prawdopodobnej kategorii.używany głównie do klasyfikacji binarnej.KNN jest jednym z najprostszych algorytmów uczenia maszynowego45.Po otrzymaniu nowych danych wejściowych znajduje k danych zbliżonych do istniejącego zbioru, a następnie klasyfikuje je do klasy o najwyższej częstotliwości.Ustalamy 3 dla liczby rozważanych sąsiadów (k).SVM to algorytm maksymalizujący odległość pomiędzy dwiema klasami poprzez wykorzystanie funkcji jądra do rozszerzenia przestrzeni liniowej do przestrzeni nieliniowej zwanej polami46.W tym modelu używamy obciążenia = 1, mocy = 1 i gamma = 1 jako hiperparametrów jądra wielomianu.DT znalazła zastosowanie w różnych dziedzinach jako algorytm podziału całego zbioru danych na kilka podgrup poprzez przedstawienie reguł decyzyjnych w strukturze drzewiastej47.Model jest skonfigurowany z minimalną liczbą rekordów na węzeł wynoszącą 2 i wykorzystuje indeks Giniego jako miarę jakości.RF to metoda zespołowa, która łączy wiele DT w celu poprawy wydajności przy użyciu metody agregacji metodą bootstrap, która generuje słaby klasyfikator dla każdej próbki poprzez wielokrotne losowe pobieranie próbek o tej samej wielkości z oryginalnego zbioru danych48.Jako kryteria separacji węzłów wykorzystaliśmy 100 drzew, 10 głębokości drzew, 1 minimalny rozmiar węzła i wskaźnik domieszki Giniego.Klasyfikacja nowych danych jest ustalana większością głosów.XGBoost to algorytm, który łączy techniki wzmacniania za pomocą metody, która jako dane szkoleniowe przyjmuje błąd pomiędzy rzeczywistymi i przewidywanymi wartościami poprzedniego modelu i zwiększa błąd za pomocą gradientów49.Jest to algorytm szeroko stosowany ze względu na dobrą wydajność i efektywne wykorzystanie zasobów, a także wysoką niezawodność jako funkcję korekcji przeuczenia.Model wyposażony jest w 400 kół podporowych.MLP to sieć neuronowa, w której jeden lub więcej perceptronów tworzy wiele warstw z jedną lub większą liczbą warstw ukrytych pomiędzy warstwą wejściową i wyjściową38.Dzięki temu można przeprowadzić klasyfikację nieliniową, w której po dodaniu warstwy wejściowej i uzyskaniu wartości wyniku przewidywana wartość wyniku jest porównywana z rzeczywistą wartością wyniku, a błąd jest propagowany z powrotem.Stworzyliśmy warstwę ukrytą zawierającą 20 ukrytych neuronów w każdej warstwie.Każdy opracowany przez nas model zastosowano do zbiorów wewnętrznych i zewnętrznych w celu przetestowania wydajności klasyfikacji poprzez obliczenie czułości, swoistości, PPV, NPV i AUROC.Czułość definiuje się jako stosunek próbki, której wiek szacuje się na 18 lat lub więcej, do próbki, której wiek szacuje się na 18 lat lub więcej.Specyficzność to odsetek próbek poniżej 18 roku życia i próbek szacowanych na mniej niż 18 lat.
Etapy stomatologiczne oceniane w zestawie uczącym zostały przekształcone w etapy numeryczne w celu analizy statystycznej.Przeprowadzono wieloczynnikową regresję liniową i logistyczną, aby opracować modele predykcyjne dla każdej płci i wyprowadzić wzory regresji, które można wykorzystać do oszacowania wieku.Zastosowaliśmy te wzory do oszacowania wieku zębów zarówno w przypadku testów wewnętrznych, jak i zewnętrznych.Tabela 4 przedstawia modele regresji i klasyfikacji zastosowane w tym badaniu.
Wiarygodność wewnątrz i między obserwatorami obliczono za pomocą statystyki kappa Cohena.Aby przetestować dokładność modeli DM i tradycyjnych modeli regresji, obliczyliśmy MAE i RMSE, korzystając z szacunkowego i rzeczywistego wieku wewnętrznych i zewnętrznych zestawów testowych.Błędy te są powszechnie stosowane do oceny dokładności przewidywań modelu.Im mniejszy błąd, tym większa trafność prognozy24.Porównaj MAE i RMSE wewnętrznych i zewnętrznych zestawów testów obliczonych przy użyciu DM i tradycyjnej regresji.Skuteczność klasyfikacji 18-letniego okresu odcięcia w tradycyjnych statystykach oceniono przy użyciu tabeli kontyngencji 2 × 2.Obliczoną czułość, swoistość, PPV, NPV i AUROC zestawu testowego porównano z zmierzonymi wartościami modelu klasyfikacji DM.Dane wyrażono jako średnią ± odchylenie standardowe lub liczbę (%) w zależności od charakterystyki danych.Za istotne statystycznie uznano dwustronne wartości P <0,05.Wszystkie rutynowe analizy statystyczne przeprowadzono przy użyciu SAS w wersji 9.4 (SAS Institute, Cary, NC).Model regresji DM został zaimplementowany w Pythonie przy użyciu backendu Keras50 2.2.4 i Tensorflow51 1.8.0 specjalnie do operacji matematycznych.Model klasyfikacji DM został zaimplementowany w środowisku analizy wiedzy Waikato i platformie analitycznej Konstanz Information Miner (KNIME) 4.6.152.
Autorzy przyjmują do wiadomości, że w artykule i materiałach uzupełniających można znaleźć dane potwierdzające wnioski z badania.Zbiory danych wygenerowane i/lub przeanalizowane podczas badania są dostępne u odpowiedniego autora na uzasadnioną prośbę.
Ritz-Timme, S. i in.Ocena wieku: najnowocześniejsza wersja spełniająca specyficzne wymagania praktyki kryminalistycznej.międzynarodowość.J. Medycyna legalna.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. i Olze, A. Aktualny stan kryminalistycznej oceny wieku żywych osób do celów ścigania karnego.Kryminalni.medycyna.Patologia.1, 239–246 (2005).
Pan, J. i in.Zmodyfikowana metoda oceny wieku zębowego dzieci w wieku od 5 do 16 lat we wschodnich Chinach.kliniczny.Ankieta ustna.25, 3463–3474 (2021).
Lee, SS i in. Chronologia rozwoju drugich i trzecich zębów trzonowych u Koreańczyków i jej zastosowanie w kryminalistycznej ocenie wieku.międzynarodowość.J. Medycyna legalna.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY i Lee, SS Dokładność szacowania wieku i szacowania progu 18 lat na podstawie dojrzałości drugich i trzecich zębów trzonowych u Koreańczyków i Japończyków.PLoS ONE 17, e0271247 (2022).
Kim, JY i in.Przedoperacyjna analiza danych oparta na uczeniu maszynowym może przewidzieć wynik leczenia chirurgii snu u pacjentów z OSA.nauka.Raport 11, 14911 (2021).
Han, M. i in.Dokładne oszacowanie wieku na podstawie uczenia maszynowego z interwencją człowieka czy bez?międzynarodowość.J. Medycyna legalna.136, 821–831 (2022).
Khan, S. i Shaheen, M. Od eksploracji danych do eksploracji danych.J.Informacja.nauka.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. i Shaheen, M. WisRule: Pierwszy algorytm poznawczy do wydobywania reguł asocjacyjnych.J.Informacja.nauka.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. i Abdullah U. Karm: Tradycyjna eksploracja danych oparta na regułach skojarzeń opartych na kontekście.Oblicz.Matt.Kontynuować.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. i Habib M. Wykrywanie podobieństw semantycznych w oparciu o głębokie uczenie się przy użyciu danych tekstowych.poinformować.technologie.kontrola.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. i Shahin, M. System rozpoznawania aktywności w filmach sportowych.multimedialne.Narzędzia Aplikacje https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS i in.Wyzwanie RSNA związane z uczeniem się maszynowym w wieku kostnym u dzieci.Radiologia 290, 498–503 (2019).
Li, Y. i in.Ocena wieku w kryminalistyce na podstawie zdjęć rentgenowskich miednicy przy użyciu głębokiego uczenia się.EURO.promieniowanie.29, 2322–2329 (2019).
Guo, YC i in.Dokładna klasyfikacja wieku przy użyciu metod manualnych i głębokich splotowych sieci neuronowych na podstawie obrazów z projekcji ortograficznej.międzynarodowość.J. Medycyna legalna.135, 1589–1597 (2021).
Alabama Dalora i in.Oszacowanie wieku kostnego przy użyciu różnych metod uczenia maszynowego: systematyczny przegląd literatury i metaanaliza.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. i Yang, J. Szacowanie wieku Afroamerykanów i Chińczyków specyficzne dla populacji na podstawie objętości komory miazgi pierwszych zębów trzonowych za pomocą tomografii komputerowej z wiązką stożkową.międzynarodowość.J. Medycyna legalna.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK i Oh KS Określanie grup wiekowych żyjących ludzi z wykorzystaniem obrazów pierwszych zębów trzonowych opartych na sztucznej inteligencji.nauka.Raport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. i Urschler, M. Automatyczne szacowanie wieku i klasyfikacja większości wieków na podstawie wieloczynnikowych danych MRI.IEEE J. Biomed.Alerty zdrowotne.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. i Li, G. Oszacowanie wieku na podstawie segmentacji 3D komory miazgi pierwszych zębów trzonowych z tomografii komputerowej z wiązką stożkową poprzez integrację głębokiego uczenia się i zestawów poziomów.międzynarodowość.J. Medycyna legalna.135, 365–373 (2021).
Wu, WT i in.Eksploracja danych w dużych zbiorach danych klinicznych: wspólne bazy danych, kroki i modele metod.Świat.medycyna.ratunek.8, 44 (2021).
Yang, J. i in.Wprowadzenie do medycznych baz danych i technologii eksploracji danych w erze Big Data.J.Avid.Podstawowa medycyna.13, 57–69 (2020).
Shen, S. i in.Metoda Camerera szacowania wieku zębów z wykorzystaniem uczenia maszynowego.BMC Oral Health 21, 641 (2021).
Galliburg A. i in.Porównanie różnych metod uczenia maszynowego do przewidywania wieku zębów przy użyciu metody stopniowania Demirdjiana.międzynarodowość.J. Medycyna legalna.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. i Tanner, JM Nowy system oceny wieku zębów.parsknięcie.biologia.45, 211–227 (1973).
Landis, JR i Koch, GG Miary zgodności obserwatorów w sprawie danych kategorycznych.Biometria 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK i Choi HK.Analiza teksturalna, morfologiczna i statystyczna dwuwymiarowego obrazowania metodą rezonansu magnetycznego z wykorzystaniem technik sztucznej inteligencji w różnicowaniu pierwotnych guzów mózgu.Informacje o zdrowiu.ratunek.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Czas publikacji: 04 stycznia 2024 r