Dziękujemy za odwiedzenie Nature.com. Wersja przeglądarki, której używasz, ma ograniczoną obsługę CSS. Aby uzyskać najlepsze wyniki, zalecamy korzystanie z nowszej wersji przeglądarki (lub wyłączania trybu kompatybilności w Internet Explorer). W międzyczasie, aby zapewnić ciągłe wsparcie, pokazujemy witrynę bez stylizacji lub JavaScript.
Zęby są uważane za najdokładniejszy wskaźnik wieku ludzkiego ciała i są często stosowane w ocenie wieku kryminalistycznym. Staraliśmy się potwierdzić szacunki wieku dentystycznego oparte na eksploracji danych poprzez porównanie dokładności szacowania i wyników klasyfikacji 18-letniego progu z tradycyjnymi metodami i szacunkami wieku opartym na eksploracji danych. W sumie 2657 Panoramicznych Radiografii zebrano od obywateli koreańskich i japońskich w wieku od 15 do 23 lat. Zostały one podzielone na zestaw treningowy, każdy zawierający 900 koreańskich radiogramów i wewnętrzny zestaw testowy zawierający 857 japońskich radiogramów. Porównaliśmy dokładność klasyfikacji i wydajność tradycyjnych metod z zestawami testów modeli eksploracji danych. Dokładność tradycyjnej metody na wewnętrznym zestawie testowym jest nieco wyższa niż w modelu eksploracji danych, a różnica jest niewielka (średni błąd bezwzględny <0,21 lat, średni błąd kwadratowy <0,24 lat). Wydajność klasyfikacji 18-letniego odcięcia jest również podobna między tradycyjnymi metodami i modelami wydobywania danych. Zatem tradycyjne metody można zastąpić modelami eksploracji danych podczas przeprowadzania oceny wieku kryminalistycznego za pomocą dojrzałości drugiego i trzeciego zębów trzonowych u koreańskich nastolatków i młodych dorosłych.
Oszacowanie wieku dentystycznego jest szeroko stosowane w medycynie kryminalistycznej i stomatologii pediatrycznej. W szczególności, ze względu na wysoką korelację między wiekiem chronologicznym a rozwojem dentystycznym, ocena wieku według stadiów rozwojowych dentystycznych jest ważnym kryterium oceny wieku dzieci i młodzieży 1,2,3. Jednak w przypadku młodych ludzi szacowanie wieku zębów na podstawie dojrzałości stomatologicznej ma swoje ograniczenia, ponieważ wzrost zębów jest prawie kompletny, z wyjątkiem trzecich zębów trzonowych. Celem prawnym w zakresie ustalenia wieku młodych ludzi i młodzieży jest dostarczenie dokładnych szacunków i naukowego dowodów na to, czy osiągnęły wiek większości. W praktyce medyczno-prawnej nastolatków i młodych dorosłych w Korei wiek oszacowano metodą Lee, a próg prawny wynoszący 18 lat został przewidziany na podstawie danych zgłoszonych przez OH i in. 5.
Uczenie maszynowe jest rodzajem sztucznej inteligencji (AI), która wielokrotnie uczy się i klasyfikuje duże ilości danych, rozwiązuje problemy i napędza programowanie danych. Uczenie maszynowe może odkryć przydatne ukryte wzorce w dużych ilościach danych6. Natomiast klasyczne metody, które są pracochłonne i czasochłonne, mogą mieć ograniczenia w radzeniu sobie z dużymi ilościami złożonych danych, które są trudne do przetworzenia ręcznego 7. Dlatego ostatnio przeprowadzono wiele badań przy użyciu najnowszych technologii komputerowych w celu zminimalizowania błędów ludzkich i wydajnego przetwarzania danych wielowymiarowych 8,9,10,11,12. W szczególności stwierdzono, że głębokie uczenie się jest szeroko stosowane w analizie obrazu medycznego, a różne metody oszacowania wieku poprzez automatyczne analiza radiogramów poprawia dokładność i wydajność oszacowania wieku13,14,15,16,17,18,19,20 . Na przykład Halabi i in. 13 opracowali algorytm uczenia maszynowego opartego na splotowych sieciach neuronowych (CNN) w celu oszacowania wieku szkieletowego za pomocą radiogramów rąk dzieci. W niniejszym badaniu proponuje model, który stosuje uczenie maszynowe do obrazów medycznych i pokazuje, że metody te mogą poprawić dokładność diagnostyczną. Li i in .14 oszacowali wiek na podstawie obrazów rentgenowskich miednicy za pomocą głębokiego uczenia się CNN i porównali je z wynikami regresji przy użyciu oszacowania stadium kostnicy. Odkryli, że model CNN głębokiego uczenia się wykazał taką samą wydajność oszacowania wieku, co tradycyjny model regresji. Badanie Guo i in. [15] oceniło wydajność klasyfikacji tolerancji wieku technologii CNN opartej na dentystycznych ortofotos, a wyniki modelu CNN udowodniły, że ludzie przewyższali wydajność klasyfikacji wieku.
Większość badań dotyczących oszacowania wieku za pomocą uczenia maszynowego Metody głębokiego uczenia się13,14,15,16,17,18,19,20. Oszacowanie wieku oparte na głębokim uczeniu się jest bardziej dokładne niż tradycyjne metody. Jednak takie podejście stanowi niewielką okazję do przedstawienia naukowej podstaw dla szacunków wieku, takich jak wskaźniki wieku zastosowane w szacunkach. Istnieje również spór prawny o to, kto prowadzi inspekcje. Dlatego oszacowanie wieku oparte na głębokim uczeniu się jest trudne do zaakceptowania przez władze administracyjne i sądowe. Mining danych (DM) to technika, która może odkryć nie tylko oczekiwane, ale także nieoczekiwane informacje jako metodę odkrywania przydatnych korelacji między dużymi ilościami danych 6,21,22. Uczenie maszynowe jest często używane w eksploracji danych, a zarówno eksploracja danych, jak i uczenie maszynowe wykorzystują te same kluczowe algorytmy do odkrywania wzorców w danych. Oszacowanie wieku za pomocą rozwoju dentystycznego opiera się na ocenie egzaminatora dojrzałości docelowych zębów, a ocena ta wyraża się jako etap dla każdego zęba docelowego. DM można wykorzystać do analizy korelacji między etapem oceny dentystycznej a faktycznym wiekiem i może zastąpić tradycyjną analizę statystyczną. Dlatego jeśli zastosujemy techniki DM do oszacowania wieku, możemy wdrożyć uczenie maszynowe w szacowaniu wieku kryminalistycznym bez obawy o odpowiedzialność prawną. Opublikowano kilka badań porównawczych na temat możliwych alternatyw dla tradycyjnych metod manualnych stosowanych w praktyce kryminalistycznej i metodach opartych na EBM do określania wieku zębów. Shen i in. 23 wykazali, że model DM jest dokładniejszy niż tradycyjna formuła kamera. Galibourg i in. 24 zastosowali różne metody DM do przewidywania wieku zgodnie z kryterium Demirdjian25, a wyniki wykazały, że metoda DM przewyższyła metody Demirdjian i Willems w szacowaniu wieku francuskiej populacji.
Aby oszacować wiek stomatologiczny koreańskich młodzieży i młodych dorosłych, metoda Lee 4 jest szeroko stosowana w koreańskiej praktyce kryminalistycznej. Ta metoda wykorzystuje tradycyjną analizę statystyczną (taką jak regresja wielokrotna) w celu zbadania związku między osobami koreańskimi a wiekiem chronologicznym. W tym badaniu metody szacowania wieku uzyskane przy użyciu tradycyjnych metod statystycznych są zdefiniowane jako „metody tradycyjne”. Metoda Lee jest tradycyjną metodą, a jej dokładność została potwierdzona przez OH i in. 5; Jednak możliwość zastosowania szacowania wieku opartego na modelu DM w koreańskiej praktyce kryminalistycznej jest nadal wątpliwa. Naszym celem było naukowo potwierdzenie potencjalnej przydatności szacowania wieku na podstawie modelu DM. Celem tego badania było (1) porównanie dokładności dwóch modeli DM w szacowaniu wieku dentystycznego i (2) w celu porównania wydajności klasyfikacji 7 modeli DM w wieku 18 lat z uzyskanymi za pomocą tradycyjnych metod statystycznych dojrzałości drugiego i trzecie zęby trzonowe w obu szczękach.
Średnie i standardowe odchylenia wieku chronologicznego według stadium i rodzaju zęba pokazano online w tabeli uzupełniającej S1 (zestaw treningowy), tabelę uzupełniającą S2 (zestaw testowy wewnętrzny) i tabela uzupełniająca S3 (Zestaw testów zewnętrznych). Wartości kappa dla niezawodności wewnątrz- i międzybserverowej uzyskane z zestawu treningowego wynosiły odpowiednio 0,951 i 0,947. Wartości P i 95% przedziały ufności dla wartości kappa pokazano w internetowej tabeli uzupełniającej S4. Wartość kappa została zinterpretowana jako „prawie idealna”, zgodna z kryteriami Landis i Koch26.
Porównując średni błąd bezwzględny (MAE), tradycyjna metoda nieznacznie przewyższa model DM dla wszystkich płci i w zewnętrznym zestawie testowym męskim, z wyjątkiem wielowarstwowego perceptronu (MLP). Różnica między tradycyjnym modelem a modelem DM w wewnętrznym zestawie testowym MAE wynosiła 0,12–0,19 lat dla mężczyzn i 0,17–0,21 lat dla kobiet. W przypadku zewnętrznej baterii testowej różnice są mniejsze (0,001–0,05 lat dla mężczyzn i 0,05–0,09 lat dla kobiet). Dodatkowo, średnia kwadratowy błąd (RMSE) jest nieco niższy niż tradycyjna metoda, z mniejszymi różnicami (0,17–0,24, 0,2–0,24 dla mężczyzn wewnętrznego testu i 0,03–0,07, 0,04–0,08 dla zewnętrznego zestawu testowego). ). MLP wykazuje nieco lepszą wydajność niż pojedyncza warstwy Perceptron (SLP), z wyjątkiem żeńskich zewnętrznych zestawów testowych. W przypadku MAE i RMSE zewnętrzny zestaw testów wynika wyższy niż wewnętrzny zestaw testowy dla wszystkich płci i modeli. Wszystkie MAE i RMSE pokazano w tabeli 1 i rycinie 1.
Mae i RMSE tradycyjnych i modeli regresji wydobycia danych. Średni błąd bezwzględny MAE, średnia liczba root kwadratowa RMSE, pojedyncza warstwy Perceptron SLP, wielowarstwowy Perceptron MLP, tradycyjna metoda CM.
Wydajność klasyfikacji (z odcięciem 18 lat) tradycyjnych i DM wykazano pod względem czułości, swoistości, pozytywnej wartości predykcyjnej (PPV), ujemnej wartości predykcyjnej (NPV) i powierzchni pod krzywą charakterystyczną odbiornika (AUROC) 27 (Tabela 2, Rysunek 2 i Rysunek uzupełniający 1 online). Pod względem wrażliwości wewnętrznej baterii testowej tradycyjne metody działały najlepiej wśród mężczyzn, a gorzej wśród kobiet. Jednak różnica w wydajności klasyfikacji między tradycyjnymi metodami a SD wynosi 9,7% dla mężczyzn (MLP) i tylko 2,4% dla kobiet (XGBOOST). Wśród modeli DM regresja logistyczna (LR) wykazywała lepszą wrażliwość u obu płci. Jeśli chodzi o swoistość wewnętrznego zestawu testowego, zaobserwowano, że cztery modele SD działały dobrze u mężczyzn, podczas gdy tradycyjny model działał lepiej u kobiet. Różnice w wydajności klasyfikacji mężczyzn i kobiet wynoszą odpowiednio 13,3% (MLP) i 13,1% (MLP), co wskazuje, że różnica w wydajności klasyfikacji między modelami przekracza wrażliwość. Wśród modeli DM modele wektorowe (SVM), drzewo decyzyjne (DT) i losowe Forest (RF) najlepiej działały wśród mężczyzn, podczas gdy model LR najlepiej działał wśród kobiet. Auroc tradycyjnego modelu i wszystkich modeli SD był większy niż 0,925 (sąsiad K-Nearest (KNN) u mężczyzn), wykazując doskonałą wydajność klasyfikacji w rozróżnianiu 18-letnich próbek 28. W przypadku zewnętrznego zestawu testowego nastąpił spadek wydajności klasyfikacji pod względem czułości, swoistości i AUROC w porównaniu z wewnętrznym zestawem testów. Ponadto różnica w czułości i swoistości między wydajnością klasyfikacji najlepszych i najgorszych modeli wahała się od 10% do 25% i była większa niż różnica w wewnętrznym zestawie testów.
Czułość i swoistość modeli klasyfikacji eksploracji danych w porównaniu z tradycyjnymi metodami z odcięciem 18 lat. Knn K najbliższy sąsiad, maszyna wektorowa SVM, regresja logistyczna LR, drzewo decyzyjne DT, RF Random Forest, XGB XGBOOST, MLP Multilayer Perceptron, tradycyjna metoda CM.
Pierwszym krokiem w tym badaniu było porównanie dokładności szacunków wieku zębów uzyskanych z siedmiu modeli DM z uzyskanymi za pomocą tradycyjnej regresji. MAE i RMSE oceniono w wewnętrznych zestawach testowych dla obu płci, a różnica między tradycyjną metodą a modelem DM wynosiła od 44 do 77 dni dla MAE i od 62 do 88 dni dla RMSE. Chociaż tradycyjna metoda była nieco dokładniejsza w tym badaniu, trudno jest stwierdzić, czy tak niewielka różnica ma znaczenie kliniczne lub praktyczne. Wyniki te wskazują, że dokładność oszacowania wieku dentystycznego za pomocą modelu DM jest prawie taka sama jak w przypadku tradycyjnej metody. Bezpośrednie porównanie z wynikami poprzednich badań jest trudne, ponieważ żadne badanie nie porównano dokładności modeli DM z tradycyjnymi metodami statystycznymi przy użyciu tej samej techniki rejestrowania zębów w tym samym przedziale wiekowym, co w tym badaniu. Galibourg i in. 24 porównali MAE i RMSE między dwiema tradycyjnymi metodami (Demirjian Method25 i Willems Method29) i 10 modeli DM w populacji francuskiej w wieku od 2 do 24 lat. Poinformowali, że wszystkie modele DM były dokładniejsze niż metody tradycyjne, z różnicami 0,20 i 0,38 lat w MAE oraz 0,25 i 0,47 lat w RMSE w porównaniu z metodami Willems i Demirdjian. Rozbieżność między modelem SD a tradycyjnymi metodami pokazanymi w badaniu Halibourg uwzględnia wiele raportów 30,31,32,33, że metoda demirdjiana nie ocenia dokładnie wieku zębów w populacjach innych niż Kanadyjczycy francuski, na których oparte było badanie. w tym badaniu. Tai i in. 34 zastosowali algorytm MLP, aby przewidzieć wiek zęba na podstawie 1636 chińskich fotografii ortodontycznych i porównali jego dokładność z wynikami metody Demirjian i Willems. Poinformowali, że MLP ma wyższą dokładność niż metody tradycyjne. Różnica między metodą demirdjian a metodą tradycyjną wynosi <0,32 lata, a metoda Willemsa wynosi 0,28 lat, co jest podobne do wyników niniejszego badania. Wyniki tych poprzednich badań24,34 są również zgodne z wynikami niniejszego badania, a dokładność szacowania wieku modelu DM i tradycyjna metoda jest podobna. Jednak na podstawie przedstawionych wyników możemy jedynie ostrożnie stwierdzić, że zastosowanie modeli DM do oszacowania wieku może zastąpić istniejące metody z powodu braku poprzednich badań porównawczych i odniesienia. Konieczne są badania kontrolne z wykorzystaniem większych próbek w celu potwierdzenia wyników uzyskanych w tym badaniu.
Wśród badań testujących dokładność SD w szacowaniu wieku zębów niektóre wykazały wyższą dokładność niż nasze badanie. Stepanovsky i wsp. 35 zastosowali 22 modele SD do panoramicznych radiogramów 976 mieszkańców Czech w wieku od 2,7 do 20,5 lat i przetestowali dokładność każdego modelu. Ocenili rozwój 16 górnych i dolnych lewych zębów stałych, stosując kryteria klasyfikacji zaproponowane przez Moorrees i in. 36. MAE wynosi od 0,64 do 0,94 lat, a RMSE wynosi od 0,85 do 1,27 lat, które są dokładniejsze niż dwa modele DM zastosowane w tym badaniu. Shen i in. 23 wykorzystali metodę kamery, aby oszacować wiek zębów zębów stałych w lewej żuchwie u mieszkańców chińskiego wschodniego w wieku od 5 do 13 lat i porównali ją z wiekiem oszacowanym za pomocą regresji liniowej, SVM i RF. Wykazali, że wszystkie trzy modele DM mają wyższą dokładność w porównaniu z tradycyjną formułą kamery. MAE i RMSE w badaniu Shena były niższe niż w modelu DM w tym badaniu. Zwiększona precyzja badań Stepanovsky i in. 35 i Shen i in. 23 może być spowodowane włączeniem młodszych osób do próbek badań. Ponieważ szacunki wieku dla uczestników z rozwijającymi się zębami stają się bardziej dokładne wraz ze wzrostem liczby zębów podczas rozwoju dentystycznego, dokładność wynikającej z tego metody oszacowania wieku może być zagrożona, gdy uczestnicy badania są młodsi. Ponadto błąd MLP w oszacowaniu wieku jest nieco mniejszy niż SLP, co oznacza, że MLP jest dokładniejszy niż SLP. MLP jest uważany za nieco lepszy dla oszacowania wieku, być może z powodu ukrytych warstw w MLP38. Istnieje jednak wyjątek dla zewnętrznej próbki kobiet (SLP 1.45, MLP 1.49). Odkrycie, że MLP jest dokładniejszy niż SLP w ocenie wieku, wymaga dodatkowych badań retrospektywnych.
Porównano również wydajność klasyfikacji modelu DM i tradycyjną metodę w progu 18-letnim. Wszystkie testowane modele SD i tradycyjne metody wewnętrznego zestawu testów wykazały praktycznie akceptowalne poziomy dyskryminacji dla 18-letniej próby. Czułość mężczyzn i kobiet była odpowiednio większa niż 87,7% i 94,9%, a swoistość była większa niż 89,3% i 84,7%. AUROC wszystkich testowanych modeli również przekracza 0,925. Zgodnie z naszą najlepszą wiedzą, żadne badanie nie przetestowało wydajności modelu DM pod kątem 18-letniej klasyfikacji opartej na dojrzałości dentystycznej. Możemy porównać wyniki tego badania z wydajnością klasyfikacji modeli głębokiego uczenia się na panoramicznych radiogramach. Guo i in. 15 obliczyli wydajność klasyfikacji modelu głębokiego uczenia się opartego na CNN oraz metodę ręczną opartą na metodzie Demirjiana dla określonego progu wieku. Czułość i swoistość metody ręcznej wyniosły odpowiednio 87,7% i 95,5%, a czułość i swoistość modelu CNN przekroczyły odpowiednio 89,2% i 86,6%. Doszli do wniosku, że modele głębokiego uczenia się mogą zastąpić lub przewyższyć ocenę ręczną w klasyfikacji progów wieku. Wyniki tego badania wykazały podobną wydajność klasyfikacji; Uważa się, że klasyfikacja przy użyciu modeli DM może zastąpić tradycyjne metody statystyczne do oszacowania wieku. Wśród modeli DM LR był najlepszym modelem pod względem wrażliwości dla męskiej próbki oraz czułości i swoistości dla próbki żeńskiej. LR zajmuje drugie miejsce pod względem specyficzności dla mężczyzn. Ponadto LR jest uważany za jeden z bardziej przyjaznych dla użytkownika modeli DM35 i jest mniej złożony i trudny do przetworzenia. Na podstawie tych wyników LR uznano za najlepszy model klasyfikacji odcięcia dla 18-latków w populacji koreańskiej.
Ogólnie rzecz biorąc, dokładność oszacowania wieku lub wydajności klasyfikacji w zewnętrznym zestawie testowym była słaba lub niższa w porównaniu z wynikami na wewnętrznym zestawie testów. Niektóre raporty wskazują, że dokładność lub wydajność klasyfikacji zmniejsza się, gdy szacunki wieku oparte na populacji koreańskiej są stosowane do populacji japońskiej 5,39, a podobny wzór stwierdzono w niniejszym badaniu. Ten trend pogorszenia zaobserwowano również w modelu DM. Dlatego, aby dokładnie oszacować wiek, nawet przy użyciu DM w procesie analizy, metody pochodzące z danych populacji rodzimych, takie jak metody tradycyjne, powinny być preferowane 5,39,40 41,42. Ponieważ nie jest jasne, czy modele głębokiego uczenia się mogą wykazywać podobne trendy, badania porównujące dokładność klasyfikacji i wydajność przy użyciu tradycyjnych metod, modeli DM i modeli głębokiego uczenia się na tych samych próbkach, aby potwierdzić, czy sztuczna inteligencja może przezwyciężyć te rozbieżności rasowe w ograniczonym wieku. oceny.
Wykazujemy, że tradycyjne metody można zastąpić oszacowaniem wieku na podstawie modelu DM w praktyce szacowania wieku kryminalistycznego w Korei. Odkryliśmy również możliwość wdrożenia uczenia maszynowego do oceny wieku kryminalistycznego. Istnieją jednak wyraźne ograniczenia, takie jak niewystarczająca liczba uczestników w tym badaniu, aby ostatecznie określić wyniki, oraz brak wcześniejszych badań w celu porównania i potwierdzenia wyników tego badania. W przyszłości badania DM należy przeprowadzić z większą liczbą próbek i bardziej różnorodnymi populacjami, aby poprawić jej praktyczne zastosowanie w porównaniu z tradycyjnymi metodami. Aby potwierdzić wykonalność wykorzystania sztucznej inteligencji do oszacowania wieku w wielu populacjach, potrzebne są przyszłe badania w celu porównania dokładności klasyfikacji i wydajności modeli DM i głębokiego uczenia się za pomocą tradycyjnych metod w tych samych próbkach.
W badaniu wykorzystano 2657 zdjęć ortograficznych zebranych od koreańskich i japońskich dorosłych w wieku od 15 do 23 lat. Koreańskie radiogramy podzielono na 900 zestawów szkoleniowych (19,42 ± 2,65 lat) i 900 wewnętrznych zestawów testowych (19,52 ± 2,59 lat). Zestaw szkoleń został zebrany w jednej instytucji (szpital Seul St. Mary's Hospital), a własny zestaw testowy został zebrany w dwóch instytucjach (szpital dentystyczny Uniwersytetu w Seulu i szpital dentystyczny Uniwersytetu Yonsei). Zebraliśmy również 857 radiogramów z innych danych populacyjnych (IWate Medical University, Japonia) do testów zewnętrznych. Radiografie japońskich (19,31 ± 2,60 lat) wybrano jako zewnętrzny zestaw testowy. Dane zebrano retrospektywnie w celu analizy etapów rozwoju dentystycznego na panoramicznych radiogramach pobranych podczas leczenia dentystycznego. Wszystkie zebrane dane były anonimowe, z wyjątkiem płci, daty urodzenia i daty radiogramu. Kryteria włączenia i wykluczenia były takie same, jak wcześniej opublikowane badania 4, 5. Rzeczywisty wiek próbki obliczono, odejmując datę urodzenia od daty pobrania radiogramu. Grupa próbki podzielono na dziewięć grup wiekowych. Rozkład wiekowy i płci pokazano w tabeli 3 Badanie to przeprowadzono zgodnie z deklaracją Helsinek i zatwierdzone przez instytucjonalną komisję rewizyjną (IRB) szpitala Seulu St. Mary's Hospital of the Catholic University of Korea (KC22WISI0328). Z powodu retrospektywnego projektu tego badania nie można było uzyskać świadomej zgody od wszystkich pacjentów poddawanych badaniu radiograficznym do celów terapeutycznych. Uniwersytet w Seulu Korea University St. Mary's Hospital (IRB) zrezygnował z wymogu świadomej zgody.
Staże rozwojowe bimaksilarnego drugiego i trzeciego trzonu oceniono zgodnie z kryteriami Demircan25. Wybrano tylko jeden ząb, jeśli znaleziono ten sam rodzaj zęba po lewej i prawej stronie każdej szczęki. Jeśli zęby homologiczne po obu stronach znajdowały się na różnych stadiach rozwojowych, ząb z niższym etapem rozwojowym został wybrany w celu uwzględnienia niepewności w szacowanym wieku. Stu losowo wybranych radiogramów z zestawu treningowego zostało ocenionych przez dwóch doświadczonych obserwatorów w celu przetestowania niezawodności międzypserverowej po wstępnej przedalibracji w celu określenia stadium dojrzałości zębów. Niezawodność śródbserkowania oceniono dwukrotnie w trzymiesięcznych odstępach przez głównego obserwatora.
Stadium płci i rozwoju drugiego i trzeciego zębów trzonowych każdej szczęki w zestawie treningowym oszacowano przez głównego obserwatora przeszkolonego z różnymi modelami DM, a faktyczny wiek ustalono jako wartość docelową. Modele SLP i MLP, które są szeroko stosowane w uczeniu maszynowym, zostały przetestowane przeciwko algorytmom regresji. Model DM łączy funkcje liniowe przy użyciu etapów rozwojowych czterech zębów i łączy te dane, aby oszacować wiek. SLP jest najprostszą siecią neuronową i nie zawiera ukrytych warstw. SLP działa na podstawie transmisji progowej między węzłami. Model SLP w regresji jest matematycznie podobny do regresji wielokrotnej liniowej. W przeciwieństwie do modelu SLP, model MLP ma wiele ukrytych warstw z nieliniowymi funkcjami aktywacji. W naszych eksperymentach wykorzystano ukrytą warstwę z tylko 20 ukrytymi węzłami z nieliniowymi funkcjami aktywacji. Użyj zejścia gradientu jako metody optymalizacji, a MAE i RMSE jako funkcji utraty, aby szkoliła nasz model uczenia maszynowego. Najlepiej uzyskany model regresji zastosowano do wewnętrznych i zewnętrznych zestawów testowych, a wiek zębów oszacowano.
Opracowano algorytm klasyfikacji, który wykorzystuje dojrzałość czterech zębów w zestawie szkoleniowym, aby przewidzieć, czy próbka ma 18 lat, czy nie. Aby zbudować model, wyprowadziliśmy siedem algorytmów uczenia maszynowego reprezentacji 6,43: (1) LR, (2) KNN, (3) SVM, (4) dt, (5) RF, (6) xgboost i (7) mlp . LR jest jednym z najczęściej stosowanych algorytmów klasyfikacyjnych44. Jest to nadzorowany algorytm uczenia się, który wykorzystuje regresję do przewidywania prawdopodobieństwa danych należących do określonej kategorii od 0 do 1 i klasyfikuje dane należące do bardziej prawdopodobnej kategorii opartej na tym prawdopodobieństwie; używane głównie do klasyfikacji binarnej. KNN jest jednym z najprostszych algorytmów uczenia maszynowego45. Po otrzymaniu nowych danych wejściowych znajduje K dane bliskie istniejącemu zestawowi, a następnie klasyfikuje je do klasy o najwyższej częstotliwości. Ustawiliśmy 3 dla liczby sąsiadów rozważanych (k). SVM jest algorytmem, który maksymalizuje odległość między dwiema klasami za pomocą funkcji jądra do rozszerzenia przestrzeni liniowej na przestrzeń nieliniową zwaną Fields46. W przypadku tego modelu używamy stronniczości = 1, mocy = 1 i gamma = 1 jako hiperparametry dla ziaren wielomianowego. DT zastosowano w różnych dziedzinach jako algorytm podziału całego zestawu danych na kilka podgrup poprzez reprezentowanie reguł decyzyjnych w strukturze drzewa47. Model jest skonfigurowany z minimalną liczbą rekordów na węzeł 2 i wykorzystuje indeks Gini jako miarę jakości. RF jest metodą zespołu, która łączy wiele DTS w celu poprawy wydajności przy użyciu metody agregacji bootstrap, która generuje słaby klasyfikator dla każdej próbki poprzez losowe pobieranie próbek tego samego rozmiaru wielokrotnie z oryginalnego zestawu danych 48. Zastosowaliśmy 100 drzew, 10 głębokości drzewa, 1 minimalny rozmiar węzła i wskaźnik domieszki Gini jako kryteria separacji węzłów. Klasyfikacja nowych danych zależy od głosowania większości. XGBOOST to algorytm, który łączy techniki zwiększania przy użyciu metody, która przyjmuje dane treningowe błąd między rzeczywistymi i przewidywanymi wartościami poprzedniego modelu i zwiększa błąd za pomocą gradients49. Jest to szeroko stosowany algorytm ze względu na dobrą wydajność i wydajność zasobów, a także wysoką niezawodność jako funkcja korekcji nadmiernej reflektora. Model jest wyposażony w 400 kół wsporniczych. MLP to sieć neuronowa, w której jeden lub więcej perceptronów tworzy wiele warstw z jedną lub więcej ukrytymi warstwami między warstwami wejściowymi i wyjściowymi38. Korzystając z tego, możesz wykonać nieliniową klasyfikację, w której po dodaniu warstwy wejściowej i uzyskaniu wartości wyniku przewidywana wartość wyniku jest porównywana z rzeczywistą wartością wyniku, a błąd jest propagowany. Stworzyliśmy ukrytą warstwę z 20 ukrytymi neuronami w każdej warstwie. Każdy opracowany przez nas model został zastosowany do zestawów wewnętrznych i zewnętrznych w celu oceny wydajności klasyfikacji poprzez obliczenie czułości, swoistości, PPV, NPV i AUROC. Czułość definiuje się jako stosunek próby szacowanej na 18 lat lub starszy do próby szacowanej na 18 lat lub starsze. Specyficzność to odsetek próbek poniżej 18 roku życia i szacuje się, że w wieku poniżej 18 lat.
Staże dentystyczne oceniane w zestawie treningowym zostały przekształcone w etapy numeryczne do analizy statystycznej. Przeprowadzono wielowymiarową regresję liniową i logistyczną w celu opracowania modeli predykcyjnych dla każdego formuły regresji płciowej i wyprowadzenia regresji, które można wykorzystać do oszacowania wieku. Zastosowaliśmy te wzory, aby oszacować wiek zębów zarówno dla wewnętrznych, jak i zewnętrznych zestawów testowych. Tabela 4 pokazuje modele regresji i klasyfikacji zastosowane w tym badaniu.
Niezawodność wewnątrz- i interobserver została obliczona za pomocą statystyki Kappa Cohena. Aby przetestować dokładność modeli DM i tradycyjnych modeli regresji, obliczyliśmy MAE i RMSE przy użyciu szacowanego i rzeczywistego wieku wewnętrznych i zewnętrznych zestawów testowych. Błędy te są powszechnie stosowane do oceny dokładności prognoz modelu. Im mniejszy błąd, tym wyższa dokładność prognozy24. Porównaj MAE i RMSE wewnętrznych i zewnętrznych zestawów testowych obliczonych za pomocą DM i tradycyjnej regresji. Wydajność klasyfikacji 18-letniego granicy w tradycyjnej statystyce oceniono za pomocą tabeli awaryjnej 2 × 2. Obliczoną czułość, swoistość, PPV, NPV i AUROC zestawu testowego porównano z zmierzonymi wartościami modelu klasyfikacji DM. Dane są wyrażone jako średnia ± odchylenie standardowe lub liczba (%) w zależności od charakterystyk danych. Dwustronne wartości p <0,05 uznano za statystycznie istotne. Wszystkie rutynowe analizy statystyczne przeprowadzono przy użyciu SAS w wersji 9.4 (SAS Institute, Cary, NC). Model regresji DM został zaimplementowany w Pythonie przy użyciu Backend Keras50 2.2.4 i tensorflow51 1.8.0 specjalnie dla operacji matematycznych. Model klasyfikacji DM został zaimplementowany w środowisku analizy wiedzy Waikato i platformie analizy Informacje Konstanz (KNIME) 4.6.152.
Autorzy potwierdzają, że dane potwierdzające wnioski badania można znaleźć w artykule i materiałach uzupełniających. Zestawy danych wygenerowane i/lub analizowane podczas badania są dostępne od odpowiedniego autora na rozsądne żądanie.
Ritz-Timme, S. i in. Ocena wieku: najnowocześniejszy w celu spełnienia konkretnych wymagań praktyki kryminalistycznej. internacjonalność. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. i Olze, A. Obecny status oceny wieku kryminalistycznego żywych osób do celów prokuratury karnej. Forensics. medycyna. Patologia. 1, 239–246 (2005).
Pan, J. i in. Zmodyfikowana metoda oceny wieku dentystycznego dzieci w wieku od 5 do 16 lat we wschodnich Chinach. kliniczny. Ankieta ustna. 25, 3463–3474 (2021).
Lee, SS itp. Chronologia rozwoju drugiego i trzeciego zębów trzonowych u Koreańczyków i jej zastosowanie do oceny wieku kryminalistycznego. internacjonalność. J. Legal Medicine. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy i Lee, SS Dokładność szacowania wieku i oszacowanie 18-letniego progu w oparciu o dojrzałość drugiego i trzeciego zębów trzonowych u Koreańczyków i Japończyków. PLOS ONE 17, E0271247 (2022).
Kim, Jy i in. Przedoperacyjna analiza danych oparta na uczeniu maszynowym może przewidzieć wynik leczenia chirurgii snu u pacjentów z OSA. nauka. Raport 11, 14911 (2021).
Han, M. i in. Dokładne oszacowanie wieku z uczenia maszynowego z interwencją ludzką lub bez? internacjonalność. J. Legal Medicine. 136, 821–831 (2022).
Khan, S. i Shaheen, M. od eksploracji danych do wydobycia danych. J.information. nauka. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. i Shaheen, M. Wisrule: Pierwszy algorytm poznawczy do wydobycia zasad. J.information. nauka. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. i Abdullah U. Karm: Tradycyjne wydobycie danych oparte na regułach stowarzyszenia opartych na kontekście. obliczać. Matt. Kontynuować. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. i Habib M. Detekcja podobieństwa semantycznego oparta na głębokim uczeniu się za pomocą danych tekstowych. poinformować. technologie. kontrola. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. i Shahin, M. System rozpoznawania aktywności w filmach sportowych. Multimedia. Aplikacje narzędzi https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS i in. Wyzwanie uczenia maszynowego RSNA w wieku kości pediatrycznej. Radiology 290, 498–503 (2019).
Li, Y. i in. Oszacowanie wieku kryminalistycznego z promieni rentgenowskich miednicy za pomocą głębokiego uczenia się. EURO. promieniowanie. 29, 2322–2329 (2019).
Guo, YC i in. Dokładna klasyfikacja wieku przy użyciu metod ręcznych i głębokich sieci neuronowych z obrazów projekcji ortograficznej. internacjonalność. J. Legal Medicine. 135, 1589–1597 (2021).
Alabama Dalora i in. Oszacowanie wieku kości przy użyciu różnych metod uczenia maszynowego: przegląd literatury systematyczny i metaanaliza. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. i Yang, J. Specyficzne dla populacji oszacowanie Afroamerykanów i Chińczyków na podstawie objętości komory pulpy pierwszych zębów trzonowych przy użyciu tomografii komputerowej z wiązką stożkową. internacjonalność. J. Legal Medicine. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK i OH KS określające grupy wiekowe żywych ludzi za pomocą sztucznej inteligencji oparte na wizerunku pierwszych zębów trzonowych opartych na inteligencji. nauka. Raport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. i Urschler, M. Automatyczne oszacowanie wieku i klasyfikacja wieku większości na podstawie wielu danych MRI. IEEE J. Biomed. Alerty zdrowotne. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. i Li, G. Oszacowanie wieku oparte na segmentacji komory pulpy 3D pierwszych zębów trzonowych z tomografii komputerowej belki stożkowej poprzez integrację zestawów uczenia się głębokiego i poziomów. internacjonalność. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT i in. Wydobycie danych w klinicznych dużych zbiorach danych: wspólne bazy danych, kroki i modele metod. Świat. medycyna. ratunek. 8, 44 (2021).
Yang, J. i in. Wprowadzenie do medycznych baz danych i technologii wydobywania danych w erze Big Data. J. Avid. Medycyna podstawowa. 13, 57–69 (2020).
Shen, S. i in. Metoda Camerera do szacowania wieku zęba za pomocą uczenia maszynowego. BMC Oral Health 21, 641 (2021).
Galburg A. i in. Porównanie różnych metod uczenia maszynowego do przewidywania wieku dentystycznego za pomocą metody inscenizacji demirdjian. internacjonalność. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. i Tanner, JM nowy system oceny wieku dentystycznego. parsknięcie. biologia. 45, 211–227 (1973).
Landis, Jr i Koch, GG miary zgody obserwatora w sprawie danych kategorycznych. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK i Choi HK. Teksturalna, morfologiczna i statystyczna analiza dwuwymiarowego obrazowania rezonansu magnetycznego przy użyciu technik sztucznej inteligencji do różnicowania pierwotnych guzów mózgu. Informacje zdrowotne. ratunek. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Czas po: 04-2024