Ứng dụng trí tuệ nhân tạo trong nhận dạng giọng nói ở bệnh nhân Parkinson
Nội dung chính của bài viết
Tóm tắt
Nghiên cứu ứng dụng trí tuệ nhân tạo (Al) trong nhận dạng giọng của bệnh nhân Parkinson (PD) so với người khỏe mạnh, dữ liệu tiếng Việt. Nghiên cứu cắt ngang, thực hiện tại Bệnh viện Đại học Y Hà Nội từ năm 2024 đến 2025, với 20 bệnh nhân được chẩn đoán PD và 60 người đối chứng khỏe mạnh. Giọng nói được ghi âm: kéo dài nguyên âm /a/, /i/, /u/ (≥ 3 giây, lặp lại 3 lần), đọc câu chuẩn 25 âm tiết và nói tự do trong 30 giây. Đanh giá các đặc trưng âm học gồm jitter, shimmer, độ hài thanh (HNR), tần số cơ bản (F0) trung bình/ độ lệch chuẩn và chỉ số âm học (MFCC). Huấn luyện hai mô hình Al: Máy vectơ hỗ trợ với hàm nhân cơ sở (SVM - RBF kernel) và Mạng nơ-ron tích chập trên biểu phổ Mel, đánh giá bằng hệ kiểm định chéo 5 phần. Kết quả: Mô hình CNN đạt độ chính xác với AUC 0,91, độ nhạy 88% và độ đặc hiệu 84%.
Chi tiết bài viết
Từ khóa
Parkinson, giọng nói, trí tuệ nhân tạo, CNN, MFCC, tiếng Việt
Tài liệu tham khảo
2. Tsanas A, Little MA, McSharry PE, et al. Accurate telemonitoring of Parkinson’s disease progression by noninvasive speech tests. IEEE Trans Biomed Eng. 2012; 59(5): 1264-71. doi:10.1109/TBME.2011.2170335.
3. Orozco‑Arroyave JR, Hönig F, Arias‑Londoño JD, et al. Automatic detection of Parkinson’s disease from continuous speech. J Neurolinguistics. 2016; 37: 141-60. doi:10.1016/j.jneuroling.2016.11.005.
4. Sakar CO, Serbes G, Gunduz A, et al. A comparative analysis of speech signal processing algorithms for Parkinson’s disease classification. IEEE J Biomed Health Inform. 2013; 17(4): 828-34. doi:10.1109/JBHI.2013.2245674.
5. Rusz J, Cmejla R, Ruzickova H et al. Quantitative acoustic measurements for characterization of speech and voice disorders in early PD. J Acoust Soc Am. 2011; 129(1): 350-67. doi:10.1121/1.3514381.
6. Al‑Fatlawi A, et al. Deep CNNs for Parkinson’s disease detection using spectrograms. Comput Methods Programs Biomed. 2021; 199: 105915. doi:10.1016/j.cmpb.2020.105915.
7. Vásquez‑Correa JC, Arias‑Vergara T, Orozco‑Arroyave JR, et al. Convolutional neural networks and transfer learning to classify PD from speech in three languages. Lect Notes Comput Sci. 2019; 11896: 697-708. doi:10.1007/978-3-030-26626-4_68.
8. Shen M, et al. Explainable AI to diagnose early Parkinson’s using voice. Sci Rep. 2025; 15: 5487. doi:10.1038/s41598-025-96575-6.
9. Reddy GP, et al. Artificial intelligence‑based effective detection of Parkinson’s disease using voice. Electronics. 2024; 13(20): 4028. doi:10.3390/electronics13204028.
10. Orozco‑Arroyave JR, Vásquez‑Correa JC, Arias‑Vergara T, et al. Apkinson: The smartphone application to monitor PD patients in the wild. Sensors. 2019; 19(21): 4802. doi:10.3390/s19214802.
11. Rusz J, Krack P, Tripoliti E. Digital speech biomarkers in PD: from prodromal stages to clinical trials. Neurosci Biobehav Rev. 2024; 156: 105922. doi:10.1016/j.neubiorev.2023.105922.
12. Tsanas A, et al. Novel speech signal processing algorithms for PD monitoring. IEEE Trans Biomed Eng. 2014; 61(8): 2180-94. doi:10.1109/TBME.2014.2314574.
13. Ho AK, Iansek R, Marigliani C, Bradshaw JL, Gates S. Speech impairment in PD: a review. Mov Disord. 1998; 13(5): 676-88. doi:10.1002/mds.870130407.
14. Skodda S, Flasskamp A, Schlegel U. Instability of syllable repetition in PD measured by acoustic analysis. J Voice. 2011; 25(6): e265-75. doi:10.1016/j.jvoice.2010.06.009.
15. Dehak N, Kenny P, Dehak R et al. Front‑end factor analysis for speaker verification. IEEE Trans Audio Speech Lang Process. 2011; 19(4): 788-98. doi:10.1109/TASL.2010.2064307.