SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Nhận dạng hình ảnh với dữ liệu mất cân bằng dựa trên học sâu

[28/02/2026 05:14]

Ung thư da là vấn đề sức khỏe nghiêm trọng đôi với xã hội và người bệnh sẽ dễ dàng phải đôi mặt với những tình huông nguy hiểm nếu không được phát hiện sớm. Để góp phần giải quyết, nghiên cứu này do tác giả Dương Thị Nhung – Đại học Thái Nguyên và các cộng sự được thực hiện hướng đến việc tự động phân loại ảnh tổn thương da.

Ung thư da đang trở thành một trong những mối đe dọa nghiêm trọng đối với sức khỏe cộng đồng toàn cầu. Theo báo cáo của WHO năm 2022, mỗi năm có khoảng 1,2 triệu ca mắc mới ung thư da được ghi nhận trên toàn cầu. Tại Hoa Kỳ, số ca mắc mới đã tăng đến 225% trong giai đoạn 1990-2018, với hơn 99.780 ca ung thư hắc tố được chẩn đoán trong năm 2022 và khoảng 7.650 ca tử vong. Tại châu Âu, hơn 144.000 ca mắc mới được báo cáo hằng năm, với khoảng 27.000 ca tử vong. Đặc biệt tại châu Á, mặc dù tỷ lệ mắc thấp hơn, xu hướng gia tăng vẫn được ghi nhận rõ rệt, với tốc độ tăng khoảng 3-8% mỗi năm tại các nước phát triển như Nhật Bản và Hàn Quốc. Chi phí điều trị ung thư da, đặc biệt là ung thư hắc tố, đã vượt quá 3,3 tỷ đô la Mỹ mỗi năm tại Hoa Kỳ. Điều đáng lo ngại là bệnh có khả năng di căn nhanh và tỷ lệ sống sót giảm đáng kể nếu không được phát hiện sớm, từ 98% ở giai đoạn sớm xuống còn 25% khi đã di căn. Trong những năm gần đây, sự phát triển của công nghệ học sâu và hệ thống CAD/CADx đã cho thấy tiềm năng to lớn trong việc hỗ trợ chẩn đoán sớm ung thư da, với độ chính xác có thể so sánh với các chuyên gia da liễu. Tuy nhiên, thách thức lớn nhất trong việc phát triển các hệ thống này là sự mất cân bằng nghiêm trọng của dữ liệu y tế, khi số lượng mẫu bệnh lý ác tính thường ít hơn nhiều so với các trường hợp lành tính.

Trong những năm gần đây, học sâu đã ghi dấu ấn mạnh mẽ trong lĩnh vực phân loại ảnh y tế, đặc biệt là với các bài toán liên quan đến tổn thương da. Esteva và cộng sự đã tiên phong khi ứng dụng mạng nơ-ron tích chập (CNN) dựa trên kiến trúc Inception-v3 để phân loại tổn thương da, đạt hiệu suất ngang tầm với các bác sĩ da liễu chuyên môn. Nghiên cứu này được thực hiện trên một tập dữ liệu khổng lồ gồm 129.450 hình ảnh lâm sàng, mở ra tiềm năng to lớn của học sâu trong chẩn đoán y khoa. Trong khi đó, Syed và cộng sự đã khai thác kỹ thuật tinh chỉnh (fine-tuning) trên mạng DenseNet với tập dữ liệu HAM10000, nâng cao đáng kể khả năng nhận diện các loại tổn thương da khác nhau. Zhang và cộng sự lại tập trung vào việc cải thiện hiệu suất trên dữ liệu mất cân bằng bằng cách kết hợp EfficientNet-B4 với hàm mất mát focal loss, đạt được độ chính xác cân bằnglên đến 85,7%. Ngoài ra, Chaturvedi và cộng sự đã đề xuất một phương pháp phân loại ung thư da cho 7 lớp sử dụng MobileNet, tận dụng tính nhẹ và hiệu quả của mô hình này để triển khai trên các thiết bị hạn chế tài nguyên. Tương tự, Lucius và cộng sự đã phát triển các khung mạng nơ-ron sâu nhằm hỗ trợ bác sĩ tổng quát trong việc phân loại tổn thương da có sắc tố, với kết quả cải thiện độ chính xác đáng kể, đạt diện tích dưới đường cong ấn tượng trên tập dữ liệu thực tế.

Tuy nhiên, các nghiên cứu trên vẫn đối mặt với những hạn chế nhất định, đặc biệt là vấn đề mất cân bằng dữ liệu - một thách thức phổ biến trong các tập dữ liệu y tế như ISIC 2018, nơi tỷ lệ mẫu giữa các lớp có thể chênh lệch lên đến 60 lần. Sự mất cân bằng này khiến mô hình dễ bị thiên lệch về các lớp chiếm ưu thế, làm giảm khả năng nhận diện các lớp thiểu số - vốn thường liên quan đến các tình trạng bệnh hiếm gặp nhưng quan trọng. Để khắc phục, nhiều giải pháp đã được đề xuất. Chẳng hạn, việc lấy mẫu lại giúp cân bằng số lượng mẫu giữa các lớp, nhưng có thể dẫn đến mất thông tin quan trọng khi giảm mẫu hoặc tạo ra dữ liệu nhân tạo không thực tế khi tăng mẫu. Việc học nhạy chi phí điều chỉnh trọng số của các lớp trong hàm mất mát, nhưng hiệu quả phụ thuộc lớn vào cách lựa chọn trọng số, vốn không phải lúc nào cũng tối ưu. Việc học theo nhóm kết hợp nhiều mô hình để tăng độ bền, song lại đòi hỏi tài nguyên tính toán lớn và phức tạp trong triển khai. Lin và cộng sự giới thiệu focal loss để tập trung vào các mẫu khó, nhưng việc lựa chọn các siêu tham số không phải lúc nào cũng dễ dàng và cách tiếp cận này đôi khi bỏ qua sự đóng góp của các mẫu dễ phân loại, dẫn đến hiệu suất không đồng đều. Wang và cộng sự tích hợp tăng cường dữ liệu với DenseNet-121, đạt độ chính xác 87,3%, nhưng phương pháp này thiếu cơ chế kiểm soát tỷ lệ mẫu một cách linh hoạt, dễ gây quá khớp trên các lớp thiểu số. Trong khi đó, nghiên cứu của Chaturvedi và cộng sự tuy hiệu quả với MobileNet, lại chưa giải quyết triệt để vấn đề mất cân bằng dữ liệu, còn Lucius và cộng sự tập trung chủ yếu vào hỗ trợ lâm sàng mà không tối ưu hóa cho các tập dữ liệu đa dạng.

Trong bài báo này, tác giả tập trung vào việc phát hiện tổn thương da với trọng tâm là xử lý việc mất cân bằng dữ liệu vốn dẫn đến sự thiên lệch trong các kết quả phân loại. Dữ liệu được sử dụng là bộ HAM10000. Những đóng góp chính trong nghiên cứu này bao gồm những nội dung sau. Thứ nhất, tác giả áp dụng xử lý mất cân bằng dựa trên việc kết hợp các kỹ thuật về chuẩn hóa, tăng cường dữ liệu cũng như hiệu chỉnh hàm mất mát. Thứ hai, tác giả tiến hành thử nghiệm có tính so sánh với nhiều trường hợp khác nhau của các mô hình học sâu như ConvNeXtTiny, Inception ResNet v2, MobileNet V3 Small và Densenet 201 cho các trường hợp áp dụng và không áp dụng xử lý mất cân bằng để nội dung thử nghiệm được toàn diện. Cuối cùng, tác giả làm rõ hiệu quả của phương pháp xử lý mất cân bằng trên cơ sở phân tích chi tiết các trường hợp thử nghiệm với việc các độ đo tổng quát trên tập dữ liệu cũng như riêng rẽ trên từng lớp tổn thương. Bên cạnh đó, tác giả cũng tiến hành so sánh những kết quả đạt được với nghiên cứu khác cũng thử nghiệm trên tập dữ liệu HAM10000 và thảo luận.

Các thử nghiệm được tiến hành trên bộ HAM10000 với 7 loại tổn thương khác nhau và có sự mất cân bằng đáng kể giữa các lớp. Theo đó, nghiên cứu của tác giả tập trung vào việc xử lý mất cân bằng dữ liệu, giúp tăng sự hiệu quả trong việc nhận dạng các lớp thiểu sô nhưng vẫn cần đảm bảo hiệu năng trên các lớp đa sô. Tác giả cũng tiến hành thử nghiệm có tính toàn diện và so sánh với ConvNeXtTiny, DenseNet 201, Inception-ResNet-v2, và MobileNet-v3 Small để thảo luận làm rõ giả thuyết. Nghiên cứu đã khẳng định ưu thế vượt trội của phương pháp đê xuất với độ chính xác cân bằng cao nhất là 0,7584 và độ chính xác trên toàn tập 0,8408 cho mô hình ConvNeXtTiny.

Nghiên cứu đã khẳng định hiệu quả của việc kết hợp các kỹ thuật xử lý mất cân bằng dữ liệu với các mô hình học sâu hiện đại trong bài toán phân loại ảnh y tế. Kết quả này góp phần mở ra hướng phát triển các hệ thống hỗ trợ chẩn đoán tự động, giúp phát hiện sớm ung thư da, hỗ trợ các bác sĩ trong quá trình chẩn đoán và nâng cao chất lượng chăm sóc sức khỏe. Trong tương lai, phương pháp này có thể được mở rộng để áp dụng cho nhiều loại bệnh khác và các bài toán phân loại ảnh y tế phức tạp hơn, góp phần thúc đẩy ứng dụng trí tuệ nhân tạo trong lĩnh vực y tế thông minh.

Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ