Nam sinh Bách khoa biến AI thành 'trợ lý' cho bác sĩ nội soi
Ngọc Thăng, sinh viên năm thứ tư ngành Truyền thông số và Kỹ thuật đa phương tiện, đã phát triển mô hình LViTES (Leveraging Vision and Text for Endoscopic Segmentation) ứng dụng trí tuệ nhân tạo (AI) để hỗ trợ bác sĩ trong chẩn đoán nội soi.
LViTES: Trợ lý AI trong chẩn đoán nội soi
LViTES có khả năng phân đoạn các tổn thương trong ảnh nội soi, tự động xác định và khoanh vùng các khu vực nghi ngờ như polyp, viêm loét, hoặc các dấu hiệu tiền ung thư. Điểm đặc biệt, mô hình này kết hợp phân tích hình ảnh với bệnh án hoặc ghi chú từ bác sĩ để tăng độ chính xác chẩn đoán.
Mô hình đã được thử nghiệm thành công trên bộ dữ liệu Kvasir-SEG, một tập dữ liệu mở chứa các ảnh về tình trạng polyp trong hệ tiêu hóa.
Hành trình nghiên cứu và phát triển
Niềm đam mê với thị giác máy tính của Thăng bắt đầu từ môn Xử lý ảnh số. Dưới sự hướng dẫn của PGS. TS Trần Thị Thanh Hải, giảng viên trường Điện - Điện tử, Thăng tiếp cận bài toán ứng dụng AI trong phân tích ảnh nội soi y tế.
Quá trình này giúp Thăng nhận thấy những khó khăn mà các bác sĩ gặp phải trong việc phân tích hình ảnh nội soi. Từ đó, Thăng bắt tay vào nghiên cứu và phát triển LViTES.
Các giai đoạn phát triển
Quá trình nghiên cứu được chia thành ba giai đoạn chính:
- Thu thập và xử lý dữ liệu từ bộ dữ liệu Kvasir-SEG và hình ảnh nội soi ung thư dạ dày, thực quản.
- Xây dựng và huấn luyện mô hình trên nền tảng mạng nơ-ron tích chập (CNN) EfficientNet và kiến trúc Transformer, kết hợp thông tin hình ảnh với văn bản.
- Thử nghiệm mô hình trên bộ dữ liệu thực tế, cho thấy hiệu suất vượt trội, đặc biệt là về độ chính xác phân vùng.
Kết quả và đánh giá
Quá trình đánh giá được thực hiện dựa trên các chỉ số phổ biến trong thị giác máy tính như IoU và Dice coefficient, kết hợp với định hướng khoa học từ PGS Hải và đánh giá của các chuyên gia y tế.
Kết quả thử nghiệm với hình ảnh nội soi ung thư dạ dày, thực quản cho thấy LViTES vượt trội hơn các phương pháp truyền thống về độ chính xác phân vùng.
Thăng tự nhận thấy cách tiếp cận của mình có phần khác biệt so với các nghiên cứu hiện tại. Anh nhấn mạnh tầm quan trọng của khả năng tự học, tinh thần kiên trì và nền tảng toán học vững chắc trong quá trình nghiên cứu.
Đánh giá từ giảng viên hướng dẫn
PGS. TS Trần Thị Thanh Hải đánh giá cao sự điềm đạm, nỗ lực và nền tảng kỹ thuật vững vàng của Thăng. Cô nhận xét Thăng đã lựa chọn một hướng đi mới trong lĩnh vực nghiên cứu về mô hình thị giác - ngôn ngữ (Visual Language Models – VLM).
“Em ấy luôn kiên định với chủ đề mình lựa chọn và nỗ lực giải quyết các vấn đề một cách trọn vẹn. Đây là một nỗ lực sáng tạo rất đáng ghi nhận,” cô Hải chia sẻ.
Hướng phát triển trong tương lai
Ngọc Thăng dự định tiếp tục theo đuổi hướng nghiên cứu ứng dụng AI trong lĩnh vực y tế. Anh đang phát triển phiên bản nâng cao của mô hình, hướng tới việc trở thành công cụ hỗ trợ đắc lực cho bác sĩ nội soi trong phát hiện sớm và chính xác.
Ngoài ra, Thăng cũng có kế hoạch mở rộng ứng dụng của mô hình sang các lĩnh vực chẩn đoán hình ảnh khác như X-quang và CT scan.
Theo Phương Anh - Huyền Trang
```
bình luận (0)
Vui lòng Đăng nhập để bình luận
Chưa có bình luận nào
Hãy là người đầu tiên bình luận về bài viết này