Luận văn Nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc

pdf 75 trang Quỳnh Hoa 27/10/2025 80
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_nghien_cuu_mot_so_phuong_phap_khai_pha_du_lieu_phat.pdf

Nội dung tài liệu: Luận văn Nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Hà NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC LUẬN VĂN THẠC SĨ: NGÀNH MÁY TÍNH Hà Nội – 2021
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Hà NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC Chuyên ngành: Hệ thống thông tin Mã số: 8480104 LUẬN VĂN THẠC SĨ: NGÀNH MÁY TÍNH CÁN BỘ HƯỚNG DẪN KHOA HỌC Hướng dẫn 1: TS. Trần Mạnh Tuấn Hướng dẫn 2: TS. Nguyễn Như Sơn Hà Nội – Năm 2021
  3. Lời cam đoan Tôi xin cam đoan luận văn này là do tôi thực hiện, không sao chép lại của người khác. Nội dung trong luận văn là của cá nhân nghiên cứu và được tổng hợp từ nhiều nguồn tài liệu, các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn đúng quy cách. Nếu có gì sai sót, tôi xin chịu mọi trách nhiệm. Hà nội, 03/2021 Nguyễn Thị Hà
  4. Lời cảm ơn Tôi xin dành sự biết ơn chân thành đến TS. Trần Mạnh Tuấn, Giảng viên Khoa Công nghệ thông tin, Trường Đại học Thủy Lợi – Người thầy đã trực tiếp hướng dẫn và tận tình chỉ bảo tôi trong quá trình thực hiện khóa luận. Tôi xin cảm ơn TS. Nguyễn Như Sơn, Trưởng phòng CNTT, Viện Công nghệ thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã góp ý, hướng dẫn và cung cấp tài liệu để tôi hoàn thành tốt luận văn này. . Tôi xin cảm ơn toàn thể giảng viên Học viện Khoa học và Công nghệ đã truyền đạt cho tôi những kiến thức và kỹ năng nghiên cứu trong suốt quá trình học tập tại Trường. Cuối cùng, tôi xin chân thành cảm ơn gia đình và bạn bè, những người đã luôn ủng hộ và giúp đỡ tôi trong thời gian học tập và thực hiện khóa luận. Với khả năng của mình, tôi đã cố gắng hoàn thành luận văn của mình tốt nhất, nhưng chắc chắn luận văn vẫn còn nhiều thiếu sót, tôi rất mong nhận được thêm góp ý và chỉ bảo từ phía quý thầy cô và các bạn.
  5. Danh mục các ký hiệu và chữ viết tắt Tên viết tắt Ý nghĩa WHO Tổ chức Y tế Thế giới (World Health Organization) FDA Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (U.S Food and Drug Administration) TNLS Thử nghiệm lâm sàng UMC Trung tâm giám sát Uppsala WHO-UCM Trung tâm giám sát Uppsala (UMC) của Tổ chức Y tế Thế giới (WHO) (World Health Organization-Uppsala Monitoring Center) ADR Phản ứng có hại của thuốc (Adverse Drug Reaction) NSD Người sử dụng CSDL Cơ sở dữ liệu KPDL Khai phá dữ liệu Trung tâm Trung tâm Quốc gia về thông tin thuốc và DI&ADR Quốc gia theo dõi phản ứng có hại của thuốc
  6. Danh mục các bảng Bảng 1.1 – Các thành phần chính của hệ thống .............................................. 22 Bảng 2.1 - Thống kê số dữ liệu theo thuốc R và phản ứng T ......................... 25 Bảng 2.2 - Thống kê dữ liệu theo thuốc R và phản ứng T .............................. 30 Bảng 2.3 - Thống kê dữ liệu theo Thuốc R và phản ứng T ............................ 34 Bảng 3.1 - Bảng dữ liệu một vài bản ghi trong bộ dữ liệu. ............................ 41 Bảng 3.2 – Danh sách thuốc có số lần xuất hiện nhiều nhất ........................... 43 Bảng 3.3 – Danh sách 50 ADR có số lần xuất hiện nhiều nhất ...................... 48
  7. Danh mục các hình vẽ, đồ thị Hình 1.1 - Quy trình khám phá tri thức ........................................................... 10 Hình 1.2 - Các bước của quá trình khai phá dữ liệu ....................................... 12 Hình 1.3 - Mục đích chính của khai phá dữ liệu ............................................. 13 Hình 1.4 - Mô hình mô tả giai đoạn phân lớp ................................................. 14 Hình 1.5 - Ví dụ về phân tích khai phá dữ liệu mô tả ..................................... 16 Hình 1.6 - Mô tả giai đoạn gom cụm sử dụng khai phá dữ liệu mô tả .......... 16 Hình 1.7 - Mô tả giai đoạn khai phá luật kết hợp của bài toán giỏ hàng ........ 17 Hình 1.8 – Kiến trúc tổng thể .......................................................................... 22 Hình 3.1 – Dữ liệu ADR trong hệ thống ......................................................... 51 Hình 3.2 – Kết quả khai phá dữ liệu Apriori với độ hỗ trợ 70 ....................... 52 Hình 3.3 – Kết quả phương pháp WHO-UCM với độ hỗ trợ 70 .................... 53 Hình 3.4 – Kết quả phương pháp FDA với độ hỗ trợ 70 ................................ 56 Hình 3.5 – Kết quả khai phá dữ liệu Apriori với độ hỗ trợ 80 ....................... 58 Hình 3.6 – Kết quả phương pháp WHO-UCM với độ hỗ trợ 80 .................... 59 Hình 3.7 – Kết quả phương pháp FDA với độ hỗ trợ 80 ................................ 61 Hình 3.8 – Kết quả khai phá dữ liệu Apriori với độ hỗ trợ 100 ..................... 62 Hình 3.9 – Kết quả phương pháp WHO-UCM với độ hỗ trợ 100 .................. 63 Hình 3.10 – Kết quả phương pháp FDA với độ hỗ trợ 100 ............................ 64
  8. 1 MỤC LỤC MỞ ĐẦU ......................................................................................................... 3 CHƯƠNG 1: GIỚI THIỆU ........................................................................... 5 1.1. GIỚI THIỆU CHUNG VỀ LĨNH VỰC CẢNH GIÁC DƯỢC ...... 5 1.1.1. Hoạt động cảnh giác dược tại Việt Nam [4] ............................. 5 1.1.2. Hoạt động cảnh giác dược tại Mỹ ............................................. 6 1.1.3. Hoạt động cảnh giác dược của tổ chức y tế thế giới [6] ........... 7 1.2. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU ...................................... 9 1.2.1. Giới thiệu chung ........................................................................ 9 1.2.2. Giới thiệu về Khai phá dữ liệu ................................................ 10 1.2.3. Ý nghĩa và vai trò của Khai phá dữ liệu ................................. 17 1.2.4. Bài toán khai phá dữ liệu ........................................................ 18 1.3. TỔNG QUAN VÀ MỤC TIÊU CỦA ĐỀ TÀI ............................. 19 1.3.1. Tổng quan của đề tài ............................................................... 19 1.3.2. Mục tiêu của đề tài .................................................................. 20 1.3.3. Phương pháp thực hiện ........................................................... 20 1.3.4. Công cụ, ngôn ngữ lập trình .................................................... 21 CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC ....................................................................................... 24 2.1. BÀI TOÁN PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC . 24 2.2. SỬ DỤNG THUẬT TOÁN KHAI PHÁ DỮ LIỆU APRIORI ĐỂ PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC ................................. 25 2.2.1. Một số khái niệm trong luật kết hợp ....................................... 25 2.2.2. Khai phá luật kết hợp .............................................................. 26 2.2.3. Thuật toán Apriori ................................................................... 27 2.3. NGHIÊN CỨU VÀ ÁP DỤNG PHƯƠNG PHÁP FDA ĐỂ GIẢI BÀI TOÁN PHÁT HIỆU ADR ................................................................ 29 2.3.1. Giới thiệu chỉ số thống kê RR ................................................. 29 2.3.2. Nghiên cứu phương pháp FDA ............................................... 30 2.3.3. Thuật toán áp dụng .................................................................. 32
  9. 2 2.4. NGHIÊN CỨU VÀ ÁP DỤNG PHƯƠNG PHÁP WHO-UMC ĐỂ TÌM RA PHẢN ỨNG CÓ HẠI CỦA THUỐC ........................................ 33 2.4.1. Giới thiệu chỉ số thống kê OR ................................................ 33 2.4.2. Nghiên cứu phương pháp WHO-UCM ................................... 34 2.4.3. Thuật toán áp dụng .................................................................. 36 CHƯƠNG 3: THỬ NGHIỆM CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU PHÁT HIỆN PHẢN ỨNG CÓ HẠI CỦA THUỐC ......................... 38 3.1. ÁP DỤNG CÁC THUẬT TOÁN CHO BÀI TOÁN PHÁT HIỆN TÍN HIỆU .................................................................................................. 38 3.2. MÔ TẢ DỮ LIỆU THỬ NGHIỆM ............................................... 40 3.3. CÁC BƯỚC THỰC HIỆN THỬ NGHIỆM ................................. 51 3.4. KẾT QUẢ THỬ NGHIỆM ........................................................... 52 3.4.1. Thử nghiệm lần 1 .................................................................... 52 3.4.2. Thử nghiệm lần 2 .................................................................... 57 3.4.3. Thử nghiệm lần 3 .................................................................... 62 3.4.4. Kết luận ................................................................................... 64 CHƯƠNG 4: KẾT LUẬN VÀ KIẾN NGHỊ ............................................... 66 4.1. KẾT LUẬN. ....................................................................................... 66 4.2. ĐỊNH HƯỚNG PHÁT TRIỂN ĐỀ TÀI ............................................ 66
  10. 3 MỞ ĐẦU Trong những năm gần đây, các phương tiện lưu trữ có dung lượng ngày càng lớn, các hệ quản trị cơ sở dữ liệu ngày càng nhiều, cung cấp cho người dùng khả năng lưu trữ không giới hạn. Dữ liệu tuy nhiều nhưng giá trị tri thức mà nó chứa đựng lại chưa được sử dụng một cách hiệu quả. Với những thành công trong các công trình nghiên cứu về lĩnh vực khai phá dữ liệu, con người đã khai thác được những giá trị tri thức từ các dữ liệu được lưu trữ, và sử dụng chúng để giải quyết nhiều bài toán trong các lĩnh vực quan trọng trong đời sống. Trong ngành y tế, mục đích của dùng thuốc là chữa bệnh, phòng bệnh, phục hồi, điều chỉnh chức năng của cơ thể, làm giảm triệu chứng bệnh, chẩn đoán bệnh, phục hồi hoặc nâng cao sức khoẻ cho con người. Tuy nhiên, mặt trái của thuốc là có thể gây ra các phản ứng có hại ở nhiều mức độ, thậm chí tử vong kể cả khi dùng đúng liều, đúng quy định [1]. Theo định nghĩa của Tổ chức Y tế thế giới (WHO), ADR (Adverse Drug Reactions) là “phản ứng gây hại đáng kể hoặc bất lợi xảy ra sau một can thiệp có liên quan đến việc sử dụng thuốc. Một phản ứng có hại có thể là cơ sở để dự đoán được mức độ nguy hại của việc sử dụng thuốc này để phòng, điều trị, điều chỉnh liều hoặc ngừng thuốc” [2]. Cũng theo WHO, các phản ứng có hại của thuốc với mức độ nghiêm trọng có thể xảy ra ở bất kỳ liều dùng nào, khi phản ứng có hại xảy ở mức độ nặng có thể gây ra tử vong, nguy hại đến tính mạng, ở thể nhẹ hơn nó có thể làm cho người bệnh nhập viện hoặc kéo dài thời gian nằm viện, gây ra tàn tật hoặc suy giảm chức năng vĩnh viễn, gây dị tật bẩm sinh hoặc khiếm khuyết khi sinh [3]. Các vấn đề liên quan đến ADR được coi là trọng tâm của các nghiên cứu Cảnh giác Dược, do đó hầu hết các quốc gia đều có trung tâm hoặc đơn vị cảnh giác dược để tiến hành phân tích, theo dõi ADR. Ở Việt Nam, thông tin về phản ứng phụ của thuốc trong quá trình điều trị (báo cáo ADR) xảy ra tại các cơ sở khám chữa bệnh trên cả nước được gửi về trung tâm Cảnh giác dược Quốc gia. Dựa vào các số liệu ADR của các cơ sở khám chữa bệnh, Trung tam Cảnh giác dược Quốc gia phân tích phát hiện tín hiệu của những ADR