Luận văn Phân tích dữ liệu sinh viên tốt nghiệp bằng phương pháp trực quan
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Phân tích dữ liệu sinh viên tốt nghiệp bằng phương pháp trực quan", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
File đính kèm:
luan_van_phan_tich_du_lieu_sinh_vien_tot_nghiep_bang_phuong.pdf
Nội dung tài liệu: Luận văn Phân tích dữ liệu sinh viên tốt nghiệp bằng phương pháp trực quan
- NGUY BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VN Ễ N TH HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Ị HOÀNG Y Ế N Nguyễn Thị Hoàng Yến H Ệ TH Ố NG THÔNG TIN NG PHÂN TÍCH DỮ LIỆU SINH VIÊN TỐT NGHIỆP BẰNG PHƯƠNG PHÁP TRỰC QUAN LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH 2021 Thành phố Hồ Chí Minh - 2021
- BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VN HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Hoàng Yến PHÂN TÍCH DỮ LIỆU SINH VIÊN TỐT NGHIỆP BẰNG PHƯƠNG PHÁP TRỰC QUAN Chuyên ngành : Hệ Thống Thông Tin. Mã số : 8480104 LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRẦN VĨNH PHƯỚC Thành phố Hồ Chí Minh – 2021
- i LỜI CAM KẾT Tôi cam đoan đây là công trình nghiên cứu của cá nhân tôi, xuất phát từ nhu cầu thực tế trong quá trình học tập cao học, cũng như nhu cầu biểu diễn và phân tích trực quan của Trường Cao đẳng Giao thông Vận tải. Dữ liệu sử dụng trong nghiên cứu được thu thập tại Trường Cao đẳng Giao thông Vận tải Trung ương III. Trong quá trình nghiên cứu của luận văn, các tài liệu trích dẫn và tham khảo có nguồn gốc rõ ràng. Kết quả của luận văn nghiên cứu Phân tích dữ liệu sinh viên tốt nghiệp bằng phương pháp trực quan được đặt ra nhằm tìm kiếm thông tin hữu ích liên quan đến việc hình thành hoặc bổ sung các thông tin hỗ trợ nâng cao chất lượng đào tạo của Trường là trung thực. Tác giả luận văn Nguyễn Thị Hoàng Yến
- ii LỜI CẢM ƠN Trong quá trình thực hiện luận văn “Phân tích dữ liệu sinh viên tốt nghiệp bằng phương pháp trực quan”, tôi đã nhận được nhiều sự hỗ trợ, chỉ dẫn từ phía Thầy Cô, các cá nhân và tổ chức sau: Tôi xin chân thành cảm ơn sâu sắc đến Thầy hướng dẫn chính PGS.TS. Trần Vĩnh Phước đã tận tình dìu dắt, hướng dẫn, góp ý, chỉnh sửa, chỉ dạy các kiến thức trực quan, khai phá dữ liệu, hệ thống thông tin để tôi hoàn thành luận văn này. Trân trọng cảm ơn TS. Trương Nguyên Vũ – Viện trưởng viện Cơ học và Tin học ứng dụng thuộc Viện Hàn Lâm Khoa Học đã tạo điều kiện cho lớp học tốt nhất, mời nhiều nhà giáo ưu tú nhất để lớp học thành công tốt đẹp. Tôi xin gởi lời cảm ơn đến Quý bạn Viện Cơ Học và Tin Học Ứng Dụng, Trường Cao đẳng Giao thông Vận tải Trung ương III đã đóng góp ý kiến xây dựng dữ liệu ban đầu. Tôi cũng xin được gửi lời cảm ơn đến Ban Giám đốc Học Viện, Phòng đào tạo Sau Đại học, các Thầy, Cô trong Khoa Hệ thống thông tin và viễn thông, Học Viện Khoa học và Công nghệ, Viện Cơ Học và Tin Học Ứng Dụng đã tạo mọi điều kiện và môi trường nghiên cứu học tập tốt nhất. Tác giả luận văn Nguyễn Thị Hoàng Yến
- iii DANH MỤC CHỮ VIẾT TẮT TÊN VIẾT TẮT KÍ HIỆU DIỄN GIẢI SV Sinh viên
- iv DANH MỤC CÁC BẢNG BIỂU Bảng 2.1: Bảng điểm tốt nghiệp của Sinh viên ............................................... 11 Bảng 2.2: Bảng điểm tốt nghiệp sinh viên tốt nghiệp và có việc làm ............ 11 Bảng 3.1: Bảng dữ liệu sinh viên xử lý ........................................................... 14 Bảng 3.2: Bảng dữ liệu điểm SV thuật toán K -Means .................................. 33 Bảng 3.3: Bảng dữ liệu cụm ngẫu nhiên k = 1 ................................................ 34 Bảng 3.4: Bảng kết quả khoảng cách đến tâm cụm ........................................ 34 Bảng 3.5: Bảng kết quả phân cụm .................................................................. 35 Bảng 3.6: Bảng tính kết quả tâm cụm ............................................................. 36 Bảng 3.7: Kết quả khoảng cách sinh viên đến tâm cụm ................................. 37 Bảng 3.8: Bảng kết quả phân cụm mới ........................................................... 37 Bảng 3.9: Bảng dữ liệu tính lại tâm cụm ........................................................ 38 Bảng 3.10: Bảng kết quả số liệu đến tâm cụm mới ........................................ 39 Bảng 3.11: Bảng kết quả phân cụm mới ......................................................... 39 Bảng 3.12: Bảng dữ liệu SV phân cụm ........................................................... 40 Bảng 4.1: Bảng phân tích câu hỏi ................................................................... 46
- v DANH SÁCH CÁC HÌNH Hình 2.1: Biểu đồ minh họa trực quan .............................................................. 3 Hình 2.2: Biểu đồ cột đứng ............................................................................... 4 Hình 2.3: Biểu đồ Pareto Chart ......................................................................... 4 Hình 2.4: Biểu đồ Area ..................................................................................... 5 Hình 2.5: Biểu đồ Line ...................................................................................... 6 Hình 2.6: Biểu đồ Line Point ............................................................................ 6 Hình 2.7: Sơ đồ thuật toán K - Mean ................................................................ 7 Hình 2.8: Minh họa thành phần Matplotlib figure [10] .................................... 9 Hình 3.1: Biểu đồ cột biểu diễn điểm toàn khóa Sinh Viên ........................... 20 Hình 3.2: Biểu đồ dạng đường biểu diễn điểm Sinh viên Cơ khí động lực .... 20 Hình 3.3: Biểu đồ dạng đường biểu diễn điểm Sinh viên Cơ khí chế tạo ...... 21 Hình 3.4: Biểu đồ dạng đường biểu diễn điểm Sinh viên Khoa Điện ............ 21 Hình 3.5: Biểu đồ dạng đường biểu diễn điểm Sinh viên toàn khóa .............. 22 Hình 3.6: Biểu đồ đường so sánh biểu diễn điểm Sinh viên Cơ khí động lực 22 Hình 3.7: Biểu đồ đường so sánh biểu diễn điểm Sinh viên Cơ khí chế tạo .. 23 Hình 3.8: Biểu đồ đường so sánh biểu diễn điểm Sinh viên Khoa Điện ........ 23 Hình 3.9: Biểu đồ đường so sánh biểu diễn điểm Sinh viên toàn khóa .......... 24 Hình 3.10: Biểu đồ đường điểm biểu diễn điểm SV Cơ khí động lực ............ 24 Hình 3.11: Biểu đồ đường điểm biểu diễn điểm SV Cơ chế tạo .................... 25 Hình 3.12: Biểu đồ đường điểm biểu diễn điểm SV Khoa Điện .................... 25 Hình 3.13: Biểu đồ đường điểm biểu diễn điểm Sinh viên toàn khóa ............ 26 Hình 3.14: Biểu diễn điểm chuyên ngành và điểm tốt nghiệp SV.................. 26 Hình 3.15: Biểu diễn điểm chuyên ngành, tốt nghiệp SV .............................. 27 Hình 3.16: Điểm trung bình tốt nghiệp SV ..................................................... 27 Hình 3.17: Biểu diễn điểm SV có việc và chưa có việc ................................. 28 Hình 3.18: Biểu diễn điểm SV có việc và chưa có việc ................................. 28 Hình 3.19: Biểu diễn 3 chiều điểm SV năm 1 ................................................ 29 Hình 3.10: Biểu diễn 3 chiều điểm SV năm 2 ................................................ 29 Hình 3.21: Biểu diễn 3 chiều điểm SV năm 3 ................................................ 30 Hình 3.22: Biểu diễn 3 chiều điểm SV chuyên ngành .................................... 31 Hình 3.23: Biểu diễn 3 chiều điểm tốt nghiệp SV .......................................... 31
- vi Hình 3.24: Biểu diễn điểm SV khoa cơ khí động lực ..................................... 32 Hình 3.25: Biểu diễn 3 chiều điểm SV cơ khí chế tạo .................................... 32 Hình 3.26: Biểu diễn 3 chiều điểm SV khoa điện ........................................... 32 Hình 3.27: Nhận file dữ liệu Excel ................................................................. 41 Hình 3.28: Phân cụm với K =3 ....................................................................... 41 Hình 3.29: Phâm cụm với K = 5 ..................................................................... 42 Hình 3.30: Phân cụm K = 10 ........................................................................... 42 Hình 3.31: Kết quả phân cụm theo K .............................................................. 43 Hình 3.32: Phân cụm với K = 5 ...................................................................... 43 Hình 3.33: Phâm cụm điểm Ycn và Ytn SV với K = 5 .................................. 44 Hình 3.34: Kết quả phân cụm điểm Ycn, Ytn của SV với K = 10 ................. 45 Hình 4.1: Biểu đồ điểm toàn khóa học SV ..................................................... 46 Hình 4.2: Điểm chuyên ngành và tốt nghiệp SV ............................................ 47 Hình 4.3: Biểu đồ 3D điểm SV Y1, Y2, Y3, Ycn, Ytn................................... 48 Hình 4.4: Điểm năm 1, 2, 3 với K =10 ........................................................... 48 Hình 4.5: Điểm chuyên ngành Ycn, Ytn của SV với K = 10 ......................... 49
- vii MỤC LỤC LỜI CAM KẾT .................................................................................................. i LỜI CẢM ƠN ................................................................................................... ii DANH MỤC CHỮ VIẾT TẮT ....................................................................... iii DANH MỤC CÁC BẢNG BIỂU .................................................................... iv DANH SÁCH CÁC HÌNH ............................................................................... v MỤC LỤC ....................................................................................................... vii CHƯƠNG 1: GIỚI THIỆU ............................................................................... 1 1.1 Đặt vấn đề ............................................................................................. 1 1.2 Mục tiêu nghiên cứu ............................................................................. 1 1.3 Đối tượng và phạm vi nghiên cứu ........................................................ 1 1.4 Phương pháp nghiên cứu ...................................................................... 1 CHƯƠNG 2: TỔNG QUAN TÀI LIỆU NGHIÊN CỨU ................................. 3 2.1 Lý thuyết về trực quan hoá ................................................................... 3 2.2 Lý thuyết về phân cụm dữ liệu theo thuật toán K-Means .................... 6 2.3 Các tài liệu nghiên cứu phương pháp trực quan ...................................... 8 2.4 Trực quan hoá điểm tốt nghiệp sinh viên hiện thực hóa Python ............. 9 2.4.1 Thư viện Matplotlib ........................................................................... 9 2.4.2 Thư viện Pandas ............................................................................... 10 2.4.3 Thư viện numpy ............................................................................... 10 2.4.4 Thư viện Scikit – learn ..................................................................... 10 2.5 Khảo sát dữ liệu điểm sinh viên ............................................................. 11 CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU ............................................ 12 3.1 Xác định các biến và mô tả biểu đồ biểu diễn dữ liệu ........................... 12 3.1.1 Danh sách các biến .......................................................................... 12 3.1.2 Mô tả các biến .................................................................................. 12
- viii 3.1.3 Xây dựng hàm toán học cho các biến .............................................. 14 3.2 Xây dựng biểu đồ trực quan hóa các biến dữ liệu điểm sinh viên ......... 14 3.2.1 Xây dựng bản dữ liệu điểm sinh viên .............................................. 14 3.2.2 Xây dựng biểu đồ 2D ....................................................................... 19 3.2.3 Xây dựng biểu đồ trực quan 3D ................................................... 29 3.3 Phương pháp chuyên gia phân cụm dữ liệu theo thuật toán K - Means 33 3.3.1 Xây dựng dữ liệu phân cụm dữ liệu theo thuật toán K - Means ...... 33 3.3.2 Xây dựng ứng dụng phân cụm K -Means bằng Python .................. 40 CHƯƠNG 4: XÂY DỰNG TẬP CÂU HỎI PHÂN TÍCH ............................ 46 4.1 Xây dựng tập dữ liệu câu hỏi phân tích và trả lời ........................... 46 4.2 Xây dựng tập câu hỏi và trả lời theo K – Means ............................. 48 CHƯƠNG 5: KẾT LUẬN .............................................................................. 50 TÀI LIỆU THAM KHẢO ............................................................................... 51 PHỤ LỤC CODE ............................................................................................ 53

