Data Classification and Incremental Clustering in Data Mining and Machine Learning
Cập nhật vào: Thứ ba - 28/11/2023 02:25
Nhan đề chính: Data Classification and Incremental Clustering in Data Mining and Machine Learning
Nhan đề dịch: Phân loại dữ liệu và gom cụm gia tăng trong khai thác dữ liệu và học máy
Tác giả: Sanjay Chakraborty, Sk Hafizul Islam, Debabrata Samanta
Nhà xuất bản: Springer Cham
Năm xuất bản: 2022
Số trang: 217 tr.
Ngôn ngữ: Tiếng Anh
ISBN: 978-3-030-93088-2
SpringerLink
Lời giới thiệu: Đây là một một cuốn sách hướng dẫn thực hành một cách toàn diện, về những kiến thức cơ bản trong việc khai thác dữ liệu và học máy, đặc biệt nhấn mạnh vào các phương pháp học có giám sát và không giám sát. Cuốn sách nhấn mạnh những cách suy nghĩ mới, cần thiết, để thành thạo trong học máy dựa trên nền tảng lập trình Python, R và Java. Đầu tiên là cung cấp các khái niệm về khai thác dữ liệu, học máy và ứng dụng của chúng, đặc biệt chú ý đến các kỹ thuật phân loại và phân cụm. Các tác giả đưa ra một cuộc thảo luận về kỹ thuật khai thác dữ liệu và học máy bằng các nghiên cứu điển hình kèm ví dụ. Cuốn sách cũng mô tả các ví dụ mã hóa thực hành của một số kỹ thuật học tập có giám sát và không giám sát nổi tiếng, bằng cách sử dụng ba nền tảng mã hóa khác nhau rất phổ biến gồm: R, Python và Java. Đồng thời giải thích một số kỹ thuật phân loại phổ biến nhất (K-NN, Phân loại Naive Bayes, Cây quyết định, Rừng ngẫu nhiên, Máy vectơ hỗ trợ,…) cùng với mô tả cơ bản về mạng nơ-ron nhân tạo và mạng nơ-ron sâu. Cuốn sách này hữu ích cho các chuyên gia, sinh viên đang nghiên cứu về khai thác dữ liệu và học máy cũng như các nhà nghiên cứu về kỹ thuật học có giám sát và không giám sát.
Từ khóa: Khai thác dữ liệu, học máy, phân cụm, Python, R, Java
Nội dung cuốn sách gồm những phần sau:
- Giới thiệu về khai thác dữ liệu và khám phá tri thức
- Khái niệm ngắn gọn về học máy
- Phân loại dữ liệu dựa trên học tập được giám sát và phân cụm tăng dần
- Phân loại dữ liệu và gom cụm gia tăng bằng cách sử dụng phương pháp học không giám sát
- Ý định nghiên cứu hướng tới gom cụm gia tăng
- Ứng dụng thời gian thực với khai thác dữ liệu và học máy
- Kỹ thuật lựa chọn tập hợp con tính năng với học máy
- Các tính năng của tập hợp con biến thể dựa trên khai thác dữ liệu
Nhan đề dịch: Phân loại dữ liệu và gom cụm gia tăng trong khai thác dữ liệu và học máy
Tác giả: Sanjay Chakraborty, Sk Hafizul Islam, Debabrata Samanta
Nhà xuất bản: Springer Cham
Năm xuất bản: 2022
Số trang: 217 tr.
Ngôn ngữ: Tiếng Anh
ISBN: 978-3-030-93088-2
SpringerLink
Lời giới thiệu: Đây là một một cuốn sách hướng dẫn thực hành một cách toàn diện, về những kiến thức cơ bản trong việc khai thác dữ liệu và học máy, đặc biệt nhấn mạnh vào các phương pháp học có giám sát và không giám sát. Cuốn sách nhấn mạnh những cách suy nghĩ mới, cần thiết, để thành thạo trong học máy dựa trên nền tảng lập trình Python, R và Java. Đầu tiên là cung cấp các khái niệm về khai thác dữ liệu, học máy và ứng dụng của chúng, đặc biệt chú ý đến các kỹ thuật phân loại và phân cụm. Các tác giả đưa ra một cuộc thảo luận về kỹ thuật khai thác dữ liệu và học máy bằng các nghiên cứu điển hình kèm ví dụ. Cuốn sách cũng mô tả các ví dụ mã hóa thực hành của một số kỹ thuật học tập có giám sát và không giám sát nổi tiếng, bằng cách sử dụng ba nền tảng mã hóa khác nhau rất phổ biến gồm: R, Python và Java. Đồng thời giải thích một số kỹ thuật phân loại phổ biến nhất (K-NN, Phân loại Naive Bayes, Cây quyết định, Rừng ngẫu nhiên, Máy vectơ hỗ trợ,…) cùng với mô tả cơ bản về mạng nơ-ron nhân tạo và mạng nơ-ron sâu. Cuốn sách này hữu ích cho các chuyên gia, sinh viên đang nghiên cứu về khai thác dữ liệu và học máy cũng như các nhà nghiên cứu về kỹ thuật học có giám sát và không giám sát.
Từ khóa: Khai thác dữ liệu, học máy, phân cụm, Python, R, Java
Nội dung cuốn sách gồm những phần sau:
- Giới thiệu về khai thác dữ liệu và khám phá tri thức
- Khái niệm ngắn gọn về học máy
- Phân loại dữ liệu dựa trên học tập được giám sát và phân cụm tăng dần
- Phân loại dữ liệu và gom cụm gia tăng bằng cách sử dụng phương pháp học không giám sát
- Ý định nghiên cứu hướng tới gom cụm gia tăng
- Ứng dụng thời gian thực với khai thác dữ liệu và học máy
- Kỹ thuật lựa chọn tập hợp con tính năng với học máy
- Các tính năng của tập hợp con biến thể dựa trên khai thác dữ liệu