Modern Trends in Controlled Stochastic Processes: Theory and Applications, V.III
Cập nhật vào: Thứ hai - 24/07/2023 00:28
Nhan đề chính: Modern Trends in Controlled Stochastic Processes: Theory and Applications, V.III
Nhan đề dịch: Xu hướng hiện đại trong các quá trình ngẫu nhiên có kiểm soát: Lý thuyết và ứng dụng, V.III
Tác giả: Alexey Piunovskiy, Yi Zhang
Nhà xuất bản: Springer Cham
Năm xuất bản: 2021
Số trang: 356 tr.
Ngôn ngữ: Tiếng Anh
ISBN: 978-3-030-76928-4
SpringerLink
Lời giới thiệu: Cuốn sách này trình bày các phương pháp giải hiện đại và các ứng dụng của điều khiển tối ưu ngẫu nhiên. Nó là một tập hợp các bài báo mở rộng được thảo luận tại hội thảo truyền thống ở Liverpool về các quy trình ngẫu nhiên có kiểm soát với những người tham gia từ cả phương đông và phương tây. Các vấn đề mới được xây dựng và các tiến trình của nghiên cứu đang diễn ra được báo cáo. Các chủ đề trong cuốn sách này bao gồm các kết quả lý thuyết và phương pháp số cho các quy trình quyết định Markov và bán Markov, dừng tối ưu các quy trình Markov, trò chơi ngẫu nhiên, các vấn đề với thông tin một phần, lọc tối ưu, điều khiển mạnh mẽ, Q-learning và thuật toán tự tổ chức. Các nghiên cứu và ứng dụng tình huống thực tế, ví dụ: hệ thống xếp hàng, quản lý rừng, kiểm soát nguồn nước, khoa học tiếp thị và chăm sóc sức khỏe, được trình bày. Các nhà nghiên cứu khoa học và sinh viên sau đại học quan tâm đến điều khiển tối ưu ngẫu nhiên, cũng như những người thực hành sẽ thấy cuốn sách này hấp dẫn và là một tài liệu tham khảo có giá trị.
Từ khóa: Quy trình Markov. Các quy trình ngẫu nhiên. Kiểm soát tối ưu. Tối ưu hóa. Lập trình năng động. Lập trình tuyến tính. Viễn thông. Trí tuệ bầy đàn. Thuật toán tiến hóa.
Nội dung cuốn sách gồm những phần sau:
Quy trình quyết định Markov chi phí trung bình với xác suất chuyển đổi Feller bán đồng nhất
Bài toán tối ưu hàm mũ của đoạn đầu tiên cho các quy trình quyết định bán Markov
Bước đi ngẫu nhiên có kiểm soát: Phỏng đoán và phản ví dụ
Các bài toán dừng tối ưu cho họ các quá trình Markov thời gian liên tục
Kiểm soát các hệ thống tuyến tính nhảy Markov thời gian liên tục với thông tin một phần
Q-Learning cho các quy trình quyết định Markov mạnh mẽ về mặt phân phối
Ước tính trạng thái trong các mạng ngẫu nhiên được quan sát một phần với các ứng dụng xếp hàng
Ước tính trạng thái cân bằng trong trò chơi quảng cáo với phân phối phản hồi không xác định đối với nỗ lực quảng cáo
Mạnh mẽ đối với các xấp xỉ và học tập mô hình trong MDP và POMDP
Full Gradient DQN Reinforcement Learning: Một sơ đồ hội tụ có thể chứng minh được
Về xấp xỉ hữu hạn đối với quy trình quyết định Markov với chiết khấu đệ quy và phi tuyến tính
Khóa, bom và thử nghiệm: Trường hợp khóa độc lập
Khảo sát kết quả ổn định cho các hệ thống dự phòng
Công nghệ IBM Crew Pairing and Rostering Optimization (C-PRO) với MDP để điều phối luồng tối ưu hóa
Một nguyên tắc điều chỉnh cho sự phân rã mạnh mẽ theo thời gian đối ứng của phản ứng miễn dịch thích ứng
Swarm Intelligence và Swarm Robotics trong bài toán hoạch định đường đi
Sử dụng sự tiến hóa khác biệt để tối ưu hóa các phương pháp điều trị ung thư được nhắm mục tiêu
Về cách tiếp cận đánh giá chương trình chăm sóc sức khỏe theo mô hình quyết định Markov