Phân tích tin cậy đối với chuỗi dữ liệu mô phỏng có tính lặp và tính chu kỳ
Kiểm định về sự phù hợp với các xác suất chuyển và kiểm định về tính độc lập của chuỗi dữ liệu mô phỏng là hai dạng phân tích tin cậy được đề cập trong bài báo. Các kiểm định này được áp dụng đối với chuỗi dữ liệu mô phỏng có tính lặp và tính chu kỳ.
Chuỗi dữ liệu mô phỏng được giả thiết là chuỗi Markov bậc nhất có các xác suất chuyển ổn định. Dựa vào một số kết quả nghiên cứu đã có về những suy luận thống kê trên các chuỗi Markov, hai dạng thống kê 𝜒 2 – bình phương được xây dựng để sử dụng trong hai kiểm định đã nêu. Áp dụng minh họa được thực hiện trên chuỗi dữ liệu mô phỏng của dãy chỉ số sáng hàng ngày được khởi tạo từ mô hình Markov ẩn với bốn trạng thái.
Trên nền tảng phát triển của công nghệ số, các mô hình ngẫu nhiên ngày càng được ứng dụng mạnh mẽ trong nhiều lĩnh vực như trong toán học (phép thử thống kê, lý thuyết thông tin phục vụ đám đông và đối sách), trong vật lý (vật lý hạt nhân, địa vật lý, quang học và khí tượng, khí quyển) cùng nhiều lĩnh vực khác như sinh học, hóa học, kỹ thuật quân sự và kinh tế. Các ứng dụng chủ yếu là để nắm bắt, quan sát, nghiên cứu các hiện tượng trong tự nhiên, kỹ thuật hay kinh tế xã hội và cả trong các nghiên cứu cơ bản thông qua các mô phỏng dưới các dạng cụ thể như các hình ảnh, các chuyển động, các phản ứng hay những phép thử, thử nghiệm,… Những hình thức ứng dụng khác biệt này có thể được xem xét, nghiên cứu ở một dạng chung là các dữ liệu mô phỏng được khởi tạo ban đầu từ các mô hình. Các cấu trúc mô hình và các phương pháp khởi tạo dữ liệu mô phỏng đã được nghiên cứu rất nhiều. Ngoài những mô hình cơ bản như Markov, Markov ẩn, các mô hình được xây dựng theo chuyển động Brown (Elliott et al., 2010)…, còn có rất đa dạng các mô hình được xây dựng trong rất nhiều lĩnh vực khác nhau. Đối với các phương pháp khởi tạo dữ liệu mô phỏng, xuất phát từ phương pháp Monte Carlo (Rubinstein & Kroese, 2017), nhiều nhánh được phát triển rất phong phú như nhóm các thuật toán tạo mẫu Gibbs (Levine & Casella, 2006) hay khởi tạo mô phỏng theo phương pháp MCMC (Markov Chain Monte Carlo), …
Tuy nhiên, vấn đề phân tích sự tin cậy và suy luận kiểm chứng các tính chất và các điều kiện phù hợp của các chuỗi dữ liệu mô phỏng chưa được nghiên cứu phong phú lắm, mặc dầu những vấn đề này đã được chú ý đến từ trước đây rất lâu. Ví dụ như Cramér (1946) có các phân tích, nghiên cứu cơ bản về các suy luận chung thường gặp, hay Bartlett (1951) nghiên cứu về các suy luận trên chuỗi mô phỏng theo mô hình xác suất; còn các phân tích suy luận trên các dãy mô phỏng Markov có thể tìm thấy ở Anderson and Goodman (1957) và Billingsley (1961). Mặc dầu vậy, số lượng các nghiên cứu về nhóm vấn đề này đến nay là chưa nhiều, chưa phong phú tương xứng với sự phát triển đa dạng của các cấu trúc mô hình, các phương pháp, thuật toán khởi tạo mô phỏng.
Cũng có nhiều trường hợp ứng dụng dữ liệu mô phỏng, trong đó tính tin cậy của các dữ liệu khởi tạo nội tại đã được đảm bảo từ chính các phương pháp mô phỏng sử dụng; hay đã có các nghiên cứu lý thuyết liên quan nhưng người sử dụng lại thiếu sót không sử dụng để luận giải, suy luận cho chặt chẽ, giúp cho các ứng dụng của mình được thuyết phục hơn theo các tiêu chuẩn thống kê phù hợp.
Bài báo trình bày một ứng dụng mà trong đó một số kết quả nghiên cứu lý thuyết liên quan được sử dụng để rút ra các suy luận kiểm định về sự tin cậy của dữ liệu mô phỏng, đảm bảo dữ liệu mô phỏng mang tải được các tính chất của cấu trúc mô hình. Ưu thế của phương pháp nghiên cứu dựa trên mô phỏng là có thể khởi tạo và sử dụng số lượng rất lớn các chuỗi dữ liệu mô phỏng để thử nghiệm và thẩm định các thiết bị mới, các phát triển ứng dụng mới (trên thực tế hầu như không thể nào có được cỡ mẫu dữ liệu thực lớn được như vậy để sử dụng thử nghiệm, thẩm định). Cách thức khởi tạo được xem xét ở đây (và cũng là cách được sử dụng rất phổ biến) là sử dụng cấu trúc mô hình để mô phỏng lần lượt một số lượng lớn các chuỗi dữ liệu để phục vụ các mục đích nghiên cứu. Phương pháp tiếp cận này phù hợp với các ứng dụng cần phân tích thử nghiệm trên các chuỗi mô phỏng cần quan sát lặp lại và cần phải sử dụng nhiều lần những chuỗi dữ liệu có tính chu kỳ. Trên cơ sở sử dụng một số suy luận thống kê có liên quan, phạm vi bài báo đề cập đến hai kiểm định trên các chuỗi dữ liệu mô phỏng có tính lặp và tính chu kỳ. Các chuỗi mô phỏng được giả thiết là các chuỗi Markov bậc nhất và là các chuỗi Markov ổn định. Xuất phát từ mục đích nghiên cứu của các ứng dụng, kiểm định thứ nhất xem xét liệu các chuỗi mô phỏng có đảm bảo tính ổn định, có phù hợp của cấu trúc chuyển đổi của mô hình hay không và kiểm định thứ hai sẽ kiểm tra tính độc lập của chuỗi dữ liệu được khởi tạo.
nqhuy
Tạp chí Khoa học Trường Đại học Cần Thơ, Tập 58, Số 1A (2022): 106-112