BIỂU DIỄN TRI THỨC SỬ DỤNG LUẬT DẪN XUẤT (LUẬT SINH)
Khái niệm
Phương pháp biểu diễn tri thức bằng luật
sinh được phát minh bởi Newell và Simon trong lúc hai ông đang cố gắng
xây dựng một hệ giải bài toán tổng quát. Đây là một kiểu biểu diễn tri
thức có cấu trúc. Ý tưởng cơ bản là tri thức có thể được cấu trúc bằng
một cặp điều kiện – hành động : "NẾU điều kiện xảy ra THÌ hành động sẽ
được thi hành". Chẳng hạn : NẾU đèn giao thông là đỏ THÌ bạn không được
đi thẳng, NẾU máy tính đã mở mà không khởi động được THÌ kiểm tra nguồn
điện, …
Ngày nay, các luật sinh đã trở nên phổ
biến và được áp dụng rộng rãi trong nhiều hệ thống trí tuệ nhân tạo khác
nhau. Luật sinh có thể là một công cụ mô tả để giải quyết các vấn đề
thực tế thay cho các kiểu phân tích vấn đề truyền thống. Trong trường
hợp này, các luật được dùng như là những chỉ dẫn (tuy có thể không hoàn
chỉnh) nhưng rất hữu ích để trợ giúp cho các quyết định trong quá trình
tìm kiếm, từ đó làm giảm không gian tìm kiếm. Một ví dụ khác là luật
sinh có thể được dùng để bắt chước hành vi của những chuyên gia. Theo
cách này, luật sinh không chỉ đơn thuần là một kiểu biểu diễn tri thức
trong máy tính mà là một kiểu biễu diễn các hành vi của con người.
Một cách tổng quát luật sinh có dạng như sau :
Tùy vào các vấn đề đang quan tâm mà luật sinh có những ngữ nghĩa hay cấu tạo khác nhau :
Trong logic vị từ : P1, P2, ..., Pn, Q là những biểu thức logic.
Trong ngôn ngữ lập trình, mỗi một luật sinh là một câu lệnh.
IF (P1 AND P2 AND .. AND Pn) THEN Q.
Trong lý thuyết hiểu ngôn ngữ tự nhiên, mỗi luật sinh là một phép dịch :
ONE → một.
TWO → hai.
JANUARY → tháng một
Để biễu diễn một tập luật sinh, người ta thường phải chỉ rõ hai thành phần chính sau :
Ví dụ : Cho 1 cơ sở tri thức được xác định như sau :
Các sự kiện : A, B, C, D, E, F, G, H, K
Tập các quy tắc hay luật sinh (rule)
Cơ chế suy luận trên các luật sinh
Suy diễn tiến : là quá trình suy luận xuất phát từ một số sự kiện ban đầu, xác định các sự kiện có thể được "sinh" ra từ sự kiện này.
Sự kiện ban đầu : H, K
Suy diễn lùi : là
quá trình suy luận ngược xuất phát từ một số sự kiện ban đầu, ta tìm
kiếm các sự kiện đã "sinh" ra sự kiện này. Một ví dụ thường gặp trong
thực tế là xuất phát từ các tình trạng của máy tính, chẩn đoán xem máy
tính đã bị hỏng hóc ở đâu.
Ví dụ :
Tập các sự kiện :
- Ổ cứng là "hỏng" hay "hoạt động bình thường"
- Hỏng màn hình.
- Lỏng cáp màn hình.
- Tình trạng đèn ổ cứng là "tắt" hoặc "sáng"
- Có âm thanh đọc ổ cứng.
- Tình trạng đèn màn hình "xanh" hoặc "chớp đỏ"
- Không sử dụng được máy tính.
- Điện vào máy tính "có" hay "không"
Tập các luật :
R1. Nếu ( (ổ cứng "hỏng") hoặc (cáp màn hình "lỏng")) thì không sử dụng được máy tính.
R2. Nếu (điện vào máy là "có") và ( (âm thanh đọc ổ cứng là "không") hoặc tình trạng đèn ổ cứng là "tắt")) thì (ổ cứng "hỏng").
R3. Nếu (điện vào máy là "có") và (tình trạng đèn màn hình là "chớp đỏ") thì (cáp màn hình "lỏng").
Để xác định được các nguyên nhân gây ra
sự kiện "không sử dụng được máy tính", ta phải xây dựng một cấu trúc đồ
thị gọi là đồ thị AND/OR như sau :
Như vậy là để xác định được nguyên nhân
gây ra hỏng hóc là do ổ cứng hỏng hay cáp màn hình lỏng, hệ thống phải
lần lượt đi vào các nhánh để kiểm tra các điều kiện như điện vào máy
"có", âm thanh ổ cứng "không"…Tại một bước, nếu giá trị cần xác định
không thể được suy ra từ bất kỳ một luật nào, hệ thống sẽ yêu cầu người
dùng trực tiếp nhập vào. Chẳng hạn như để biết máy tính có điện không,
hệ thống sẽ hiện ra màn hình câu hỏi "Bạn kiểm tra xem có điện vào máy tính không (kiểm tra đèn nguồn)? (C/K)". Để thực hiện được cơ chế suy luận lùi, người ta thường sử dụng ngăn xếp (để ghi nhận lại những nhánh chưa kiểm tra).
Vấn đề tối ưu luật
Tập các luật trong một cơ sở tri thức rất có khả năng thừa, trùng lắp hoặc mâu thuẫn. Dĩ nhiên là hệ thống có thể đổ lỗi cho
người dùng về việc đưa vào hệ thống những tri thức như vậy. Tuy việc
tối ưu một cơ sở tri thức về mặt tổng quát là một thao tác khó (vì giữa
các tri thức thường có quan hệ không tường minh), nhưng trong giới hạn
cơ sở tri thức dưới dạng luật, ta vẫn có một số thuật toán đơn giản để
loại bỏ các vấn đề này.
Rút gọn bên phải
Quy tắc rút gọn :
Có thể loại bỏ những sự kiện bên vế phải nếu những sự kiện đó đã xuất
hiện bên vế trái. Nếu sau khi rút gọn mà vế phải trở thành rỗng thì luật
đó là luật hiển nhiên. Ta có thể loại bỏ các luật hiển nhiên ra khỏi
tri thức.
Rút gọn bên trái
Xét các luật :
(L1) A, B → C (L2) A → X (L3) X → C
Rõ ràng là luật A, B → C có thể được thay
thế bằng luật A → C mà không làm ảnh hưởng đến các kết luận trong mọi
trường hợp. Ta nói rằng sự kiện B trong luật (1) là dư thừa và có thể
được loại bỏ khỏi luật dẫn trên.
Phân rã và kết hợp luật
Tương đương với hai luật
A → C
B → C
Với quy tắc này, ta có thể loại bỏ hoàn
toàn các luật có phép nối HOẶC. Các luật có phép nối này thường làm cho
thao tác xử lý trở nên phức tạp.
Luật thừa
Một luật dẫn A → B được gọi là thừa nếu có thể suy ra luật này từ những luật còn lại.
Ví dụ : trong tập các luật gồm {A → B, B → C, A → C} thì luật thứ 3 là luật thừa vì nó có thể được suy ra từ 2 luật còn lại.
Thuật toán tối ưu tập luật dẫn
Thuật toán này sẽ tối ưu hóa tập luật đã
cho bằng cách loại đi các luật có phép nối HOẶC, các luật hiển nhiên
hoặc các luật thừa.
Thuật toán bao gồm các bước chính
Ưu điểm và nhược điểm của biểu diễn tri thức bằng luật
Ưu điểm
Biểu diễn tri thức bằng luật đặc biệt hữu
hiệu trong những tình huống hệ thống cần đưa ra những hành động dựa vào
những sự kiện có thể quan sát được. Nó có những ưu điểm chính yếu sau
đây :
Các luật rất dễ hiểu nên có thể dễ dàng dùng để trao đổi với người dùng (vì nó là một trong những dạng tự nhiên của ngôn ngữ).
Có thể dễ dàng xây dựng được cơ chế suy luận và giải thích từ các luật.
Việc hiệu chỉnh và bảo trì hệ thống là tương đối dễ dàng.
Có thể cải tiến dễ dàng để tích hợp các luật mờ.
Các luật thường ít phụ thuộc vào nhau.
Nhược điểm
Các tri thức phức tạp đôi lúc đòi hỏi quá
nhiều (hàng ngàn) luật sinh. Điều này sẽ làm nảy sinh nhiều vấn đề liên
quan đến tốc độ lẫn quản trị hệ thống.
Thống kê cho thấy, người xây dựng hệ
thống trí tuệ nhân tạo thích sử dụng luật sinh hơn tất cả phương pháp
khác (dễ hiểu, dễ cài đặt) nên họ thường tìm mọi cách để biểu diễn tri
thức bằng luật sinh cho dù có phương pháp khác thích hợp hơn! Đây là
nhược điểm mang tính chủ quan của con người.
Cơ sở tri thức luật sinh lớn sẽ làm giới
hạn khả năng tìm kiếm của chương trình điều khiển. Nhiều hệ thống gặp
khó khăn trong việc đánh giá các hệ dựa trên luật sinh cũng như gặp khó
khăn khi suy luận trên luật sinh.
Không có nhận xét nào:
Đăng nhận xét