CÁC PHƯƠNG PHÁP TÌM KIẾM HEURISTIC
Qua các phần trước chúng ta tìm hiểu tổng
quan về ý tưởng của thuật giải Heuristic (nguyên lý Greedy và sắp thứ
tự). Trong mục này, chúng ta sẽ đi sâu vào tìm hiểu một số kỹ thuật tìm
kiếm Heuristic – một lớp bài toán rất quan trọng và có nhiều ứng dụng
trong thực tế.
Cấu trúc chung của bài toán tìm kiếm
Để tiện lợi cho việc trình bày, ta hãy
dành chút thời gian để làm rõ hơn "đối tượng" quan tâm của chúng ta
trong mục này. Một cách chung nhất, nhiều vấn đề-bài toán phức tạp đều
có dạng "tìm đường đi trong đồ thị" hay nói một cách hình thức hơn là
"xuất phát từ một đỉnh của một đồ thị, tìm đường đi hiệu quả nhất đến
một đỉnh nào đó". Một phát biểu khác thường gặp của dạng bài toán này là
:
Cho trước hai trạng thái T0 và TG hãy xây dựng chuỗi trạng thái T0, T1, T2, ..., Tn-1, Tn = TG sao cho :
Trong đó, Ti thuộc tập hợp S (gọi là
không gian trạng thái – state space) bao gồm tất cả các trạng thái có
thể có của bài toán và cost(Ti-1, Ti) là chi phí để biến đổi từ trạng thái Ti-1 sang trạng thái Ti. Dĩ nhiên, từ một trạng thái Ti ta có nhiều cách để biến đổi sang trạng thái Ti+1. Khi nói đến một biến đổi cụ thể từ Ti-1 sang Ti ta sẽ dùng thuật ngữ hướng đi (với ngụ ý nói về sự lựa chọn).
Hình : Mô hình chung của các vấn đề-bài
toán phải giải quyết bằng phương pháp tìm kiếm lời giải. Không gian tìm
kiếm là một tập hợp trạng thái - tập các nút của đồ thị. Chi phí cần
thiết để chuyển từ trạng thái T này sang trạng thái Tkđược biểu diễn dưới dạng các con số nằm trên cung nối giữa hai nút tượng trưng cho hai trạng thái.
Đa số các bài toán thuộc dạng mà chúng ta
đang mô tả đều có thể được biểu diễn dưới dạng đồ thị. Trong đó, một
trạng thái là một đỉnh của đồ thị. Tập hợp S bao gồm tất cả các trạng
thái chính là tập hợp bao gồm tất cả đỉnh của đồ thị. Việc biến đổi từ
trạng thái Ti-1 sang trạng thái Ti là việc đi từ đỉnh đại diện cho Ti-1 sang đỉnh đại diện cho Titheo cung nối giữa hai đỉnh này.
Tìm kiếm chiều sâu và tìm kiếm chiều rộng
Để bạn đọc có thể hình dung một cách cụ
thể bản chất của thuật giải Heuristic, chúng ta nhất thiết phải nắm vững
hai chiến lược tìm kiếm cơ bản là tìm kiếm theo chiều sâu (Depth First
Search) và tìm kiếm theo chiều rộng (Breath First Search). Sở dĩ chúng
ta dùng từ chiến lược mà không phải là phương pháp là bởi vì trong thực
tế, người ta hầu như chẳng bao giờ vận dụng một trong hai kiểm tìm kiếm
này một cách trực tiếp mà không phải sửa đổi gì.
Tìm kiếm chiều sâu (Depth-First Search)
Trong tìm kiếm theo chiều sâu, tại trạng
thái (đỉnh) hiện hành, ta chọn một trạng thái kế tiếp (trong tập các
trạng thái có thể biến đổi thành từ trạng thái hiện tại) làm trạng thái
hiện hành cho đến lúc trạng thái hiện hành là trạng thái đích. Trong
trường hợp tại trạng thái hiện hành, ta không thể biến đổi thành trạng
thái kế tiếp thì ta sẽ quay lui (back-tracking) lại trạng thái trước
trạng thái hiện hành (trạng thái biến đổi thành trạng thái hiện hành) để
chọn đường khác. Nếu ở trạng thái trước này mà cũng không thể biến đổi
được nữa thì ta quay lui lại trạng thái trước nữa và cứ thế. Nếu đã quay
lui đến trạng thái khởi đầu mà vẫn thất bại thì kết luận là không có
lời giải. Hình ảnh sau minh họa hoạt động của tìm kiếm theo chiều sâu.
Hình : Hình ảnh của tìm kiếm chiều sâu.
Nó chỉ lưu ý "mở rộng" trạng thái được chọn mà không "mở rộng" các trạng
thái khác (nút màu trắng trong hình vẽ).
Tìm kiếm chiều rộng (Breath-First Search)
Ngược lại với tìm kiếm theo kiểu chiều
sâu, tìm kiếm chiều rộng mang hình ảnh của vết dầu loang. Từ trạng thái
ban đầu, ta xây dựng tập hợp S bao gồm các trạng thái kế tiếp (mà từ
trạng thái ban đầu có thể biến đổi thành). Sau đó, ứng với mỗi trạng
thái Tk trong tập S, ta xây dựng tập Sk bao gồm các trạng thái kế tiếp
của Tkrồi lần lượt bổ sung các Sk vào S. Quá
trình này cứ lặp lại cho đến lúc S có chứa trạng thái kết thúc hoặc S
không thay đổi sau khi đã bổ sung tất cả Sk.
Hình : Hình ảnh của tìm kiếm chiều rộng. Tại một bước, mọi trạng thái đều được mở rộng, không bỏ sót trạng thái nào.
| Chiều sâu | Chiều rộng | |
| Tính hiệu quả | Hiệu quả khi lời giải nằm sâu trong cây tìm kiếm và có một phương án chọn hướng đi chính xác. Hiệu quả của chiến lược phụ thuộc vào phương án chọn hướng đi. Phương án càng kém hiệu quả thì hiệu quả của chiến lược càng giảm. Thuận lợi khi muốn tìm chỉ một lời giải. | Hiệu quả khi lời giải nằm gần gốc của cây tìm kiếm. Hiệu quả của chiến lược phụ thuộc vào độ sâu của lời giải. Lời giải càng xa gốc thì hiệu quả của chiến lược càng giảm. Thuận lợi khi muốn tìm nhiều lời giải. |
| Lượng bộ nhớ sử dụng để lưu trữ các trạng thái | Chỉ lưu lại các trạng thái chưa xét đến. | Phải lưu toàn bộ các trạng thái. |
| Trường hợp xấu nhất | Vét cạn toàn bộ | Vét cạn toàn bộ. |
| Trường hợp tốt nhất | Phương án chọn hướng đi tuyệt đối chính xác. Lời giải được xác định một cách trực tiếp. | Vét cạn toàn bộ. |
Tìm kiếm chiều sâu
và tìm kiếm chiều rộng đều là các phương pháp tìm kiếm có hệ thống và
chắc chắn tìm ra lời giải. Tuy nhiên, do bản chất là vét cạn nên với
những bài toán có không gian lớn thì ta không thể dùng hai chiến lược
này được. Hơn nữa, hai chiến lược này đều có tính chất "mù quáng" vì
chúng không chú ý đến những thông tin (tri thức) ở trạng thái hiện thời
và thông tin về đích cần đạt tới cùng mối quan hệ giữa chúng. Các tri
thức này vô cùng quan trọng và rất có ý nghĩa để thiết kế các thuật giải
hiệu quả hơn mà ta sắp sửa bàn đến.
Tìm kiếm leo đồi
Leo đồi đơn giản
Tìm kiếm leo đồi theo đúng nghĩa, nói
chung, thực chất chỉ là một trường hợp đặc biệt của tìm kiếm theo chiều
sâu nhưng không thể quay lui. Trong tìm kiếm leo đồi, việc lựa chọn
trạng thái tiếp theo được quyết định dựa trên một hàm Heuristic.
Hàm Heuristic là gì ?
Thuật ngữ "hàm Heuristic" muốn nói lên
điều gì? Chẳng có gì ghê gớm. Bạn đã quen với nó rồi! Đó đơn giản chỉ là
một ước lượng về khả năng dẫn đến lời giải tính từ trạng thái đó
(khoảng cách giữa trạng thái hiện tại và trạng thái đích). Ta sẽ quy ước
gọi hàm này là h trong suốt giáo trình này. Đôi lúc ta cũng đề cập đến
chi phí tối ưu thực sự từ một trạng thái dẫn đến lời giải. Thông thường,
giá trị này là không thể tính toán được (vì tính được đồng nghĩa là đã
biết con đường đến lời giải !) mà ta chỉ dùng nó như một cơ sở để suy
luận về mặt lý thuyết mà thôi ! Hàm h, ta quy ước rằng, luôn trả ra kết
quả là một số không âm. Để bạn đọc thực sự nắm được ý nghĩa của hai hàm
này, hãy quan sát hình sau trong đó minh họa chi phí tối ưu thực sự và
chi phí ước lượng.
Hình Chi phí ước lượng h’ = 6 và chi phí tối ưu thực sự h = 4+5 = 9 (đi theo đường 1-3-7)
Bạn đang ở trong một thành phố xa lạ mà
không có bản đồ trong tay và ta muốn đi vào khu trung tâm? Một cách suy
nghĩ đơn giản, chúng ta sẽ nhắm vào hướng những tòa cao ốc của khu trung
tâm!
Tư tưởng
1) Nếu trạng thái bắt đầu cũng là trạng
thái đích thì thoát và báo là đã tìm được lời giải. Ngược lại, đặt trạng
thái hiện hành (Ti) là trạng thái khởi đầu (T0)
2) Lặp lại cho đến khi đạt đến trạng thái
kết thúc hoặc cho đến khi không tồn tại một trạng thái tiếp theo hợp lệ
(Tk) của trạng thái hiện hành :
a. Đặt Tk là một trạng thái tiếp theo hợp lệ của trạng thái hiện hành Ti.
b. Đánh giá trạng thái Tk mới :
b.1. Nếu là trạng thái kết thúc thì trả về trị này và thoát.
b.2. Nếu không phải là trạng thái kết thúc nhưng tốt hơn trạng thái hiện hành thì cập nhật nó thành trạng thái hiện hành.
b.3. Nếu nó không tốt hơn trạng thái hiện hành thì tiếp tục vòng lặp.
Mã giả
Ti:= T0; Stop :=FALSE;
WHILE Stop=FALSE DO BEGIN
IF Ti TG THEN BEGIN
<tìm được kết quả >; Stop:=TRUE;
END;
ELSE BEGIN
Better:=FALSE;
WHILE (Better=FALSE) AND (STOP=FALSE) DO BEGIN
IF <không tồn tại trạng thái kế tiếp hợp lệ của Ti> THEN BEGIN
<không tìm được kết quả >; Stop:=TRUE; END;
ELSE BEGIN
Tk := <một trạng thái kế tiếp hợp lệ của Ti>;
IF <h(Tk) tốt hơn h(Ti)> THEN BEGIN
Ti :=Tk; Better:=TRUE;
END;
END;
END; {WHILE}
END; {ELSE}
END;{WHILE}
Mệnh đề "h’(Tk) tốt hơn h’(Ti)" nghĩa là
gì? Đây là một khái niệm chung chung. Khi cài đặt thuật giải, ta phải
cung cấp một định nghĩa tường minh về tốt hơn. Trong một số trường hợp,
tốt hơn là nhỏ hơn : h’(Tk) < h’(Ti); một số trường hợp khác tốt hơn
là lớn hơn h’(Tk) > h’(Ti)...Chẳng hạn, đối với bài toán tìm đường đi
ngắn nhất giữa hai điểm. Nếu dùng hàm h’ là hàm cho ra khoảng cách theo
đường chim bay giữa vị trí hiện tại (trạng thái hiện tại) và đích đến
(trạng thái đích) thì tốt hơn nghĩa là nhỏ hơn.
Vấn đề cần làm rõ kế tiếp là thế nào là
<một trạng thái kế tiếp hợp lệ của Ti>? Một trạng thái kế tiếp hợp
lệ là trạng thái chưa được xét đến. Giả sử h của trạng thái hiện tại Ti
có giá trị là h(Ti) = 1.23 và từ Ti ta có thể biến đổi sang một trong 3
trạng thái kế tiếp lần lượt là Tk1, Tk2, Tk3 với giá trị các hàm h tương ứng là h(Tk1) = 1.67, h(Tk2) = 2.52, h’(Tk3) = 1.04. Đầu tiên, Tk sẽ được gán bằng Tk1, nhưng vì h’(Tk) = h’(Tk1) > h’(Ti) nên Tk không được chọn. Kế tiếp là Tk sẽ được gán bằng Tk2 và cũng không được chọn. Cuối cùng thì Tk3 được chọn. Nhưng giả sử h’(Tk3) = 1.3 thì cả Tk3
cũng không được chọn và mệnh đề <không thể sinh ra trạng thái kế
tiếp của Ti> sẽ có giá trị TRUE. Giải thích này có vẻ hiển nhiên
nhưng có lẽ cần thiết để tránh nhầm lẫn cho bạn đọc.
Để thấy rõ hoạt động của thuật giải leo
đồi. Ta hãy xét một bài toán minh họa sau. Cho 4 khối lập phương giống
nhau A, B, C, D. Trong đó các mặt (M1), (M2), (M3), (M4), (M5), (M6) có
thể được tô bằng 1 trong 6 màu (1), (2), (3), (4), (5), (6). Ban đầu các
khối lập phương được xếp vào một hàng. Mỗi một bước, ta chỉ được xoay
một khối lập phương quanh một trục (X,Y,Z) 900
theo chiều bất kỳ (nghĩa là ngược chiều hay thuận chiều kim đồng hồ cũng
được). Hãy xác định số bước quay ít nhất sao cho tất cả các mặt của
khối lập phương trên 4 mặt của hàng là có cùng màu như hình vẽ.
Hình : Bài toán 4 khối lập phương
Để giải quyết vấn đề, trước hết ta cần
định nghĩa một hàm G dùng để đánh giá một tình trạng cụ thể có phải là
lời giải hay không? Bạn đọc có thể dễ dàng đưa ra một cài đặt của hàm G
như sau :
IF (Gtrái + Gphải + Gtrên + Gdưới + Gtrước + Gsau) = 16 THEN
G:=TRUE
ELSE
G:=FALSE;
Trong đó, Gphải là
số lượng các mặt có cùng màu của mặt bên phải của hàng. Tương tự cho
Gtrái, Gtrên, Ggiữa, Gtrước, Gsau. Tuy nhiên, do các khối lập phương
A,B,C,D là hoàn toàn tương tự nhau nên tương quan giữa các mặt của mỗi
khối là giống nhau. Do đó, nếu có 2 mặt không đối nhau trên hàng đồng
màu thì 4 mặt còn lại của hàng cũng đồng màu. Từ đó ta chỉ cần hàm G
được định nghĩa như sau là đủ :
IF Gphải + Gdưới = 8 THEN
G:=TRUE
ELSE
G:=FALSE;
Hàm h (ước lượng khả năng dẫn đến lời giải của một trạng thái) sẽ được định nghĩa như sau :
h = Gtrái+ Gphải+ Gtrên+ Gdưới
Bài toán này đủ đơn giản để thuật giải leo đồi có thể hoạt động tốt. Tuy nhiên, không phải lúc nào ta cũng may mắn như thế!
Đến đây, có thể chúng ta sẽ nảy sinh một ý
tưởng. Nếu đã chọn trạng thái tốt hơn làm trạng thái hiện tại thì tại
sao không chọn trạng thái tốt nhất ? Như vậy, có lẽ ta sẽ nhanh chóng
dẫn đến lời giải hơn! Ta sẽ bàn luận về vấn đề: "liệu cải tiến này có
thực sự giúp chúng ta dẫn đến lời giải nhanh hơn hay không?" ngay sau
khi trình bày xong thuật giải leo đồi dốc đứng.
Leo đồi dốc đứng
Về cơ bản, leo đồi dốc đứng cũng giống
như leo đồi, chỉ khác ở điểm là leo đồi dốc đứng sẽ duyệt tất cả các
hướng đi có thể và chọn đi theo trạng thái tốt nhất trong số các trạng
thái kế tiếp có thể có (trong khi đó leo đồi chỉ chọn đi theo trạng thái
kế tiếp đầu tiên tốt hơn trạng thái hiện hành mà nó tìm thấy).
Tư tưởng
1) Nếu trạng thái bắt đầu cũng là trạng
thái đích thì thoát và báo là đã tìm được lời giải. Ngược lại, đặt trạng
thái hiện hành (Ti) là trạng thái khởi đầu (T0)
2) Lặp lại cho đến khi đạt đến trạng thái
kết thúc hoặc cho đến khi (Ti) không tồn tại một trạng thái kế tiếp
(Tk) nào tốt hơn trạng thái hiện tại (Ti)
a) Đặt S bằng tập tất cả trạng thái kế tiếp có thể có của Ti và tốt hơn Ti.
b) Xác định Tkmax là trạng thái tốt nhất trong tập S
Đặt Ti = Tkmax
Mã giả
Ti:= T0;
Stop :=FALSE;
WHILE Stop=FALSE DO BEGIN
IF Ti TG THEN BEGIN
<tìm được kết quả >;
STOP :=TRUE;
END;
ELSE BEGIN
Best:=h’(Ti);
Tmax:= Ti;
WHILE <tồn tại trạng thái kế tiếp hợp lệ của Ti> DO BEGIN
Tk := <một trạng thái kế tiếp hợp lệ của Ti>;
IF <h’(Tk) tốt hơn Best> THEN BEGIN
Best :=h’(Tk);
Tmax:= Tk;
END;
END;
IF (Best>Ti) THEN
Ti:= Tmax;
ELSE BEGIN
<không tìm được kết quả >;
STOP:=TRUE;
END;
END; {ELSE IF}
END;{WHILE STOP}
Đánh giá
So với leo đồi đơn giản, leo đồi dốc đứng
có ưu điểm là luôn luôn chọn hướng có triển vọng nhất để đi. Liệu điều
này có đảm bảo leo đồi dốc đứng luôn tốt hơn leo đồi đơn giản không? Câu
trả lời là không. Leo đồi dốc đứng chỉ tốt hơn leo đồi đơn giản trong
một số trường hợp mà thôi. Để chọn ra được hướng đi tốt nhất, leo đồi
dốc đứng phải duyệt qua tất cả các hướng đi có thể có tại trạng thái
hiện hành. Trong khi đó, leo đồi đơn giản chỉ chọn đi theo trạng thái
đầu tiên tốt hơn (so với trạng thái hiện hành) mà nó tìm ra được. Do đó,
thời gian cần thiết để leo đồi dốc đứng chọn được một hướng đi sẽ lớn
hơn so với leo đồi đơn giản. Tuy vậy, do lúc nào cũng chọn hướng đi tốt
nhất nên leo đồi dốc đứng thường sẽ tìm đến lời giải sau một số bước ít
hơn so với leo đồi đơn giản. Nói một cách ngắn gọn, leo đồi dốc đứng sẽ
tốn nhiều thời gian hơn cho một bước nhưng lại đi ít bước hơn; còn leo
đồi đơn giản tốn ít thời gian hơn cho một bước đi nhưng lại phải đi
nhiều bước hơn. Đây chính là yếu tố được và mất giữa hai thuật giải nên
ta phải cân nhắc kỹ lưỡng khi lựa chọn thuật giải.
Cả hai phương pháp leo núi đơn giản và
leo núi dốc đứng đều có khả năng thất bại trong việc tìm lời giải của
bài toán mặc dù lời giải đó thực sự hiện hữu. Cả hai giải thuật đều có
thể kết thúc khi đạt được một trạng thái mà không còn trạng thái nào tốt
hơn nữa có thể phát sinh nhưng trạng thái này không phải là trạng thái
đích. Điều này sẽ xảy ra nếu chương trình đạt đến một điểm cực đại địa
phương, một đoạn đơn điệu ngang.
Điểm cực đại địa phương (a local maximum)
: là một trạng thái tốt hơn tất cả lân cận của nó nhưng không tốt hơn
một số trạng thái khác ở xa hơn. Nghĩa là tại một điểm cực đại địa
phương, mọi trạng thái trong một lân cận của trạng thái hiện tại đều xấu
hơn trạng thái hiện tại. Tuy có dáng vẻ của lời giải nhưng các cực đại
địa phương không phải là lời giải thực sự. Trong trường hợp này, chúng
được gọi là những ngọn đồi thấp.
Đoạn đơn điệu ngang (a plateau) : là một
vùng bằng phẳng của không gian tìm kiếm, trong đó, toàn bộ các trạng
thái lân cận đều có cùng giá trị.
Hình : Các tình huống khó khăn cho tìm kiếm leo đèo.
Để đối phó với các các điểm này, người ta
đã đưa ra một số giải pháp. Ta sẽ tìm hiểu 2 trong số các giải pháp
này. Những giải này, không thực sự giải quyết trọn vẹn vấn đề mà chỉ là
một phương án cứu nguy tạm thời mà thôi.
Phương án đầu tiên là kết hợp leo đồi và
quay lui. Ta sẽ quay lui lại các trạng thái trước đó và thử đi theo
hướng khác. Thao tác này hợp lý nếu tại các trạng thái trước đó có một
hướng đi tốt mà ta đã bỏ qua trước đó. Đây là một cách khá hay để đối
phó với các điểm cực đại địa phương. Tuy nhiên, do đặc điểm của leo đồi
là "bước sau cao hơn bước trước" nên phương án này sẽ thất bại khi ta
xuất phát từ một điểm quá cao hoặc xuất phát từ một đỉnh đồi mà để đến
được lời giải cần phải đi qua một "thung lũng" thật sâu như trong hình
sau.
Hình : Một trường hợp thất bại của leo đèo kết hợp quay lui.
Cách thứ hai là thực hiện một bước nhảy
vọt theo hướng nào đó để thử đến một vùng mới của không gian tìm kiếm.
Nôm na là "bước" liên tục nhiều "bước" (chẳng hạn 5,7,10, …) mà tạm thời
"quên" đi việc kiểm tra "bước sau cao hơn bước trước". Tiếp cận có vẻ
hiệu quả khi ta gặp phải một đoạn đơn điệu ngang. Tuy nhiên, nhảy vọt
cũng có nghĩa là ta đã bỏ qua cơ hội để tiến đến lời giải thực sự. Trong
trường hợp chúng ta đang đứng khá gần lời giải, việc nhảy vọt sẽ đưa
chúng ta sang một vị trí hoàn toàn xa lạ, mà từ đó, có thể sẽ dẫn chúng
ta đến một rắc rối kiểu khác. Hơn nữa, số bước nhảy là bao nhiêu và nhảy
theo hướng nào là một vấn đề phụ thuộc rất nhiều vào đặc điểm không
gian tìm kiếm của bài toán.
Hình Một trường hợp khó khăn cho phương án "nhảy vọt".
Leo núi là một phương pháp cục bộ bởi vì
nó quyết định sẽ làm gì tiếp theo dựa vào một đánh giá về trạng thái
hiện tại và các trạng thái kế tiếp có thể có (tốt hơn trạng thái hiện
tại, trạng thái tốt nhất tốt hơn trạng thái hiện tại) thay vì phải xem
xét một cách toàn diện trên tất cả các trạng thái đã đi qua. Thuận lợi
của leo núi là ít gặp sự bùng nổ tổ hợp hơn so với các phương pháp toàn
cục. Nhưng nó cũng giống như các phương pháp cục bộ khác ở chỗ là không
chắc chắn tìm ra lời giải trong trường hợp xấu nhất.
Một lần nữa, ta khẳng định lại vai trò
quyết định của hàm Heuristic trong quá trình tìm kiếm lời giải. Với cùng
một thuật giải (như leo đồi chẳng hạn), nếu ta có một hàm Heuristic tốt
hơn thì kết quả sẽ được tìm thấy nhanh hơn. Ta hãy xét bài toán về các
khối được trình bày ở hình sau. Ta có hai thao tác biến đổi là:
+ Lấy một khối ở đỉnh một cột bất kỳ và
đặt nó lên một chỗ trống tạo thành một cột mới. Lưu ý là chỉ có thể tạo
ra tối đa 2 cột mới.
+ Lấy một khối ở đỉnh một cột và đặt nó lên đỉnh một cột khác
Hãy xác định số thao tác ít nhất để biến đổi cột đã cho thành cột kết quả.
Hình : Trạng thái khởi đầu và trạng thái kết thúc
Giả sử ban đầu ta dùng một hàm Heuristic đơn giản như sau :
H1 : Cộng 1 điểm
cho mỗi khối ở vị trí đúng so với trạng thái đích. Trừ 1 điểm cho mỗi
khối đặt ở vị trí sai so với trạng thái đích.
Dùng hàm này, trạng thái kết thúc sẽ có
giá trị là 8 vì cả 8 khối đều được đặt ở vị trí đúng. Trạng thái khởi
đầu có giá trị là 4 (vì nó có 1 điểm cộng cho các khối C, D, E, F, G, H
và 1 điểm trừ cho các khối A và B). Chỉ có thể có một di chuyển từ trạng
thái khởi đầu, đó là dịch chuyển khối A xuống tạo thành một cột mới (T1).
Điều đó sinh ra một trạng thái với số
điểm là 6 (vì vị trí của khối A bây giờ sinh ra 1 điểm cộng hơn là một
điểm trừ). Thủ tục leo núi sẽ chấp nhận sự dịch chuyển đó. Từ trạng thái
mới T1, có ba di chuyển có thể thực hiện dẫn đến
ba trạng thái Ta, Tb, Tc được minh họa trong hình dưới. Những trạng
thái này có số điểm là : h’(Ta)= 4; h’(Tb) = 4 và h’(Tc) = 4
Hình Các trạng thái có thể đạt được từ T1
Thủ tục leo núi sẽ tạm dừng bởi vì tất
cả các trạng thái này có số điểm thấp hơn trạng thái hiện hành. Quá
trình tìm kiếm chỉ dừng lại ở một trạng thái cực đại địa phương mà không
phải là cực đại toàn cục.
Chúng ta có thể đổ lỗi cho chính giải
thuật leo đồi vì đã thất bại do không đủ tầm nhìn tổng quát để tìm ra
lời giải. Nhưng chúng ta cũng có thể đổ lỗi cho hàm Heuristic và cố gắng
sửa đổi nó. Giả sử ta thay hàm ban đầu bằng hàm Heuristic sau đây :
H2 : Đối với mỗi khối phụ trợ đúng (khối phụ trợ là khối nằm bên dưới khối hiện tại), cộng 1 điểm, ngược lại trừ 1 điểm.
Dùng hàm này, trạng thái kết thúc có số
điểm là 28 vì B nằm đúng vị trí và không có khối phụ trợ nào, C đúng vị
trí được 1 điểm cộng với 1 điểm do khối phụ trợ B nằm đúng vị trí nên C
được 2 điểm, D được 3 điểm, ....Trạng thái khởi đầu có số điểm là –28.
Việc di chuyển A xuống tạo thành một cột mới làm sinh ra một trạng thái
với số điểm là h’(T1) = –21 vì A không còn 7 khối
sai phía dưới nó nữa. Ba trạng thái có thể phát sinh tiếp theo bây giờ
có các điểm số là : h’(Ta)=–28; h’(Tb)=–16 và h’(Tc) = –15. Lúc này thủ
tục leo núi dốc đứng sẽ chọn di chuyến đến trạng thái Tc, ở đó có một
khối đúng. Qua hàm H2 này ta rút ra một nguyên
tắc : tốt hơn không chỉ có nghĩa là có nhiều ưu điểm hơn mà còn phải ít
khuyết điểm hơn. Hơn nữa, khuyết điểm không có nghĩa chỉ là sự sai biệt
ngay tại một vị trí mà còn là sự khác biệt trong tương quan giữa các vị
trí. Rõ ràng là đứng về mặt kết quả, cùng một thủ tục leo đồi nhưng hàm H1 bị thất bại (do chỉ biết đánh giá ưu điểm) còn hàm H2 mới này lại hoạt động một cách hoàn hảo (do biết đánh giá cả ưu điểm và khuyết điểm).
Đáng tiếc, không phải lúc nào chúng ta
cũng thiết kế được một hàm Heuristic hoàn hảo như thế. Vì việc đánh giá
ưu điểm đã khó, việc đánh giá khuyết điểm càng khó và tinh tế hơn. Chẳng
hạn, xét lại vấn đề muốn đi vào khu trung tâm của một thành phố xa lạ.
Để hàm Heuristic hiệu quả, ta cần phải đưa các thông tin về các đường
một chiều và các ngõ cụt, mà trong trường hợp một thành phố hoàn toàn xa
lạ thì ta khó hoặc không thể biết được những thông tin này.
Đến đây, chúng ta hiểu rõ bản chất của
hai thuật giải tiếp cận theo chiến lược tìm kiếm chiều sâu. Hiệu quả của
cả hai thuật giải leo đồi đơn giản và leo đồi dốc đứng phụ thuộc vào :
+ Chất lượng của hàm Heuristic.
+ Đặc điểm của không gian trạng thái.
+ Trạng thái khởi đầu.
Sau đây, chúng ta sẽ tìm hiểu một tiếp
cận theo mới, kết hợp được sức mạnh của cả tìm kiếm chiều sâu và tìm
kiếm chiều rộng. Một thuật giải rất linh động và có thể nói là một thuật
giải kinh điển của Heuristic.
Không có nhận xét nào:
Đăng nhận xét