Giáo sư Lofti Zadeh, thuyết mờ, và con đường đi đến một trí tuệ nhân tạo

Giáo sư Lofti Zadeh, thuyết mờ, và con đường đi đến một trí tuệ nhân tạo

Hôm nay tôi nhân được một email quảng cáo của một hội nghị sắp tới được tổ chức để kỷ niệm những công hiến của giáo sư Lofti Zadeh , cha đẻ của lý thuyết mờ (fuzzy sets and fuzzy logic).

Trước khi Zadeh xuất bản công trình đầu tiên về lý thuyết tập mờ vào năm 1965, ông đã là một trong những nhà nghiên cứu tên tuổi nhất ở Mỹ trong ngành điện tử, xử lý tín hiệu, lý thuyết hệ thống, v.v. Ông chính là người sáng tạo ra phương pháp z-transform cho tín hiệu rời rạc, là một trong những người đặt nền móng cho lý thuyết state-space cho linear systems mà chúng ta được học trong những sách giáo khoa về signal and systems, phát triển lý thuyết dự đoán của Wiener. Chỉ nhờ những cống hiến của những năm 1950 của Zadeh cũng đủ để người ta nhắc đến ông như những ông tổ của signal processing, cùng với những Claude Shannon, Richard Bellman hay Nobert Wiener.

Từ năm 1965 trở đi, Zadeh cống hiến toàn bộ sức lực của mình vào phát triển lý thuyết tập mờ, logic mờ và ứng dụng của chúng trong lý thuyết điều khiển, hệ thống và trí tuệ nhân tạo. Zadeh tin rằng lý thuyết mờ chính là ngôn ngữ chủ đạo, là một chìa khóa quan trọng để giúp cho chúng ta mở cửa lâu đài bí ẩn Trí tuệ nhân tạo mà Turing đã
gõ cửa giúp.

Về sự đón nhận của giới hàn lâm (academics) với lý thuyết của Zadeh thì có nhiều tranh cãi. Nói chung giới nghiên cứu về signal processing cũng như giới nghiên cứu trí tuệ nhân tạo ở Mỹ thì rất lạnh nhạt. Những người làm về xác suất và thông kê thì nhún vai, cho rằng lý thuyết mờ có thể xây dựng trực tiếp từ nền tản của lý thuyết xác suất đồ sộ và lâu đời hơn. Mặc dù vậy, ở châu Âu, Nhật bản và các nước khác thì nghe nói phong trào nghiên cứu về lý thuyết mờ và ứng dụng của chúng phát triển rất mạnh. Có một vài bloggers ở đây là chuyên gia về lĩnh vực này.

Với những người ngoại đạo, thì chúng ta có thể thấy chữ fuzzy xuất hiện trên các máy giặt của Nhật bản và Hàn Quốc. Vài năm trước khi về thăm nhà, tôi còn được giới thiệu một cuốn sách nghiên cứu về Kinh Dịch bằng lý thuyết tập mờ của giáo sư vật lý Hoàng Phương. (Cách đây vài năm báo chí ở Mỹ hay nhắc đến chữ fuzzy math của Bush, nhưng có lẽ Bush không biết mình nói gì :-).

Là một học trò của ngành trí tuệ nhân tạo (TTNT), thỉnh thoảng vẫn thấy Zadeh đi đến office hay ra quán cafe, nhưng tôi thú thật cũng không hiểu biết gì nhiều về lý thuyết mờ. Đó là kết quả của sự giáo dục chính thống về trí tuệ nhân tạo trong suốt 50 năm qua, hầu như bỏ lý thuyết này ra ngoài. Điều thú vị là giáo sư Stuart Russell, tác giả của quyển sách giáo khoa nhập môn TTNT rất hợp thời trang hiện nay, người vẫn coi Zadeh là một mentor, cũng không phải là một người theo đuổi quan điểm của Zadeh về TTNT. Hai ông này có hai offices ở ngay cạnh nhau.
Ở trong khoa Electrical Engineering and Computer Science ở Berkeley, Zadeh luôn là một nhân vật được tất cả mọi người kính trọng. Nhưng ông luôn là một nhà tiên phong cô đơn ở đây. Một giáo sư về signal processing trong khoa từng nói với tôi: “Trước năm 60 thì Zadeh là thần đồng, còn sau đó ông ấy là một tên điên khùng”.
Điều đó cho ta thấy sự tiếp nhận của giới mainstream trong ngành với Zadeh còn nhiều trắc trở thế nào.

Tại sao lý thuyết của Zadeh lại có một lịch sử trắc trở như vậy, với dân làm về signal processing, hay dân làm về xác suất thống kê, thì tôi không biết nhiều để suy đoán. Tuy nhiên trong ngành TTNT, thì có lẽ ta đã có thể kết luận được vài điều. Khi Zadeh xuất bản những ý tưởng đầu tiên về tập mờ với hy vọng nó sẽ là một ngôn ngữ cho TTNT, ông đã đi trước TTNT ít nhất 20 năm. Khi ấy những ông tổ của TTNT, như John McCarthy, Herbert Simon , Alen Newell đang còn đắm chìm trong sức mạnh tính toán của máy tính và vẻ đẹp và sức mạnh của ngôn ngữ logic toán học. Họ cho rằng logic hy vọng sẽ là ngôn ngữ thích hợp nhất để xây dựng TTNT. PhảI đến hơn 20 năm sau, người ta mới nhận ra rằng mặc dù logic có thể là ngôn ngữ hữu hiệu để computers có thể biết chơi cờ và suy luận rất … logic, nhưng lại rất hạn chế trong những lĩnh vực đòi hỏi sự tiếp xúc với thế giới bên ngoài, với tín hiệu (signal), với số liệu (data). Zadeh, với những kinh nghiệm nghiên cứu về signal và systems từ những năm 1950 đã nhận ra hạn chế của logic từ lâu. Nhưng trong hơn 3 thập niên từ những năm 1960 cho đến hết những năm thập niên 80, giới nghiên cứu TTNT ở Mỹ chịu sự thống trị của trường phái của McCarthy, Simon hay Newell, và những thế hệ học trò của ông.

Ngày nay, người ta nhận ra rằng để giúp cho computers có những khả năng để vượt qua được thử thách của Turing, có lẽ cần cả ngôn ngữ logic và ngôn ngữ xác suất. (Và cả fuzzy logic nữa, nếu bạn không sống ở xứ sở của bánh mì kẹp thịt McDonald). Có rất nhiều thành tựu vượt bậc trong việc phát triển các thuật toán và hardware về chơi cờ, nhận dạng, xử lý âm thanh, hình ảnh, hay ngôn ngữ. Nhưng chúng ta sẽ đạt được TTNT hay không? Đâu là những cơ chế nền móng nhất để có thể tạo ra được một cái gọi là TTNT? Đâu là ngôn ngữ thống nhất của một hệ thống có TTNT? Những hiểu biết của chúng ta về computation, logic và probability có đủ không, hay chúng ta phải cần cả sự trợ giúp của cả neuroscientists, molecular biologists, và physicists nữa? Hay chúng ta nên định nghĩa lại khái niệm TTNT, với sự trợ giúp của những nhà triết học? Hay chúng ta cứ khai triển thêm trên cơ sở thử thách của Turing, để xây dựng máy tính có thể vượt qua những thử thách chông gai đó trước đã?

Có quá nhiều câu hỏi mà hình như ngày nay, chúng ta vẫn không biết hơn là bao so với Turing của những năm 50 của thế kỷ trước. Để có thể tiến tới gần những câu trả lời, ngành KHMT chắc chắn phải cần thêm nhiều nhà khoa học tiên phong và độc đáo như Lofti Zadeh.

Fuzzy logic của Zadeh thực ra không bị lãng quên đến mức như vậy. Mọi sinh viên học máy tính hay tóan ở những năm cuối của ĐH tổng hợp (not technical univ) ở Châu Âu (eg. Đức, Ba Lan, Finland, etc.)trong 1-2 kỳ năm 4 hoặc thứ 5 khi học về các lọai non-standard logics đều được học về Fuzzy logics. Dĩ nhiên nó chỉ là 1 trong nhiều models nên ng ta không dành cho nó nhiều thời gian được. Vả lại trong đó có mấy định lý hay ho đâu mà dạy? Có 2 lý do mà dân Tóan không thích Fuzzy logic. Thứ nhất là dân Tóan ghét every non-boolean logics vì chấp nhận nó đồng thời phải xây dựng lại nền tảng của Tóan và xd lại phần lớn các lý thuyết và định lý. Đây là 1 việc khổng lồ và gần như không tưởng cho nhân lọai. Có thể đếm trên đầu ngón tay những lý thuyết Tóan đã được xây dựng lại trên cơ sở khác với logic cổ điển. Thứ hai là nó không có giá trị gì lớn đối với Tóan cả. Ý định mở rộng lý thuyết tập hợp (fuzzy set) của Zadeh không thành công về mặt Tóan, cái fuzzy set định nghĩa được = lý thuyết tập hợp 1 cách dễ dàng. Nếu vậy thì không thể là nền tảng được. Còn bọn làm xác suất ghét fuzzy *** bời vì bản thân xác suất chính là fuzzy set rồi, bọn nó không coi là có dạng uncertainty nào khác. Còn các kiểu fuzzy sets khác thì phần lớn là vô nghĩa, phải vứt bỏ theo bọn probabilists. Nói cách khác dạng possibility math theory là quá rộng và không cần thiết. Trên thực tế thì tòan bộ Vật lý lượng tử được xây dựng nhờ 1 dạng fuzzy là xác suất, còn fuzzy *** mà không phải xác suất thì chắc 0 có chỗ đứng trong tự nhiên, just speculation, nhưng có thể dùng vào 1 số việc hữu ích khác 🙂 Bọn Tóan thì ghét không những vì non-boolean mà cả cái hàm “degree” trong fuzzy không là additive measure. Còn chuyện dùng fuzzy logic trong các electronic programable devices thì vì nó khá tiện lợi, ng ta đã dùng nó từ lâu lắm rồi, như trong ABS của xe hơi (80’s), diều hòa nhiệt độ, máy giặt, Lifts (elevators), refrigators, cameras, controllers, etc. Ví dụ việc hữu ích của fuzzy ***(logic,set,messure)có thể nhìn thấy ngay (obviously) trong việc chuẩn đóan bệnh trong Y khoa dựa trên quan sát các symptoms (expert systems).

Nói thêm là 1 giáo sư lớn cần phải biết cho ra lò những học trò lớn, nếu không thì ý tưởng sẽ chết – thường nhiều năm sau ai đó lại rediscover nó. Fuzzy concept ra đời 40 năm rồi, nhưng phát triển về mặt Tóan học lèo tèo chảng có gì. Tầm vóc của possibility “theory” sẽ khác hẳn nếu có ng develop nó thành theory thực sự với những định lý lớn, tương tự hoặc khác hẳn của probability theory. Lúc đó mới có thể nói đến alternative one, cạnh tranh với probability, vốn có nền tảng Tóan vững chăc hơn 70 năm rồi.
Còn vai trò của fuzzy logic đối với AI sau 20 năm nữa thì tôi chưa dám bàn, dù nhiều ng cho đây là ngõ cụt, tôi vẫn tin là là ảnh hưởng của nó sẽ gia tăng.