Evolutionary Multitasking – A New Paradigm

Evolutionary Multitasking – A New Paradigm

We are in era where many methods of computational problem-solving methodologies are being developed to address the diverse issues that researchers are intersted. Traditional methods for optimization, including the population-based search algorithms of Evolutionary Computation (EC). Have generally been focused on efficiently solving only a single optimization task at a time. In fact, the variety and volume of incoming information streams that must be absorbed and appropriately processed, the need to multitask are unprecedented. Recently, Multifactorial Optimization (MFO) has been developed to explore the potential for evolutionary multitasking. The pursuit of intelligent systems and algorithms that are capable of efficient multitasking is rapidly gaining importance among contemporary scientists who are faced with the increasing complexity of real-world problems. We introduce the characteristic of population-based search algorithms. Their inherent ability (much like the human mind) to handle multiple optimization tasks at once. Most notably, it shows that multi-tasking allows a person to automatically promote common ground between different optimization tasks, thus providing a significant scope for improvement in problem solving in the real world.

Assoc. Prof. Huynh Thi Thanh Binh – Hanoi University of Science and Technology (Vietnam)

Huynh Thi Thanh Binh is Associate Professor and Vice Dean of the School of Information and Communication Technology (SoICT), Hanoi University of Science and Technology (HUST). She is Head of Modeling, Simulation and Optimization Lab (MSO).
Her current research interests include – Computational Intelligence, Artificial Intelligence, Memetic Computing, Evolutionary Multitasking. She has published more than 80 refereed academic papers/articles, 2 Books; Editor 1 Book. She is Associate Editor of the International Journal of Advances in intelligent Informatics, VNU Journal Computer Science Communication Engineering; Editor Board of Journal of Computer Science and Cybernetics,. She has served as a regular reviewer, a programme committee member of numerous prestigious academic journals and conferences, such as IEEE Transactions on Vehicular Technology, Journal of Information Science and Engineering, IES, SoICT…
She is member of IEEE Computational Intelligence Society – Women in Computational Intelligence Committe (2017, 2018); Chair of IEEE Computational Intelligent Society Vietnam Chapter (IEEE Vietnam CIS). She is member of some committee of IEEE Asia Pacific: Strategic Planning, Membership Development, Humanitarian Technology Activities.

Data science: A key in the digital transformation time

Data science: A key in the digital transformation time

This talk consists of two parts. First to discuss the decision making in a digital economy and a digital society, as well as the relationship between AI and recent ICT breakthrough including data science. Second to illustrate the power of data science through problems and solutions in medicine, transportation, customer relationship, and more.

 

Prof. Ho Tu Bao – Japan Advanced Institute for Science and Technology (Japan)

Ho Tu Bao graduated (1978) from the Faculty of Mathematics -Physics, Hanoi University of Technology, MA (1984) and Doctor (1987) in Artificial Intelligence at the Universite Paris 6. He has been doing research, application and teaching since then in the fields of Artificial Intelligence (AI), Machine Learning (ML) and Data Mining (DM), and more recently in Data Science (DS). He has been professors and emeritus professor of Japan Advanced Institute of Science and Technology (JAIST) since 7.1993. From 4.2018, he is Professor of John von Neumann Institute of VNUHCM and Head of Data Science Lab of the Vietnam Institute for Advanced Study in Mathematics (VIASM). He is members of the Steering Committee of PRICAI (Pacific Rim International Conference on Artificial Intelligence), PAKDD (Pacific Asia Knowledge Discovery and Data Mining, Chair 2014-2017), ACML (Asia Conference on Machine Learning, Co-chair 2013) -2016). http://www.jaist.ac.jp/~bao

ARTIFICIAL INTELLIGENCE For Life 2018 TALK LIST

ARTIFICIAL INTELLIGENCE For Life 2018 TALK LIST

The 2018 Vietnam joint Conference on Artificial Intelligence for Life (AI4Life-2018) is an international forum for practitioners and researchers among Acedemia, Industry, and Government to present novel research results in Artificial Intelligence, to communicate and exchange innovative ideas, as well as to discuss potential applications. The conference aims to raise the public awareness on the recent advances and emergence of Artificial Intelligence in every aspect of our life.

(09–11 May 2018: VNU University of Engineering and Technology – 144 Xuan Thuy, Cau Giay, Hanoi, Vietnam)

TUTORIALS

Deep Learning for Natural Language Processing and Beyond – Assoc. Prof. Nguyen Le Minh (Japan Advanced Institute for Science and Technology, Japan)

AI and data in cancer research – Dr. Pham Viet Thang (VU University Medical Center, Netherland)

Pattern recognition: feature engineering and (deep) feature learning – Assoc. Prof. Nguyen Duc Dung (Institute of Information Technology)

From ML Algorithms to ML Systems – Kenneth Tran (Microsoft Research, USA)

POLICY AND STRATEGY FOR DEVELOPMENT AND SOCIAL ISSUES

Fostering the communities of robotics and AI in Vietnam and in International – Dr. Vu Duy Thuc (Ohmilabs, USA)

AI2’s startup incubator: progress and directions – Dr. Ha Vu (Allen Institute for AI, USA)

Virtual and Augmented Reality: Applications and Issues in a Smart City context – Assoc. Prof. Perry Stuart (University of Technology Sydney, Australia)

Implementation of AI Platforms to create competitive advantages for enterprises – Dr. Le Hong Viet (FPT Corporation, Vietnam)

An application of Deep learning in smart city traffic management – Assoc. Prof. Pham Hong Quang (Vietnam Academy of Science and Technology, Vietnam)

AI in smart city infrastructure management – Prof. Nguyen Kim Khoa (University of Québec, Canada)

AI in Healthcare – Opportunities for Vietnam – Dr. Tran Dang Minh Tri (Harrison-AI, Australia)

Applied AI for predicting the quality of irrigation services in the Red river delta – Dr. Nguyen Thanh Tung (ThuyLoi University, Vietnam)

APPLICATIONS AND PRODUCTS

Data science: A key in the digital transformation time – Prof. Ho Tu Bao (Japan Advanced Institute for Science and Technology, Japan)

AI Strategy and Implementation on Got It’s Knowledge as a Service Platform – Dr. Hung Tran (Got it, USA)

Applied machine learning for decision making in real-life problems – Dr. Le Sy Quang (Google, UK)

ML&AI Approach to User Understanding Ecosystem at VCCorp: Applications to News, Ads, and E-commerce – Dr. Hoang Anh Tuan (VCCORP, Vietnam)

Application of artificial intelligence techniques in building economic-financial forecast models on high dimensional data sets – Assoc. Prof. Do Van Thanh (Nguyen Tat Thanh University, Vietnam)

Operations research: from theory to applications in Vietnam – Dr. Ha Minh Hoang (Vietnam National University, Vietnam)

Developing Intelligent Systems based on Internet of Things: Some preliminary results – Assoc. Prof. Le Hoang Son (VNU, Vietnam)

Cognitive Banking – Mr. Nguyen Manh Khang (IBM, Vietnam)

AI in Electro-Optical/Infrared camera surveillance systems – Dr. Dao Duc Minh (Viettel R&D, Vietnam)

Social graph analysis for verification and fill out users’ information – Mr. Le Minh (Five9, Vietnam)

BASIC RESEARCH

Structured prediction for the summarisation and alignment of videos – Prof. Massimo Piccardi (University of Technology Sydney, Australia)

From Human Machine Interaction to Human Machine Intelligence – Assoc. Prof. Le Thanh Ha (Vietnam National University, Vietnam)

How to Make Chatbots Smarter: Computational Semantics Beyond Events and Roles – Dr. Le Hong Phuong (Vietnam National University, Vietnam)

Analyzing Daily Activity Logs for Smart Interaction – Assoc. Prof. Tran Minh Triet (Vietnam National University Ho Chi Minh City, Vietnam)

Reinforcement learning for mobile robots – Dr. Nguyen Do Van (Vietnam National University, Vietnam)

20 years of Vietnamese Spoken Language Processing: Research & Achievements – Assoc. Prof. Vu Hai Quan (VNUHCM University of Science, Vietnam)

General Game Playing: a Challenge for AI – Assoc. Prof. Sylvain Lagrue (University of Artois, France)

Answer set programming and its Applications – Prof. Tran Cao Son (New Mexico State University, USA)

Evolutionary computation and its roles in AI – Assoc. Prof. Bui Thu Lam (Le Quy Don University, Vietnam)

AI in 5G networks – Prof. Do Van Tien (Budapest University Of Technology And Economics, Hungary)

A New Paradigm – Assoc. Prof. Huynh Thanh Binh (Hanoi University of Science and Technology, Vietnam) – Evolutionary Multitasking

Performance Improvement of Industrial Motor Drives using Artificial-Intelligence based Control Techniques – Prof. Ta Cao Minh (Hanoi University of Science and Technology, Vietnam)

Dialogue Engine Algorithms for Personal Artificial Intelligence (P.A.I.) – Dr. Nguyen Tuan Duc (Alt, Vietnam)


Hội nghị Trí tuệ nhân tạo cho cuộc sống

Hội nghị Trí tuệ nhân tạo cho cuộc sống

Năm 2018 tại Việt Nam, hội nghị về Trí tuệ nhân tạo dành cho cuộc sống (AI4Life-2018) là diễn đàn quốc tế dành cho các học viên, nhà nghiên cứu thuộc các cơ quan chính phủ, doanh nghiệp và viện hàn lâm để giao tiếp, trao đổi ý kiến, thảo luận về các ứng dụng tiềm năng – đưa ra các kết quả nghiên cứu về trí tuệ nhân tạo. Hội nghị sẽ nâng cao các nhận thức của công chúng và các tổ chức về những tiến bộ, ứng dụng và các khuyến cáo gần đây cũng như sự xuất hiện của Trí tuệ nhân tạo (AI) trong mọi khí cạnh của cuộc sống.

Hội nghị được tổ chức từ 09-11/05/2018 Tại Đại học công nghệ – Đại học Quốc gia Hà Nội – 144 Xuân Thủy – Cầu Giấy – Hà Nội

Danh sách các chủ đề

1. Các bài hướng dẫn

* Nguyen Le Minh (Japan Advanced Institute for Science and Technology, Japan): Học sâu về Xử lý ngôn ngữ tự nhiên và hơn thế nữa (Deep Learning for Natural Language Processing and Beyond)

* Pham Viet Thang(VU University Medical Center, Netherland): Trí tuệ nhân tạo và dữ liệu trong nghiên cứu ung thư (AI and data in cancer research)

* Nguyen Duc Dung (Institute of Information Technology): Nhận dạng mẫu: tính năng kỹ thuật và tính năng học sâu(Pattern recognition: feature engineering and (deep) feature learning)

* Kenneth Tran (Microsoft Research, USA): Từ các thuật toán học máy đến các hệ thống học máy (From ML Algorithms to ML Systems)

2. Chiến lược và chính sách về các vấn đề phát triển và xã hội

* Vu Duy Thuc (Ohmilabs, USA): Khuyến khích cộng đồng robot và AI tại Việt Nam và quốc tế (Fostering the communities of robotics and AI in Vietnam and in International)

* Ha Vu (Allen Institute for AI, USA): Vườn ươm khởi nghiệp AI2’s: tiến độ và hướng dẫn (AI2’s startup incubator: progress and directions)

* Perry Stuart (University of Technology Sydney, Australia): (Virtual and Augmented Reality: Applications and Issues in a Smart City context)

Học máy qua phản hồi của con người – DEEPMIND

Chúng tôi tin rằng Trí tuệ Nhân tạo sẽ trở thành tiến bộ công nghệ quan trọng nhất và có nhiều lợi ích nhất từ trước đến giờ, giúp loài người giải quyết được những vấn đề lớn mà chúng ta phải đối mặt, từ biến đổi khí hậu tới hệ thống y tế tân tiến. Nhưng để AI có thể thực hiện điều đó, chúng tôi biết rằng công nghệ này phải được xây dựng với một thái độ có trách nhiệm và chúng tôi phải tính đến tất cả những thử thách và nguy cơ tiềm tàng.

Chính vì thế mà những nhà sáng lập của DeepMind khởi xướng Partnership on AI to Benefit People and Society và vì vậy mà chúng tôi có một nhóm chuyên đảm bảo An toàn kỹ thuật AI. Nghiên cứu trong lĩnh vực này cần phải có tính mở và hợp tác để đảm bảo rằng những thực nghiệm tốt nhất được thực hiện một cách rộng rãi nhất có thể, vì vậy mà chúng tôi cũng hợp tác với OpenAI trong nghiên cứu về An toàn Kỹ thuật AI.

Một trong những câu hỏi cốt lõi của lĩnh vực này là làm sao để con người có thể yêu cầu một hệ thống làm điều chúng ta muốn và quan trọng là những gì chúng ta không muốn nó làm. Việc này càng ngày càng quan trọng hơn khi mà những vấn đề chúng ta gặp phải với machine learning đang ngày càng phức tạp và được áp dụng trong thực tiễn.

Kết quả đầu tiên từ sự hợp tác của chúng tôi mô tả một phương pháp để giải quyết vấn đề nêu trên, bằng cách cho những người không có kinh nghiệm về kỹ thuật để dạy cho một hệ thống Reinforcement learning (RL) – một AI học bằng cách thử sai – một mục tiêu rất phức tạp. Như vậy con người sẽ không cần đưa ra một mục tiêu cụ thể ban đầu cho hệ thống. Đây là một bước quan trọng bởi vì hiểu sai mục tiêu một chút thôi cũng có thể dẫn tới những hành vi không mong muốn hay thậm chí nguy hiểm. Trong một số trường hợp, chỉ 30 phút phản hồi từ một người bình thường cũng đủ để huấn luyện hệ thống, bao gồm cả dạy cho nó một hành vi phức tạp hoàn toàn mới, như dạy một robot giả lập cách nhảy blackflips.

Cần tới 900 phản hồi của con người để dạy cho thuật toán cách nhảy backflip
Cần tới 900 phản hồi của con người để dạy cho thuật toán cách nhảy backflip

 

Hệ thống – được miêu tả trong nghiên cứu của chúng tôi Deep Reinforcement Learning from Human Preferences – khác với một hệ thống RL thông thường ở chỗ nó huấn luyện agent (robot hoặc AI) bằng một neural network theo kiểu dự đoán phần thưởng “reward predictor” hơn là kiểu thu thập phần thưởng trong khi agent khám phá một môi trường.

Nó bao gồm ba tiến trình chạy song song:

1.Một Agent Reinforcement learning khám phá và tương tác với môi trường quanh nó, ví dụ như các trò chơi trên máy Atari.

2.Định kỳ, một cặp video clip dài 1 tới 2 giây quay các hoạt động của agent tới một điều hành viên con người và hỏi xem hoạt động trong video nào là cách tốt nhất để đạt được mục tiêu mong muốn.

3.Lựa chọn của con người được dùng để huấn luyện một “reward predictor” , rồi sau đó predictor này sẽ huấn luyện agent. Qua thời gian, agent sẽ học cách để tối đa hóa phần thưởng và cải thiện hành vi của nó theo lựa chọn của con người.

Hệ thống này sẽ tách biệt việc học hiểu mục tiêu và việc học hiểu phương pháp để đạt được mục tiêu đó
Hệ thống này sẽ tách biệt việc học hiểu mục tiêu và việc học hiểu phương pháp để đạt được mục tiêu đó

 

Phương pháp học tập lặp lại này đồng nghĩa với việc con người có thể phát hiện và chỉnh sửa bất kỳ hành vi không mong muốn nào, một điểm rất quan trọng của bất kỳ hệ thống an toàn nào. Cơ chế này cũng sẽ không dồn một khối lượng công việc quá lớn lên điều hành viên con người, họ chỉ phải duyệt qua khoảng 0.1% số lượng hành vi của agent để có thể khiến agent thực hiện những gì họ muốn. Tuy vậy, điều hành viên cũng phải duyệt qua vài trăm tới vài nghìn cặp video clip nên thuật toán cần được cải thiện để có thể áp dụng vào các vấn đề thực tiễn.

Điều hành viên sẽ phải chọn một trong hai clip. Trong ví dụ này, đối với trò Qbert, clip bên phải cho thấy hành vi phù hợp hơn để ghi điểm.
Điều hành viên sẽ phải chọn một trong hai clip. Trong ví dụ này, đối với trò Qbert, clip bên phải cho thấy hành vi phù hợp hơn để ghi điểm.

 

Trong trò Enduro, người chơi phải lái một chiếc xe để vượt qua những xe khác. Với trò này thì rất khó để agent có thể học chơi trò này bằng phương pháp thử sai trong thuật toán RL trước đây, phản hồi của con người cuối cùng cũng cho phép hệ thống của chúng tôi đạt được kết quả như con người. Trong những trò chơi khác và các tác vụ robot giả lập, hệ thống của chúng tôi đạt được những kết quả có thể so sánh với hệ thống RL thông thường trong khi một số trò khác như Qbert và Breakout thì nó không thể thực hiện tác vụ.

Nhưng mục tiêu cuối cùng của một hệ thống như này là cho phép con người đặt một mục tiêu cụ thể cho agent kể cả khi nó không xuất hiện trong môi trường. Để kiểm tra việc này, chúng tôi dạy agent nhiều hành vi mới lạ như nhảy backflip, bước đi trên một chân hay học lái xe song song với một xe khác trong Enduro hơn là vượt qua để lấy điểm số cao.

Mục tiêu thông thường của trò Enduro là vượt qua nhiều xe nhất có thể. Tuy nhiên trong hệ thống của chúng tôi, chúng tôi có thể dạy cho agent một mục tiêu hoàn toàn khác, như là lái song song một chiếc xe khác.
Mục tiêu thông thường của trò Enduro là vượt qua nhiều xe nhất có thể. Tuy nhiên trong hệ thống của chúng tôi, chúng tôi có thể dạy cho agent một mục tiêu hoàn toàn khác, như là lái song song một chiếc xe khác.

Mục tiêu thông thường của trò Enduro là vượt qua nhiều xe nhất có thể. Tuy nhiên trong hệ thống của chúng tôi, chúng tôi có thể dạy cho agent một mục tiêu hoàn toàn khác, như là lái song song một chiếc xe khác.

Mặc dù những bài kiểm tra đó cho thấy một vài kết quả khả quan, một số khác cho thấy những hạn chế của hệ thống. Cụ thể hơn, cài đặt của chúng tôi dễ bị reward hacking hay đánh lừa hàm tính thưởng – nếu phản hồi của con người bị ngắt quãng trong giai đoạn đầu của huấn luyện. Trong trường hợp đó, agent sẽ tiếp tục khám phá môi trường game trong khi reward predictor bị buộc phải ước lượng phần thưởng cho các tình huống mà nó không nhận được phản hồi nào. Việc này có thể dẫn tới đánh giá quá cao phần thưởng, khiến agent học những hành vi sai, thường là kỳ lạ. Một ví dụ có thể thấy ở video tiếp theo, khi mà agent nhận thấy đập bóng qua lại là một chiến thuận tốt hơn là thắng hay mất điểm.

Agent đã qua mặt hàm tính thưởng của chính nó, và quyết định chỉ đánh bóng qua lại thay vì cố gắng ghi điểm hay để mất điểm.
Agent đã qua mặt hàm tính thưởng của chính nó, và quyết định chỉ đánh bóng qua lại thay vì cố gắng ghi điểm hay để mất điểm.

Agent đã qua mặt hàm tính thưởng của chính nó, và quyết định chỉ đánh bóng qua lại thay vì cố gắng ghi điểm hay để mất điểm.

Hiểu được những thiếu sót như vậy là tối quan trọng để đảm bảo chúng tôi tránh được những thất bại và phát triển được một hệ thống AI có hành vi như mong muốn.

Còn rất nhiều công việc phải làm để kiểm tra và nâng cấp hệ thống này, nhưng nó đã cho thấy một số bước đột phá đầu tiên trong việc xây dựng một hệ thống có thể được dạy bởi những người dùng không chuyên nghiệp, mang tính kinh tế với số lượng phản hồi mà nó cần và có thể mở rộng ra nhiều vấn đề khác.

Các lĩnh vực cần khám phá khác có thể bao gồm việc giảm thiểu số lượng phản hồi của con người hay cho phép con người phản hồi qua giao diện ngôn ngữ tự nhiên. Việc đó sẽ đánh dấu một bước thay đổi trong việc tao ra một hệ thống có thể dễ dàng học từ những hành vi phức tạp của con người và là một bước quan trọng hướng tới việc tạo ra AI có thể làm việc với và vì loài người.

Lưu ý: Bài viết này được các nhà khoa học của DeepMind viết dựa trên nghiên cứu chung với OpenAI. Các nhà khoa học của OpenAI cũng đã viết một bài blog khác dưới góc nhìn của họ. Chúng tôi sẽ giới thiệu tới độc giả bài viết đó trong tương lai gần.

Theo Shane Legg, Jan Leike, Miljan Martic (DeepMind)

Bài viết được dẫn nguồn tại đây: Tạp chí AI