VÀI NÉT TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO


I. TRÍ TUỆ NHÂN TẠO LÀ GÌ?

Trí tuệ nhân tạo (Artficial Intelligent) là các kỹ thuật, thuật toán giúp máy tính bắt trước các hành vi của con người. AI có rất nhiều ứng dụng cho các lĩnh vực khác nhau như robotics, tài chính, y học, sinh học ...


Trí tuệ nhân tạo (Artficial Intelligent)

Nền tảng lý thuyết của AI bao gồm: xác suất thống kê, tối ưu hóa, logic toán học, lý thuyết quyết định. Có rất nhiều lĩnh vực quan trọng của khoa học máy tính thuộc về AI như: computer vision, robotics, học máy (machine learning), học sâu (deep learning) và xử lý ngôn ngữ tự nhiên (natural language processing). Đặc biệt machine learning (ML) và deep learning là hai mảng có nhiều ứng dụng và đang được nhiều người quan tâm nghiên cứu.

⦁ Học máy (Machine learning - ML)

Như trên đã nói, ML là một lĩnh vực con của AI. Mục tiêu của ML là giúp cho máy tính tự học. Các thuật toán của ML cho phép máy tính nhận dạng mẫu trong tập dữ liệu được quan sát. Trên cơ sở đó nó đưa ra quyết định dựa trên việc phân tích dữ liệu

Nền tảng lý thuyết của AI bao gồm: xác suất thống kê, tối ưu hóa, logic toán học, lý thuyết quyết định. Có rất nhiều lĩnh vực quan trọng của khoa học máy tính thuộc về AI như: computer vision, robotics, học máy (machine learning), học sâu (deep learning) và xử lý ngôn ngữ tự nhiên (natural language processing). Đặc biệt machine learning (ML) và deep learning là hai mảng có nhiều ứng dụng và đang được nhiều người quan tâm nghiên cứu.

AI (Trí tuệ nhân tạo)

⦁ Học sâu (Deep learning - DL)

Là một vùng của Học máy (ML), ở đó các thuật toán được dựa trên mạng neutral nhân tạo (artificial neutral networks). Việc học có thể là một trong ba loại SL, UL và RL.

II. MỘT VÀI KHÁI NIỆM

⦁ Vecto đặc điểm (feature vector)

Tập dữ liệu được đặc trưng bởi vector đặc điểm X=[x_1, x_2,…, x_d], ở đó x_i là một đặc điểm của dữ liệu. Ta gọi đó là số chiều hay số đặc điểm của dữ liệu. + Ví dụ: Xét tập dữ liệu là một nhóm người thì vector đặc điểm sẽ là X=[a, h, w], ở đó x_1=a là tuổi, x_2=h là chiều cao và x_3=w là cân nặng.

⦁ Nhãn (Label)

Xét tập dữ liệu { X_1, X2,….} và tập các số {y_1, y_2,..} một qui tắc gán mỗi vector đặc điểm X_j với số y_j được gọi là một qui tắc gán nhãn và y_j được gọi là nhãn của vector X_j.
+ Ví dụ: Việc gán nhãn tập {X_1, X_2,…} bằng hai số {0, 1} được gọi là việc phân lớp tập dữ liệu thành hai lớp: lớp 0 và lớp 1. Nếu X_i có nhãn 0 ta nói X_i thuộc lớp 0, trong trường hợp ngược lại ta nói X_i thuộc lớp 1.

⦁ Học có giám sát (Supervised learning)

 Là các thuật toán dự đoán đầu ra của một hoặc nhiều tập dữ liệu {X} dựa trên một số cặp (X_i, y_i) đã biết, ở đó X_i là feature vector và y_i là nhãn của X_i. Nói cách khác chúng ta biết tập dữ liệu đầu vào A={X_1, X_2,…, X_N} với đàu ra là B={y_1, y_2,…, y_N}. Các cặp (X_i, y_i) tạo nên một tập huấn luyện. Từ tập huấn luyện này chúng ta xây dựng một hàm số F sao cho y_i ≈f(X_i). Mục đích là tìm hàm F thật tốt sao cho khi có đầu vào X, ta có thể dự đoán đầu ra là Y=F(X). Học giám sát có thể giải thích như việc ôn luyện thi. Để giải các đề thi {X}, chúng ta cần nghiên cứu một số đề mẫu {X_1,…, X_N} đã có đáp án là {y_1,…, y_N}. Dựa trên việc tìm hiểu và ôn luyện các đề mẫu này, mà chúng ta có thể giải và dự đoán đề thi bất kỳ X nào. Các thuật toán như hồi qui (regression) và phân loại (classification) thuộc vào lớp các thuật toán học có giám sát

⦁ Học không giám sát (Unsupervised learning -UL)

     Unsupervised Learning là một nhóm thuật toán hay phương pháp kỹ thuật cho phép máy tự học hỏi và tìm ra một mô hình hay cấu trúc nào đó ẩn trong một bộ dữ liệu không được gắn nhãn trước. Điều này đồng nghĩa với việc chúng ta chỉ có bộ dữ liệu đầu vào và hoàn toàn không biết  sự kiện  là gì.

⦁ Học củng cố (Reinforcement learning)

Là các thuật toán định hướng mục tiêu giúp máy tính học cách để đạt được các đối tượng phức hợp. Bản chất của RL là trial-and-error, nghĩa là thử đi thử lại và rút ra kinh nghiệm sau mỗi lần thử như vậy. Gần đây, RL đã đạt được những thành tựu đáng kể khi các thuật toán của DeepMind (AlphaGo, AlphaZero, AlphaStar,...) đã chiến thắng áp đảo các tuyển thủ thế giới trong những trò chơi mà con người đã từng nghĩ rằng máy móc sẽ không bao giờ có thể vượt mặt như cờ vây. Số nước cờ vây là 10^{170} trong khi số nguyên tử trong vũ trụ khoảng 10^{80}.
   Có 7 khái niệm chính trong RL mà chúng ta cần phải biết bao gồm: Agent, Environment, State, Action, Reward, Episode, Policy. Để hiểu rõ hơn về RL, chúng ta lấy ví dụ về một con robot tìm đường như hình bên dưới.

Nhiệm vụ của con robot - Agent là đi đến ô đích màu xanh, tránh ô phạt màu đỏ và ô xám là chướng ngại vật không được phép đi vào. Agent tương tác với Environment bằng các Actions trái/phải/lên/xuống. Sau mỗi action, environment trả lại cho agent một State (ở ví dụ này là vị trí của robot) và Reward tương ứng với state đó (+1 nếu đi vào xanh, -1 nếu đi vào ô đỏ và 0 nếu ở ô trắng). Khi agent đến ô xanh hoặc đỏ trò chơi kết thúc; một loạt các tương tác giữa agent và environment từ thời điểm bắt đầu đến lúc này được gọi là một Episode.
  Trong một episode, agent sẽ cố gắng chọn ra các actions tối ưu để tối đa hóa reward nhận được sau mỗi episode. Cách mà agent chọn những actions đó là Policy; ví dụ: "đi ngẫu nhiên", "đi men theo rìa" hoặc "hướng về ô đích". Mục đích của RL là tìm ra policy tốt nhất.