VnTips 9 tháng trước

Công nghệ Máy học (Machine Learning) là gì?

Mục lục

Mặc dù khác xa với tầm nhìn ban đầu về trí tuệ nhân tạo, máy học đã đưa chúng ta đến gần hơn nhiều với mục tiêu cuối cùng là tạo ra những cỗ máy biết tư duy. Đưới đây là phân tích cách nó hoạt động.

Vào tháng 12 năm 2017, DeepMind, phòng thí nghiệm nghiên cứu được Google mua lại vào năm 2014, đã giới thiệu AlphaZero, một chương trình trí tuệ nhân tạo có thể đánh bại các nhà vô địch thế giới trong một số trò chơi board game.

Điều thú vị là AlphaZero không nhận được hướng dẫn nào từ con người về cách chơi trò chơi (do đó có tên như vậy). Thay vào đó, nó sử dụng máy học, một nhánh của AI phát triển hành vi của nó thông qua trải nghiệm thay vì các mệnh lệnh rõ ràng.

Trong vòng 24 giờ, AlphaZero đã đạt được thành tích siêu phàm trong môn cờ vua và đánh bại chương trình cờ vua vô địch thế giới trước đó. Ngay sau đó, thuật toán học máy của AlphaZero cũng thành thạo Shogi (cờ Nhật) và trò chơi cờ vây của Trung Quốc, đồng thời nó đã đánh bại người tiền nhiệm của nó, AlphaGo, với tỷ số 100-0.

Học máy đã trở nên phổ biến trong những năm gần đây và đang giúp máy tính giải quyết các vấn đề trước đây được cho là lĩnh vực độc quyền của trí tuệ con người. Và mặc dù vẫn còn rất xa so với tầm nhìn ban đầu về trí tuệ nhân tạo, học máy đã đưa chúng ta đến gần hơn nhiều với mục tiêu cuối cùng là tạo ra những cỗ máy biết tư duy.

Sự khác nhau giữa trí tuệ nhân tạo (AI) và học máy (Machine Learning) là gì?

Các cách tiếp cận truyền thống để phát triển trí tuệ nhân tạo bao gồm việc mã hóa tỉ mỉ tất cả các quy tắc và kiến thức xác định hành vi của tác nhân AI. Khi tạo AI dựa trên quy tắc, nhà phát triển phải viết hướng dẫn chỉ định cách AI sẽ hành xử để ứng phó với mọi tình huống có thể xảy ra. Cách tiếp cận dựa trên quy tắc này, còn được gọi là AI cổ điển (GOFAI) hoặc AI biểu tượng, cố gắng bắt chước các chức năng lý luận và biểu diễn kiến thức của tâm trí con người.

Một ví dụ hoàn hảo về AI mang tính biểu tượng là Stockfish, một công cụ cờ vua mã nguồn mở xếp hạng hàng đầu trong hơn 10 năm hình thành. Hàng trăm lập trình viên và người chơi cờ đã đóng góp cho Stockfish và giúp phát triển logic của nó bằng cách mã hóa các quy tắc của nó, ví dụ: AI nên làm gì khi đối thủ di chuyển quân mã của nó từ B1 sang C3.

Nhưng AI dựa trên quy tắc thường bị phá vỡ khi xử lý các tình huống trong đó các quy tắc quá phức tạp và tiềm ẩn. Ví dụ: nhận dạng giọng nói và đối tượng trong hình ảnh là các thao tác nâng cao không thể diễn đạt bằng các quy tắc logic.

Trái ngược với AI biểu tượng, các mô hình AI học máy được phát triển không phải bằng cách viết các quy tắc mà bằng cách thu thập các ví dụ. Ví dụ: để tạo ra một công cụ cờ vua dựa trên công nghệ học máy, nhà phát triển sẽ tạo một thuật toán cơ bản rồi “huấn luyện” thuật toán đó bằng dữ liệu từ hàng nghìn ván cờ đã chơi trước đó. Bằng cách phân tích dữ liệu, AI tìm ra các mô hình chung xác định chiến lược chiến thắng mà nó có thể sử dụng để đánh bại các đối thủ thực sự.

AI đánh giá càng nhiều trò chơi thì khả năng dự đoán các nước đi thắng trong quá trình chơi càng tốt. Đây là lý do tại sao học máy được định nghĩa là một chương trình có hiệu suất được cải thiện theo kinh nghiệm.

Học máy có thể áp dụng cho nhiều tác vụ trong thế giới thực, bao gồm phân loại hình ảnh, nhận dạng giọng nói, đề xuất nội dung, phát hiện gian lận và xử lý ngôn ngữ tự nhiên.

Học tập có giám sát và không giám sát

Tùy thuộc vào vấn đề họ muốn giải quyết, các nhà phát triển sẽ chuẩn bị dữ liệu liên quan để xây dựng mô hình học máy của họ. Ví dụ: nếu họ muốn sử dụng công nghệ học máy để phát hiện các giao dịch ngân hàng gian lận, các nhà phát triển sẽ lập danh sách các giao dịch hiện có và gắn nhãn kết quả cho chúng (lừa đảo hoặc hợp lệ). Khi họ cung cấp dữ liệu cho thuật toán, nó sẽ phân tách các giao dịch gian lận và hợp lệ, đồng thời tìm ra các đặc điểm chung trong mỗi loại trong số hai loại. Quá trình đào tạo các mô hình với dữ liệu chú thích được gọi là “học có giám sát” và hiện là hình thức học máy thống trị.

Đã tồn tại nhiều kho lưu trữ trực tuyến dữ liệu được gắn nhãn cho các nhiệm vụ khác nhau. Một số ví dụ phổ biến là ImageNet, một tập dữ liệu nguồn mở gồm hơn 14 triệu hình ảnh được gắn nhãn và MNIST, một tập dữ liệu gồm 60.000 chữ số viết tay được gắn nhãn. Các nhà phát triển học máy cũng sử dụng các nền tảng như Mechanical Turk của Amazon, một trung tâm tuyển dụng trực tuyến theo yêu cầu để thực hiện các nhiệm vụ nhận thức như gắn nhãn hình ảnh và mẫu âm thanh. Và ngày càng có nhiều công ty khởi nghiệp chuyên về chú thích dữ liệu.

Nhưng không phải tất cả các vấn đề đều yêu cầu dữ liệu được dán nhãn. Một số vấn đề về học máy có thể được giải quyết thông qua “học không giám sát”, trong đó bạn cung cấp cho mô hình AI dữ liệu thô và để nó tự tìm ra mẫu nào có liên quan.

Một cách sử dụng phổ biến của học tập không giám sát là phát hiện sự bất thường. Ví dụ: thuật toán học máy có thể huấn luyện dữ liệu lưu lượng mạng thô của một thiết bị được kết nối internet chẳng hạn như tủ lạnh thông minh. Sau khi đào tạo, AI sẽ thiết lập đường cơ sở cho thiết bị và có thể gắn cờ hành vi ngoại lệ. Nếu thiết bị bị nhiễm phần mềm độc hại và bắt đầu liên lạc với các máy chủ độc hại, mô hình học máy sẽ có thể phát hiện ra thiết bị đó vì lưu lượng truy cập mạng khác với hành vi bình thường được quan sát trong quá trình đào tạo.

Học tăng cường

Đến bây giờ, có lẽ bạn đã biết rằng dữ liệu đào tạo chất lượng đóng một vai trò rất lớn đối với hiệu quả của các mô hình học máy. Nhưng học tăng cường là một loại học máy chuyên biệt trong đó AI phát triển hành vi của nó mà không cần sử dụng dữ liệu trước đó.

Các mô hình học tăng cường bắt đầu với một nền tảng rõ ràng. Họ chỉ được hướng dẫn về các quy tắc cơ bản của môi trường và nhiệm vụ trước mắt. Thông qua việc thử và sai, họ học cách tối ưu hóa hành động của mình để đạt được mục tiêu.

AlphaZero của DeepMind là một ví dụ thú vị về học tăng cường. Trái ngược với các mô hình học máy khác, vốn phải xem cách con người chơi cờ và học hỏi từ họ, AlphaZero bắt đầu chỉ biết nước đi của quân cờ và điều kiện thắng của trò chơi. Sau đó, nó chơi hàng triệu trận đấu với chính mình, bắt đầu bằng những hành động ngẫu nhiên và dần dần phát triển các khuôn mẫu hành vi.

Học tăng cường là một lĩnh vực nghiên cứu nóng. Đây là công nghệ chính được sử dụng để phát triển các mô hình AI có thể làm chủ các trò chơi phức tạp như Dota 2 và StarCraft 2, đồng thời cũng được sử dụng để giải quyết các vấn đề trong đời thực như quản lý tài nguyên trung tâm dữ liệu và tạo ra bàn tay robot có thể xử lý các vật thể khéo léo như con người. .

Học sâu

Học sâu là một tập hợp con phổ biến khác của học máy. Nó sử dụng mạng lưới thần kinh nhân tạo, cấu trúc phần mềm gần như được lấy cảm hứng từ cấu trúc sinh học của bộ não con người.

Mạng lưới thần kinh vượt trội trong việc xử lý dữ liệu phi cấu trúc như hình ảnh, video, âm thanh và các đoạn văn bản dài như bài báo và tài liệu nghiên cứu. Trước khi học sâu, các chuyên gia về máy học đã phải nỗ lực rất nhiều trong việc trích xuất các tính năng từ hình ảnh và video, đồng thời chạy thuật toán của họ trên đó. Mạng lưới thần kinh tự động phát hiện các tính năng đó mà không cần nhiều nỗ lực từ các kỹ sư con người.

Học sâu là nền tảng đằng sau nhiều công nghệ AI hiện đại như ô tô không người lái, hệ thống dịch thuật tiên tiến và công nghệ nhận dạng khuôn mặt trong iPhone X của bạn.

Giới hạn của Machine Learning

Mọi người thường nhầm lẫn giữa học máy (Machine Learning) với trí tuệ nhân tạo (AI) ở cấp độ con người và bộ phận tiếp thị của một số công ty cố tình sử dụng các thuật ngữ này thay thế cho nhau. Nhưng mặc dù học máy đã có những bước tiến lớn trong việc giải quyết các vấn đề phức tạp, nhưng vẫn còn rất xa mới tạo ra được những cỗ máy biết suy nghĩ như những người tiên phong về AI đã hình dung .

Ngoài việc học hỏi từ kinh nghiệm, trí thông minh thực sự còn đòi hỏi lý luận, lẽ thường và tư duy trừu tượng – những lĩnh vực mà các mô hình học máy hoạt động rất kém.

Ví dụ, trong khi máy học rất giỏi trong các nhiệm vụ nhận dạng mẫu phức tạp như dự đoán ung thư vú trước 5 năm, thì nó lại gặp khó khăn với các nhiệm vụ lý luận và logic đơn giản hơn như giải các bài toán trung học.

Việc thiếu khả năng suy luận của máy học khiến nó không có khả năng khái quát hóa kiến thức. Ví dụ: một tác nhân học máy có thể chơi Super Mario 3 như một người chuyên nghiệp sẽ không thống trị được một trò chơi nền tảng khác, chẳng hạn như Mega Man hoặc thậm chí là một phiên bản khác của Super Mario. Nó sẽ cần phải được đào tạo từ đầu.

Không có khả năng trích xuất kiến thức khái niệm từ kinh nghiệm, các mô hình học máy đòi hỏi rất nhiều dữ liệu đào tạo để thực hiện. Thật không may, nhiều miền thiếu dữ liệu đào tạo đầy đủ hoặc không có đủ kinh phí để thu thập thêm. Học sâu, hiện là hình thức học máy phổ biến, cũng gặp phải vấn đề về khả năng giải thích: Mạng lưới thần kinh hoạt động theo những cách phức tạp và ngay cả những người tạo ra chúng cũng gặp khó khăn trong việc tuân theo các quy trình ra quyết định. Điều này gây khó khăn cho việc sử dụng sức mạnh của mạng lưới thần kinh trong những môi trường có yêu cầu pháp lý để giải thích các quyết định của AI.

May mắn thay, những nỗ lực đang được thực hiện để vượt qua giới hạn của học máy. Một ví dụ đáng chú ý là sáng kiến rộng rãi của DARPA, cơ quan nghiên cứu của Bộ Quốc phòng, nhằm tạo ra các mô hình AI có thể giải thích được.

Các dự án khác nhằm mục đích giảm sự phụ thuộc quá mức của học máy vào dữ liệu được chú thích và làm cho công nghệ này có thể truy cập được đối với các miền có dữ liệu đào tạo hạn chế. Các nhà nghiên cứu tại IBM và MIT gần đây đã xâm nhập vào lĩnh vực này bằng cách kết hợp AI biểu tượng với mạng lưới thần kinh. Các mô hình AI lai yêu cầu ít dữ liệu hơn để đào tạo và có thể đưa ra giải thích từng bước về các quyết định của chúng.

Liệu sự phát triển của học máy cuối cùng có giúp chúng ta đạt được mục tiêu khó nắm bắt là tạo ra AI ở cấp độ con người hay không vẫn còn phải xem. Nhưng điều chúng ta biết chắc chắn là nhờ những tiến bộ trong học máy, các thiết bị trên bàn và trong túi của chúng ta đang ngày càng thông minh hơn.

23 lượt xem | 0 bình luận

Bình luận

Chia sẻ

Đề xuất cho bạn