Apple công bố đang tạo hệ thống AI có thể vượt qua hệ thống mô hình ngôn ngữ GPT-4

author 09:38 06/04/2024

(VietQ.vn) - Apple đang phát triển hệ thống AI dự kiến có thể vượt qua GPT-4 - một phiên bản mới nhất của hệ thống mô hình ngôn ngữ.

Các nhà nghiên cứu của Apple đã phát triển hệ thống trí tuệ nhân tạo (AI) có tên ReALM (mô hình ngôn ngữ giải quyết tham chiếu) với mục tiêu cải thiện đáng kể khả năng hiểu và phản hồi lệnh của trợ lý ảo, dự đoán có thể vượt qua cả tính năng GPT-4 (GPT-4 là phiên bản mới nhất của hệ thống mô hình ngôn ngữ của OpenAI).

Trong một bài báo nghiên cứu, Apple phác thảo hệ thống AI mới về cách các mô hình ngôn ngữ lớn xử lý tiến trình “giải quyết tham chiếu”, đây là tiến trình hiểu các tham chiếu trên màn hình, cũng như bối cảnh hội thoại và bối cảnh tổng thể để đem đến kết quả mong muốn cho người dùng. Kết quả là, ReALM có thể mang đến tương tác trực quan và tự nhiên hơn với các thiết bị.

Giải quyết tham chiếu là một phần quan trọng của việc hiểu ngôn ngữ tự nhiên, cho phép người dùng sử dụng đại từ và các tham chiếu gián tiếp khác trong cuộc trò chuyện mà không bị nhầm lẫn. Đối với các trợ lý kỹ thuật số, khả năng này từ lâu đã là thách thức đáng kể do bị giới hạn phải giải thích nhiều tín hiệu bằng lời và thông tin trực quan.

Apple công bố đang tạo hệ thống AI có thể vượt qua GPT-4. (Ảnh minh họa)

Hệ thống ReALM của Apple tìm cách giải quyết vấn đề này bằng cách chuyển đổi quá trình phức tạp của việc giải quyết tham chiếu thành vấn đề mô hình ngôn ngữ thuần túy. Bằng cách đó, hệ thống có thể hiểu các tham chiếu đến yếu tố hình ảnh hiển thị trên màn hình và tích hợp sự hiểu biết này vào luồng hội thoại.

AI của Apple có tên ReALM, được phát triển nhằm cải tiến cách trợ lý giọng nói hiểu và phản hồi câu lệnh của con người một cách tự nhiên. Trong tài liệu nghiên cứu đăng trên website của Đại học Cornell (Mỹ), Apple mô tả cách mô hình ngôn ngữ lớn xử lý các tham chiếu, trong đó có việc giải mã những tham chiếu không rõ ràng, cũng như hiểu bối cảnh hội thoại, giúp tương tác trực quan và tự nhiên hơn.

"Lời nói của con người thường chứa những tham chiếu mơ hồ như 'họ' hoặc 'cái đó', vốn có ý nghĩa tùy theo ngữ cảnh. Có thể hiểu ngữ cảnh là điều cần thiết đối với một trợ lý giọng nói, cho phép người dùng trò chuyện và truyền đạt yêu cầu của họ một cách tự nhiên", các chuyên gia của Apple cho hay.

Đối với trợ lý ảo như Siri, khả năng hiểu tham chiếu trước đây là một thách thức lớn, bị hạn chế bởi việc diễn giải nhiều loại tín hiệu bằng lời nói, thông tin hình ảnh. Hệ thống ReALM giải quyết vấn đề bằng cách chuyển đổi quy trình phân giải tham chiếu phức tạp thành mô hình ngôn ngữ thuần túy. Từ đó, nó có thể hiểu tham chiếu đến các yếu tố hình ảnh hiển thị trên màn hình và đưa sự hiểu biết này vào luồng đàm thoại.

Các nhà nghiên cứu của Apple cho biết, chiến lược này kết hợp việc tinh chỉnh cụ thể mô hình ngôn ngữ cho các tác vụ phân giải tham chiếu, vượt qua phương pháp truyền thống, trong đó có GPT-4 của OpenAI. Apple dường như cuối cùng đã “vén bức màn” về một số nỗ lực liên quan đến Trí tuệ Nhân tạo (AI).

Theo CNN, các nhà nghiên cứu của Apple đã phát triển một nhóm mô hình đa phương thức được gọi là MM1. Nhóm mô hình này đề cập đến hệ thống AI có thể diễn giải và tạo ra các loại dữ liệu khác nhau, chẳng hạn như văn bản và hình ảnh cùng lúc. Thông báo cho biết các phương pháp mới của hãng có “khả năng vượt trội” và cung cấp khả năng suy luận nâng cao cũng như học tập theo ngữ cảnh để phản hồi văn bản và hình ảnh. Hệ thống như vậy có thể mang lại lợi ích trong tương lai cho các sản phẩm của Apple, bao gồm iPhone, Mac và trợ lý giọng nói Siri.

Kết quả, Apple khẳng định mô hình AI nhỏ nhất cho hiệu suất hoạt động tương đương với GPT-4, trong khi mô hình lớn nhất thậm chí còn vượt trội hoàn toàn. Khác với phương pháp truyền thống tập trung vào bối cảnh hội thoại, ReALM chuyển đổi thông tin màn hình thành văn bản, cho phép bỏ qua nhu cầu về các tham số nhận dạng hình ảnh, từ đó xử lý hiệu quả hơn trên thiết bị AI.

Nền tảng từ hệ thống AI này hứa hẹn sẽ mang đến trải nghiệm ấn tượng hơn cho người dùng khi trợ lý ảo Siri có thể ghi nhớ lịch sử cuộc trò chuyện và phản hồi câu lệnh một cách tự nhiên hơn.

Thanh Hiền (t/h)

Thích và chia sẻ bài viết:

tin liên quan

video hot

Về đầu trang