Tính năng gọi video cùng trí tuệ nhân tạo - bước tiến mới của ChatGPT
(VietQ.vn) - Mang lại khả năng gọi video và nhận diện hình ảnh trực tiếp trong chế độ giọng nói nâng cao, "Live Camera” có thể là bước tiến mới của ChatGPT.
Vì sao Vinamilk liên tục được gọi tên tại nhiều giải thưởng về phát triển bền vững?
Việt Nam gia tăng tình trạng kháng thuốc
Năm 2024, PV GAS TRADING thiết lập nhiều kỷ lục, vươn tầm cao mới
OpenAI đang phát triển tính năng mới mang tên “Live Camera”, được cho là sẽ tích hợp vào chế độ giọng nói nâng cao của ChatGPT. Tính năng này sẽ giúp AI (trí tuệ nhân tạo) không chỉ trò chuyện bằng âm thanh mà còn có khả năng nhận diện và phản hồi về hình ảnh.
“Live Camera” từng được giới thiệu vào tháng 5/2024 khi OpenAI trình diễn cách AI có thể quan sát hình ảnh và đưa ra phản hồi chi tiết. Trong buổi giới thiệu, AI đã nhận diện chính xác một chú chó và cung cấp thông tin về loài, đặc điểm cũng như tên gọi. Tuy nhiên, kể từ đó, OpenAI không công bố thêm bất kỳ thông tin nào về tính năng này.
Mới đây, mã nguồn trong phiên bản beta (v1.2024.317) của ChatGPT hé lộ tham chiếu mang tên “Live Camera”, gợi ý tính năng này có thể sớm ra mắt dưới dạng thử nghiệm beta trước khi được triển khai rộng rãi.
Chế độ giọng nói nâng cao của ChatGPT thử nghiệm ở giai đoạn Alpha, nhận được phản hồi tích cực từ người dùng. Một người thử nghiệm so sánh trải nghiệm với việc gọi FaceTime cùng một “người bạn siêu thông minh” cho biết tính năng này rất hữu ích khi trả lời câu hỏi theo thời gian thực. Việc tích hợp khả năng nhận diện hình ảnh và gọi video hứa hẹn giúp ChatGPT vượt xa vai trò của một chatbot thông thường. Đây có thể là công cụ hữu ích cho người khiếm thị hoặc giúp người dùng xử lý các tình huống yêu cầu nhận diện trực quan.
Tính năng giọng nói nâng cao của ChatGPT sẽ có khả năng tương tác với người dùng bằng cuộc gọi video trong tương lai gần.
OpenAI chưa công bố thời gian ra mắt chính thức hoặc thông tin chi tiết về tính năng “Live Camera”, tuy nhiên, các dữ liệu mới từ mã nguồn beta cho thấy tính năng này đang được phát triển và có thể sớm đến tay người dùng.
Bên cạnh đó, Sora là bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) tổng quát với một công cụ tạo ra các video ngắn từ những chỉ dẫn bằng văn bản. Theo đó, Sora có khả năng tạo ra cảnh quay thực tế và sáng tạo từ những chỉ dẫn bằng văn bản. Mô hình này cho phép người dùng sáng tạo những video sinh động lên đến 1 phút dựa trên gợi ý mà họ viết ra.
Cụ thể, Sora là mô hình AI tạo sinh của OpenAI, hoạt động tương tự công cụ tạo ảnh Dall-E cùng nhà. Người dùng chỉ cần đưa ra prompt nội dung video và Sora sẽ trả về video clip chất lượng cao. Ngoài ra, nó còn có thể tạo ra video từ hình ảnh tĩnh, kéo dài video hoặc lấp đầy khung hình trống.
Video có thể là vùng đất tiếp theo đối với AI tạo sinh khi các chatbot và trình tạo hình ảnh đã xâm nhập vào thế giới thực. Dù được giới mộ điệu AI chào đón, các công nghệ mới cũng gây lo ngại nghiêm trọng về thông tin sai lệch khi các cuộc bầu cử chính trị lớn trên toàn cầu đang đến gần. Theo dữ liệu từ công ty máy học Clarity, số lượng deepfake do AI tạo ra đã tăng 900% so với năm trước.
Với Sora, OpenAI đang tìm cách cạnh tranh với công cụ AI tạo video từ các đối thủ như Meta, Google, hay một số startup như Stability AI. Amazon cũng phát hành Create with Alexa, mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên prompt.
Sora hiện chỉ có thể tạo các video dài một phút trở xuống. Cũng mới có một nhóm nhỏ - hay “đội đỏ” – được dùng mô hình để tìm kiếm các lỗ hổng bảo mật. OpenAI chưa phát hành bất kỳ bản demo công khai nào ngoài 10 clip mẫu có sẵn trên trang web.
OpenAI cũng đang xây dựng một bộ phân loại có thể xác định các video clip là sản phẩm của Sora và dự định đưa một số siêu dữ liệu nhất định vào đầu ra để giúp xác định nội dung do AI tạo ra. Nỗ lực này tương tự những gì Meta đang làm để xác định hình ảnh do AI tạo ra. Trên mạng xã hội X, Giám đốc điều hành OpenAI Sam Altman thông báo trong giai đoạn thử nghiệm, công ty chỉ cho phép một số nhà sáng tạo nội dung sử dụng Sora.
Thanh Hiền (t/h)









