Tính năng gọi video cùng trí tuệ nhân tạo - bước tiến mới của ChatGPT

18:50 20/11/2024

(VietQ.vn) - Mang lại khả năng gọi video và nhận diện hình ảnh trực tiếp trong chế độ giọng nói nâng cao, "Live Camera” có thể là bước tiến mới của ChatGPT.

OpenAI đang phát triển tính năng mới mang tên “Live Camera”, được cho là sẽ tích hợp vào chế độ giọng nói nâng cao của ChatGPT. Tính năng này sẽ giúp AI (trí tuệ nhân tạo) không chỉ trò chuyện bằng âm thanh mà còn có khả năng nhận diện và phản hồi về hình ảnh.

“Live Camera” từng được giới thiệu vào tháng 5/2024 khi OpenAI trình diễn cách AI có thể quan sát hình ảnh và đưa ra phản hồi chi tiết. Trong buổi giới thiệu, AI đã nhận diện chính xác một chú chó và cung cấp thông tin về loài, đặc điểm cũng như tên gọi. Tuy nhiên, kể từ đó, OpenAI không công bố thêm bất kỳ thông tin nào về tính năng này.

Mới đây, mã nguồn trong phiên bản beta (v1.2024.317) của ChatGPT hé lộ tham chiếu mang tên “Live Camera”, gợi ý tính năng này có thể sớm ra mắt dưới dạng thử nghiệm beta trước khi được triển khai rộng rãi.

Chế độ giọng nói nâng cao của ChatGPT thử nghiệm ở giai đoạn Alpha, nhận được phản hồi tích cực từ người dùng. Một người thử nghiệm so sánh trải nghiệm với việc gọi FaceTime cùng một “người bạn siêu thông minh” cho biết tính năng này rất hữu ích khi trả lời câu hỏi theo thời gian thực. Việc tích hợp khả năng nhận diện hình ảnh và gọi video hứa hẹn giúp ChatGPT vượt xa vai trò của một chatbot thông thường. Đây có thể là công cụ hữu ích cho người khiếm thị hoặc giúp người dùng xử lý các tình huống yêu cầu nhận diện trực quan.

Tính năng giọng nói nâng cao của ChatGPT sẽ có khả năng tương tác với người dùng bằng cuộc gọi video trong tương lai gần.

OpenAI chưa công bố thời gian ra mắt chính thức hoặc thông tin chi tiết về tính năng “Live Camera”, tuy nhiên, các dữ liệu mới từ mã nguồn beta cho thấy tính năng này đang được phát triển và có thể sớm đến tay người dùng.

Bên cạnh đó, Sora là bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) tổng quát với một công cụ tạo ra các video ngắn từ những chỉ dẫn bằng văn bản. Theo đó, Sora có khả năng tạo ra cảnh quay thực tế và sáng tạo từ những chỉ dẫn bằng văn bản. Mô hình này cho phép người dùng sáng tạo những video sinh động lên đến 1 phút dựa trên gợi ý mà họ viết ra.

Cụ thể, Sora là mô hình AI tạo sinh của OpenAI, hoạt động tương tự công cụ tạo ảnh Dall-E cùng nhà. Người dùng chỉ cần đưa ra prompt nội dung video và Sora sẽ trả về video clip chất lượng cao. Ngoài ra, nó còn có thể tạo ra video từ hình ảnh tĩnh, kéo dài video hoặc lấp đầy khung hình trống.

Video có thể là vùng đất tiếp theo đối với AI tạo sinh khi các chatbot và trình tạo hình ảnh đã xâm nhập vào thế giới thực. Dù được giới mộ điệu AI chào đón, các công nghệ mới cũng gây lo ngại nghiêm trọng về thông tin sai lệch khi các cuộc bầu cử chính trị lớn trên toàn cầu đang đến gần. Theo dữ liệu từ công ty máy học Clarity, số lượng deepfake do AI tạo ra đã tăng 900% so với năm trước.

Với Sora, OpenAI đang tìm cách cạnh tranh với công cụ AI tạo video từ các đối thủ như Meta, Google, hay một số startup như Stability AI. Amazon cũng phát hành Create with Alexa, mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên prompt.

Sora hiện chỉ có thể tạo các video dài một phút trở xuống. Cũng mới có một nhóm nhỏ - hay “đội đỏ” – được dùng mô hình để tìm kiếm các lỗ hổng bảo mật. OpenAI chưa phát hành bất kỳ bản demo công khai nào ngoài 10 clip mẫu có sẵn trên trang web.

OpenAI cũng đang xây dựng một bộ phân loại có thể xác định các video clip là sản phẩm của Sora và dự định đưa một số siêu dữ liệu nhất định vào đầu ra để giúp xác định nội dung do AI tạo ra. Nỗ lực này tương tự những gì Meta đang làm để xác định hình ảnh do AI tạo ra. Trên mạng xã hội X, Giám đốc điều hành OpenAI Sam Altman thông báo trong giai đoạn thử nghiệm, công ty chỉ cho phép một số nhà sáng tạo nội dung sử dụng Sora.

Thanh Hiền (t/h)

Chất lượng Việt Nam

Từ khóa:tính năng mới, Live camera, chế độ giọng nói, ChatGPT, trí tuệ nhân tạo, OpenAl, gọi FaceTime

Xây dựng nền tảng NQI, thúc đẩy chuyển đổi số lĩnh vực tiêu chuẩn đo lường chất lượng

ISO – “tấm vé” nâng cao năng lực cạnh tranh của doanh nghiệp Việt trong chuỗi cung ứng toàn cầu

Quá trình tạo ra sản phẩm an toàn - Góc nhìn từ tiêu chuẩn và quy chuẩn

Tính năng gọi video cùng trí tuệ nhân tạo - bước tiến mới của ChatGPT

Vì sao Vinamilk liên tục được gọi tên tại nhiều giải thưởng về phát triển bền vững?

Việt Nam gia tăng tình trạng kháng thuốc

Năm 2024, PV GAS TRADING thiết lập nhiều kỷ lục, vươn tầm cao mới

tin liên quan

Điện Biên tiên phong thử nghiệm sandbox cho kinh tế không gian tầm thấp 10

Phân Bón Cà Mau khoác “áo mới” cho những con đường quê 10

Hà Nội hỗ trợ doanh nghiệp ứng dụng AI và thương mại điện tử, tạo đà bứt phá tăng trưởng hai con số 10

Chinh phục cung đường Giải Marathon Quốc tế giữa Khu bảo tồn thiên nhiên đất ngập nước Vân Long 10

Đưa tinh hoa ẩm thực xứ Lạng đến với người dân Thủ đô

Vietravel Airlines sẵn sàng khai thác đường bay thẳng TP.HCM - Thâm Quyến

Việt Nam phủ sóng 5G tới 92% dân số, chủ động đón đầu công nghệ 6G

Bộ KH&CN tiếp nhận 31 hồ sơ công nghệ chiến lược, dự kiến tổng kinh phí gần 9.700 tỷ đồng

Chưa phát hiện vi phạm về chất lượng và đo lường đối với xăng sinh học E10

Xây dựng nền tảng NQI, thúc đẩy chuyển đổi số lĩnh vực tiêu chuẩn đo lường chất lượng

Quá trình tạo ra sản phẩm an toàn - Góc nhìn từ tiêu chuẩn và quy chuẩn

ISO – “tấm vé” nâng cao năng lực cạnh tranh của doanh nghiệp Việt trong chuỗi cung ứng toàn cầu

Thị trường đá quý: Minh bạch để lấy lại niềm tin

SeABank được Moody’s nâng xếp hạng tín nhiệm nhiều hạng mục, đánh giá triển vọng tích cực

video hot

[VIDEO]Đừng vội tin quảng cáo: 76.000 hộp rau detox vừa bị tiêu hủy

[VIDEO]Kế hoạch số 2795/KH-TĐC: Động lực thúc đẩy phát triển thị trường nội địa

[VIDEO]Ấm siêu tốc kém chất lượng: Cảnh báo nguy cơ mất an toàn

TS Phan Đức Hiếu - Chuyên gia kinh tế

Ông Hoàng Quang Phòng - Phó Chủ tịch VCCI

Bộ trưởng Bộ Khoa học và Công nghệ Nguyễn Mạnh Hùng

TS. Nguyễn Đức Độ - Phó Viện trưởng Viện Kinh tế Tài chính