OpenAI được nâng cấp khả năng nhìn, nghe và nói

14:52 | 04/10/2023

Trong thông báo đăng trên blog ngày 25/9, OpenAI cho biết ứng dụng ChatGPT của hãng sắp tới sẽ có khả năng "nhìn, nghe và nói" khi tương tác với người dùng.

Cụ thể, Chatbot AI sẽ có thể trao đổi bằng giọng nói và tương tác thông qua hình ảnh, một bước đi gần hơn với trợ lý ảo Siri của Apple. Theo OpenAI tính năng hỗ trợ giọng nói sẽ mở ra cánh cửa sáng tạo và các ứng dụng tập trung vào khả năng tiếp cận.

Cũng giống như các trợ lý ảo như Siri, Google và Alexa của Amazon, tính năng mới này của ChatGPT được tích hợp trực tiếp trên thiết bị và thường được sử dụng để cài báo thức, đặt lịch nhắc nhở hoặc lấy thông tin từ Internet.

Kể từ khi được ra mắt vào cuối năm ngoái và trở thành ứng dụng có tốc độ tăng trưởng người dùng nhanh nhất lịch sử Internet, ChatGPT đã được các công ty áp dụng cho nhiều nhiệm vụ khác nhau, từ tóm tắt tài liệu cho đến viết code máy tính, tạo ra cuộc chạy đua giữa những gã khổng lồ công nghệ trong lĩnh vực này.

Tính năng giọng nói của ChatGPT có thể kể lại câu chuyện ru ngủ, tham gia giải quyết những thảo luận khi ăn tối hoặc đóng vai trò ghi chép lại nội dung đọc của người dùng.

OpenAI cho biết công nghệ này đang được Spotify sử dụng trên các podcast của nền tảng để dịch nội dung của họ sang nhiều ngôn ngữ khác nhau.

Trong khi đó, với tính năng hỗ trợ hình ảnh, người dùng có thể chụp ảnh mọi thứ xung quanh và yêu cầu Chatbot giải quyết những vấn đề như: khắc phục sự cố khiến lò nướng của bạn không khởi động; kiểm tra tủ lạnh để lên kế hoạch cho bữa tối hoặc phân tích biểu đồ phức tạp cho dữ liệu liên quan đến công việc. Hiện Google Lens của Alphabet đang là ứng dụng phổ biến thu thập thông tin về hình ảnh.

Dự kiến những tính năng mới trên ChatGPT sẽ được phát hành cho những thuê bao gói Plus và Enterprise trong tháng mười.