Chatbot Meena vượt trội hơn tất cả các chatbot hiện nay

13:32 | 12/02/2020

Google vừa tuyên bố đã tạo ra một chatbot Meena vượt trội hơn tất cả các chatbot hiện nay, bởi đánh giá về độ nhạy và độ đặc hiệu trung bình (SSA) cho thấy Meena điểm cao đến 79%.

Xu hướng Cách mạng công nghiệp 4.0 cho thấy việc sử dụng chatbot ngày càng trở nên cần thiết bởi rất nhiều doanh nghiệp hiện đang lựa chọn chatbot để cung cấp các thông tin có sẵn cho khách hàng, loại bớt sức người trong công đoạn này. Tuy nhiên một điểm vướng hiện nay chính là nhiều chabot chưa hoàn toàn thuyết phục khi thường xuyên đưa ra những phản hồi vô tri hoặc chung chung.

Trong bài báo công bố trên arXiv, Google đã nêu rõ sự cần thiết của một bộ công cụ hay cách nào đó để đánh giá chatbot. Theo đó, SSA (Độ nhạy và Độ đặc hiệu trung bình) đã ra đời.

Để lượng hóa SSA, Google đã thử nghiệm yêu cầu những công nhân tham gia 100 cuộc hội thoại tự do với Meena và một vài chatbot khác trên các lĩnh vực không giới hạn. Với mỗi phản hồi của chatbot, họ sẽ trả lời 2 câu hỏi về phản hồi đó.

Thứ nhất, nội dung của hội thoại có logic và phù hợp ngữ cảnh? Nếu có, họ sẽ phải trả lời tiếp: “Câu trả lời có đặc trưng cho cuộc hội thoại?” Điều này nhằm để loại bỏ những phản hồi mang tính chung chung. Chẳng hạn, nếu người gõ họ thích tennis, còn chatbot trả lời: “Tốt” thì câu trả lời đó sẽ bị liệt vào dạng “không cụ thể".

Google cho biết, chatbot Meena vượt trội hơn tất cả các chatbot hiện nay bởi đánh giá về SSA cho thấy, Meena điểm cao đến 79% khiến nó giao tiếp giống người hơn hẳn tất cả các hệ thống chatbot từng được thử nghiệm. Trong khi đó theo nghiên cứu, những chatbot khác hiện có số điểm dao động chỉ từ 31 - 56%.

Google sẽ không phát hành bản demo của Meena cho cộng đồng trước khi đảm bảo độ an toàn và tiềm năng của nó trong các cuộc thử nghiệm. Nếu tất cả các kiểm tra đều được thực hiện, công ty có thể phát hành bản demo trong thời gian tới để giúp nghiên cứu về các mô hình hội thoại thần kinh và chatbot nói chung.

Ngoài ra, Google cũng lưu ý rằng công ty chỉ tập trung vào tính nhạy cảm và tính cụ thể trong công việc này, nhưng các thuộc tính quan trọng khác như tính cách và thực tế có thể là mục tiêu của các dự án tiếp theo.