Hệ thống tổng đài chuyển cuộc gọi tự động mà chúng tôi đặt tên VoiceICR là hệ thống voice server được xây dựng dựa trên sự kết hợp giữa xử lý ngôn ngữ nói và ngôn ngữ viết. Hệ thống có thể nhận dạng nhiều dạng câu lệnh bằng tiếng nói tiếng Việt để chuyển thành dạng văn bản, xử lý ngữ nghĩa của chúng, rồi phát sinh các truy vấn cơ sở tri thức, cuối cùng là chuyển hướng cuộc gọi đến đúng máy trạm mà người dùng cần gọi đến
Hệ thống được xây dựng với các thành phần chính sau:
- Thành phần giao tiếp mạng: sử dụng phàn mềm mã nguồn mở Asterisk triển khai hệ thống tổng đài nội bộ có khả năng giao tiếp với mạng điện thoại công cộng PSTN.
- Thành phần nhận dạng tiếng nói: thực việc việc nhận dạng tiếng nói với bộ từ vựng giới hạn, cho độ chính xác cao trên 90%.
- Bộ phân lớp văn bản: xây dựng huấn luyện mô hình phân lớp các câu lệnh văn bản trong phạm vi ứng dụng, giúp hệ thống hiểu được các câu lệnh và đưa ra các phản hồi thích hợp.
- Thành phần xử lý trung tâm: xây dựng một module có chức năng liên kết, điều hướng trình tự giao tiếp các module chức năng của hệ thống tổng đài.
Theo hiểu biết của chúng tôi, đây là một trong những hệ thống đầu tiên tại Việt Nam được trang bị một cơ chế xử lý ngữ nghĩa câu lệnh hiệu quả vào ứng dụng tiếng nói, giúp cho hệ thống trở nên thông minh và linh hoạt hơn.
Ý nghĩa thực tiễn: Kết quả đề tài hoàn toàn có thể áp dụng trong nhiều lĩnh vực, đặc biệt là:
- Trong giáo dục – đào tạo: Làm giảm công việc cho bộ phận tiếp nhận và trả lời cuộc gọi. Kết quả của nghiên cứu này là cơ sở để chúng tôi áp dụng vào việc phát triển các ứng dụng tương tự như tra cứu thông tin học vụ, tra cứu điểm thi tại các trường học bằng tiếng nói.
- Trong kinh tế – xã hội: Kết quả của nghiên cứu này cũng có thể giúp cho việc xây dựng các ứng dụng tương tự phục vụ cho các tổ chức, doanh nghiệp, giúp giảm thiểu nhân lực, tự động hóa quá trình nghiệp vụ như hệ tra cứu thông tin tài khoản ngân hàng bằng tiếng nói, tra cứu tuyến xe buýt bằng tiếng nói…
KIẾN TRÚC HỆ THỐNG
Hệ thống được thiết kế có chức năng như sau: Nhận dạng câu truy vấn qua điện thoại; phân lớp câu lệnh truy vấn; tiến hành chuyển hướng cuộc gọi, trả lời người dung thông qua điện thoại và được thực hiện theo kịch bản sau:
|
Để hiện thực các chức năng nói trên, hệ thống cần có những thành phần sau:
- Module giao tiếp, sử dụng tổng đài Asterisk: tiếp nhận, xử lý tín hiệu từ điện thoại, chuyển hướng và trả lời thông tin từ máy tính trở lại hệ thống điện thoại.
- Bộ nhận dạng tiếng nói: chuyển dữ liệu âm thanh là tiếng nói của người dùng thành dữ liệu văn bản tiếng Việt.
- Bộ phân lớp: sử dụng phương pháp học máy naïve Bayes nhằm phân lớp cho dữ liệu văn bản tiếng Việt được nhận dạng từ đề nghị của người dùng. Kết quả của bộ phân lớp là cơ sở cho module giao tiếp chuyển hướng cuộc gọi cho người dùng.
- Thành phần xử lý trung tâm: kết nối các module xử lý với nhau tạo thành một hệ thống tổng đài thống nhất.
Hình 1. Kiến trúc hệ thống