Công nghệ AI thông minh: Chuyển suy nghĩ thành lời nói

Chuyển suy nghĩ thành lời nói – Công nghệ mới giúp cho những người mất khả năng giao tiếp. Trí tuệ nhân tạo có thể dịch chính xác suy nghĩ thành câu, ít nhất là đối với vốn từ vựng giới hạn 250 từ. Hệ thống này có thể giúp chúng ta tiến gần hơn đến việc khôi phục giọng nói cho những người đã mất khả năng vì bị liệt.

Nhóm nghiên cứu đã đưa hoạt động não này vào một thuật toán mạng thần kinh. Huấn luyện nó để xác định các mẫu thường xuyên xuất hiện có thể liên quan đến các khía cạnh lặp đi lặp lại của lời nói. Chẳng hạn như nguyên âm hoặc phụ âm. Sau đó, các mẫu này được đưa vào mạng nơ-ron thứ hai. Mạng này cố gắng chuyển chúng thành các từ để tạo thành một câu. Đây là bước tiến đột phá trong công nghệ AI thông minh. Điều này sẽ giúp những người mất khả năng ngôn ngữ có thể nói được câu hoàn chỉnh.

Công nghệ chuyển suy nghĩ thành lời nói hỗ trợ người mất khả năng giao tiếp

Các nhà khoa học tại Đại học California đã phát triển công nghệ mới. Giúp chuyển đổi suy nghĩ thành lời nói hỗ trợ người mất khả năng giao tiếp. Công nghệ giúp cải thiện khả năng tự chủ. Và tăng chất lượng cuộc sống cho người mắc chứng anarthria (mất khả năng phát âm giọng nói). Và chứng liệt tứ chi do đột quỵ thân não gây ra. Theo đó, các nhà khoa học đã cấy một mảng đa điện cực lên vùng vỏ não cảm giác-vận động. Nơi có chức năng kiểm soát lời nói – ở một số người bệnh mất khả năng giao tiếp bằng cách phát âm.

Công nghệ chuyển suy nghĩ thành lời nói hỗ trợ người mất khả năng giao tiếp
Công nghệ chuyển suy nghĩ thành lời nói hỗ trợ người mất khả năng giao tiếp

Joseph Makin tại Đại học California, San Francisco, và các đồng nghiệp của ông đã sử dụng các thuật toán học sâu; để nghiên cứu tín hiệu não của bốn phụ nữ khi họ nói chuyện. Những người phụ nữ, tất cả đều bị động kinh; đã được gắn các điện cực vào não của họ để theo dõi các cơn động kinh.

Áp dụng thuật toán chuyên sâu để tính xác suất các từ tiếp theo trong câu nói

Trong 48 cuộc thử nghiệm, họ đã ghi lại 22 giờ hoạt động của vỏ não. Khi người tham gia cố gắng nói các từ riêng lẻ trong bộ từ vựng gồm 50 từ. Từ đó, các nhà khoa học dùng thuật toán chuyên sâu để tạo ra các mô hình tính toán; nhằm phát hiện và phân loại các từ vựng từ các mẫu trong hoạt động vỏ não được ghi lại. Thuật toán này, cùng mô hình ngôn ngữ tự nhiên mang lại xác suất của từ tiếp theo cho các từ đứng trước trong một chuỗi; để giải mã các câu đầy đủ khi người tham gia cố gắng nói chúng.

Người mất khả năng ngôn ngữ có thể dùng suy nghĩ nói câu hoàn chỉnh
Người mất khả năng ngôn ngữ có thể dùng suy nghĩ nói câu hoàn chỉnh

Kết quả, các nhà khoa học đã giải mã các câu, từ hoạt động vỏ não của người tham gia trong thời gian thực; với tốc độ trung bình 15,2 từ mỗi phút, với tỷ lệ lỗi từ trung bình 25,6%. Trong phân tích hậu kỳ của các thử nghiệm, phát hiện 98% nỗ lực của người tham gia để tạo ra các từ riêng lẻ. Và phân loại các từ với độ chính xác 47,1%; bằng cách sử dụng các tín hiệu vỏ não ổn định trong suốt 81 tuần nghiên cứu. Nghiên cứu do tiến sĩ Edward Chang (thuộc Đại học California) đứng đầu đã được công bố hôm 15/7 trên tạp chí The New England.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *