Công nghệ chuyển giọng nói thành chữ viết

Viện Nghiên cứu điện tử viễn thông Hàn Quốc (ETRI) tuyên bố đã phát triển được công nghệ dịch thuật từ việc nhận diện âm thanh để "dịch" nội dung đó từ ngôn ngữ này sang ngôn ngữ khác.

Các nhà nghiên cứu của ETRI đã ứng dụng công nghệ nhận diện chuyên sâu (deep learning) của trí tuệ nhân tạo để phát triển một chương trình nhận diện-dịch thuật âm thanh đa ngôn ngữ.

Theo đó, với các cụm từ có sẵn, công nghệ sẽ nhận diện âm thanh giọng nói để dịch trực tiếp từ ngôn ngữ này sang ngôn ngữ khác rồi hiển thị nội dung đó bằng chữ viết.

So với chương trình của Google, khả năng nhận diện tiếng Hàn của ETRI vượt trội hơn khi có thể "dịch" tới 96% nội dung cuộc nói chuyện trong đời sống hằng ngày. Tỉ lệ này ở các ngôn ngữ khác đạt từ 90% tới 95%, tương đương với Google.

Hiện công nghệ trên đã được áp dụng với 9 ngôn ngữ, gồm tiếng Anh, Trung Quốc, Nhật, Tây Ban Nha, Pháp, Đức, Nga và tiếng A Rập.

ETRI dự kiến sẽ mở rộng áp dụng với một số ngôn ngữ ở Đông Nam Á.

Nguồn tin: Chinhphu.vn

Văn bản mới

CỔNG THÔNG TIN ĐIỆN TỬ TÒA ÁN NHÂN DÂN TỐI CAO
Địa chỉ : 48 Lý Thường Kiệt, Hoàn Kiếm, Hà Nội.
Điện thoại: 04.62741133 - Fax :
Email: banbientap@toaan.gov.vn, tatc@toaan.gov.vn.
Quyền Trưởng Ban biên tập: Phạm Quốc Hưng - Chánh Văn phòng - TANDTC.

Giấy phép cung cấp thông tin trên internet số 184/GP-TTÐT của Bộ thông tin và Truyền thông.
Ghi rõ nguồn Cổng thông tin điện tử TANDTC (www.toaan.gov.vn) khi trích dẫn lại tin từ địa chỉ này.

Bản quyền thuộc Trung tâm tin học Tòa án nhân dân tối cao