Mới đây, Google đã tiếp tục giới thiệu đến người dùng một mô hình ngôn ngữ AI mới, có tên là AudioPaLM.
Theo đại diện của Google, mô hình này có thể nghe, nói và dịch với độ chính xác cao. Sở hữu kiến trúc đa phương thức kết hợp sức mạnh của PaLM-2 và AudioLM.
Trong đó, PaLM-2 là mô hình ngôn ngữ rất hiệu quả trong việc đọc hiểu văn bản.
Còn AudioLM lại xuất sắc trong việc nhận dạng thông tin ngôn ngữ và âm điệu của người nói.
Bằng cách kết hợp hai mô hình này, Google đã cho ra đời AudioPaLM giúp AI có thể hiểu và tạo ra văn bản hay lời nói với chất lượng cao.
Đồng thời, Google còn trang bị cho AudioPaLM từ vựng chung (một số lượng hạn chế các mã thông báo riêng biệt) để có thể hiển thị lời nói và văn bản.
Điều này cho phép những tác vụ như nhận dạng giọng nói, tổng hợp văn bản thành giọng nói và dịch lời nói được hợp nhất.
AudioPaLM đã được chứng minh là hoạt động tốt hơn nhiều nền tảng dịch giọng nói hiện tại.
Thậm chí, AudioPaLM có thể thực hiện dịch giọng nói thành văn bản với ngôn ngữ mà mô hình này chưa từng thực hiện.
AudioPaLM còn có thể thu và tái tạo các giọng nói riêng biệt của từng ngôn ngữ khác nhau.
Đây là sản phẩm mà ông lớn mảng tìm kiếm đã mất nhiều năm khai thác toàn bộ tiềm năng của AI để giới thiệu đến người dùng.
Mới đây, Google đã tiếp tục giới thiệu đến người dùng một mô hình ngôn ngữ AI mới, có tên là AudioPaLM.
Theo đại diện của Google, mô hình này có thể nghe, nói và dịch với độ chính xác cao. Sở hữu kiến trúc đa phương thức kết hợp sức mạnh của PaLM-2 và AudioLM.
Trong đó, PaLM-2 là mô hình ngôn ngữ rất hiệu quả trong việc đọc hiểu văn bản.
Còn AudioLM lại xuất sắc trong việc nhận dạng thông tin ngôn ngữ và âm điệu của người nói.
Bằng cách kết hợp hai mô hình này, Google đã cho ra đời AudioPaLM giúp AI có thể hiểu và tạo ra văn bản hay lời nói với chất lượng cao.
Đồng thời, Google còn trang bị cho AudioPaLM từ vựng chung (một số lượng hạn chế các mã thông báo riêng biệt) để có thể hiển thị lời nói và văn bản.
Điều này cho phép những tác vụ như nhận dạng giọng nói, tổng hợp văn bản thành giọng nói và dịch lời nói được hợp nhất.
AudioPaLM đã được chứng minh là hoạt động tốt hơn nhiều nền tảng dịch giọng nói hiện tại.
Thậm chí, AudioPaLM có thể thực hiện dịch giọng nói thành văn bản với ngôn ngữ mà mô hình này chưa từng thực hiện.
AudioPaLM còn có thể thu và tái tạo các giọng nói riêng biệt của từng ngôn ngữ khác nhau.
Đây là sản phẩm mà ông lớn mảng tìm kiếm đã mất nhiều năm khai thác toàn bộ tiềm năng của AI để giới thiệu đến người dùng.
Tin hot
Đặt lịch