Mới đây, Google đã tiếp tục giới thiệu đến người dùng một mô hình ngôn ngữ AI mới, có tên là AudioPaLM. 

Theo đại diện của Google, mô hình này có thể nghe, nói và dịch với độ chính xác cao. Sở hữu kiến ​​trúc đa phương thức kết hợp sức mạnh của PaLM-2 và AudioLM.

Google giới thiệu mô hình AI mới (Ảnh: Sưu tầm)

Trong đó, PaLM-2 là mô hình ngôn ngữ rất hiệu quả trong việc đọc hiểu văn bản.

Còn AudioLM lại xuất sắc trong việc nhận dạng thông tin ngôn ngữ và âm điệu của người nói. 

Bằng cách kết hợp hai mô hình này, Google đã cho ra đời AudioPaLM giúp AI có thể hiểu và tạo ra văn bản hay lời nói với chất lượng cao.

Đồng thời, Google còn trang bị cho AudioPaLM từ vựng chung (một số lượng hạn chế các mã thông báo riêng biệt) để có thể hiển thị lời nói và văn bản. 

Điều này cho phép những tác vụ như nhận dạng giọng nói, tổng hợp văn bản thành giọng nói và dịch lời nói được hợp nhất.

AudioPaLM đã được chứng minh là hoạt động tốt hơn nhiều nền tảng dịch giọng nói hiện tại.

Thậm chí, AudioPaLM có thể thực hiện dịch giọng nói thành văn bản với ngôn ngữ mà mô hình này chưa từng thực hiện. 

AudioPaLM còn có thể thu và tái tạo các giọng nói riêng biệt của từng ngôn ngữ khác nhau.

Đây là sản phẩm mà ông lớn mảng tìm kiếm đã mất nhiều năm khai thác toàn bộ tiềm năng của AI để giới thiệu đến người dùng.

Google giới thiệu mô hình AI mới

26/06/2023 - Tin công nghệ
Google vừa giới thiệu một mô hình ngôn ngữ AI mới có tên AudioPaLM, có thể nghe, nói và dịch.

Mới đây, Google đã tiếp tục giới thiệu đến người dùng một mô hình ngôn ngữ AI mới, có tên là AudioPaLM. 

Theo đại diện của Google, mô hình này có thể nghe, nói và dịch với độ chính xác cao. Sở hữu kiến ​​trúc đa phương thức kết hợp sức mạnh của PaLM-2 và AudioLM.

Google giới thiệu mô hình AI mới (Ảnh: Sưu tầm)

Trong đó, PaLM-2 là mô hình ngôn ngữ rất hiệu quả trong việc đọc hiểu văn bản.

Còn AudioLM lại xuất sắc trong việc nhận dạng thông tin ngôn ngữ và âm điệu của người nói. 

Bằng cách kết hợp hai mô hình này, Google đã cho ra đời AudioPaLM giúp AI có thể hiểu và tạo ra văn bản hay lời nói với chất lượng cao.

Đồng thời, Google còn trang bị cho AudioPaLM từ vựng chung (một số lượng hạn chế các mã thông báo riêng biệt) để có thể hiển thị lời nói và văn bản. 

Điều này cho phép những tác vụ như nhận dạng giọng nói, tổng hợp văn bản thành giọng nói và dịch lời nói được hợp nhất.

AudioPaLM đã được chứng minh là hoạt động tốt hơn nhiều nền tảng dịch giọng nói hiện tại.

Thậm chí, AudioPaLM có thể thực hiện dịch giọng nói thành văn bản với ngôn ngữ mà mô hình này chưa từng thực hiện. 

AudioPaLM còn có thể thu và tái tạo các giọng nói riêng biệt của từng ngôn ngữ khác nhau.

Đây là sản phẩm mà ông lớn mảng tìm kiếm đã mất nhiều năm khai thác toàn bộ tiềm năng của AI để giới thiệu đến người dùng.

Xem thêm

Đánh giá - Bình luận
Nhấn vào đây để đánh giá
X
Đặt lịch hẹn sửa chữa
Hãy đặt lịch trước để chúng tôi phục vụ bạn tốt hơn
Liên hệ tổng đài 1800 6024 - Hoặc 085 245 3366 để được đặt lịch.
X
Tra cứu bảo hành
Dễ dàng theo dõi tình trạng bảo hành máy của bạn
Tra cứu thông tin bảo hành

Nhập thông tin bảo hành

Đặt lịch

0.51519 sec| 2471.563 kb