Bên trong phòng thí nghiệm tại Công ty Nuance Communications, ông Vlad Sejnoha, Giám đốc công nghệ, và các nhà quản trị khác của công ty đang mường tượng về một tương lai nơi giọng nói con người dẫn đến phản ứng từ đủ loại thiết bị thông minh, từ điện thoại, ti vi, xe hơi, máy tính cho đến tủ lạnh, hệ thống báo động…

Nhiều hứa hẹn

Những hệ thống như thế đang bắt đầu thay đổi cách thức chúng ta tương tác với thế giới. Vào những năm 80 của thế kỷ trước, các hệ thống nhận biết giọng nói thương mại đã trở nên đủ tinh vi để chuyển lời nói thành văn bản. Ngày nay, các công ty đang chạy đua để cải thiện hiệu quả và mang lại diện mạo mới cho công nghệ này. Với khoảng 7.300 nhân viên, Nuance Communications, có trụ sở ở thành phố Burlington (Mỹ), hiện là công ty đi đầu trong nỗ lực nói trên. Công ty này chính là tác giả của công nghệ đằng sau trợ lý ảo Siri trên điện thoại thông minh iPhone 4S của Apple.

Chỉ mới 10 năm trước, những trợ lý ảo có khả năng đáp lại người sử dụng như Siri nghe không khác gì chuyện khoa học viễn tưởng. Vào năm 2000, Paul Ricci, người từng giữ chức vụ quản lý tại Công ty Xerox và hiện là Giám đốc điều hành Nuance, dự báo rằng một ngày nào đó sẽ có thị trường dành cho công nghệ giọng nói nhiều hứa hẹn này.

Để đón đầu thị trường này, Nuance, trước kia mang tên ScanSoft, tiến hành thâu tóm hơn 40 công ty chuyên nghiên cứu và phát triển công nghệ nhận biết giọng nói, điều khiển bằng giọng nói và phản hồi mệnh lệnh giọng nói. Thương vụ nổi bật nhất của ScanSoft là việc sáp nhập với đối thủ Nuance vào năm 2005 và cái tên Nuance được chọn cho công ty mới. Trong năm 2011, doanh thu của Nuance vào khoảng 1,3 tỉ đô la Mỹ, trong đó 515 triệu đô la đến từ hoạt động kinh doanh trong lĩnh vực chăm sóc sức khỏe.

Phần mềm nhận biết giọng nói hoạt động bằng cách gửi lời nói đến bộ xử lý để chuyển chúng thành sóng âm và dùng thuật toán để xác định những từ được tạo thành bởi âm thanh. Hệ thống thường ghi lại và lưu trữ lời nói để có thể tự cải thiện tính chính xác theo thời gian. Nuance tin rằng quy mô kho dữ liệu lời nói của họ chỉ thua của mỗi chính phủ liên bang ở Mỹ.

Cũng như nhiều công nghệ mới, các hệ thống giọng nói tinh vi cũng gây ra không ít lo lắng. Một số chuyên gia lo ngại về nguy cơ xâm phạm sự riêng tư của người sử dụng bởi công nghệ này sẽ để lại thêm nhiều dấu vết số hơn nữa trên mạng khi họ sử dụng web hoặc ứng dụng. Các nhà điều chỉnh luật cũng đang quan tâm đến những rủi ro mà phần mềm nhận biết giọng nói có thể gây ra cho người sử dụng. David C. Vladeck, Giám đốc Cục bảo vệ người tiêu dùng tại Ủy ban Thương mại liên bang Mỹ, bày tỏ: "Chúng tôi không khỏi lo ngại về mối đe dọa của những phương thức nhận dạng sinh trắc học, như nhận biết giọng nói và khuôn mặt, khi chúng được ứng dụng trong thực tế".

Để xoa dịu những nỗi lo này, Nuance cho biết hệ thống của công ty không thể xác định được danh tính người tiêu dùng dựa trên giọng nói của họ. Lý do là hệ thống này chỉ nhận biết được giọng nói của người sử dụng bằng những mã độc nhất trên thiết bị họ dùng, thay vì bằng tên của họ. Ngoài ra, chính sách riêng tư của Nuance quy định công ty chỉ dùng dữ liệu giọng nói của người tiêu dùng để cải thiện những hệ thống nội bộ của mình.

Tìm kiếm bằng giọng nói

Dragon Go là ứng dụng trợ lý ảo của Nuance và được tải về vài triệu lần kể từ khi ra mắt vào mùa hè năm ngoái. Dù vậy, không như Siri, Dragon Go không đối thoại với người sử dụng. Ứng dụng này là nỗ lực mới của Nuance trong việc giới thiệu những thành tựu công nghệ của mình với khách hàng doanh nghiệp. Mục tiêu của Nuance còn lớn hơn thế: phá vỡ vai trò của công cụ tìm kiếm như là người gác cổng truy cập vào web.

Đối với hầu hết các truy vấn tìm kiếm thông thường, Dragon Go đưa người sử dụng đến ngay trang web của những công ty đối tác của Nuance như Amazon, Expedia, Open Table… Nếu người sử dụng không tìm thấy những gì mình cần ở đó, Dragon Go mới cung cấp phương thức tìm kiếm trực tuyến truyền thống. Theo Nuance, công nghệ này có lợi cho người sử dụng vì nó cung cấp những câu trả lời nhanh hơn mà không mất nhiều bước hơn so với phương thức đã có. Trong nhiều trường hợp, Nuance thu một khoản phí nhỏ từ đối tác khi người sử dụng, chẳng hạn như, đặt chỗ tại nhà hàng hoặc hoàn tất một vụ mua sắm nào đó. Dragon Go có thể trở thành một sự thách thức không nhỏ đối với những công ty như Google và Microsoft (vốn là hai công ty lớn chuyên về công nghệ này và cũng có sản phẩm giọng nói của riêng mình là Google Voice Actions và Microsoft Tellme) và các công cụ tìm kiếm trực tuyến truyền thống.

Ngoài Dragon Go, Nuance đang nỗ lực hoàn thiện phần mềm mới, Dragon TV, để có thể sớm tích hợp nó vào trong những mẫu ti vi có khả năng kết nối Internet. Với phần mềm này, người xem có thể dùng lời nói để ra lệnh tìm kiếm chương trình, gọi điện thoại qua Skype hoặc mua sắm trên Amazon thông qua ti vi. Công nghệ này có thể sẽ sớm xuất hiện trên thị trường sau khi LG Electronics dự kiến giới thiệu một mẫu ti vi thông minh chạy phần mềm của Nuance, cho phép người xem ti vi cập nhật tài khoản Facebook và Twitter bằng cách nói vào một bộ điều khiển từ xa đặc biệt.

Ông Sejnoha dự báo rằng không chỉ ti vi mà nhiều thiết bị khác sẽ hiểu được mệnh lệnh giọng nói của người sử dụng và trả lời lại họ. Tại Đức, người ta có thể đặt mua loại máy pha cà phê chạy phần mềm Nuance, được tiếp thị như là chiếc máy hoàn toàn tự động đầu tiên biết làm theo mệnh lệnh giọng nói.

H. Minh (The New York Times)

Cập nhật Facebook, Twitter bằng giọng nói

05/06/2012 - Tin công nghệ
Thị trường các sản phẩm ứng dụng công nghệ điều khiển giọng nói được xem là mảnh đất màu mỡ trong tương lai không xa...
Bên trong phòng thí nghiệm tại Công ty Nuance Communications, ông Vlad Sejnoha, Giám đốc công nghệ, và các nhà quản trị khác của công ty đang mường tượng về một tương lai nơi giọng nói con người dẫn đến phản ứng từ đủ loại thiết bị thông minh, từ điện thoại, ti vi, xe hơi, máy tính cho đến tủ lạnh, hệ thống báo động…

Nhiều hứa hẹn

Những hệ thống như thế đang bắt đầu thay đổi cách thức chúng ta tương tác với thế giới. Vào những năm 80 của thế kỷ trước, các hệ thống nhận biết giọng nói thương mại đã trở nên đủ tinh vi để chuyển lời nói thành văn bản. Ngày nay, các công ty đang chạy đua để cải thiện hiệu quả và mang lại diện mạo mới cho công nghệ này. Với khoảng 7.300 nhân viên, Nuance Communications, có trụ sở ở thành phố Burlington (Mỹ), hiện là công ty đi đầu trong nỗ lực nói trên. Công ty này chính là tác giả của công nghệ đằng sau trợ lý ảo Siri trên điện thoại thông minh iPhone 4S của Apple.

Chỉ mới 10 năm trước, những trợ lý ảo có khả năng đáp lại người sử dụng như Siri nghe không khác gì chuyện khoa học viễn tưởng. Vào năm 2000, Paul Ricci, người từng giữ chức vụ quản lý tại Công ty Xerox và hiện là Giám đốc điều hành Nuance, dự báo rằng một ngày nào đó sẽ có thị trường dành cho công nghệ giọng nói nhiều hứa hẹn này.

Để đón đầu thị trường này, Nuance, trước kia mang tên ScanSoft, tiến hành thâu tóm hơn 40 công ty chuyên nghiên cứu và phát triển công nghệ nhận biết giọng nói, điều khiển bằng giọng nói và phản hồi mệnh lệnh giọng nói. Thương vụ nổi bật nhất của ScanSoft là việc sáp nhập với đối thủ Nuance vào năm 2005 và cái tên Nuance được chọn cho công ty mới. Trong năm 2011, doanh thu của Nuance vào khoảng 1,3 tỉ đô la Mỹ, trong đó 515 triệu đô la đến từ hoạt động kinh doanh trong lĩnh vực chăm sóc sức khỏe.

Phần mềm nhận biết giọng nói hoạt động bằng cách gửi lời nói đến bộ xử lý để chuyển chúng thành sóng âm và dùng thuật toán để xác định những từ được tạo thành bởi âm thanh. Hệ thống thường ghi lại và lưu trữ lời nói để có thể tự cải thiện tính chính xác theo thời gian. Nuance tin rằng quy mô kho dữ liệu lời nói của họ chỉ thua của mỗi chính phủ liên bang ở Mỹ.

Cũng như nhiều công nghệ mới, các hệ thống giọng nói tinh vi cũng gây ra không ít lo lắng. Một số chuyên gia lo ngại về nguy cơ xâm phạm sự riêng tư của người sử dụng bởi công nghệ này sẽ để lại thêm nhiều dấu vết số hơn nữa trên mạng khi họ sử dụng web hoặc ứng dụng. Các nhà điều chỉnh luật cũng đang quan tâm đến những rủi ro mà phần mềm nhận biết giọng nói có thể gây ra cho người sử dụng. David C. Vladeck, Giám đốc Cục bảo vệ người tiêu dùng tại Ủy ban Thương mại liên bang Mỹ, bày tỏ: "Chúng tôi không khỏi lo ngại về mối đe dọa của những phương thức nhận dạng sinh trắc học, như nhận biết giọng nói và khuôn mặt, khi chúng được ứng dụng trong thực tế".

Để xoa dịu những nỗi lo này, Nuance cho biết hệ thống của công ty không thể xác định được danh tính người tiêu dùng dựa trên giọng nói của họ. Lý do là hệ thống này chỉ nhận biết được giọng nói của người sử dụng bằng những mã độc nhất trên thiết bị họ dùng, thay vì bằng tên của họ. Ngoài ra, chính sách riêng tư của Nuance quy định công ty chỉ dùng dữ liệu giọng nói của người tiêu dùng để cải thiện những hệ thống nội bộ của mình.

Tìm kiếm bằng giọng nói

Dragon Go là ứng dụng trợ lý ảo của Nuance và được tải về vài triệu lần kể từ khi ra mắt vào mùa hè năm ngoái. Dù vậy, không như Siri, Dragon Go không đối thoại với người sử dụng. Ứng dụng này là nỗ lực mới của Nuance trong việc giới thiệu những thành tựu công nghệ của mình với khách hàng doanh nghiệp. Mục tiêu của Nuance còn lớn hơn thế: phá vỡ vai trò của công cụ tìm kiếm như là người gác cổng truy cập vào web.

Đối với hầu hết các truy vấn tìm kiếm thông thường, Dragon Go đưa người sử dụng đến ngay trang web của những công ty đối tác của Nuance như Amazon, Expedia, Open Table… Nếu người sử dụng không tìm thấy những gì mình cần ở đó, Dragon Go mới cung cấp phương thức tìm kiếm trực tuyến truyền thống. Theo Nuance, công nghệ này có lợi cho người sử dụng vì nó cung cấp những câu trả lời nhanh hơn mà không mất nhiều bước hơn so với phương thức đã có. Trong nhiều trường hợp, Nuance thu một khoản phí nhỏ từ đối tác khi người sử dụng, chẳng hạn như, đặt chỗ tại nhà hàng hoặc hoàn tất một vụ mua sắm nào đó. Dragon Go có thể trở thành một sự thách thức không nhỏ đối với những công ty như Google và Microsoft (vốn là hai công ty lớn chuyên về công nghệ này và cũng có sản phẩm giọng nói của riêng mình là Google Voice Actions và Microsoft Tellme) và các công cụ tìm kiếm trực tuyến truyền thống.

Ngoài Dragon Go, Nuance đang nỗ lực hoàn thiện phần mềm mới, Dragon TV, để có thể sớm tích hợp nó vào trong những mẫu ti vi có khả năng kết nối Internet. Với phần mềm này, người xem có thể dùng lời nói để ra lệnh tìm kiếm chương trình, gọi điện thoại qua Skype hoặc mua sắm trên Amazon thông qua ti vi. Công nghệ này có thể sẽ sớm xuất hiện trên thị trường sau khi LG Electronics dự kiến giới thiệu một mẫu ti vi thông minh chạy phần mềm của Nuance, cho phép người xem ti vi cập nhật tài khoản Facebook và Twitter bằng cách nói vào một bộ điều khiển từ xa đặc biệt.

Ông Sejnoha dự báo rằng không chỉ ti vi mà nhiều thiết bị khác sẽ hiểu được mệnh lệnh giọng nói của người sử dụng và trả lời lại họ. Tại Đức, người ta có thể đặt mua loại máy pha cà phê chạy phần mềm Nuance, được tiếp thị như là chiếc máy hoàn toàn tự động đầu tiên biết làm theo mệnh lệnh giọng nói.

H. Minh (The New York Times)

Đánh giá - Bình luận
Nhấn vào đây để đánh giá
X
Đặt lịch hẹn sửa chữa
Hãy đặt lịch trước để chúng tôi phục vụ bạn tốt hơn
Liên hệ tổng đài 1800 6024 - Hoặc 085 245 3366 để được đặt lịch.
X
Tra cứu bảo hành
Dễ dàng theo dõi tình trạng bảo hành máy của bạn
Tra cứu thông tin bảo hành

Nhập thông tin bảo hành

Đặt lịch

0.30478 sec| 2572.477 kb