Thứ sáu, 07/03/2014 | 13:02 GMT+7

Web âm thanh: tương lai của internet

(ĐSPL) - Với sự phát triển mạnh mẽ của những thiết bị thông minh nhỏ gọn những trang web truyền thống giờ đây đã trở nên không còn phù hợp.
Web âm thanh: tương lai của internet - ảnh 1
Nhận dạng giọng nói là tương lai của web.
Lâu nay chúng ta vẫn quen với những trang web hình ảnh trực quan được thiết kế bằng HTML và CSS. Nhưng với sự phát triển của những thiết bị thông minh “mặc trên người” như đồng hồ thông minh, kính thông minh hay có thể là cả nhẫn thông minh... thì những trang web hình ảnh trực quan truyền thống trở nên không còn phù hợp. Các trong web trong tương lai cần làm gì để có thể tương tác với các sản phẩm công nghệ mới?
Xuất bản nội dung âm thanh và điều khiển bằng giọng nói chính là chìa khóa cho sự phát triển của thế hệ website tiếp theo. Phương pháp tương tác bằng ngôn ngữ tự nhiên và cung cấp API (application programming interface) nhận dạng giọng nói dành cho nhà phát triển sẽ trở thành trọng tâm của xu hướng phát tiển web thời gian tới.
Hình thức đơn giản nhất của nhận dạng giọng nói là khả năng chuyển đổi lời nói thành văn bản. Đây không phải là một công nghệ mới, nó đã được hình thành và phát triển trong một khoảng thời gian tương đối lâu so với sự ra đời của máy tính. Chương trình hợp tác “Georgetown-IBM experiment” giữa IBM và đại học Geogetown năm 1954 đã đặt nền móng cho kỹ thuật “dịch máy” và xử lí ngôn ngữ tự nhiên, khi dịch thành công hơn 60 câu tiếng Nga sang tiếng Anh, chỉ với 6 nguyên tắc ngữ pháp và 250 bài viết tay làm vốn từ vựng.
Đến những năm 1980, các thuật toán học máy hiện đại được thiết kế đặc biệt để xử lý ngôn ngữ tự nhiên đã được giới thiệu. Những thuật toán này đã cho thấy khả năng thương mại của công nghệ nhận dạng giọng nói. Tuy nhiên, vào thời điểm đó, những công nghệ này vẫn nằm ngoài tầm với của những nhà phát triển tầm trung, vì việc nắm bắt được những thuật toán này là điều không hề dễ dàng..
Sau 30 năm, giờ đây mọi chuyện đã trở nên dễ dàng hơn rất nhiều khi một số công ty đã bắt đầu cung cấp các phầm mềm nguồn mở và API để giúp các nhà phát triển có thể tiếp cận và sử dụng công nghệ phức tập này. Điều này giúp lập trình viên dễ dàng xây dựng một trang web âm thanh giống như xây dựng một trang web hình ảnh trực quan bằng HTML.
Một trong những hệ thống tiêu chuẩn kĩ thuật cho việc phát triển website âm thanh tốt nhất dành cho lập trình viên là “Web Speech API Specification” do tổ chức W3C (World Wide Web Consortium) công bố. Hệ thống API này được đưa ra với mục đích cung cấp cho lập trình viên công cụ để phát triển một trang web nhập liệu bằng âm thanh (Speech-input) và chuyển văn bản thành âm thanh (text-to-speech). Nói một cách đơn giản là API này giúp cho người dùng có thể “nói chuyện” với website và nhận được phản hồi theo yêu cầu bằng giọng nói.
Web âm thanh: tương lai của internet - ảnh 1
Google Now cho phép bạn có thể "nói chuyện" với Google.
Tính năng web âm thanh tiêu biểu nhất hiện nay là Google Now, tính năng này mới đây đã được Google chính thức đưa vào trình duyệt Chrome, nhằm giúp người dùng có thể đưa ra yêu cầu tìm kiếm bằng giọng nói. 750 triệu người đang sử dụng trình duyệt Chrome đã có thể tự mình trải nghiệm nền tảng web của tương lai.
IBM cũng đã bỏ ra hơn 1 tỷ USD để xây dựng siêu máy tính Watson cực kì thông mình, với khả năng học hỏi, giao tiếp và tư vấn thông tin cao cấp cho con người. Ví dụ trong việc hỗ trợ y tế, Watson có thể nói chuyện và tư vấn cho bệnh nhân bị ung thư, hỗ trợ các bác sĩ trong việc lựa chọn phương pháp điều trị , theo dõi tình hình bệnh nhân. Watson cũng liên tục học hỏi kiến thức mới trong quá trình hoạt động, thông qua những lần nói chuyện với các bác sĩ và bệnh nhân đang được điều trị.
Một tương lai với những chiếc máy tính thông mình có thể trả lời cho bạn những câu hỏi phức tạp, giúp bạn đọc e-mail, tài liệu, nhập liệu tìm kiếm, theo dõi hồ sơ bệnh nhân… Tất cả những điều này bắt đầu với khả năng xử lí ngôn ngữ tự nhiên, mà tiêu biểu là giọng nói của bạn.
Đức Thọ