Ứng dụng Google Tạo phụ đề giúp người khiếm thính giao tiếp tốt hơn
Việc “xả băng” ghi âm hay tổng hợp nội dung họp là điều rất phiền toái cho mọi nhân viên văn phòng, nay đã có thể xử lý nhanh bằng một ứng dụng miễn phí từ Google là Google Tạo phụ đề trực tiếp (Google Live Transcribe) hỗ trợ nhiều ngôn ngữ bao gồm tiếng Việt. Ứng dụng còn giúp người khiếm thính (điếc) giao tiếp nhanh chóng, hiệu quả hơn rất nhiều.
Google Tạo phụ đề trực tiếp hay (Google Live Transcribe) là ứng dụng di động miễn phí được các kỹ sư Google tạo ra nhằm hỗ trợ người khiếm thính có thể giao tiếp tốt hơn (phiên bản đầu tiên được công bố ngày 4-2-2019). Cụ thể, ứng dụng Tạo phụ đề trực tiếp chuyển giọng nói thành văn bản theo thời gian thực, nhờ đó, người điếc hay giảm thính lực có thể dễ dàng tham gia các cuộc trò chuyện hàng ngày chỉ với chiếc điện thoại Android. Người đối diện nói bất cứ điều gì, ứng dụng cũng đều chuyển lời nói đó thành văn bản trên màn hình điện thoại để người dùng xem và phản hồi.
Thế giới sẽ có 900 triệu người giảm thính lực vào năm 2055, theo Tổ chức Y tế Thế giới (WHO)
Bên cạnh đó, Google Tạo phụ đề trực tiếp còn có một công dụng phụ thú vị rất hữu ích cho các nhân viên văn phòng hoặc người làm báo chí truyền thông là “xả băng” ghi âm cuộc họp. Bình thường, người ta thường mất nhiều thời gian để nghe lại một bản ghi âm cuộc họp hay trao đổi, rồi gõ lại thành văn bản. Tuy nhiên, với ứng dụng Tạo phụ đề trực tiếp (Live Transcribe), việc chuyển bản ghi âm thành văn bản được thực hiện ngay lúc cuộc họp đang diễn ra.
Sử dụng công nghệ nhận dạng lời nói tự động tiên tiến của Google, ứng dụng Tạo phụ đề trực tiếp hiển thị lời nói và âm thanh ở dạng văn bản trên màn hình, hỗ trợ đến hơn 80 ngôn ngữ và phương ngữ, bao gồm tiếng Việt. Nhờ vậy, người điếc hay người suy giảm thính lực có thể dễ dàng tham gia các cuộc trò chuyện đang diễn ra quanh mình hơn. Họ có thể nhập câu trả lời trên màn hình, nhận thông báo rung khi tên họ được nhắc và tìm kiếm nội dung trong bản chép lời đó.
Ứng dụng cho phép bạn chọn nhanh hai ngôn ngữ thường được dùng nhất trong phần Thiết lập. Thí dụ có thể chọn tiếng Việt và tiếng Anh, đặc biệt hơn, ứng dụng cho phép phân loại các giọng phát âm để có thể nhận diện giọng nói tốt hơn như Tiếng Anh (giọng Mỹ), tiếng Anh (giọng Ấn)… Điều này cho phép ứng dụng ghi nhận giọng nói và chuyển thành văn bản chính xác hơn, nắm bắt chính xác các sắc thái của cách sử dụng từ trong ngữ cảnh.
Một số tính năng phụ mà người dùng có thể thiết lập:
- Thêm các từ tùy chỉnh mà bạn thường dùng, như tên hoặc vật dụng trong nhà
- Xem các sự kiện âm thanh trong môi trường xung quanh bạn, như tiếng chó sủa, tiếng vỗ tay hoặc tiếng huýt sáo
- Nhập nội dung trả lời trong cuộc trò chuyện của bạn. Hiển thị bàn phím điện thoại và nhập nội dung để trò chuyện liên tục. Bản chép lời nói sẽ vẫn hiển thị khi bạn nhập
- Xem âm lượng giọng nói của người nói so với độ ồn trong môi trường của bạn. Bạn có thể dùng chỉ báo âm thanh này để điều chỉnh âm lượng của mình khi nói
Khi đã hoàn thành bản chuyển giọng nói thành văn bản, tạm gọi là “bản chép lời”, người dùng có thể chọn xem lại bản này trong 3 ngày (mặc định không được lưu lại) để chuyển chúng sang các đám mây lưu trữ như Google Drive hoặc sao chép nhanh nội dung qua Google Docs.
Ứng dụng Tạo phụ đề trực tiếp (Live Transcribe) là sản phẩm hợp tác giữa Google và Đại học Gallaudet, trường đại học hàng đầu Hoa Kỳ dành cho người khiếm thính và người bị suy giảm thính lực, hỗ trợ điện thoại chạy hệ điều hành Android 5.0 (Lollipop) trở lên, tải miễn phí trên Google Play (nghĩa là người dùng các điện thoại Android giá phổ thông thế hệ cũ vẫn có thể sử dụng được ứng dụng này).
Công nghệ nhận diện giọng nói và chuyển thành văn bản trong thời gian thực dùng cho ứng dụng Tạo phụ đề trực tiếp được Google chia sẻ trên mạng phát triển mở GitHub, nơi các nhà phát triển có thể khai thác để ứng dụng hay sáng tạo cho các sản phẩm của mình.
Mẹo dùng gia tăng độ chính xác
- Dùng microphone gắn ngoài đi kèm tai nghe có dây, tai nghe Bluetooth để tiếp nhận âm thanh tốt hơn
- Kiểm tra chỉ báo âm lượng và tiếng ồn (biểu tượng màu xanh góc phải trên màn hình) để tìm hiểu xem môi trường xung quanh bạn có phù hợp để tạo bản chép lời không.
Xin mời xem video.
MEDIAONLINE
+ Ảnh do Google cung cấp.