Công nghệ nào giúp Google Dịch hỗ trợ tới gần 250 ngôn ngữ?
Google Dịch đang thêm mới hơn 100 ngôn ngữ nữa vào kho ngôn ngữ, nâng tổng số ngôn ngữ dịch được lên tới gần 250.
Google ra mắt Google Dịch vào năm 2006. Kể từ đó, công ty đã dần dần bổ sung hỗ trợ cho nhiều ngôn ngữ hơn cho nền tảng này. Hồi tháng 5, công ty đã bổ sung thêm hỗ trợ cho 24 ngôn ngữ mới, nâng tổng số ngôn ngữ được hỗ trợ lên 133.
Tuy nhiên, hôm 27/6 vừa qua có thể nói là lần cập nhật lớn nhất của Google Dịch. Gã khổng lồ công nghệ thông báo rằng công cụ này đang có "sự mở rộng lớn nhất từ trước đến nay", với 110 ngôn ngữ mới, nâng tổng số ngôn ngữ được hỗ trợ lên 243.
Để so sánh, Apple Translate hỗ trợ 20 ngôn ngữ và Microsoft Translator hỗ trợ 135 ngôn ngữ. Hiện tại, Google Dịch đang chiếm thế thượng phong và bỏ rất xa 2 đối thủ trên.
Theo Google, họ đạt được thành tích này nhờ sự trợ giúp của mô hình ngôn ngữ lớn PaLM 2. Một số ngôn ngữ mới được hỗ trợ bao gồm tiếng Afar, tiếng Quảng Đông, tiếng Manx, NKo, tiếng Punjabi, Tamazight và Tok Pisin.
Google đạt được cột mốc này nhờ mô hình PaLM 2. (Ảnh: Google).
Hãng cho biết 110 ngôn ngữ mới được thêm vào “đại diện cho hơn 614 triệu người nói, mở ra khả năng dịch thuật cho khoảng 8% dân số thế giới”.
Ngoài ra, “Một vài trong số này là ngôn ngữ lớn trên thế giới với hơn 100 triệu người nói. Những ngôn ngữ khác được sử dụng bởi các cộng đồng nhỏ người bản địa, và một số ít hầu như không có người nói tiếng mẹ đẻ nhưng đang được khôi phục".
1/4 trong số 110 ngôn ngữ mới đến từ Châu Phi, và đây là bản cập nhật lớn nhất của Google Dịch cho cư dân lục địa này. Với 243 ngôn ngữ, số cặp dịch của Google Dịch hiện đã lên tới 29.403.
Mô hình PaLM 2 có gì đặc biệt?
PaLM là viết tắt của Pathways Language Model (mô hình ngôn ngữ Pathways), sử dụng kiến trúc Pathways AI của Google giúp đào tạo các mô hình học máy để thực hiện nhiều nhiệm vụ khác nhau. Đây là một phần quan trọng trong tầm nhìn của Google nhằm đạt được AGI - artificial general intelligence - mục tiêu rằng AI sẽ thực hiện được mọi tác vụ tư duy mà con người làm được
Google trước đây đã tuyên bố rằng kiến trúc Pathways sẽ mở đường cho AI đa phương thức ngoài văn bản, và Gemini là một LLM khác đã đạt được mục tiêu này. Trong một bài đăng trên blog, công ty cho biết:
Pathways có thể kích hoạt các mô hình đa phương thức và hiểu biết về thị giác, thính giác và ngôn ngữ cùng một lúc. Do vậy, cho dù mô hình đang xử lý từ “con báo”, âm thanh của ai đó nói “con báo” hay video về một con báo đang chạy, thì phản ứng đồng nhất sẽ được kích hoạt từ bên trong: khái niệm về một con báo. Kết quả là một mô hình sâu sắc hơn và ít mắc sai lầm và thành kiến hơn.
Không giống như mô hình LaMDA mà nó thay thế, PaLM 2 đã được đào tạo về hơn 100 ngôn ngữ và thậm chí còn có kiến thức ngành tốt hơn trong các lĩnh vực như coding. Nó cũng có khả năng suy luận logic và toán học tốt hơn nhiều.
Để tiếp sức cho Google Dịch, PaLM 2 được đào tạo trên khối lượng lớn văn bản đa ngôn ngữ song song. Mô hình này có thể học và phiên dịch các ngôn ngữ nhanh hơn nhờ khả năng logic, đặc biệt là những ngôn ngữ có liên kết chặt chẽ với nhau, ví dụ như nhóm ngôn ngữ gần Hindi.
Google có mục tiêu hỗ trợ 1.000 ngôn ngữ được sử dụng rộng rãi nhất trên toàn thế giới, nhằm giảm bớt rào cản ngôn ngữ và thúc đẩy kết nối cộng đồng toàn cầu.