Google Translate Tambah 110 Bahasa Baru untuk Lebih Memahami Dunia
Google Translate memudahkan orang ramai berhubung dan memahami dunia di sekeliling mereka dengan lebih baik dengan memecahkan halangan bahasa.
Sentiasa memanfaatkan teknologi terkini, kini lebih ramai boleh mengakses alat ini. Pada tahun 2022, Google menambah 24 bahasa baharu menggunakan Terjemahan Mesin Zero-Shot, di mana model pembelajaran mesin mempelajari terjemahan tanpa contoh. Google juga mengumumkan Inisiatif 1,000 Bahasa, komitmen untuk membina model AI yang menyokong 1,000 bahasa paling banyak digunakan di seluruh dunia.
Kini, Google menggunakan AI untuk memperluaskan pelbagai bahasa yang disokong. Terima kasih kepada model bahasa besar PaLM 2, Google memperkenalkan 110 bahasa baru ke Google Translate, menjadikannya pengembangan terbesar kami setakat ini.
Sokongan Terjemahan untuk Lebih Setengah Bilion Orang
Dari Cantonese hingga Qʼeqchiʼ, bahasa-bahasa baru ini mewakili lebih 614 juta penutur, membuka terjemahan untuk kira-kira 8% populasi dunia.
Beberapa bahasa ini adalah bahasa dunia utama dengan lebih 100 juta penutur, manakala yang lain dituturkan oleh komuniti kecil masyarakat Orang Asli, dan beberapa bahasa hampir tidak mempunyai penutur asli tetapi sedang mengalami usaha pemulihan aktif.
Sekitar satu perempat daripada bahasa baru ini berasal dari Afrika, menjadikannya pengembangan bahasa Afrika terbesar kami setakat ini, termasuk Fon, Kikongo, Luo, Ga, Swati, Venda dan Wolof.
Berikut adalah beberapa bahasa yang baru disokong dalam Google Translate:
– **Afar** adalah bahasa tonal yang dituturkan di Djibouti, Eritrea, dan Ethiopia. Afar menerima sumbangan komuniti sukarelawan terbanyak di kalangan bahasa lain dalam pelancaran ini.
– **Cantonese** adalah salah satu bahasa yang paling banyak diminta dalam Google Translate. Oleh kerana Cantonese sering bertindih dengan Mandarin dalam penulisan, sukar untuk mendapatkan data dan melatih model.
– **Manx** adalah bahasa Celtic di Pulau Man. Hampir pupus dengan kematian penutur terakhirnya pada tahun 1974 tetapi usaha pemulihan menyeluruh di pulau itu kini menjadikannya mempunyai ribuan penutur.
– **NKo** adalah bentuk standarisasi bahasa Manding di Afrika Barat yang menyatukan banyak dialek ke dalam satu bahasa yang sama. Abjad uniknya dicipta pada 1949 dan mempunyai komuniti penyelidikan aktif yang mengembangkan sumber dan teknologi untuknya.
– **Punjabi (Shahmukhi)** adalah variasi Punjabi yang ditulis dalam skrip Perso-Arabik (Shahmukhi) dan merupakan bahasa paling banyak dituturkan di Pakistan.
– **Tamazight (Amazigh)** adalah bahasa Berber yang dituturkan di seluruh Afrika Utara, ditulis dalam skrip Latin dan Tifinagh, kedua-duanya disokong oleh Google Translate.
– **Tok Pisin** adalah kreol berasaskan bahasa Inggeris dan lingua franca Papua New Guinea.
Bagaimana Google Memilih Variasi Bahasa
Terdapat banyak perkara yang perlu dipertimbangkan ketika menambah bahasa baru ke Translate — segala-galanya daripada variasi bahasa yang ditawarkan, hingga ejaan tertentu yang digunakan.
Bahasa mempunyai variasi yang besar: variasi serantau, dialek, standard ejaan yang berbeza. Malah, banyak bahasa tidak mempunyai satu bentuk standard, jadi mustahil untuk memilih satu variasi yang “betul”. Pendekatan Google adalah untuk memprioritaskan variasi yang paling biasa digunakan.
Misalnya, Romani adalah bahasa yang mempunyai banyak dialek di seluruh Eropah. Model Google menghasilkan teks yang paling mirip dengan Romani Vlax Selatan, satu variasi yang digunakan secara meluas dalam talian, tetapi turut menggabungkan elemen dari dialek lain, seperti Vlax Utara dan Romani Balkan.
PaLM 2 merupakan elemen penting dalam membantu Translate belajar bahasa yang berkait rapat antara satu sama lain dengan lebih efisien, termasuk bahasa yang hampir dengan Hindi, seperti Awadhi dan Marwari, serta kreol Perancis seperti Creole Seychelles dan Creole Mauritius.