أعلنت شركة جوجل الأمريكية إتاحة الاستماع والتحدث والترجمة بتقنية الذكاء الاصطناعي عبر النموذج اللغوي الجديد AudioPaLM ، الذي يعتمد على نقاط القوة في نموذجي PaLM-2 و AudioLM.
ويعد نموذج PaLM-2 أحد نماذج اللغة الكبيرة LLMs لفهم ومحاكاة وتوليد النصوص بدقة عالية وسرعة كبيرة، فيما يُعنى نموذج AudioLM بالصوتيات مثل الحفاظ على هوية المتحدث ونبرة الصوت، ليكونا سوياً نموذجاً قادراً على التحدث والترجمة.
ويتيح AudioPaLMالترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت، والتقاط الأصوات أو الأوامر المنطوقة وإعادة إنتاجها بلغات أخرى مختلفة، كما يمكنه التعرّف على الأصوات وترجمتها إلى نصوص.