Todo gracias a PaLM 2

Google apuesta todo por su traductor: lo veremos en tiempo real conversaciones, textos y hasta videos

La Inteligencia Artificial de la compañía también añadirá esta herramienta a su potente celular Pixel Fold

Google apuesta todo por su traductor: lo veremos en tiempo real conversaciones, textos y hasta videos
La veremos reflejada en los clips subidos a YouTube, donde la IA leerá los labios, interpretará el mensaje y creará una voz. Foto: Adobe Stock

Durante el evento tecnológico más importante de Google, la compañía decidió apostarlo todo por su traductor e implementar nuevas mejoras que le servirán a chicos y grandes. Para empezar, lo que más resonó el día de ayer fue la posibilidad que su Inteligencia Artificial nos brindará al pasar —en tiempo real— conversaciones de un idioma a otro, ya no solo con la herramienta del explorador, sino en videos de YouTube. PaLM 2 logró lo impensable y ahora leerá los labios de la persona, los gestos y más para codificar el mensaje original, traducirlo al idioma deseado y finalmente reemplazarlo con una voz que se empareje con el tono y entonación del ponente, de la misma forma que lo hacen los asistentes virtuales.

Leerá los labios del ponente, modulará la entonación y la voz para así doblar en tiempo real el video al idioma deseado. FOTO: Google I/O

Lo llaman el "traductor universal"

Este es —hasta el momento— un prototipo que Google está poniendo a disposición de un número determinado de socios, llamado "traductor universal". El servicio experimental "dobla" en tiempo real un video mediante el uso de la Inteligencia Artificial. Esto permite ver y leer al instante el discurso del ponente aunque esté en otro idioma. Y es que el prototipo se presentó durante el evento a través de clips de prueba que formaban parte de un curso universitario en línea creado en colaboración con la Universidad Estatal de Arizona. El resultado de esto fueron estruendosos aplausos por acercarnos a un punto máximo en la tecnología.

Asimismo, Google afirmó que los primeros resultados han sido muy prometedores y que los estudiantes universitarios del estudio mostraron un mayor número de finalizaciones del curso. Cabe destacar que este modelo funciona en cuatro etapas, la primera es para comparar el movimiento de los labios del video con las palabras que el programa llega a reconocer. Para la segunda, un algoritmo genera el habla al instante. En la tercera el modelo utiliza la entonación que mide el aumento y la disminución del ritmo natural del habla y con ello se facilita la traducción. Por último, lo combina todo y reproduce un estilo con un ajuste al movimiento de los labios del hablante, cuida la entonación y el tono. Un paso que verdaderamente explota la cabeza de los aficionados de esta rama.

Una función ya lanzada es que se escuche y transcriba un idioma en el traductor para así pasar su mensaje al lenguaje deseado. FOTO: Adobe Stock

¿Dónde se podrá usar el traductor universal?

Como explicamos, la función del "traductor universal" aún no está disponible y solo un pequeño grupo afortunado está haciendo las pruebas necesarias para su uso. Sin embargo, es posible que una vez que Google haya calado cada una de sus funciones, resultados y demás, lo veamos en servicios como YouTube y hasta conferencias en Google Meet. Y es que la posibilidad que abrieron de traducir sin necesidad de terceros y en varios idiomas será la herramienta más útil de todo el 2023 dentro de la compañía, pues no solo aumentaría la audiencia mundial en un canal de esta plataforma, también permitirá llevar a cabo más proyectos colaborativos rompiendo la frontera del lenguaje entre los países.

Se añaden 24 idiomas más al traductor de Google

La compañía también compartió durante el evento de Google I/O que se tendrán 24 nuevos idiomas en su herramienta, esta es la lista:

  1. Asamés, utilizado por unos 25 millones de personas en el noreste de la India
  2. Aymara, utilizado por cerca de dos millones de personas en Bolivia, Chile y Perú
  3. Bambara, utilizado por unos 14 millones de personas en Malí
  4. Bhojpuri, utilizado por unos 50 millones de personas en el norte de la India, Nepal y Fiji
  5. Dhivehi, utilizado por unas 300.000 personas en las Maldivas
  6. Dogri, utilizado por unos tres millones de personas en el norte de la India
  7. Ewe, utilizado por unos siete millones de personas en Ghana y Togo
  8. Guaraní, utilizado por cerca de siete millones de personas en Paraguay y Bolivia, Argentina y Brasil
  9. Ilocano, utilizado por unos 10 millones de personas en el norte de Filipinas
  10. Konkani, utilizado por cerca de dos millones de personas en el centro de la India
  11. Krio, utilizado por unos cuatro millones de personas en Sierra Leona
  12. Kurdo (Sorani), usado por cerca de ocho millones de personas, principalmente en Irak
  13. Lingala, utilizado por unos 45 millones de personas en la República Democrática del Congo, República de Congo, República Centroafricana, Angola y República de Sudán del Sur
  14. Luganda, utilizado por unos 20 millones de personas en Uganda y Ruanda
  15. Maithili, utilizado por unos 34 millones de personas en el norte de la India
  16. Meiteilon (Manipuri), utilizado por cerca de dos millones de personas en el noreste de la India
  17. Mizo, utilizado por unas 830.000 personas en el noreste de India
  18. Oromo, utilizado por unos 37 millones de personas en Etiopía y Kenia
  19. Quechua, usado por alrededor de 10 millones de personas en Perú, Bolivia, Ecuador y países vecinos
  20. Sánscrito, utilizado por unas 20.000 personas en la India
  21. Sepedi, utilizado por unos 14 millones de personas en Sudáfrica
  22. Tigrinya, utilizado por unos ocho millones de personas en Eritrea y Etiopía
  23. Tsonga, utilizado por unos siete millones de personas en Esuatini, Mozambique, Sudáfrica y Zimbabue
  24. Twi, utilizado por alrededor de 11 millones de personas en Ghana
Ahora vendrá como una herramienta integrada en su celular más potente, el Pixel Fold. FOTO: Adobe Stock

 

Sigue leyendo:

Traductor en tiempo real, wallpapers en 3D, IA y el smartphone más potente: las novedades de Google para 2023

 

Temas