Modelo de audio innovador de código abierto VibeVoice-1.5B de Microsoft

Jin10 datos 26 de agosto: esta madrugada, el Instituto de Investigación de Microsoft lanzó el modelo de audio innovador VibeVoice-1.5B como código abierto. VibeVoice-1.5B ha logrado múltiples avances técnicos significativos en el campo de la voz: puede sintetizar de manera continua 90 minutos de voz ultra realista de una sola vez, mientras que la mayoría de los modelos anteriores solo podían sintetizar menos de 60 minutos de voz y, después de 30 minutos, presentaban problemas como el cambio de timbre y la ruptura semántica.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)