La IA puede clonar tu voz con solo 3 segundos de audio: esto es lo que pueden hacer con ella
Modelos de clonación de voz como ElevenLabs o Tortoise TTS ya reproducen tu forma de hablar con una precisión que engaña a familiares y amigos. Solo necesitan tres segundos de audio tuyo, que pueden obtener de cualquier vídeo o nota de voz que hayas publicado. Esto es lo que eso significa para tu seguridad.
Tres segundos. Eso es todo lo que necesitan.
En 2026, la tecnología de clonación de voz ha alcanzado un nivel que hace dos años parecía ciencia ficción. Herramientas disponibles públicamente —algunas gratuitas— pueden reproducir tu voz con una precisión escalofriante usando apenas tres segundos de audio de referencia. Y ese audio puede venir de cualquier vídeo que hayas publicado, cualquier nota de voz de WhatsApp que alguien haya guardado, o incluso de una llamada grabada sin tu conocimiento.
No es exageración. Es el estado actual de la tecnología.
Cómo funciona la clonación de voz con IA
Los modelos modernos de text-to-speech como ElevenLabs, Microsoft VALL-E o el reciente Fish Speech analizan las características únicas de tu voz —el timbre, el ritmo, la entonación, los patrones de respiración— y las codifican en un perfil digital. A partir de ese perfil, pueden generar audio con cualquier texto que introduzcas, pronunciado con tu voz.
La calidad ha mejorado exponencialmente. En 2022, la voz clonada sonaba robótica y era detectable. En 2026, los mejores modelos superan la prueba de familiares en primera escucha en más del 80% de los casos, según estudios de la Universidad de Stanford.
Para qué se está usando (y para qué se está abusando)
Usos legítimos: doblaje automatizado de vídeos al cambiar de idioma, accesibilidad para personas que han perdido la voz por enfermedad, personalización de asistentes de voz y producción audiovisual.
Usos fraudulentos que ya ocurren:
Estafas telefónicas de voz clonada: el atacante clona la voz de un familiar tuyo, te llama diciendo que está en problemas y necesita dinero urgente. El FBI ha documentado miles de casos en 2025. Las víctimas describen que la voz era "exactamente igual" a la de su familiar.
Acceso a sistemas de autenticación por voz: algunos bancos y servicios usan la voz como factor de autenticación. Los investigadores han demostrado que la clonación puede superar estos sistemas.
Desinformación y deepfakes de audio: declaraciones falsas atribuidas a políticos, directivos o celebridades, distribuidas por WhatsApp o redes sociales con la voz clonada de la persona.
Cómo puedes protegerte
Establece una palabra clave de seguridad con tu familia. Acuerda una palabra o frase secreta que usaréis en situaciones de emergencia para verificar que es realmente la persona. Si alguien llama diciendo que está en problemas, pregunta la palabra clave antes de tomar ninguna acción.
Sé consciente de cuánto audio tuyo hay disponible online. Los vídeos de redes sociales, los podcasts, los vídeos de YouTube y las notas de voz son fuente de audio. No significa que debas dejar de publicar, pero sí que debes saber que ese material existe.
Desconfía de cualquier llamada urgente que pida dinero o datos. Independientemente de lo real que suene la voz, cuelga y llama tú directamente al número oficial de la persona o institución antes de actuar.
Usa canales de comunicación verificados para decisiones importantes. Las videollamadas son más difíciles de falsificar en tiempo real (aunque los deepfakes de vídeo en tiempo real también existen). Para confirmar algo importante, insiste en una videollamada o en comunicación por un canal que el supuesto emisor controla directamente.
La realidad incómoda
La tecnología de clonación de voz ya no está en manos solo de estados o actores sofisticados. Está disponible para cualquier persona con un ordenador y conexión a internet. La respuesta no es el pánico, pero sí la actualización de nuestros protocolos de confianza. Verificar antes de actuar se ha convertido en una habilidad de supervivencia digital.
Junior De Leon
Editor principal de TechPulse.
Comentarios
Sé el primero en comentar.