Con apenas tres segundos, pueden replicar su voz
Delincuentes obtienen muestras de voz mediante llamadas de promociones bancarias o encuestas para crear réplicas digitales usadas en fraudes. La Condusef advierte que respuestas como '¿Me escucha?' o '¿Hablo con...?' proporcionan material suficiente para que herramientas de IA clonen la voz.
- Delincuentes obtienen muestras de voz mediante llamadas falsas de promociones bancarias o encuestas
- Apenas tres segundos de audio son suficientes para que herramientas de IA clonen una voz
- La Policía Cibernética recomienda guardar silencio al contestar números desconocidos y dejar que el otro hable primero
Las autoridades alertan sobre estafas que utilizan IA para clonar voces con apenas tres segundos de audio, recomendando evitar respuestas específicas en llamadas de números desconocidos.
Las llamadas que llegan de números desconocidos se han convertido en una herramienta de caza para los defraudadores. Lo que antes era una molestia menor ahora representa un riesgo real: criminales están usando inteligencia artificial para clonar voces y suplantar identidades, y todo lo que necesitan es apenas unos segundos de audio de su voz.
La Comisión Nacional para la Protección y Defensa de los Usuarios de Servicios Financieros ha estado monitoreando una tendencia inquietante. Los delincuentes llaman fingiendo ser de un banco, ofreciendo una promoción, o pidiendo que participe en una encuesta rápida. A veces la llamada termina en silencio después de unos segundos. No es accidente. Es recolección de datos. Cada una de estas llamadas es un intento de obtener una muestra de su voz.
El método es simple pero efectivo. Un delincuente marca desde un número que usted no reconoce y hace preguntas diseñadas para obtener respuestas breves: "¿Me escucha?" o "¿Hablo con...?". Usted responde. Esos segundos de audio son suficientes. Con apenas tres segundos de grabación, las herramientas de inteligencia artificial disponibles hoy pueden generar una imitación de su voz lo suficientemente convincente como para engañar a otras personas. Una vez que tienen esa réplica digital, pueden usarla para llamar a sus contactos, a sus bancos, a sus familiares, fingiendo ser usted.
La Policía Cibernética de México ha emitido una recomendación clara: cuando reciba una llamada de un número desconocido, no hable primero. Guarde silencio y espere a que sea la otra persona quien inicie la conversación. Si nadie responde después de unos segundos, o si algo se siente fuera de lugar, cuelgue. No es grosería. Es defensa.
Las autoridades también advierten específicamente contra tres palabras o frases que debe evitar decir al contestar: las respuestas que típicamente damos de forma automática cuando alguien nos llama. Aunque el material original no especifica cuáles son exactamente esas tres palabras, el patrón es claro: cualquier confirmación breve de su identidad o presencia es material útil para los criminales. "Sí", "Hola", "¿Quién habla?" — cualquiera de estas puede ser capturada y procesada.
Más allá de no responder a llamadas sospechosas, las autoridades recomiendan otras medidas. Desconfíe de cualquier llamada inesperada, incluso si el número parece legítimo. Los delincuentes pueden falsificar números. No proporcione información personal en respuesta a llamadas no solicitadas. Si un banco necesita hablar con usted, ellos ya tienen su número; usted puede colgar y llamarlos directamente al número que aparece en su tarjeta o en su estado de cuenta. Mantenga sus contraseñas seguras. Use autenticación de dos factores cuando sea posible.
La inteligencia artificial no es inherentemente malvada. Tiene usos legítimos en medicina, educación, entretenimiento. Pero como toda herramienta poderosa, también puede ser arma. Las redes de ciberdelincuencia ya la están usando. Y mientras la tecnología siga mejorando, el riesgo seguirá creciendo. La defensa más efectiva que tiene ahora es la cautela: no hable con extraños, especialmente no cuando llaman sin que usted los haya buscado.
Notable Quotes
Con apenas tres segundos de audio, algunas plataformas de IA pueden generar imitaciones muy similares de la voz de una persona— Comisión Nacional para la Protección y Defensa de los Usuarios de Servicios Financieros (Condusef)
The Hearth Conversation Another angle on the story
¿Por qué tres segundos de audio es suficiente? ¿No necesitan más para que suene convincente?
Tres segundos es el mínimo que necesitan las herramientas más avanzadas. Una palabra, una frase corta, un "hola" — eso contiene patrones únicos de su voz: el tono, la velocidad, la forma en que pronuncia. El algoritmo mapea eso y puede generar nuevas palabras que nunca dijo.
Pero si clonan mi voz, ¿no se daría cuenta mi familia de que algo está mal?
Depende. Si es una llamada rápida pidiendo dinero, o si la persona que recibe la llamada está asustada o distraída, es posible que no lo note. Y si el delincuente tiene información sobre usted — su nombre, su trabajo, detalles personales — la ilusión es más convincente.
¿Por qué específicamente "¿Me escucha?" y "¿Hablo con...?"?
Porque son respuestas que casi todos damos automáticamente. Son naturales, no suenan forzadas. El algoritmo necesita muestras que suenen como usted en su estado normal, no como si estuviera leyendo un guión.
Si guardo silencio cuando contesto, ¿eso realmente detiene el fraude?
Detiene la recolección de muestra en ese momento. Si no habla, no tienen nada que grabar. Pero es solo una capa de defensa. Lo importante es no responder a números desconocidos en primer lugar.
¿Qué pasa si es una llamada legítima y guardo silencio?
Una empresa real esperará. Dirá algo como "¿Hola?" o "¿Me escucha?" Entonces usted sabe que hay una persona real al otro lado. Un delincuente probablemente cuelgue si no obtiene una respuesta rápida.
¿Esto es un problema nuevo o ha estado sucediendo durante años?
Es nuevo en escala. La tecnología para clonar voces con esta precisión existe hace poco. Ahora es accesible. Eso es lo que asusta a las autoridades.