-. ¿Dónde están los botones?
-. Han instalado un dispositivo de reconocimiento de voz en el ascensor.
-. ¿Reconocimiento de voz? ¿En un ascensor? ¿En Escocia?
Ellos pretenden subir al undécimo piso, pero la voz les ignora. La tecnología les ignora. La IA sólo responde al inglés de manual. “Eleven”. Por más que intentan imitar el acento británico, la máquina no les entiende. Ni suben ni bajan. Están atrapados por culpa de su acento. Lo que empieza como un sketch de humor, se convierte en una metáfora brillante. La inteligencia artificial sólo será útil si es capaz de entendernos. A todos. Sin sesgos.
Porque el futuro, ese que imaginamos tan creativo, tan maravilloso como automatizado, está construyéndose sobre patrones y muchos de esos patrones excluyen. Por eso, lo que pasa en ese ascensor escocés no es una anécdota, es una advertencia. La IA no se equivoca por falta de datos, sino por falta de diversidad. Y cuando no escucha, no conecta. Y cuando no conecta, todo lo demás da igual.
En Thankium llevamos tiempo atentos a lo que viene. Si algo tenemos claro es que no suena a ciencia ficción, sino a evolución. Her nos lo advirtió (vale, sí, también lo dijimos en El Publicista), pero este blog no va de películas. Va de ese ascensor que pone en jaque a sus usuarios por no haber sido diseñado pensando en la diversidad, en el reconocimiento de voz. Va de cómo la voz no basta si no está bien entrenada. De cómo la empatía y la inclusión no son opcionales en la era de los asistentes. Sobre todo, va del futuro de las marcas, ese que se ve, pero también se escucha.
La nueva interfaz es la voz
Las interfaces están cambiando. Hoy, cada vez tocamos menos y decimos más. Interactuamos hablando, buscando, pidiendo. Alexa, Siri, Google Assistant. Les preguntamos, les confesamos, les dejamos tomar decisiones pequeñas (y no tan pequeñas) por nosotros. Es ahí donde la voz se convierte en la nueva interfaz. No sustituye a la imagen, la complementa. Se convierte en un acceso natural, más emocional, más humano.
El branding, que durante años se pintó con logos, tipografías y manuales de uso visual, ahora se escribe también con pausas, tonos y ritmos. Porque una marca no sólo tiene que verse bien, tiene que sonar bien. Sentirse real. Dejar huella sin necesidad de ser vista. Las identidades sonoras están dejando de ser jingles o cuñas de radio para convertirse en verdaderas extensiones del alma de la marca.
Eso no significa que desaparezca la UI visual. La pantalla seguirá ahí para mapear, comparar o ver un vídeo. Pero la voz, el reconocimiento de voz, será cada vez más protagonista. Y como tal, debe formar parte del ADN de una marca. Porque la voz transmite, pero también emociona. Y ahí está el verdadero terreno de juego.
La identidad sonora ya está aquí
Desde un tiempo a esta parte, las marcas están aprendiendo a sonar. Definen su tono, su ritmo, su temperatura. Programan su timbre, también su alma. No hay nada como echar un vistazo alrededor. Amazon convirtió a Alexa en su emblema acústico. Domino’s permite pedir una pizza con una frase. Bank of America creó a Erica para que sus clientes gestionen sus finanzas sin tocar la pantalla. KLM responde las dudas de los viajeros con un asistente de voz. Cada una de estas empresas ha encontrado en la voz una forma de estar, de servir. En definitiva, de ser.
Esto no es nuevo. Las cuñas de radio ya intuían que la voz podía ser imagen, pero ahora esa intuición se vuelve estándar. La identidad sonora está dejando de ser un accesorio para convertirse en una extensión natural del branding.
Reconocimiento de voz con propósito
Con el auge de la voz, el tablero de juego ha cambiado. En un giro casi invisible ha surgido el SEO conversacional, un nuevo jugador que ha cambiado las reglas. Ya no basta con escribir bien. Ahora hay que sonar bien. Hablar no es suficiente, hay que ser escuchado... Las búsquedas por voz están creciendo, y los asistentes tienden a dar una única respuesta. Eso convierte la conversación en territorio de alta competencia.
Las marcas tienen que adaptar su lenguaje, optimizar sus datos estructurados, jugar con las FAQ habladas y anticipar la intención real del usuario. El reto ya no es aparecer en la lista, sino ser la opción recomendada. Ser el primero que se oye.
Eso implica cambiar cómo escribimos, cómo estructuramos, cómo preguntamos. Surgen FAQ diseñadas para ser habladas, datos estructurados que no sólo informan, también dialogan. Herramientas como Schema Markup. Y sobre todo, intención. Porque la IA ya no se guía sólo por una keywords, sino por el contexto. Por cómo decimos lo que decimos.
La autenticidad suena mejor
Así las cosas, en un contexto de saturación publicitaria, la autenticidad surge como el único algoritmo valioso. La voz de una marca debe sonar cercana sin resultar invasiva. Real, sin imposturas. Porque la diferencia entre un buen asistente y uno frustrante no está en la tecnología, sino en la naturalidad. En sonar como alguien, no como algo.
Spotify lo ha entendido con DJ Livi, una inteligencia artificial con tono humano que te habla como quien comparte sus gustos musicales con un colega melómano cuyo tono de voz no chirria, acompaña. No interrumpe, no empuja, sugiere.
El marketing inmersivo no es ciencia ficción
La realidad aumentada, la inteligencia artificial y la voz también están creando un nuevo terreno de juego. El informe de IDC lo deja bien claro. “La integración de IA en dispositivos AR/VR crecerá más de un 40 % en los próximos años”. ¿El resultado?Respecto al reconocimiento de voz: experiencias más integrales, personalizadas y sensoriales. Y ahí es donde las marcas deben estar: en la combinación perfecta entre ver y escuchar, entre sentir y responder. No se trata de eliminar pantallas, sino de dar al usuario la libertad de elegir cómo interactuar.
No se asusten. La interfaz visual seguirá existiendo, pero será una opción más. La voz, combinada con IA y experiencias inmersivas se ha convertido en un plus para el lenguaje de las marcas. La publicidad también está cambiando. Ya no se impone, se integra. No te grita desde un banner, te susurra una sutil recomendación. El marketing del futuro será conversacional, sensorial, adaptativo.
No hay marcha atrás, esto ya suena así
Sólo las marcas que entiendan esto sabrán cómo adaptarse. Contarán historias que se vean, se escuchen, se sientan y se vivan. No hará falta enamorarse de un asistente como Theodore, bastará con que te entiendan. Que no te repitan "Eleven" una y otra vez sin hacer nada. Bastará con que, simplemente, suban contigo.
Todo empezó con un ascensor obstinado en quedarse en tierra, con una voz sin oído. En ese instante, entendimos que no somos nosotros quienes debemos adaptarnos a la máquina. Es ella quien debe aprender a acompañarnos.
Gracias por no repetir “Eleven”. Gracias por escuchar.

