Iván López Espejo
Mi investigación se centra en la inteligencia artificial y el procesamiento de señal aplicado a voz, voz cantada y señales biomédicas, con especial énfasis en la robustez, la seguridad y el despliegue en entornos reales. Desarrollo métodos de aprendizaje automático y aprendizaje profundo para aplicaciones como biometría vocal, detección de deepfakes de audio, mejora de voz, keyword spotting, music information retrieval e interfaces cerebro-computador.
Una de mis principales líneas de investigación aborda tecnologías vocales seguras y robustas, incluyendo sistemas anti-spoofing y detección de voz sintética o manipulada. En este ámbito colaboro con socios académicos e industriales y participo en actividades de transferencia tecnológica relacionadas con soluciones comerciales de autenticación por voz.
Asimismo, superviso investigación en procesamiento de voz cantada y music information retrieval. Nuestro trabajo incluye el desarrollo de PolySinger, un framework de traducción singing-to-singing voice, así como nuevas metodologías para la generación de bases de datos sintéticas de voz cantada orientadas a mejorar sistemas de alineamiento forzado y anotación fonética en grabaciones musicales. El objetivo a largo plazo es facilitar la generación automática de voicebanks y tecnologías escalables de síntesis de canto, con aplicaciones en tecnología musical, producción de contenido digital e interacción persona-máquina.
Otra línea activa de investigación explora la decodificación de voz imaginada a partir de señales EEG, combinando IA, tecnologías del habla y neurociencia para avanzar en sistemas de comunicación asistiva e interfaces cerebro-computador de nueva generación.
A lo largo de mi trayectoria he colaborado con universidades y empresas internacionales, incluyendo proyectos con Veridas, Oticon, LEGO y Grundfos. Estoy interesado en desarrollar proyectos colaborativos de I+D con empresas, instituciones sanitarias, industrias culturales y creativas, y organismos públicos relacionados con inteligencia artificial, tecnologías de audio, ciberseguridad, accesibilidad e interacción inteligente persona-máquina.
Mis capacidades técnicas incluyen aprendizaje profundo, IA generativa, procesamiento de voz y audio, aprendizaje multimodal, procesamiento estadístico de señal, generación de datos sintéticos y desarrollo de sistemas de IA en entornos basados en Python.
My research focuses on artificial intelligence and signal processing for speech, singing voice, and biomedical signals, with special emphasis on robustness, security, and real-world deployment. I develop machine learning and deep learning methods for applications including voice biometrics, audio deepfake detection, speech enhancement, keyword spotting, music information retrieval, and brain-computer interfaces.
A major research line concerns secure and robust voice technologies, including anti-spoofing systems and detection of synthetic or manipulated speech. In this area, I collaborate with academic and industrial partners and participate in technology transfer activities related to commercial voice authentication solutions.
I also supervise research in singing voice processing and music information retrieval. Our work includes the development of PolySinger, a singing-voice-to-singing-voice translation framework, and new approaches for generating synthetic singing voice datasets aimed at improving forced alignment and phonetic annotation systems for musical voice recordings. The long-term objective is to facilitate the automatic creation of singing voicebanks and scalable singing synthesis technologies for applications in music technology, digital content production, and human-computer interaction.
Another active line of research explores imagined speech decoding from EEG signals, combining AI, speech technology, and neuroscience to advance next-generation assistive communication systems and brain-computer interfaces.
Throughout my career, I have collaborated with international universities and companies, including projects with Veridas, Oticon, LEGO, and Grundfos. I am interested in collaborative R&D projects with companies, healthcare institutions, cultural and creative industries, and public organizations working in AI, audio technologies, cybersecurity, accessibility, and intelligent human-machine interaction.
My technical expertise includes deep learning, generative AI, speech and audio processing, multimodal machine learning, statistical signal processing, synthetic data generation, and Python-based AI development environments.
Enlace de referencia:
Datos del Experto/a
- Instituto / Departamento: Teoría de la Señal, Telemática y Comunicaciones / E.T.S. de Ingenierías Informática y de Telecomunicación
- Grupo de Investigación: SigMAT
- Tags: Artificial Intelligence for Voice Technologies, Biometría vocal y detección de deepfakes de audio, Brain-Computer Interfaces and EEG Signal Decoding, Inteligencia artificial para tecnologías del habla, Interfaces cerebro-computador y decodificación de señales EEG, Procesamiento de voz cantada y music information retrieval, Procesamiento de voz y audio, Singing Voice Processing and Music Information Retrieval, Speech and Audio Processing, Voice Biometrics and Audio Deepfake Detection

Contacta con el/la Experto/a
