Suno presenta el modelo de IA musical v5.5 con voz personalizada
Suno ha presentado su nuevo modelo de música con inteligencia artificial v5.5 junto con funciones diseñadas para mostrar la individualidad musical.
Suno ha presentado su nuevo modelo de música con inteligencia artificial v5.5 junto con funciones diseñadas para mostrar la individualidad musical.
El nuevo modelo de código abierto de Google, Gemma 4, puede procesar texto, imágenes y audio completamente de forma local en un smartphone. A través de las llamadas Agent Skills, la IA incluso puede utilizar por sí sola herramientas como Wikipedia o mapas interactivos.
Meta planea lanzar versiones de sus nuevos modelos de inteligencia artificial como código abierto, según Axios. Estos modelos son los primeros desarrollados bajo la dirección de Alexandr Wang, quien se incorporó a Meta en 2025 como parte de un acuerdo cercano a los 15.000 millones de dólares con Scale AI.
El equipo de Bing de Microsoft - sí, en serio - ha publicado como código abierto el modelo de embeddings Harrier. Harrier es compatible con más de 100 idiomas, ofrece una ventana de contexto de 32.000 tokens y fue entrenado con más de dos mil millones de ejemplos, así como con datos sintéticos generados por GPT-5. Según el equipo, Harrier ocupa el puesto número 1 en el benchmark multilingüe MTEB-v2 y, de acuerdo con Microsoft, supera a modelos propietarios de OpenAI y Amazon.
Alibaba ha presentado Qwen3.5-Omni, un modelo de IA omnimodal con comprensión de texto, imagen, audio y video. Según la compañía, supera a Gemini 3.1 Pro en tareas de audio e introduce una nueva capacidad: programar a partir de instrucciones habladas y entrada de video.
Google DeepMind ha presentado Veo 3.1 Lite, su modelo de generación de video más asequible hasta la fecha. El nuevo modelo cuesta menos de la mitad que Veo 3.1 Fast y, según Google, mantiene una velocidad de generación comparable. Sin embargo, la compañía no ha revelado diferencias cualitativas detalladas entre Veo 3.1, Fast y Lite.
El equipo de investigación detrás de Molmo ha lanzado un agente web capaz de operar sitios utilizando únicamente capturas de pantalla. A pesar de su tamaño compacto, los modelos en algunos casos superan a sistemas propietarios más grandes.
Google ha presentado Lyria 3 Pro, su modelo de IA más avanzado para la generación musical. El sistema puede crear pistas de hasta tres minutos y, según Google, comprende mejor estructuras musicales como introducciones, estrofas, estribillos y puentes que Lyria 3, que la compañía presentó en febrero.
Xiaomi planea desarrollar agentes de IA capaces de controlar software de forma autónoma, comprar en navegadores y, en el futuro, operar robots. Para respaldar esa visión, el equipo interno MiMo de la compañía presentó tres modelos al mismo tiempo.