El Lemonade SDK que AMD describe como una solución open source para correr "IA local refrescantemente rápida" sigue avanzando a un ritmo más alto que el promedio de proyectos similares. La herramienta, desarrollada mayoritariamente por ingenieros de AMD, está orientada a servir LLMs optimizados sobre GPUs y NPUs.
Desde la entrega de Lemonade SDK 10.0 en marzo, que finalmente volvió útiles a las NPU Ryzen AI bajo Linux para correr modelos de lenguaje, el desarrollo se aceleró notablemente y las releases pasaron a ser más frecuentes. En paralelo, el software GAIA de AMD, construido sobre el servidor de Lemonade, también muestra actividad creciente.
¿Por qué Lemonade soporta macOS si no hay GPUs AMD en Macs modernos?
Aunque las computadoras Apple ya no usan hardware AMD, Lemonade SDK mantiene compatibilidad con macOS mediante el backend Metal de Llama.cpp, que apunta a las GPUs de los SoC M-Series. Con la release de este fin de semana, el equipo promovió el soporte para macOS desde "beta" a estado GA (general availability). El pull request 1893 consolida la transición y refleja la mejor calidad de soporte reciente del proyecto. Todas las características principales de Lemonade están ahora consideradas soportadas en macOS.
Para usuarios atrapados en ecosistema Apple sin GPU dedicada, eso significa que la pipeline de inferencia LLM optimizada por AMD ahora es ruta oficial, no experimental.
¿Qué cambia con la integración de ROCm 7.13?
La otra novedad relevante de Lemonade SDK 10.5 es el upgrade a ROCm 7.13 Tech Preview para Llama.cpp y Stable-Diffusion.cpp. AMD ROCm 7.13, liberado la semana pasada, sumó soporte para Ubuntu 26.04 LTS, soporte para el acelerador PCIe AMD Instinct MI350P y mejoras para varios productos Ryzen AI y Radeon PRO ya existentes.
Lemonade SDK 10.5 también mejora la gestión de modelos personalizados e importados, actualiza Llama.cpp a la versión upstream 9174 y suma varias correcciones de errores.
¿Dónde se descarga?
Los binarios de Lemonade 10.5 y los detalles del release están disponibles en GitHub, bajo licencia open source. El stack continúa siendo gratuito, lo que importa para equipos LatAm que prefieren correr inferencia sobre hardware mixto AMD/Apple sin depender de NVIDIA CUDA.


