shadcn/improve propone una nueva forma de usar agentes de IA en desarrollo

El uso de agentes de inteligencia artificial en programación está entrando en una fase más madura. Ya no se trata solo de pedir a un modelo que escriba código y esperar que acierte, sino de organizar mejor qué parte del trabajo debe hacer el modelo más capaz, qué parte puede ejecutar un modelo más barato y dónde debe intervenir el desarrollador humano. En ese contexto aparece shadcn/improve, una skill para agentes que plantea una idea sencilla: usar el modelo más potente para auditar un proyecto y escribir planes de mejora, pero no para implementar directamente los cambios.

La propuesta encaja con un problema cada vez más habitual en equipos técnicos. Los modelos avanzados son buenos entendiendo bases de código complejas, detectando deuda técnica, priorizando riesgos y escribiendo especificaciones. Pero también son caros. Si se usan para cada cambio menor, cada refactor o cada ajuste repetitivo, la factura puede crecer muy rápido. shadcn/improve intenta separar la inteligencia de la ejecución: el modelo caro piensa y planifica; otro agente, más económico, implementa bajo instrucciones precisas.

El plan como producto, no el código generado

La filosofía de shadcn/improve se resume en una frase: el plan es el producto. La skill no modifica el código fuente del proyecto. Su trabajo consiste en inspeccionar el repositorio, identificar hallazgos, priorizarlos y generar planes de implementación autocontenidos en Markdown dentro de una carpeta plans/. Después, otro agente o un desarrollador humano puede ejecutar esos planes.

Este matiz es importante porque cambia la forma de usar la IA en desarrollo. En lugar de delegar una tarea completa a un agente que improvisa sobre la marcha, el sistema obliga primero a documentar el problema, citar rutas de archivos, incluir fragmentos relevantes del estado actual, definir pasos verificables, indicar comandos de prueba y marcar condiciones de parada. Es una forma de convertir el uso de IA en un flujo más parecido al trabajo de un tech lead: revisar, priorizar, especificar y después ejecutar con control.

ComandoUso principal
/improveAuditoría completa del repositorio, hallazgos priorizados y planes
/improve quickRevisión rápida y barata de puntos críticos
/improve deepAuditoría exhaustiva por paquetes y categorías
/improve securityRevisión enfocada en seguridad
/improve branchAuditoría limitada a los cambios de la rama actual
/improve nextSugerencias de evolución del proyecto basadas en evidencias
/improve plan <descripción>Crear un plan concreto sin auditoría previa
/improve review-plan <archivo>Criticar y ajustar un plan existente
/improve execute <plan>Delegar la ejecución a un agente más barato y revisar su trabajo
/improve reconcileActualizar el backlog de planes, verificar, desbloquear o retirar

La instalación se plantea con un comando directo: npx skills add shadcn/improve. Funciona en agentes compatibles con el formato Agent Skills y genera planes en texto plano. Esto facilita que el resultado no quede encerrado en una sesión concreta del modelo. Un plan puede leerlo otro agente, otro desarrollador o el propio equipo en una revisión interna.

Por qué separar auditoría y ejecución puede ahorrar dinero

El enfoque tiene sentido económico. En programación asistida por IA, las partes más caras suelen ser las que requieren más comprensión: leer el repositorio, entender convenciones, evaluar impacto, detectar problemas reales y evitar falsos positivos. Ahí un modelo de alto nivel puede aportar más valor. En cambio, implementar una lista de pasos concreta, ejecutar tests, aplicar cambios mecánicos o corregir una duplicación localizada puede delegarse a un modelo más barato si el plan está bien escrito.

Esto no significa que cualquier modelo barato pueda hacer cualquier cambio. La clave está en la calidad de la especificación. shadcn/improve escribe planes para “el ejecutor más débil plausible”, es decir, para un agente que no ha visto la conversación previa y que puede tener mucha menos capacidad de razonamiento. Por eso incluye contexto, rutas exactas, extractos de código, comandos de verificación, criterios de finalización y límites explícitos.

FaseModelo recomendadoMotivo
Reconocimiento del repositorioModelo potenteNecesita entender arquitectura, stack y convenciones
Auditoría de problemasModelo potenteRequiere juicio técnico y priorización
Escritura del planModelo potenteDebe producir instrucciones completas y verificables
Implementación guiadaModelo más barato o humanoSigue pasos definidos y acotados
Ejecución de testsAgente barato o entorno localTrabajo mecánico con salidas verificables
Revisión finalModelo potente o desarrollador seniorComprueba intención, alcance y calidad del diff

El ahorro no viene solo de usar menos el modelo caro. También puede venir de reducir iteraciones fallidas. Muchos costes de IA en desarrollo aparecen cuando el agente cambia demasiado, rompe pruebas, se sale del alcance o inventa una solución porque no entendió el contexto. Si el plan incluye condiciones de parada, comandos esperados y límites de alcance, el ejecutor tiene menos margen para desviarse.

Auditoría con evidencia, no recomendaciones genéricas

Otro aspecto relevante es que la skill no busca producir listas genéricas de “mejores prácticas”. Durante la auditoría, reparte subagentes por categorías como corrección, seguridad, rendimiento, cobertura de tests, deuda técnica, dependencias, experiencia de desarrollador, documentación y dirección del producto. Cada hallazgo debe apoyarse en evidencias del propio repositorio, con referencias a archivos y líneas.

Después, el asesor vuelve a leer los puntos citados antes de mostrarlos. Esta segunda revisión intenta reducir falsos positivos, corregir atribuciones erróneas y registrar rechazos para que no reaparezcan en futuras ejecuciones. En el ejemplo compartido por el proyecto, una supuesta alerta de SSRF asociada a una variable https_proxy se rechaza como comportamiento esperado, porque sigue una convención estándar usada por muchas herramientas CLI.

Categoría de auditoríaQué puede detectar
CorrecciónErrores lógicos, casos borde o comportamientos inconsistentes
SeguridadRiesgos reales con evidencia en código
RendimientoAlgoritmos caros, consultas ineficientes o trabajo duplicado
TestsZonas críticas sin cobertura suficiente
Deuda técnicaDuplicaciones, abstracciones rotas o migraciones incompletas
DependenciasActualizaciones, incompatibilidades o paquetes problemáticos
DXFricciones para desarrollar, probar o desplegar
DocumentaciónInstrucciones incompletas o desactualizadas
DirecciónIdeas de producto justificadas por el estado del repositorio

Esta insistencia en la evidencia es útil porque uno de los mayores problemas de los agentes de código es el ruido. Un modelo puede detectar “problemas” que en realidad son decisiones deliberadas, deuda aceptada o patrones propios del proyecto. Si cada hallazgo tiene que citar código concreto y superar una revisión interna, la salida se parece más a una auditoría técnica y menos a una lista de consejos genéricos.

Planes pensados para sobrevivir fuera de la sesión

Los planes generados por shadcn/improve son autocontenidos. Incluyen el commit contra el que se escribieron, de modo que el ejecutor puede hacer una comprobación de deriva antes de tocar nada. Si el código cambió demasiado, el plan debe detenerse y reportar el problema en lugar de improvisar.

También incorporan “verification gates”. Cada paso termina con un comando y una salida esperada. Esto convierte el éxito en algo más medible. El agente no tiene que decidir si “parece terminado”; debe cumplir pruebas, lint, compilación u otros criterios definidos por el propio repositorio.

Propiedad del planValor para el equipo
Contexto inlineEl ejecutor no depende de la conversación original
Rutas exactasReduce exploración innecesaria
Extractos de códigoAclara el estado actual antes del cambio
Comandos verificadosUsa las herramientas reales del repositorio
Criterios de finalizaciónEvita cierres ambiguos
Condiciones de paradaImpide que un modelo pequeño improvise
Commit de referenciaDetecta si el plan quedó desactualizado
Límites de alcanceReduce cambios laterales no deseados

Este enfoque puede encajar bien en equipos que ya usan issues, pull requests y revisiones. Los planes pueden publicarse como GitHub issues con --issues, de modo que el trabajo aterriza donde el equipo ya gestiona su backlog. Para organizaciones que quieren introducir agentes sin perder control, esta es una idea práctica: la IA no sustituye el proceso, sino que escribe mejor el trabajo que después entra en el proceso.

Ejecución aislada y revisión del resultado

La skill también incluye /improve execute <plan>, que despacha un ejecutor más barato en un worktree aislado, le entrega el plan y después revisa el resultado. El flujo vuelve a pasar por los criterios de finalización, comprueba que el diff respeta el alcance y emite un veredicto: aprobar, pedir revisión o bloquear y refinar el plan.

La fusión del cambio queda en manos del usuario. Esto es importante desde el punto de vista de seguridad y control. El agente puede preparar una propuesta, pero no toma la decisión final de integrarla. Para muchos equipos, esta separación puede ser la diferencia entre usar IA como asistente y dejar que modifique un producto sin supervisión suficiente.

Regla duraPor qué importa
La skill no modifica código fuenteReduce riesgo en la fase de auditoría
Solo escribe en plans/Limita el alcance de sus cambios directos
No ejecuta comandos que muten el working treeEvita efectos secundarios durante el análisis
No reproduce secretosSolo señala ubicación y tipo de credencial
Los ejecutores trabajan en worktrees desechablesAísla cambios y facilita revisión
El merge queda en manos del usuarioMantiene control humano sobre el repositorio

También existe /improve reconcile, pensado para limpiar el backlog: verificar planes ya ejecutados, investigar bloqueos, refrescar planes que quedaron desactualizados y retirar hallazgos que se arreglaron por otra vía. Esta parte es menos llamativa que el comando inicial, pero puede ser una de las más útiles. Los planes de mejora envejecen rápido si el repositorio se mueve cada día.

Una señal de hacia dónde van los agentes de código

shadcn/improve no es solo una herramienta curiosa para usuarios de Claude Code, Codex u otros entornos compatibles. Representa una tendencia más amplia: los agentes de desarrollo necesitan procesos, límites y productos intermedios. Pedir “arregla mi repo” es demasiado abierto. Pedir “audita, prioriza, escribe planes verificables y deja que otro ejecute” es mucho más controlable.

Este patrón se parece a cómo trabajan los equipos humanos. Un arquitecto o tech lead no suele implementar todos los cambios. Analiza, decide prioridades, escribe tickets, revisa propuestas y valida resultados. La IA puede aportar valor en ese rol si tiene acceso al repositorio, entiende convenciones y produce planes que otros puedan ejecutar.

La idea también encaja con la guerra de precios en modelos de IA. Si los modelos más capaces siguen siendo caros, las empresas tendrán que reservarlos para las tareas donde su razonamiento marca la diferencia. La ejecución mecánica, los cambios repetitivos y las pruebas pueden moverse a modelos más baratos o a herramientas automáticas.

No reemplaza una revisión técnica, pero puede elevar el suelo

La utilidad real dependerá de cada repositorio. Un proyecto pequeño quizá no necesite una auditoría tan estructurada. Un monorepo grande, con deuda técnica, migraciones pendientes y varios equipos, puede sacar más partido. También dependerá de la calidad del modelo usado como asesor y de la disciplina del equipo revisando los planes antes de ejecutarlos.

No conviene presentar este tipo de herramienta como sustituto de un senior. Sí puede actuar como multiplicador. Puede encontrar duplicaciones, convertir hallazgos dispersos en planes claros, generar issues accionables y evitar que un agente barato trabaje sin contexto. Para muchos equipos, ese ya es un salto relevante.

La programación con IA está dejando atrás la fase de los prompts improvisados. El siguiente paso será diseñar flujos donde los modelos caros razonen, los modelos baratos ejecuten, las pruebas verifiquen y los humanos mantengan la decisión final. shadcn/improve apunta justo a ese modelo: menos magia, más proceso y planes que se puedan revisar.

Preguntas frecuentes

¿Qué es shadcn/improve?

Es una Agent Skill que audita un repositorio, detecta mejoras y escribe planes de implementación en Markdown para que otros agentes o humanos los ejecuten.

Cómo se instala?

El proyecto indica que puede instalarse con el comando npx skills add shadcn/improve en entornos compatibles con el formato Agent Skills.

Implementa cambios en el código?

No directamente. La skill escribe planes en la carpeta plans/. La ejecución puede delegarse a otro agente en un worktree aislado, pero la fusión final queda en manos del usuario.

Por qué puede ahorrar costes en IA?

Porque permite usar un modelo caro para entender y planificar, y modelos más baratos para ejecutar tareas bien acotadas con comandos de verificación y límites claros.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×