Ir al contenido

F00 — Foundation & Overview


AI Software Factory OS es un sistema operativo para fabricas de software autonomas que implementa un Agentic Development Lifecycle (ADLC) completo — desde la estrategia hasta la operacion autonoma — donde celulas autonomas de desarrollo (FABs) construyen, testean, aseguran y despliegan software de forma continua.

La unidad fundamental de ejecucion es el Fullstack Agent Builder (FAB): una celula autonoma de desarrollo compuesta por N agentes especializados (arquitecto, builder, QA, security, ops) que ejecutan el lifecycle completo de 10 fases de forma coordinada, con oversight humano configurable.

No es una coleccion de tips, ni una guia de prompts, ni un template de proyecto. Es un sistema operativo de ingenieria agentica — con lifecycle de 10 fases, gates, roles, guias operativas, templates ejecutables, agents especializados, CI/CD integrado y un Factory OS para orquestacion autonoma de celulas FAB — disenado para equipos que construyen software en la era de las Software Factories basadas en agentes.

“La IA no reemplaza al ingeniero — lo convierte en orquestador de celulas autonomas que construyen sistemas completos.”

Un framework open-source, stack-agnostico, en espanol, que define un Agentic Development Lifecycle (ADLC) disciplinado para construir software con celulas autonomas de agentes AI (FABs) — desde la estrategia hasta la Factory-Native Software Factory — adaptable a equipos de 1 a 10 personas.

El SDLC tradicional esta siendo formalmente reemplazado por modelos agenticos:

  • ADLC (EPAM, Cycode): lifecycle para sistemas no-deterministicos donde LLMs son el core
  • AI-DLC (AWS): framework open-source para guiar agentes a traves de fases de desarrollo
  • Dark Software Factory (BCG Platinion): agentes autonomos construyen, testean y despliegan 24/7
  • Harness Engineering (OpenAI, Anthropic): disciplina de disenar la fabrica misma

AI Software Factory OS integra todos estos conceptos en un lifecycle unificado de 10 fases con 3 tracks adaptativos.


En Marzo 2026, el 92% de los desarrolladores usa herramientas AI diariamente y el 41% del codigo global es generado por IA. Pero la mayoria de los equipos:

  • No tienen proceso: usan AI de forma ad-hoc, sin disciplina ni repetibilidad
  • No miden calidad: no saben si el agente produce codigo bueno o malo
  • No controlan costos: facturas sorpresa de $10K+ por llamadas a modelos
  • No gestionan contexto: sesiones de agente que se degradan despues de 30 minutos
  • No tienen seguridad: inputs del LLM tratados como trusted, sin guardrails
  • No saben escalar: funcionan con 1 agente pero no saben como orquestar 5

El resultado: productividad individual alta, calidad organizacional baja. Exactamente lo que DORA 2025 diagnostico: “AI is an amplifier — it magnifies an organization’s existing strengths AND weaknesses.”

Un sistema operativo de fabrica de software que convierte la productividad individual con AI en capacidad organizacional repetible mediante celulas autonomas de desarrollo (FABs):

Sin frameworkCon framework
Cada dev usa AI diferenteProceso unificado con 3 tracks
No hay specs → codigo incoherenteSpec-First: contratos antes que codigo
No hay evals → calidad desconocidaGolden datasets + CI pipeline
Costos invisiblesFinOps con budgets, alertas, routing
Sesiones de agente que se pierdenHANDOFF.md + checkpoints + context layers
Seguridad como afterthoughtOWASP Agentic Top 10 integrado
Un agente para todo6 agents especializados + 4 patrones de orquestacion

PerfilComo lo usa
Tech Lead / ArchitectDefine el track (Full/Lean/Solo), selecciona stack, establece gates y quality bars
Developer (IC)Sigue el lifecycle, usa skills y agents, genera specs y codigo con agentes
Founder tecnico / Solo devTrack Solo: 1-7 dias de idea a MVP desplegado con agents
Engineering ManagerEstablece policies, tracks de adopcion AI, metricas de observability
PerfilComo lo usa
QA / SecurityAgents especializados (@qa_engineer, @security_reviewer), compliance mapping
Product ManagerFase 1 (Strategy), specs como source of truth, feedback loops
Consultor / FormadorFramework como curriculum de AI-First Engineering

El framework esta optimizado para equipos compactos de maximo 3 personas por proyecto. Si tienes mas personas, puedes paralelizar con multi-agent patterns, pero cada stream sigue siendo de 1-3 personas.


#PrincipioQue significa
1AI-First, Not AI-OnlyIA donde aporta valor, determinismo donde no. Si un if/else es mas claro, usalo.
2Spec-FirstContratos (OpenAPI, schemas, specs) antes que codigo. El agente implementa specs, no ideas vagas.
3Throwaway-FirstEl codigo es efimero (<1 ano de vida util). Las decisiones (ADRs) son permanentes. Regenerar > reparar.
4Agent UXLas herramientas se disenan para humanos Y agentes. CLAUDE.md, MCP servers, agent-friendly APIs.
5Vibe DesignDiseno de UI delegado a agentes AI (Google Stitch → prompt → UI → prototipo → codigo).
6Evals-DrivenSi no puedes medir si un cambio mejora o empeora el output del agente, no lo hagas. Golden datasets + CI.
7MCP-NativeModel Context Protocol integrado en cada fase. Los agentes acceden a tools, resources y prompts via MCP.
8Multi-AgentUn agente para una tarea. Multiples agentes orquestados para un sistema. 4 patrones formales.
9ObservableSin metricas = sin produccion. OpenTelemetry + Langfuse + cost tracking + dashboards.
10Stack AgnosticEl framework no impone tecnologias. Define criterios de decision. Python, Go, Node, Rust — elige por contexto.
113 TracksNo todos los proyectos necesitan 10 fases. Full (enterprise), Lean (startup), Solo (MVP/1 persona).
12Progressive DisclosureLos agentes AI no necesitan 18K lineas de framework. Cargan solo lo relevante: CLAUDE.md → rules → skills → agents.
  • Steve Yegge: Vibe Coding, 8 Levels of AI Adoption, Software Survival, Rule of Five
  • Gene Kim: DevOps Handbook, DORA, cambio organizacional
  • Andrej Karpathy: “Agentic Engineering” como disciplina
  • Anthropic: Context Engineering, Agentic Coding Trends 2026
  • OpenAI: Harness Engineering (Feb 2026) — invariantes mecanicos, cleanup agents
  • GitHub: Spec Kit (specify → plan → tasks → implement)
  • Google: Stitch (Vibe Design), MCP integration
  • OWASP: Top 10 Agentic Applications 2026, Top 10 LLM Applications 2025
  • ETH Zurich: AGENTS.md study (context files quality)

┌─────────────────────────────────────────────────────────────┐
│ CORE │
│ Metodologia obligatoria: lifecycle de 10 fases, │
│ roles, gates, manifesto, tracks, madurez AI │
│ Estabilidad: ALTA (cambios = major version) │
├─────────────────────────────────────────────────────────────┤
│ REFERENCE │
│ Guias transversales: deployment tracks, agent catalog, │
│ UX/AI design, multi-country, subagent patterns │
│ Estabilidad: MEDIA (cambios = minor version) │
├─────────────────────────────────────────────────────────────┤
│ ACCELERATORS │
│ Assets ejecutables: playbooks, spec-kit, templates, │
│ checklists, specs futuras (plugin, MCP, living specs) │
│ Estabilidad: MEDIA │
├─────────────────────────────────────────────────────────────┤
│ ORGANIZATION DEFAULTS │
│ Config base: framework-config.yaml, toolchain, │
│ thresholds, quality gates, FinOps limits │
│ Estabilidad: BAJA (personalizable por proyecto) │
└─────────────────────────────────────────────────────────────┘

5.2 El ADLC — Agentic Development Life Cycle (10 fases)

Sección titulada «5.2 El ADLC — Agentic Development Life Cycle (10 fases)»

El lifecycle de 10 fases del framework se denomina formalmente ADLC (Agentic Development Life Cycle) — la evolucion del SDLC para desarrollo dirigido por agentes. Mientras el SDLC tradicional asume ejecucion humana con fases lineales y handoffs documentales, el ADLC esta disenado para que agentes autonomos (FABs) ejecuten loops continuos con checkpoints, artefactos YAML como contexto persistente, y testing simultaneo en cada fase.

La industria esta convergiendo hacia este modelo: EPAM y Cycode formalizaron el termino ADLC, AWS propuso AI-DLC, BCG Platinion describe Dark Software Factories, y PwC, Microsoft y HCLTech estan adoptando lifecycles agenticos en produccion.

F01 Strategy ─► F02 Domain ─► F03 Knowledge ─► F04 Architecture ─► F05 Contracts
│ │ │ │ │
▼ ▼ ▼ ▼ ▼
Problema Dominio Fuentes de Blueprint + OpenAPI +
+ valor modelado conocimiento ADRs + stack data model
+ trust model selection + contracts
F06 Build ─► F07 TEVV ─► F08 Security ─► F09 Operations ─► F10 Evolution
│ │ │ │ │
▼ ▼ ▼ ▼ ▼
Codigo + Evals + Compliance + Deploy + Feedback +
tests scorecards threat model dashboards + improvement
alerts backlog

Cada fase tiene: objetivo, entregables minimos, gate de salida, roles, y skill de agente asociado.

TrackEquipoFasesTimelineNivel AI
Full3+ personas, regulado10 fases, 6 gates formales4-20 semanas1-5
Lean1-3, startup/SaaS3 macro-fases (Discover/Deliver/Operate)2-4 semanas3-6
Solo1 persona + agentsFlow continuo1-7 dias4-8

Diferenciador: ningun otro framework de ingenieria AI ofrece adaptacion por madurez del equipo. La mayoria asume “enterprise” o “hobby” — no hay punto medio.

En vez de cargar todo el framework en cada sesion de agente, el contexto se carga por capas:

Layer 1 ─ CLAUDE.md (~70 lineas) ← Siempre residente
Layer 2 ─ .claude/rules/ (3 archivos) ← Auto-cargados por path
Layer 3 ─ .claude/skills/ (20 skills) ← On-demand, invocados por usuario
Layer 4 ─ .claude/agents/ (6 agents) ← Al delegar tareas
Layer 5 ─ Hooks (pre-commit, post-compact) ← Automaticos, nunca en contexto

DocumentoContenido
Lifecycle 10 Fases (ADLC)Tabla maestra del ADLC — Agentic Development Life Cycle
Manifesto y Principios6 pilares, principios de arquitectura, vocabulario
Multi-Track ExecutionFull / Lean / Solo — cuando usar cada uno
Roles, RACI y GatesQuien hace que, criterios de salida por fase
AI Adoption Maturity8 niveles (Yegge) — de “sin AI” a “orquestador propio”
CHANGELOGHistorial de versiones desde v3.0 hasta v7.7
GuiaLineasContenido principal
AI-First SDLC Workflow~1,218Flujo completo de 10 fases con ejemplos, long-running agent harness
Data Governance AI~1,429Clasificacion, linaje, sesgo, EU AI Act, ISO 42001
Multi-Agent Orchestration~1,6004 patrones, durable execution, progressive autonomy, AG-UI, self-healing pipeline
Evals Framework~1,242promptfoo, braintrust, deepeval, ragas, DeepTeam, testing pyramid 2.0
Observability & FinOps~1,211OpenTelemetry, Langfuse, semantic cache, agent-legible observability
OWASP Agentic Security~1,200ASI01-10 mapping, OWASP LLM Top 10, OWASP MCP Top 10, zero trust, circuit breakers, slopsquatting playbook
MCP Integration~1,009Templates, security, A2A, Server Cards, DPoP, AG-UI protocol stack
Context Engineering~8891M token wall, 5 surfaces, context freshness, compaction
Brownfield Adoption~737Strangler Fig AI, 3 escenarios, init-brownfield.sh
Vibe Coding Practices~700CHOP, Rule of Five, Harness Engineering, 6 pilares
Agentic Workforce & Factory Ops~700Citizen dev, workforce transition, benchmarking, model selection, long-running agents
FAB Intake & Headless Workspace~600FAB headless protocol, intent intake, workspace isolation
Platform Integration~500Kiro IDE, Cursor, Windsurf, Claude Code — integracion por plataforma
Gap Analysis v6.2 Roadmap~85028 gaps identificados y cerrados en sprints 2-4
State-of-Art Gap Analysis v6.0~730Comparativa vs 14 fuentes industria, 9 gaps
State-of-Art Gap Analysis v6.3~7005 gaps cerrados, cobertura 92%→97%
Framework Enforcement~440Piramide de enforcement, MCP server, linter, CI
Happy Path Walkthrough~280Tutorial paso-a-paso desde zero
Agent UX & Desire Paths~370Diseno agent-friendly, Vibe Design con Google Stitch
Swarming & Merge Wall~300Multi-agent parallel work, merge queue
Token FinOps~220Model routing, cost guards, semantic cache
Quick Start 15min~160De zero a primer proyecto en 15 minutos

Total: ~16,200+ lineas de guias operativas.

Skills (on-demand, formato agentskills.io): /f01_strategy, /f02_domain, /f03_knowledge, /f04_architecture, /f05_contracts, /f06_build, /f07_tevv, /f08_security, /f09_operations, /f10_evolution, /fab_orchestrator, /spec_workflow, /brownfield_adoption, /mcp_setup, /eval_workflow, /onboarding, /security_audit, /code_review, /dora_metrics

Agents (especializados): @architect, @qa_engineer, @security_reviewer, @spec_writer, @code_reviewer, @team_lead

ScriptFuncion
framework-mcp-server.pyMCP server: 10 tools para consultas real-time del framework
compliance-linter.py15 reglas de compliance, scoring, metricas SAST/SCA
artifact-validator.pyValidacion de YAML artifacts contra 48 JSON schemas
context-router.pyEnruta tareas a fases, guias, skills y agents relevantes
gate-check.shVerifica conformance de gates A-F + DG por track
init-project.shCrea proyecto greenfield con baseline como subtree (auto-sync diario)
init-brownfield.shAdopta framework en proyecto existente (no-destructivo)
version-check.shValida coherencia de versiones en todo el framework
compare-evals.pyCompara eval results baseline vs PR con regression detection
sast-sca-scanner.pySAST/SCA agnostico: Semgrep + npm audit/pip-audit/govulncheck
owasp-asi-checker.pyOWASP ASI01-ASI10 automated compliance checks
aibom-generator.pyAI Bill of Materials auto-generation desde artefactos del proyecto
sbom-generator.pySoftware Bill of Materials: CycloneDX 1.5 / SPDX 3.0, license check, diff
mcp-security-audit.pyAuditoria de seguridad MCP: source trust, auth, transport
dora-metrics.pyDORA + SPACE metrics con AI attribution desde git history
db-doc-generator.pyGeneracion automatica de documentacion de base de datos (inventario, diccionario, migraciones)
iso42001-annex-check.pyISO 42001 Annex automated compliance checks
iso42001-evidence-collector.pyISO 42001 evidence collection y gap analysis
soc2-evidence-collector.pySOC 2 Type II evidence collection automatizada
ScriptFuncion
fab-gate-check.pyAutonomous gates + confidence scoring + decision tree
fab-feedback-loop.pyTelemetria → analisis → auto-generacion de intents
fab-eval-builders.pyEvaluar/comparar/recomendar builders (promote/tune/retire)
fab-cost-guard.pyCost circuit breakers: green/yellow/red/critical + auto-signal
fab-kill-switch.shEmergency stop + graceful shutdown + auto-checkpoint
fab-intake.shIntake processor (GitHub, texto, PRD → intent YAML)
validate-intent.pyValidar intents contra JSON schema
fab-workspace-setup.shSetup worktrees aislados por FAB
fab-factory.shFactory orchestration (status/launch/stop/cost)
fab-health-check.shHealth monitoring de FABs activos
fab-trigger-dispatcher.pyEvent-driven triggers para automatizacion Factory OS
fab-coordinator.pyCoordinacion nativa multi-agente (file-locking, inbox, task routing)
EjemploContenido
solo-mvp/API de Tareas con Hono + SQLite + Cloudflare Workers (track Solo)
brownfield-adoption/Django e-commerce + AI Semantic Search (Strangler Fig)

DimensionEste frameworkFrameworks tipicos del mercado
Tracks3 (Full/Lean/Solo) adaptables por madurez1 (enterprise o nada)
StackAgnostico — criterios de decision, no imposicionesAtado a LangChain, o Python, o un vendor
LifecycleADLC: 10 fases con gates formales”Best practices” sueltas
Context layers5 capas de progressive disclosure para agentesCLAUDE.md monolitico o nada
EvalsCI pipeline con golden datasets + 4 herramientas”Deberias evaluar” sin templates
BrownfieldSuite completa (530 lineas + script + ejemplo)Solo greenfield
ComplianceEU AI Act Art.50/73 + ISO 42001 + OWASP Agentic Top 10 + OWASP MCP Top 10 + AIBOMMencion generica a “compliance”
Multi-agent4 patrones formales + metricas + full autonomy cycle”Usa multi-agent” sin patrones
IdiomaEspanol (docs), ingles (filenames) — unico en el mercadoSolo ingles
Harness Engineering6 pilares de diseno de entorno para agentesNo existe en otros frameworks
Factory OSOrquestacion autonoma: celulas FAB (N agentes especializados), autonomous gates, cost circuit breakers, kill switchNo existe
Cobertura estado del arte~92% (validado contra 14 fuentes, Marzo 2026)No medida
Sin frameworkCon este framework
Productividad 1-5x con AI10-100x con orquestacion disciplinada
Calidad impredecibleQuality gates con umbrales medibles
Costos sorpresaFinOps con budgets diarios y alertas
Cada dev hace lo suyoProceso unificado adaptable
Seguridad ad-hocOWASP Agentic integrado en cada fase

Ventana de terminal
git clone https://github.com/aforero22/baseline.git
cd baseline
./scripts/init-project.sh "Mi App" "mi-app" ~/projects
Ventana de terminal
cd mi-proyecto-existente
git clone https://github.com/aforero22/baseline.git /tmp/baseline
/tmp/baseline/scripts/init-brownfield.sh "Mi Proyecto" "mi-proyecto"
  1. Leer este documento (entender que es)
  2. Leer CORE_F00_Lifecycle_10_Fases.md (entender las fases)
  3. Leer CORE_F00_Multi_Track_Execution.md (elegir tu track)
  4. Explorar las guias en framework/guides/ segun tu interes
Soy 1 persona haciendo un MVP? → SOLO
Somos 1-3 personas en una startup? → LEAN
Estamos en enterprise/regulado con 3+ personas? → FULL
No se / primer proyecto con el framework? → LEAN (y ajustar)

El framework se integra como git subtree con actualizacion automatica diaria:

mi-proyecto/
baseline/ ← subtree (auto-actualizado diariamente via GitHub Actions)
framework/ ← Metodologia, guias, patrones
project/ ← Artefactos del proyecto (editar aqui)
.claude/ ← Context layers para AI
CLAUDE.md ← Instrucciones para agentes AI
src/ ← Tu codigo
.github/workflows/
update-baseline.yml ← Auto-sync diario (3:00 AM COT / 08:00 UTC)

Regla: el baseline es read-only. Los overrides van en project-config.yaml. Las decisiones van en ADRs. El codigo va en src/.

Actualizacion:

  • Automatica: el workflow update-baseline.yml sincroniza diariamente a las 3:00 AM (Colombia)
  • Manual via GitHub Actions: ejecutar el workflow manualmente desde la pestana Actions
  • Inmediata: git subtree pull --prefix=baseline https://github.com/aforero22/baseline.git main --squash
  • Desarrolladores: solo necesitan git pull origin main

Tipo de cambioVersion
Cambios en core/ (metodologia)Major (7.0 → 8.0)
Cambios en guides/, reference/, accelerators/Minor (7.3 → 7.4)
Fixes, clarificacionesPatch (7.3.0 → 7.3.1)
VersionFeature principalFecha
7.7.0Kill switch drills, cost guard verify, MCP attestation audit, DX AI metrics, FAB coordinator commandsMar 2026
7.6.0Singapore MGF, Agent Governance Gateway, SOC 2 + AI Controls, Multi-Agent Failure TaxonomyMar 2026
7.5.0ISO 42001 alignment, AIBOM SPDX 3.0, multi-agent coordination, SWE-Bench evalsMar 2026
7.4.0Database documentation, event-driven triggers, A2A protocol, DX AI metricsMar 2026
7.3.0OWASP MCP Top 10, EU AI Act Art.50/73, Kiro IDE integrationMar 2026
7.2.0EU AI Act, OWASP ASI, AIBOM auto-gen, MCP security audit, DORA metricsMar 2026
7.1.0SAST/SCA security gates, schema expansion, context-router evolutionMar 2026
7.0.0Factory-Native: Factory OS, FABs autonomos, autonomous gates, cost circuit breakers, kill switchMar 2026
6.5.0Remediation: stubs, seguridad agentic, EU AI Act, AG-UI, Progressive AutonomyMar 2026
6.4.0Gap Closure: cost model, human-agent matrix, A2A, testing pyramid 2.0Mar 2026
6.1.0Gap Closure: 9 brechas cerradas, cobertura 84% → 92%Mar 2026
6.0.0Operational Excellence: Evals, MCP, Observability, Multi-AgentMar 2026
5.2.1Brownfield Adoption suiteMar 2026
5.2.0Vibe Design, Google StitchMar 2026
5.1.0Context Engineering, agentskills.ioMar 2026
5.0.0Progressive Disclosure, Context LayersMar 2026
4.1.0Stack agnosticoMar 2026
4.0.0Reestructuracion lifecycle 10 fasesMar 2026
3.0.1Template repository inicialMar 2026
AreaCobertura
Spec-Driven Development95%
Context Engineering96%
MCP + A2A + AG-UI Ecosystem95%
AI Code Evaluation96%
LLMOps & Observability96%
Multi-Agent Orchestration94%
Security (OWASP + DeepTeam)97%
Brownfield Modernization95%
Compliance (EU AI Act + ISO 42001)97%
Vibe→Agentic Evolution94%
Promedio~97%

Validado contra 14 fuentes: Anthropic, OpenAI, DORA, OWASP, MCP, ETH Zurich, NxCode, Karpathy, Osmani, GitHub Spec Kit, promptfoo, DeepEval, RAGAS, SDD Map (30+ frameworks).


MetricaValor
Versiones liberadas20 (v3.0.1 → v7.7.0)
Fases del lifecycle10
Tracks de ejecucion3 (Full / Lean / Solo)
Guias operativas41 (~16,200+ lineas)
Skills (agentskills.io)20
Agents especializados6
Scripts de automatizacion28 (15 enforcement + 13 Factory OS)
Ejemplos completos2
JSON schemas de validacion48
Patrones de orquestacion4
Niveles de madurez AI8
Cobertura estado del arte~97%
Fuentes de industria validadas14
Idioma de documentacionEspanol
LicenciaInternal

AI Software Factory OS v7.7.0 — Marzo 2026 Spec-First, Evals-Driven, MCP-Native, Multi-Agent, Observable, Stack-Agnostic, Factory-Native “La IA no reemplaza al ingeniero — amplifica su inteligencia y velocidad de entrega.”