Estimación de costes de uso de la IA

Este capítulo está pensado para perfiles no especializados. Se pretende que el lector tenga una visión general pero cuantitativa de los costes de uso de la Inteligencia Artificial con datos reales.

Costes energéticos: energía consumida durante el uso (Wh/kWh). Puede expresarse por consulta o por lote.
Costes económicos: precio por uso (p. ej., € por 1.000 tokens en una API, o coste de ejecución local).
Equivalentes de CO2 (CO2e): emisiones asociadas a la energía consumida. Se estiman como kWh × factor de la red (kgCO2e/kWh).

1) Por qué medir costes de IA

En esta sección resumimos las razones prácticas para medir los costes de IA desde cuatro perspectivas complementarias: económica, energética, ambiental y de calidad.

Económico: cuánto pagamos por consulta/servicio.
Energético: cuánta energía se consume (aprox.).
Ambiental: CO2e asociado a esa energía.
Calidad: ¿la salida merece la pena frente al coste/impacto?

2) Limitaciones y métricas

Antes de medir, es clave acotar el alcance (frontera del sistema) y acordar unas métricas simples que permitan comparar alternativas de forma justa y reproducible.

Frontera: medimos el uso (operacional). El impacto incorporado del hardware se comenta como limitación.
Unidad funcional: 1 salida (p. ej., resumen de 150 palabras) o 1.000 consultas.
Métricas: coste/consulta (€), tiempo/consulta (s), energía/consulta (Wh), CO2e/consulta (g), calidad (1–5).

flowchart TB A["Entrada\n(texto/prompt)"] --> B["Modelo IA"] B --> C["Salida"] A --> D["Medición tokens / tiempo"] B --> E["Coste €"] E --> F["Plantilla CSV"] D --> G["Energía/CO2e\n(cliente)"] B --> H["CO2e estimado\n(servidor)"] %% Estilos de nodos classDef proc fill:#C8E6C9,stroke:#2E7D32,color:#1B5E20,stroke-width:1px; classDef measure fill:#E3F2FD,stroke:#1E88E5,color:#0D47A1,stroke-width:1px; classDef impact fill:#FFF3E0,stroke:#FB8C00,color:#E65100,stroke-width:1px; %% Asignación de estilos class A,D measure; class B,C proc; class E,F,G,H impact;

2.1) Qué entendemos por frontera

En análisis ambiental, la “frontera” define qué partes del sistema se incluyen en la medición. Para esta práctica adoptamos una frontera de uso (operacional) centrada en una consulta de inferencia o en un lote de consultas.

Qué INCLUYE (mínimo recomendado):
- Pre y post‑procesado en el cliente: tiempo de CPU al preparar el prompt y procesar la respuesta (medible con CodeCarbon).
- Cómputo de inferencia en el servidor del proveedor: estimado a partir de tokens y un factor energético (Wh/token) documentado o asumido.
Qué EXCLUYE (por simplicidad docente):
- Entrenamiento y afinado del modelo (fase previa a la operación).
- Impacto incorporado del hardware (fabricación, reposición, fin de vida) — ver energía incorporada.
- Consumos en reposo/idle fuera del tiempo de tarea.
- Almacenamiento persistente y analítica posterior.

Opciones de frontera ampliada (si quieres profundizar):

Incluir red y transferencia de datos (Wh/MB) con un factor publicado por la literatura o tu organización.
Incluir almacenamiento temporal y caché si es relevante para el caso.

Cómo reportarlo en el trabajo:

Escribe una frase al inicio de la tabla o informe: “Frontera: uso (inferencia) + pre/post en cliente; servidor estimado por tokens; se excluyen entrenamiento y hardware incorporado”.
Cita los factores usados (Wh/token y kgCO2e/kWh) y su fuente. Si no dispones de datos, justifica tu supuesto y menciona la incertidumbre.

Referencias breves:

ISO 14040/14044 (ACV): ISO (oficial).
GHG Protocol – Product Life Cycle: ghgprotocol.org/product-standard.

3) Metodología resumida

Presentamos dos vías complementarias para estimar costes e impactos: una basada en el uso de APIs (con supuestos transparentes) y otra en ejecución local con medición directa.

Vía A (API):
- Coste € = (prompt_tokens/1000 × precio_prompt_1k) + (completion_tokens/1000 × precio_completion_1k).
- CO2e servidor (estimación) = tokens_totales × Wh/token × (kgCO2e/kWh) × 1000.
- Justifica supuestos (Wh/token y factor kgCO2e/kWh) y discútelos.
Vía B (local, opcional):
- Mide en tu equipo con CodeCarbon (energía y CO2e del cliente).
- Compara CPU vs. otros modos, y un baseline “sin IA” si aplica.

3.1) Cómo usar la plantilla (sin código)

Descarga la plantilla: plantilla-medicion.csv y ábrela en tu hoja de cálculo favorita.
Copia/pega un texto por fila (o un identificador) y registra los tokens usados (las APIs devuelven contadores de tokens) y el tiempo aprox.
Introduce los precios de tu proveedor (€ por 1.000 tokens). La plantilla calcula el coste por consulta y total.
Si no mides energía del cliente, deja esa columna en blanco o usa el valor por defecto. Ajusta Wh/token y el factor kgCO2e/kWh si tienes datos mejores.
Valora la calidad (1–5) con una mini rúbrica (fidelidad, claridad, concisión) y añade notas.
Usa filtros para comparar alternativas (modelo/prompt/estilo) y toma una decisión argumentada.

3.2) Ejemplo numérico completo (orientativo)

Supuesto: 50 notas a resumir (150 palabras c/u) con un mismo modelo.

Parámetros de entrada y supuestos

Concepto	Símbolo/Unidad	Valor	Origen	Incertidumbre
Tokens de entrada por consulta	prompt_tokens (tok)	300	Devolución API	Baja
Tokens de salida por consulta	completion_tokens (tok)	200	Devolución API	Baja
Precio entrada	€/(1k tok)	0,50 €	Tarifa proveedor	Baja
Precio salida	€/(1k tok)	1,50 €	Tarifa proveedor	Baja
Energía por token (servidor)	Wh/tok	0,005 Wh	Literatura/estimación	Alta
Factor de red	kgCO2e/kWh	0,25	Inventario país/UE (aprox.)	Media
Energía cliente por consulta	Wh	0,02 Wh	Medición con CodeCarbon	Baja

Resultados (1 consulta)

Magnitud	Fórmula	Resultado
Coste €/consulta	(300/1000×0,50) + (200/1000×1,50)	0,45 €
Energía servidor	(300+200)×0,005 Wh	2,5 Wh
CO2e servidor	2,5 Wh × 0,25 kgCO2e/kWh	0,625 g
Energía cliente	Medida	0,02 Wh
CO2e cliente	0,02 Wh × 0,25 kgCO2e/kWh	0,005 g
CO2e total consulta	0,625 g + 0,005 g	0,630 g

Escalado al lote (50 consultas)

Magnitud (lote)	Resultado
Coste total (50)	22,50 €
CO2e total (50)	31,5 g

Notas sobre incertidumbre

El término dominante en la incertidumbre suele ser Wh/token (servidor). Si el proveedor ofrece datos, usa esos valores.
El factor kgCO2e/kWh depende del mix eléctrico y del periodo. Si tienes un valor local, sustitúyelo.
Los precios cambian por modelo/ubicación; usa tu tarifa vigente.

🤖 4) Ejercicio práctico (60–90 min)

Haz una estimación rápida y defendible del coste y CO2e de un caso real y rastreable.

🏢 Empresa y modelo (ejemplo real): OpenAI — consulta el precio vigente del modelo en su página oficial de precios: openai.com/pricing
📄 Datos: usa 10 textos del fichero textos-ejemplo.txt (150 palabras aprox. cada uno).
🧰 Herramienta: rellena la plantilla CSV con 1 fila por texto.

Pasos mínimos (15–30 min)

💸 Precio: toma de la web del proveedor el precio por 1.000 tokens (entrada y salida si aplica).
🔢 Tokens y tiempo: anota los tokens totales por texto (o un supuesto simple si no puedes medir) y el tiempo aprox.
🧮 Calcula en la plantilla el coste por consulta y total (se hace automático) y el CO2e estimado del servidor (usa los campos ya preparados).

Qué entregas (simple y claro)

📊 Un número: coste total de las 10 consultas (y coste medio/consulta).
🌍 Un número: CO2e total estimado (y por consulta).
📝 3 frases: qué supuestos usaste, cuánto confías en ellos y qué harías para mejorar la estimación.

Para programadores (opcional)

Puedes medir en tu equipo el consumo del cliente con el script incluido (ver CodeCarbon):

1
2
3
4
5
# Instalar dependencia
pip install codecarbon

# Ejecutar medición sobre los textos de ejemplo
python scripts/ia-costos/measure_codecarbon.py --input static/data/ia-costos/textos-ejemplo.txt

El script devuelve tiempo total, tokens agregados y, si CodeCarbon está disponible, energía (kWh) y CO2e (kg) del cliente.

Recursos y referencias

Definición de CO2e (introducción): Wikipedia
Tokenización en modelos de lenguaje: Byte Pair Encoding (BPE) — Wikipedia
Contador práctico de tokens (OpenAI): platform.openai.com/tokenizer
Medición de energía local: CodeCarbon — docs · repositorio
Unidad energética kWh: Wikipedia

5) Rúbrica de evaluación (0–10)

Datos y reproducibilidad (3): tabla completa, unidades y supuestos claros.
Análisis (4): comparación coste–calidad–CO2e, interpretación de trade‑offs.
Comunicación (2): 2 gráficos sencillos y legibles.
Ética/limitaciones (1): privacidad, sesgos, incertidumbre de CO2e.

6) Notas y límites

La estimación de CO2e del servidor es aproximada si el proveedor no publica datos. Documenta siempre tus supuestos.

Estimación de costes de uso de la IA

1) Por qué medir costes de IA #

2) Limitaciones y métricas #

2.1) Qué entendemos por frontera #

3) Metodología resumida #

3.1) Cómo usar la plantilla (sin código) #

3.2) Ejemplo numérico completo (orientativo) #

🤖 4) Ejercicio práctico (60–90 min) #

Para programadores (opcional) #

Recursos y referencias #

5) Rúbrica de evaluación (0–10) #

6) Notas y límites #

1) Por qué medir costes de IA

2) Limitaciones y métricas

2.1) Qué entendemos por frontera

3) Metodología resumida

3.1) Cómo usar la plantilla (sin código)

3.2) Ejemplo numérico completo (orientativo)

🤖 4) Ejercicio práctico (60–90 min)

Para programadores (opcional)

Recursos y referencias

5) Rúbrica de evaluación (0–10)

6) Notas y límites