Estimación de costes de uso de la IA
Este capítulo está pensado para perfiles no especializados. Se pretende que el lector tenga una visión general pero cuantitativa de los costes de uso de la Inteligencia Artificial con datos reales.
- Costes energéticos: energía consumida durante el uso (Wh/kWh). Puede expresarse por consulta o por lote.
- Costes económicos: precio por uso (p. ej., € por 1.000 tokens en una API, o coste de ejecución local).
- Equivalentes de CO2 (CO2e): emisiones asociadas a la energía consumida. Se estiman como kWh × factor de la red (kgCO2e/kWh).
1) Por qué medir costes de IA
En esta sección resumimos las razones prácticas para medir los costes de IA desde cuatro perspectivas complementarias: económica, energética, ambiental y de calidad.
- Económico: cuánto pagamos por consulta/servicio.
- Energético: cuánta energía se consume (aprox.).
- Ambiental: CO2e asociado a esa energía.
- Calidad: ¿la salida merece la pena frente al coste/impacto?
2) Limitaciones y métricas
Antes de medir, es clave acotar el alcance (frontera del sistema) y acordar unas métricas simples que permitan comparar alternativas de forma justa y reproducible.
- Frontera: medimos el uso (operacional). El impacto incorporado del hardware se comenta como limitación.
- Unidad funcional: 1 salida (p. ej., resumen de 150 palabras) o 1.000 consultas.
- Métricas: coste/consulta (€), tiempo/consulta (s), energía/consulta (Wh), CO2e/consulta (g), calidad (1–5).
2.1) Qué entendemos por frontera
En análisis ambiental, la “frontera” define qué partes del sistema se incluyen en la medición. Para esta práctica adoptamos una frontera de uso (operacional) centrada en una consulta de inferencia o en un lote de consultas.
- Qué INCLUYE (mínimo recomendado):
- Pre y post‑procesado en el cliente: tiempo de CPU al preparar el prompt y procesar la respuesta (medible con CodeCarbon).
- Cómputo de inferencia en el servidor del proveedor: estimado a partir de tokens y un factor energético (Wh/token) documentado o asumido.
- Qué EXCLUYE (por simplicidad docente):
- Entrenamiento y afinado del modelo (fase previa a la operación).
- Impacto incorporado del hardware (fabricación, reposición, fin de vida) — ver energía incorporada.
- Consumos en reposo/idle fuera del tiempo de tarea.
- Almacenamiento persistente y analítica posterior.
Opciones de frontera ampliada (si quieres profundizar):
- Incluir red y transferencia de datos (Wh/MB) con un factor publicado por la literatura o tu organización.
- Incluir almacenamiento temporal y caché si es relevante para el caso.
Cómo reportarlo en el trabajo:
- Escribe una frase al inicio de la tabla o informe: “Frontera: uso (inferencia) + pre/post en cliente; servidor estimado por tokens; se excluyen entrenamiento y hardware incorporado”.
- Cita los factores usados (Wh/token y kgCO2e/kWh) y su fuente. Si no dispones de datos, justifica tu supuesto y menciona la incertidumbre.
Referencias breves:
- ISO 14040/14044 (ACV): ISO (oficial).
- GHG Protocol – Product Life Cycle: ghgprotocol.org/product-standard.
3) Metodología resumida
Presentamos dos vías complementarias para estimar costes e impactos: una basada en el uso de APIs (con supuestos transparentes) y otra en ejecución local con medición directa.
- Vía A (API):
- Coste € = (prompt_tokens/1000 × precio_prompt_1k) + (completion_tokens/1000 × precio_completion_1k).
- CO2e servidor (estimación) = tokens_totales × Wh/token × (kgCO2e/kWh) × 1000.
- Justifica supuestos (Wh/token y factor kgCO2e/kWh) y discútelos.
- Vía B (local, opcional):
- Mide en tu equipo con CodeCarbon (energía y CO2e del cliente).
- Compara CPU vs. otros modos, y un baseline “sin IA” si aplica.
3.1) Cómo usar la plantilla (sin código)
- Descarga la plantilla: plantilla-medicion.csv y ábrela en tu hoja de cálculo favorita.
- Copia/pega un texto por fila (o un identificador) y registra los tokens usados (las APIs devuelven contadores de tokens) y el tiempo aprox.
- Introduce los precios de tu proveedor (€ por 1.000 tokens). La plantilla calcula el coste por consulta y total.
- Si no mides energía del cliente, deja esa columna en blanco o usa el valor por defecto. Ajusta Wh/token y el factor kgCO2e/kWh si tienes datos mejores.
- Valora la calidad (1–5) con una mini rúbrica (fidelidad, claridad, concisión) y añade notas.
- Usa filtros para comparar alternativas (modelo/prompt/estilo) y toma una decisión argumentada.
3.2) Ejemplo numérico completo (orientativo)
Supuesto: 50 notas a resumir (150 palabras c/u) con un mismo modelo.
Parámetros de entrada y supuestos
| Concepto | Símbolo/Unidad | Valor | Origen | Incertidumbre |
|---|---|---|---|---|
| Tokens de entrada por consulta | prompt_tokens (tok) | 300 | Devolución API | Baja |
| Tokens de salida por consulta | completion_tokens (tok) | 200 | Devolución API | Baja |
| Precio entrada | €/(1k tok) | 0,50 € | Tarifa proveedor | Baja |
| Precio salida | €/(1k tok) | 1,50 € | Tarifa proveedor | Baja |
| Energía por token (servidor) | Wh/tok | 0,005 Wh | Literatura/estimación | Alta |
| Factor de red | kgCO2e/kWh | 0,25 | Inventario país/UE (aprox.) | Media |
| Energía cliente por consulta | Wh | 0,02 Wh | Medición con CodeCarbon | Baja |
Resultados (1 consulta)
| Magnitud | Fórmula | Resultado |
|---|---|---|
| Coste €/consulta | (300/1000×0,50) + (200/1000×1,50) | 0,45 € |
| Energía servidor | (300+200)×0,005 Wh | 2,5 Wh |
| CO2e servidor | 2,5 Wh × 0,25 kgCO2e/kWh | 0,625 g |
| Energía cliente | Medida | 0,02 Wh |
| CO2e cliente | 0,02 Wh × 0,25 kgCO2e/kWh | 0,005 g |
| CO2e total consulta | 0,625 g + 0,005 g | 0,630 g |
Escalado al lote (50 consultas)
| Magnitud (lote) | Resultado |
|---|---|
| Coste total (50) | 22,50 € |
| CO2e total (50) | 31,5 g |
Notas sobre incertidumbre
- El término dominante en la incertidumbre suele ser Wh/token (servidor). Si el proveedor ofrece datos, usa esos valores.
- El factor kgCO2e/kWh depende del mix eléctrico y del periodo. Si tienes un valor local, sustitúyelo.
- Los precios cambian por modelo/ubicación; usa tu tarifa vigente.
🤖 4) Ejercicio práctico (60–90 min)
Haz una estimación rápida y defendible del coste y CO2e de un caso real y rastreable.
- 🏢 Empresa y modelo (ejemplo real): OpenAI — consulta el precio vigente del modelo en su página oficial de precios: openai.com/pricing
- 📄 Datos: usa 10 textos del fichero textos-ejemplo.txt (150 palabras aprox. cada uno).
- 🧰 Herramienta: rellena la plantilla CSV con 1 fila por texto.
Pasos mínimos (15–30 min)
- 💸 Precio: toma de la web del proveedor el precio por 1.000 tokens (entrada y salida si aplica).
- 🔢 Tokens y tiempo: anota los tokens totales por texto (o un supuesto simple si no puedes medir) y el tiempo aprox.
- 🧮 Calcula en la plantilla el coste por consulta y total (se hace automático) y el CO2e estimado del servidor (usa los campos ya preparados).
Qué entregas (simple y claro)
- 📊 Un número: coste total de las 10 consultas (y coste medio/consulta).
- 🌍 Un número: CO2e total estimado (y por consulta).
- 📝 3 frases: qué supuestos usaste, cuánto confías en ellos y qué harías para mejorar la estimación.
Para programadores (opcional)
Puedes medir en tu equipo el consumo del cliente con el script incluido (ver CodeCarbon):
| |
El script devuelve tiempo total, tokens agregados y, si CodeCarbon está disponible, energía (kWh) y CO2e (kg) del cliente.
Recursos y referencias
- Definición de CO2e (introducción): Wikipedia
- Tokenización en modelos de lenguaje: Byte Pair Encoding (BPE) — Wikipedia
- Contador práctico de tokens (OpenAI): platform.openai.com/tokenizer
- Medición de energía local: CodeCarbon — docs · repositorio
- Unidad energética kWh: Wikipedia
5) Rúbrica de evaluación (0–10)
- Datos y reproducibilidad (3): tabla completa, unidades y supuestos claros.
- Análisis (4): comparación coste–calidad–CO2e, interpretación de trade‑offs.
- Comunicación (2): 2 gráficos sencillos y legibles.
- Ética/limitaciones (1): privacidad, sesgos, incertidumbre de CO2e.
6) Notas y límites
- La estimación de CO2e del servidor es aproximada si el proveedor no publica datos. Documenta siempre tus supuestos.