Comparar IA
Decide con datos tu mejor opción
vs
Identificación
Nombre
Gemma-3-12b-it (Prompt)
Mistral-Small-2506 (Prompt)
Empresa
Otro
Mistral
Familia / Sistema
Sin datos
Sin datos
Última medición
11 may 2026
11 may 2026
¿Sabe trabajar con tus herramientas?
Capacidad para llamar APIs y orquestar acciones.
¿Acierta cuando llama a tus aplicaciones?
Acierta 3.0 de cada 10 veces
★Acierta 3.2 de cada 10 veces
Gana Mistral-Small-2506 (Prompt). Importante si conectas la IA a APIs, herramientas o automatizaciones de tu trabajo.
¿Sabe usar UNA herramienta?
Acierta 7.6 de cada 10 veces
★Acierta 7.9 de cada 10 veces
Gana Mistral-Small-2506 (Prompt). Para tareas simples donde la IA solo tiene que decidir cuándo llamar a una integración.
¿Elige bien entre varias herramientas?
94 de cada 100 veces
★96 de cada 100 veces
Gana Mistral-Small-2506 (Prompt). Importante si tu agente tiene un menú de funciones y debe elegir cuál usar.
¿Sabe usar varias a la vez sin liarse?
91 de cada 100 veces
★93 de cada 100 veces
Gana Mistral-Small-2506 (Prompt). Para orquestar varias acciones simultáneas (consultar, reservar, notificar).
Datos básicos
Modalidad
agente autónomo
agente autónomo
Fuentes que lo miden
bfcl
bfcl
Total mediciones
4
4
¿Qué SÍ sabe hacer?
Capacidades verificadas con datos del dataset. Si falta evidencia, lo marcamos como no medido todavía; nunca afirmamos lo contrario.
¿Lee y escribe texto?
Sí
Sí
¿Llama funciones de tu código?
Sí (medido en BFCL)
Sí (medido en BFCL)
¿Qué NO sabe hacer?
Avisos basados en evidencia medida. Si el modelo no supera ningún umbral, lo decimos abiertamente.
Gemma-3-12b-it (Prompt)
No tenemos avisos negativos verificados sobre este modelo todavía.
Mistral-Small-2506 (Prompt)
No tenemos avisos negativos verificados sobre este modelo todavía.
Recomendación por caso de uso
Sugerencia basada en mediciones reales. Si falta evidencia, lo decimos abiertamente.
RedactarInformes, emails, artículos.
No tenemos suficientes mediciones sobre redactar para recomendar todavía.
ProgramarAPIs, scripts, automatización.
Gana Mistral-Small-2506 (Prompt). Acierta más cuando llama a tus aplicaciones y funciones.
Chatear (uso general)Conversación cotidiana, preguntas variadas.
No tenemos suficientes mediciones sobre chatear (uso general) para recomendar todavía.
Frescura de los datos
Última medición
11 may 2026
11 may 2026
Antigüedad
Hoy
Hoy
Sigue explorando: últimas noticias de IA · informes y análisis · alertas de seguridad · índice de fallos IA con datos completos.
Llévate esta comparativa contigo o pásala a quien la necesite. Sin registro, sin coste.