Salesforce lanza simulador para medir desempeño de agentes de IA en empresas

Este nuevo entorno de simulación empresarial, pretende poner a prueba la capacidad de los agentes en escenarios empresariales realistas, respaldando el lanzamiento de una nueva herramienta de evaluación comparativa.

Foto: cortesía. Portal ERP LATAM.

Salesforce AI Research dio a conocer un entorno de simulación empresarial diseñado para evaluar el rendimiento de los agentes de IA en contextos realistas, junto con una nueva herramienta de benchmarking. También fortaleció Data Cloud con funciones de consolidación que emplean tanto modelos de lenguaje grandes como pequeños para unificar datos de manera automática. Con estas innovaciones, la compañía busca acelerar la evolución de la IA y dar respuesta a los principales desafíos que enfrentan hoy los CIOs y líderes de TI.

Desde la mejora de la calidad de los datos hasta el establecimiento de nuevos estándares en la medición del rendimiento de los agentes, Salesforce AI Research está proporcionando a las empresas la confianza y las herramientas necesarias para evolucionar hacia empresas con agentes, es decir, organizaciones que adoptan el trabajo digital y utilizan la IA para trabajar junto a los seres humanos.

Simulación de entornos empresariales con CRMArena-Pro

Ahora los agentes de IA podrán entrenarse y evaluarse en entornos de simulación que los preparan para manejar la complejidad e incertidumbre de las operaciones comerciales diarias antes de ser implementadas. A partir de la primera versión de CRMArena, enfocada en tareas B2C de un solo turno, Salesforce AI Research lanzó CRMArena-Pro, que permite medir el desempeño de los agentes en escenarios más favorables y colaborativos, como previsión de ventas, clasificación de casos de servicio y procesos CPQ.

Te puede interesar: Oracle suma OpenAI GPT-5 a su ecosistema de base de datos y nube

Este nuevo entorno ofrece un marco empresarial simulado, con datos sintéticos y pruebas seguras de llamadas API a sistemas clave, garantizando la protección de datos sensibles. Así, las compañías pueden validar a gran escala la precisión, consistencia y eficiencia de los agentes en situaciones específicas, funcionando como un verdadero gemelo digital de la organización.

Medición de la preparación de los agentes con el índice de referencia agrícola para CRM

Con la aparición diaria de nuevos modelos y actualizaciones de IA, las empresas se enfrentan al creciente dilema de qué modelo —o combinación de modelos— es el más adecuado para ayudar a los agentes en entornos empresariales reales. La respuesta no puede provenir únicamente de los ciclos de expectación o del tamaño bruto; requiere una forma rigurosa de medir el rendimiento de los agentes dentro de flujos de trabajo empresariales específicos.

Esta necesidad imperiosa llevó a Salesforce a presentar el nuevo Agentic Benchmark for CRM , la primera herramienta de evaluación comparativa, diseñada para evaluar a los agentes de IA no en función de sus capacidades genéricas, sino en los contextos que más importantes a las empresas, como el servicio de atención al cliente, el de campo, marketing y ventas.

La sostenibilidad, la métrica más reciente de la herramienta de medición agrícola, es especialmente importante de seguir. Esta medida destaca el impacto medioambiental relativo de los sistemas de IA, que pueden requerir importantes recursos computacionales. Las empresas pueden minimizar su huella medioambiental y determinar la sostenibilidad de su IA , al tiempo que logra el rendimiento que necesita, alineando el tamaño del modelo con el nivel específico de inteligencia necesario para completar una tarea específica de la empresa. Con nuevos modelos que surgen casi cada semana, las empresas se ven abrumadas por cuál implementar y utilizar para impulsar sus agentes de IA.

Salesforce presentó también MCP-Eval y MCP-Universe, dos nuevos benchmarks complementarios lanzados este trimestre para medir el desempeño de los agentes de IA con distintos niveles de exigencia y monitorear el comportamiento de los LLM en interacciones reales con servidores MCP. MCP-Eval ofrece evaluaciones automáticas y escalables mediante tareas sintéticas, mientras que MCP-Universe plantea desafíos basados en casos reales con evaluadores orientados a la ejecución, que someten a los agentes a pruebas de estrés en escenarios complejos, dentro de un marco ampliable para su validación y mejora.

Además, la compañía introdujo Account Matching, una herramienta que identifica y unifica de forma autónoma cuentas dispersas o inconsistentes, generando datos limpios y consolidados. Con ello, los agentes de IA pueden operar con mayor precisión, habilitando una automatización más inteligente, personalización avanzada y decisiones más rápidas a gran escala.

Salesforce lanza simulador para medir desempeño de agentes de IA en empresas

Te puede interesar: Oracle suma OpenAI GPT-5 a su ecosistema de base de datos y nube

Redação Portal ERP

Workday Learning, impulsado por Sana, ya está disponible para el público en general

Google fortalece Gemini con modelos más eficientes y seguros

El transporte público en la ciudad de Panamá ahora cuenta con nuevas formas de pago

El desarrollo de software impulsado por IA exige nuevas metodologías de gobernanza

IFS y Chelsea FC anuncian acuerdo para integrar la IA industrial en las operaciones de la Premier League

Noticias Relacionadas

Workday Learning, impulsado por Sana, ya está disponible para el público en general

Google fortalece Gemini con modelos más eficientes y seguros

El transporte público en la ciudad de Panamá ahora cuenta con nuevas formas de pago