BOLIVIA.- OpenAI lanzó herramienta para desarrolladores que facilita conversaciones naturales en tiempo real en aplicaciones de IA

BOLIVIA, 2 Oct (EUROPA PRESS)

En la reciente reunión DevDay 2024 celebrada en San Francisco, OpenAI dio a conocer innovaciones significativas para la comunidad desarrolladora, poniendo a disposición herramientas avanzadas destinadas a la personalización de modelos de inteligencia artificial (IA). Estas permiten la creación de aplicaciones que incluyen diálogos en tiempo real con una voz natural y la incorporación y mejora en la comprensión de imágenes.

Ahora, los desarrolladores pueden beneficiarse de un nuevo método de destilación de modelos que facilita el uso de los avances obtenidos en modelos de gran capacidad, tales como o1-preview y GPT-4o. Este método posibilita la refinación de modelos más compactos y económicos, como GPT-4o mini, mejorando así la eficiencia y reduciendo costos.

Por otro lado, OpenAI introdujo una suite que facilita la generación de conjuntos de datos para la destilación y la creación y ejecución de evaluaciones personalizadas. Este conjunto de herramientas, integradas en la oferta de ajuste de OpenAI, apunta a evaluar el desempeño de los modelos en tareas específicas, optimizando su funcionamiento.

En el evento también se presentó una herramienta para el ajuste fino de visión, permitiendo a los desarrolladores trabajar no sólo con texto sino también con imágenes. Esto abre la puerta a la incorporación de capacidades de comprensión de imágenes en aplicaciones, ampliando significativamente las posibilidades en funciones de búsqueda visual o detección de objetos.

Adicionalmente, OpenAI anunció 'Prompt Caching', una herramienta diseñada para ayudar a los desarrolladores a economizar tiempo y recursos. Esta permite almacenar en caché contextos frecuentemente usados en múltiples llamadas a la API, aplicándose automáticamente en las últimas versiones de los modelos de OpenAI, entre ellos GPT-4o y su versión mini, o1-preview y o1-mini. Según la compañía, "La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, ... Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API".

Finalmente, se presentó 'Realtime API', una novedad en fase de beta pública que promete revolucionar la interacción en aplicaciones al permitir experiencias de conversión de voz a voz de manera rápida y fluida, similar al modo de voz avanzado de ChatGPT, con seis voces predefinidas para escoger.

Estas herramientas no solo marcan un avance en la personalización y eficiencia en el desarrollo de IA, sino que también abren nuevas vías para la creación de aplicaciones más intuitivas y ricas en funcionalidades.