NVIDIA AI

Crea IA Generativa con NVIDIA NIM

Explora los últimos modelos de IA optimizados, conecta aplicaciones a datos con NVIDIA Blueprints e implementa en cualquier lugar con los microservicios de NVIDIA NAM.

Experimente Modelos Abiertos Líderes Ahora


Integraciones

La IA Acelerada Está a Solo Una API de Distancia

Póngase en marcha rápidamente con API conocidas.

Compatibilidad Perfecta con Bibliotecas Populares

Aproveche las API de NVIDIA de sus SDK existentes con tan solo tres líneas de código.

import openai
client = openai.OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key="YOUR_NVIDIA_API_KEY"
)
chat_completion = client.chat.completions.create(
model="mistralai/mixtral-8x7b-instruct-v0.1",
messages=[{"role" : "user" , "content" : "Write me a love song" }],
temperature=0.7
)

Construya con las Herramientas Que Ama

Trabaje con sus frameworks de programación LLM favoritos, incluidos LangChain y LlamaIndex, e implemente fácilmente sus aplicaciones.

Desbloquee la Información de los Datos Empresariales

Los datos impulsan las aplicaciones empresariales modernas. Conecte los agentes de IA con los datos empresariales a escala con un motor de consultas de IA que utiliza la generación aumentada de recuperación (RAG) para equipar a los empleados con conocimientos institucionales instantáneos y precisos.

NVIDIA Blueprints

Todo lo que necesitas para crear aplicaciones de IA generativa impactantes.   Cada plano incluye NVIDIA NIM y microservicios de socios, uno o más agentes de IA, código de muestra, instrucciones de personalización y un gráfico de Helm para la implementación.


Corre en Cualquier Lugar

Acelera Tu Implementación de IA con NVIDIA NIM

Como parte de NVIDIA AI Enterprise, NVIDIA NIM es un conjunto de microservicios de inferencia fáciles de usar para acelerar la implementación de modelos básicos en cualquier nube o data center y ayudar a mantener tus datos seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Implementa NIM

Implemente NIM para su modelo con un solo comando. También puede ejecutar NIM fácilmente con modelos optimizados.

Ejecuta Inferencia

Ponga en funcionamiento NIM con el motor de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Construya

Los desarrolladores pueden integrar puntos finales NIM autoalojados con solo unas pocas líneas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Lanzamiento Local o Escalado con Kubernetes

Implementa sin problemas microservicios de IA en contenedores en cualquier infraestructura acelerada de NVIDIA, desde un solo dispositivo hasta la escala del data center.

Implemente de Forma Segura y con Confianza

Confíe en los tiempos de ejecución de nivel de producción, incluidas las actualizaciones de seguridad continuas, y ejecute sus aplicaciones empresariales con API estables respaldadas por soporte de nivel empresarial.

Reducción de Costes y de Huella de Carbono

Reduzca el costo operativo de ejecutar modelos en producción con tiempos de ejecución de IA que se optimizan continuamente para lograr baja latencia y alto rendimiento en la infraestructura acelerada por NVIDIA.

Rendimiento

NVIDIA NIM proporciona un rendimiento y una latencia optimizados desde el primer momento para maximizar la generación de tokens, admitir usuarios simultáneos en las horas pico y mejorar la capacidad de respuesta.


Configuración: Llama3.1-8B-instruct, 1x H100SXM; Entrada 1000 tokens, salida 1000 tokens. Solicitudes concurrentes: 200. NIM ON : FP8. rendimiento 6.354 tokens/s, TTFT 0,4s, ITL: 31ms. NIM OFF: FP8. rendimiento 2,265 tokens/s, TTFT 1.1s, ITL: 85ms

Vea los NIM de NVIDIA en Acción

Personalización

Adapte los Microservicios NIM a las Necesidades Específicas de Su Dominio

Ajuste Fino con NVIDIA NeMo

NVIDIA NeMo™ es una plataforma integral para desarrollar IA generativa personalizada en cualquier lugar. Incluye herramientas para la formación, la personalización y la generación aumentada de recuperación, la protección, la curación de datos y la formación previa de modelos, lo que ofrece a las empresas una forma fácil, rentable y rápida de adoptar la IA generativa.

Empieza Ahora

Comience a Crear Prototipos de Forma Gratuita

Comienza con las API sin servidor fáciles de usar y administradas por NVIDIA.

  • Acceda a una infraestructura de IA totalmente acelerada.
  • Asegúrese de que los datos no se usen para el entrenamiento de modelos.
  • Comience de forma gratuita con 1,000 créditos de inferencia.

Descarga e Implementa

Ejecuta NVIDIA NIM para escalar modelos de IA optimizados en la nube o en el data center que elijas.

  • Asegúrese de que los datos nunca salgan de su enclave seguro.
  • Realice una transición fluida de los puntos de conexión en la nube a las API autoalojadas sin cambios en el código.
  • sa una licencia de NVIDIA AI Enterprise para producción o comienza de forma gratuita con el Programa para Desarrolladores de NVIDIA.

Casos de Uso

Enciende Tu Innovación

Vea cómo las API de NVIDIA respaldan los casos de uso de la industria e impulse su desarrollo de IA con ejemplos seleccionados.

Humanos Digitales

Da vida a los personajes del game o crea avatares virtuales interactivos para mejorar el servicio al cliente, permitiendo que tu aplicación se conecte más profundamente con los usuarios.

Generación de Contenido

Genere contenido altamente relevante, personalizado y preciso, basado en la experiencia del dominio y la propiedad intelectual de su empresa.

Generación Biomolecular

Los modelos generativos biomoleculares y el poder computacional de las GPU exploran de manera eficiente el espacio químico, generando rápidamente diversos conjuntos de moléculas pequeñas adaptadas a objetivos o propiedades farmacológicas específicas.

Ecosistema

Lleve Su IA Empresarial Más Lejos y Más Rápido

Desarrolle sus aplicaciones de IA con modelos, kits de herramientas, bases de datos
vectoriales, frameworks e infraestructura con nuestros socios líderes.

Recursos

Desbloquear, Mejorar Habilidades y Mejorar

NVIDIA LaunchPad

Desbloquea la IA con un Laboratorio Práctico

Experimente soluciones de IA de extremo a extremo a través de laboratorios prácticos guiados para frameworks de desarrollo, chatbots basados en generación aumentada de recuperación (RAG), optimizaciones de rutas y más.

Programa para Desarrolladores de NVIDIA

Acelere Sus Aplicaciones de IA

Obtén acceso gratuito a NIM para el desarrollo de aplicaciones, la investigación y las pruebas, además de recursos de aprendizaje técnico a través del Programa para Desarrolladores de NVIDIA.

AI Workbench

Empieza Pequeño. Escala Grande

NVIDIA AI Workbench ofrece a los desarrolladores la flexibilidad de ejecutar modelos habilitados para API en contenedores locales o remotos con GPU, lo que permite workflows de proyectos interactivos, desde la experimentación hasta la creación de prototipos y la prueba de concepto.

Noticias

Explora NVIDIA NIM en las Noticias

Consulta los últimos comunicados de prensa de NVIDIA para ver cómo NIM y la IA generativa están afectando a las industrias, los socios, los clientes y más.

Documentación

Explora la documentación técnica para comenzar a crear prototipos y crear aplicaciones de IA empresariales con las API de NVIDIA, o escala en tu propia infraestructura con NVIDIA NIM.