El CEO de Nvidia, Jensen Huang: los modelos de lenguaje de IA como servicio son “potencialmente una de las oportunidades de software más grandes de la historia”

0
3
El CEO de Nvidia, Jensen Huang: los modelos de lenguaje de IA como servicio son

El cofundador y CEO de Nvidia, Jensen Huang, inauguró la conferencia GTC de otoño de la compañía al anunciar la disponibilidad general el próximo mes de la nueva GPU “Hopper” de la compañía en sistemas de Dell y otros. El discurso de apertura también contó con computadoras para el cuidado de la salud, robótica, automatización industrial y usos automotrices, así como varios servicios en la nube, incluido un servicio en la nube alojado por Nvidia para modelos de lenguaje de aprendizaje profundo como GPT-3.

nvidia

Como se informó ayer, el cofundador y CEO de Nvidia, Jensen Huang, inauguró la conferencia GTC de otoño de su empresa con numerosos anuncios de productos y servicios, incluida la introducción de dos servicios de computación en la nube que operará la empresa.

En una conferencia de prensa el miércoles, Huang le dijo a ZDNET que los dos servicios serán “plataformas SaaS a muy largo plazo para nuestra empresa”.

Un servicio, Large Language Model Cloud Services, permite a un desarrollador tomar un programa de inteligencia artificial de aprendizaje profundo como GPT-3 o Megatron-Turing 530B de Nvidia, y ajustarlo a aplicaciones particulares, para hacerlo específico para una tarea mientras reduce el esfuerzo cliente tiene que hacer.

El segundo servicio, Omniverse Cloud Services, es una oferta de infraestructura como servicio de Nvidia que permitirá que varias partes colaboren en modelos y comportamientos 3D.

Además: el CEO de Nvidia, Jensen Huang, anuncia la disponibilidad de GPU ‘Hopper’, servicio en la nube para grandes modelos de lenguaje de IA

ZDNET le preguntó a Huang: ¿Qué tan grande puede ser el SaaS? [software-as-a-service] será el negocio de Nvidia durante muchos años?

Huang dijo que era difícil saberlo, pero que el servicio de modelo de lenguaje grande tiene una aplicabilidad tan amplia que será una de las mayores oportunidades en todo el software.

Aquí está la respuesta de Huang en su totalidad:

Bueno, es difícil de decir. Esa es realmente, más o menos, la respuesta. Depende del software que ofrecemos como servicio. Tal vez otra forma de tomarlo es solo un par a la vez. Este GTC, anunciamos nuevos chips, nuevos SDK y nuevos servicios en la nube. Y esto es lo que estás preguntando. destaco dos de ellos [cloud services]. Uno de ellos son los grandes modelos de lenguaje. Y si no ha tenido la oportunidad de investigar la efectividad de los modelos de lenguaje extenso y su participación en la IA, por favor hágalo. Es algo realmente importante. Los modelos de lenguaje grande son difíciles de entrenar y las aplicaciones para los modelos de lenguaje grande son bastante diversas. Ha sido entrenado en una gran cantidad de conocimiento humano. Y entonces tiene la capacidad de reconocer patrones, pero también tiene dentro una cantidad codificada, una gran cantidad de conocimiento humano codificado, de modo que, por así decirlo, tiene una especie de memoria humana, por así decirlo. En cierto modo, está codificado gran parte de nuestros conocimientos y habilidades. Entonces, si desea adaptarlo a algo para lo que nunca fue capacitado; por ejemplo, nunca fue capacitado para responder preguntas o nunca fue capacitado para resumir una historia o publicar noticias de última hora, parafraseando, nunca fue capacitado para haz estas cosas: con algunas tomas adicionales de aprendizaje, puedes aprender estas habilidades. Esta idea básica de ajuste fino, adaptación a nuevas habilidades, o tiro cero, o pocos tiros, aprendizaje, tiene grandes implicaciones en una gran cantidad de campos, razón por la cual está viendo una cantidad tan grande de fondos en biología digital. Porque los grandes modelos de lenguaje han aprendido a estructurar el lenguaje de las proteínas y el lenguaje de la química. Y así, pusimos ese modelo. ¿Y qué tan grande puede ser esa oportunidad? Mi sensación es que cada empresa en cada país que habla cada idioma tiene probablemente decenas de habilidades diferentes que su empresa podría adaptar a nuestro gran modelo lingüístico para llevar a cabo. No estoy exactamente seguro de qué tan grande es esa oportunidad, pero es potencialmente una de las oportunidades de software más grandes de la historia. Y la razón de ello es que la automatización de la inteligencia es una de las mayores oportunidades que existen.

La otra oportunidad de la que hablamos fue Omniverse Cloud. Y recuerda qué es el omniverso. Omniverse tiene varias características. La primera característica es que ingiere, puede almacenar, puede componer información física, información tridimensional, a través de múltiples capas o lo que se denomina esquemas. Y podría describir geometrías y texturas y materiales, propiedades como masa y peso y tal, conectividad. ¿Quién es el proveedor? ¿Cuál es el costo? ¿Con qué está relacionado? ¿Qué es la cadena de suministro? Me sorprendería si: comportamientos, comportamientos cinemáticos. Podrían ser comportamientos de inteligencia artificial. Entonces, lo primero que hace Omniverse es almacenar datos. Lo segundo que hace es conectar múltiples agentes. Y los agentes pueden ser personas, pueden ser robots, pueden ser sistemas autónomos. Y lo tercero que hace es que te da una ventana a este nuevo mundo, otra forma de decir, motor de simulación. Entonces, Omniverse es básicamente tres cosas. Es un nuevo tipo de plataforma de almacenamiento, es un nuevo tipo de plataforma de conexión. y es un nuevo tipo de plataforma informática. Podrías escribir una aplicación encima de Omniverse. Puede conectar otras aplicaciones a través de Omniverse. Como, por ejemplo, mostramos muchos ejemplos de Adobe conectado a aplicaciones de Autodesk conectadas a varias aplicaciones. Entonces, estamos conectando cosas, y tú podrías estar conectando personas. Podrías estar conectando mundos, podrías estar conectando robots, podrías estar conectando agentes. Y así, la mejor manera de pensar en lo que hemos hecho con Nucleus [Nucleus Cloud, a component of Omniverse Cloud, is a facility for developers to work on 3-D models using the Universal Scene Description specification], piense en ello como la forma más fácil de monetizar eso, es probablemente como una base de datos. Y así, es una base de datos moderna en la nube. Excepto que esta base de datos está en 3-D, esta base de datos conecta a varias personas.

Entonces, esas fueron dos aplicaciones SaaS que pusimos. Uno se llama modelo de lenguaje grande. El otro es básicamente Omniverse o un motor de base de datos, por así decirlo, que vamos a poner en la nube. Entonces, creo que estos dos anuncios, estoy muy feliz de que haya preguntado, tendré muchas oportunidades para hablar de eso una y otra vez, voy a hablar de eso una y otra vez, pero estos dos plataformas SaaS van a ser plataformas SaaS a muy largo plazo para nuestra empresa, y haremos que se ejecuten en múltiples nubes y así sucesivamente.

LEAVE A REPLY

Please enter your comment!
Please enter your name here