La potencia computacional se ha convertido en un nuevo modelo de negocio, y la fiebre de "refinar" grandes modelos eventualmente pasará. Los proveedores de servicios de potencia computacional deben prepararse con anticipación y ajustar su dirección estratégica a tiempo.
Un entrenamiento de un gran modelo vertical en el campo de la meteorología, utilizando 200 tarjetas GPU durante un preentrenamiento de dos meses, con un costo estimado de más de 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría aumentar cien veces. Actualmente, en China ya hay más de cien grandes modelos con una escala de mil millones de parámetros, pero la industria enfrenta el problema de la escasez de GPUs de alta gama. Los altos costos de potencia computacional y la falta de capacidad y fondos se han convertido en los desafíos más directos para la industria.
Las GPU de alta gama son extremadamente escasas y los precios están disparados. Una tarjeta Nvidia A100 se ha llegado a vender por entre dos y trescientos mil yuanes, y el alquiler mensual de un servidor A100 también ha aumentado a entre 50,000 y 70,000 yuanes. A pesar de esto, aún puede ser difícil conseguir los chips. Un alto ejecutivo de una empresa de computación en la nube ha declarado que, a pesar de que muchos clientes necesitan recursos de GPU de alta gama, la oferta actual aún no puede satisfacer completamente la amplia demanda del mercado.
El umbral de entrenamiento de grandes modelos no es tan bajo como se imagina. Sin una inversión de miles de millones, es difícil continuar con el desarrollo de grandes modelos. Un emprendedor describe que, sin el apoyo de cientos de miles de millones, este camino es difícil de recorrer. En la industria se cree generalmente que, a medida que la competencia en el mercado se intensifica, las empresas regresarán de la locura a la racionalidad, ajustando sus estrategias para controlar costos.
Ante la escasez de potencia computacional, todas las empresas están respondiendo activamente. Algunos métodos incluyen: utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento; mejorar la capacidad de infraestructura para lograr un funcionamiento estable; optimizar la programación de recursos de potencia computacional; pasar de una arquitectura de computación en la nube a una arquitectura de supercomputación; utilizar plataformas nacionales en lugar de Nvidia, entre otras. Sin embargo, estos métodos son grandes proyectos para las empresas en general, y muchos equipos de algoritmos eligen el apoyo de proveedores de servicios de potencia computacional especializados.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional es un campo industrial emergente basado en la diversificación de la potencia computacional, que busca suministrar potencia computacional de manera efectiva a través de una red de potencia computacional. No solo incluye potencia computacional, sino que también encapsula de manera unificada recursos como almacenamiento y red, entregando servicios en forma de API.
La cadena industrial de potencia computacional tiene como principal proveedor de recursos básicos en la parte superior, como chips y servidores. En la parte media, los proveedores de servicios en la nube y los nuevos proveedores de servicios de potencia computacional son los principales responsables de la producción y suministro de potencia computacional. En la parte inferior, se encuentran los usuarios industriales que dependen de los servicios de potencia computacional para agregar valor. En comparación con el entorno de construcción propia, usar servicios de potencia computacional tiene ventajas en términos de costos y tecnología.
La facturación por uso y la facturación anual o mensual son los modelos de facturación de servicios de potencia computacional más populares en la actualidad. Algunos proveedores de servicios también están promoviendo la "integración y fusión de red y computación", apoyando la programación de recursos a través de arquitecturas, regiones y proveedores de servicios. Los proveedores de servicios en la nube también están posicionando los servicios de potencia computacional como un producto importante para ingresar rápidamente al mercado.
En 2022, la escala total de potencia computacional en China alcanzó los 180 EFLOPS, ocupando el segundo lugar a nivel mundial, con una escala de la industria de potencia computacional de 1.8 billones de yuanes. La demanda de modelos grandes ha acelerado el desarrollo de la industria de potencia computacional. Hay opiniones que consideran que el servicio de potencia computacional actual es esencialmente un nuevo modelo de "venta de electricidad", aunque algunos proveedores de servicios aún necesitan ofrecer servicios adicionales como ajuste del sistema e instalación de software.
Con la normalización de la demanda de computación de alto rendimiento de grandes modelos, los servicios de potencia computacional están formando rápidamente una cadena industrial y un modelo de negocio únicos. Actualmente hay una escasez de GPU de alta gama y los costos son elevados; quien pueda obtener recursos de chips podrá entregar servicios. Pero los investigadores a largo plazo no están preocupados, porque la escasez es solo temporal.
La servitización de la potencia computacional es una tendencia determinada. En el contexto del regreso a la racionalidad de la ola de grandes modelos y el aceleramiento de los cambios en el mercado, los proveedores de potencia computacional necesitan prepararse con anticipación y ajustar su estrategia a tiempo para enfrentar el desarrollo futuro.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
14 me gusta
Recompensa
14
5
Republicar
Compartir
Comentar
0/400
liquidation_surfer
· 07-27 14:39
¡Incluso si sube a precios astronómicos, perderás!
Ver originalesResponder0
SerumSqueezer
· 07-25 08:05
Cocinar a lo grande, el mejor momento para tomar a la gente por tonta.
Ver originalesResponder0
AlphaBrain
· 07-25 00:54
Finalmente se ha sobrecalentado.
Ver originalesResponder0
ser_we_are_ngmi
· 07-25 00:48
Se acabó, la potencia computacional va a subir otra vez.
Nuevas oportunidades de servicios de potencia computacional: transformaciones y desafíos en la industria bajo la ola de grandes modelos
La potencia computacional se ha convertido en un nuevo modelo de negocio, y la fiebre de "refinar" grandes modelos eventualmente pasará. Los proveedores de servicios de potencia computacional deben prepararse con anticipación y ajustar su dirección estratégica a tiempo.
Un entrenamiento de un gran modelo vertical en el campo de la meteorología, utilizando 200 tarjetas GPU durante un preentrenamiento de dos meses, con un costo estimado de más de 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría aumentar cien veces. Actualmente, en China ya hay más de cien grandes modelos con una escala de mil millones de parámetros, pero la industria enfrenta el problema de la escasez de GPUs de alta gama. Los altos costos de potencia computacional y la falta de capacidad y fondos se han convertido en los desafíos más directos para la industria.
Las GPU de alta gama son extremadamente escasas y los precios están disparados. Una tarjeta Nvidia A100 se ha llegado a vender por entre dos y trescientos mil yuanes, y el alquiler mensual de un servidor A100 también ha aumentado a entre 50,000 y 70,000 yuanes. A pesar de esto, aún puede ser difícil conseguir los chips. Un alto ejecutivo de una empresa de computación en la nube ha declarado que, a pesar de que muchos clientes necesitan recursos de GPU de alta gama, la oferta actual aún no puede satisfacer completamente la amplia demanda del mercado.
El umbral de entrenamiento de grandes modelos no es tan bajo como se imagina. Sin una inversión de miles de millones, es difícil continuar con el desarrollo de grandes modelos. Un emprendedor describe que, sin el apoyo de cientos de miles de millones, este camino es difícil de recorrer. En la industria se cree generalmente que, a medida que la competencia en el mercado se intensifica, las empresas regresarán de la locura a la racionalidad, ajustando sus estrategias para controlar costos.
Ante la escasez de potencia computacional, todas las empresas están respondiendo activamente. Algunos métodos incluyen: utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento; mejorar la capacidad de infraestructura para lograr un funcionamiento estable; optimizar la programación de recursos de potencia computacional; pasar de una arquitectura de computación en la nube a una arquitectura de supercomputación; utilizar plataformas nacionales en lugar de Nvidia, entre otras. Sin embargo, estos métodos son grandes proyectos para las empresas en general, y muchos equipos de algoritmos eligen el apoyo de proveedores de servicios de potencia computacional especializados.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional es un campo industrial emergente basado en la diversificación de la potencia computacional, que busca suministrar potencia computacional de manera efectiva a través de una red de potencia computacional. No solo incluye potencia computacional, sino que también encapsula de manera unificada recursos como almacenamiento y red, entregando servicios en forma de API.
La cadena industrial de potencia computacional tiene como principal proveedor de recursos básicos en la parte superior, como chips y servidores. En la parte media, los proveedores de servicios en la nube y los nuevos proveedores de servicios de potencia computacional son los principales responsables de la producción y suministro de potencia computacional. En la parte inferior, se encuentran los usuarios industriales que dependen de los servicios de potencia computacional para agregar valor. En comparación con el entorno de construcción propia, usar servicios de potencia computacional tiene ventajas en términos de costos y tecnología.
La facturación por uso y la facturación anual o mensual son los modelos de facturación de servicios de potencia computacional más populares en la actualidad. Algunos proveedores de servicios también están promoviendo la "integración y fusión de red y computación", apoyando la programación de recursos a través de arquitecturas, regiones y proveedores de servicios. Los proveedores de servicios en la nube también están posicionando los servicios de potencia computacional como un producto importante para ingresar rápidamente al mercado.
En 2022, la escala total de potencia computacional en China alcanzó los 180 EFLOPS, ocupando el segundo lugar a nivel mundial, con una escala de la industria de potencia computacional de 1.8 billones de yuanes. La demanda de modelos grandes ha acelerado el desarrollo de la industria de potencia computacional. Hay opiniones que consideran que el servicio de potencia computacional actual es esencialmente un nuevo modelo de "venta de electricidad", aunque algunos proveedores de servicios aún necesitan ofrecer servicios adicionales como ajuste del sistema e instalación de software.
Con la normalización de la demanda de computación de alto rendimiento de grandes modelos, los servicios de potencia computacional están formando rápidamente una cadena industrial y un modelo de negocio únicos. Actualmente hay una escasez de GPU de alta gama y los costos son elevados; quien pueda obtener recursos de chips podrá entregar servicios. Pero los investigadores a largo plazo no están preocupados, porque la escasez es solo temporal.
La servitización de la potencia computacional es una tendencia determinada. En el contexto del regreso a la racionalidad de la ola de grandes modelos y el aceleramiento de los cambios en el mercado, los proveedores de potencia computacional necesitan prepararse con anticipación y ajustar su estrategia a tiempo para enfrentar el desarrollo futuro.