Обчислювальна потужність: нова бізнес-модель ери великих моделей
Зі зростанням великих моделей штучного інтелекту, обчислювальна потужність стала новою бізнес-моделлю. Хоча поточна хвиля "ковки еліксирів" великих моделей може поступово зникнути, постачальникам обчислювальної потужності потрібно заздалегідь готуватися та своєчасно коригувати стратегічний напрям.
Випускник Ціньхуа університету Бі Кайфенг, який закінчив навчання три роки тому, тренував великий метеорологічний модель, використовуючи 40 років глобальних погодних даних, на 200 графічних процесорах (GPU) протягом приблизно 2 місяців. За розрахунками вартості 7.8 юанів за годину на GPU, вартість тренування цієї великої моделі в специфічній області може перевищувати 2 мільйони юанів. Якщо ж мова йде про тренування загальної великої моделі, вартість може зрости в сотні разів.
На сьогодні в Китаї вже є понад 100 великих моделей з 10 мільярдами параметрів. Проте, галузь загалом стикається з проблемою нестачі високопродуктивних графічних процесорів. Обчислювальна потужність коштує дорого, а брак обчислювальної потужності та фінансування ставить багато підприємств перед складними завданнями.
Нестача висококласних GPU є складною проблемою для всієї галузі. Вибух великих моделей призвів до швидкого зростання попиту на обчислювальну потужність, але темпи зростання пропозиції далеко не встигають за цим. Хоча в довгостроковій перспективі пропозиція обчислювальної потужності обов'язково перейде з ринку продавців на ринок покупців, проте скільки часу займе цей процес, все ще залишається невідомим.
Кожна компанія підраховує, скільки GPU від NVIDIA вона має, і на основі цього визначає свою частку на ринку. За словами поінформованих джерел, якщо у вас є близько 10 000 карт, а загальна кількість на ринку становить 100 000 карт, то частка становитиме 10%. Очікується, що до кінця року їх може бути 40 000 карт, і якщо на той час загальна кількість на ринку складе 200 000, то це може скласти 20% частки на ринку.
З одного боку, неможливо купити GPU-карти, з іншого боку, бар'єр для навчання великих моделей не такий легкий для подолання, як це рекламує індустрія. Навчання загальної великої моделі з мільярдом параметрів або більше може коштувати десятки мільярдів або навіть сотні мільярдів юанів. Як зазначають експерти галузі, без підтримки у розмірі сотень мільярдів чи трильйонів важко розвиватися в цій сфері протягом тривалого часу.
Стикаючись з цією ситуацією, в індустрії загалом вважають, що з посиленням конкуренції на ринку великих моделей ринок також перейде від захоплення до раціональності, а компанії будуть контролювати витрати та коригувати стратегії відповідно до змін у прогнозах.
Для вирішення проблеми нестачі високопродуктивних графічних процесорів підприємства вжили різноманітних заходів:
Використовуйте дані вищої якості для навчання, щоб підвищити ефективність навчання.
Підвищення можливостей інфраструктури, забезпечення стабільної роботи понад тисячу калорій протягом двох тижнів без збоїв.
Оптимізація обчислювальної потужності карток ресурсів, підвищення ефективності використання.
Покращити мережеву продуктивність, уникнути впливу на швидкість і ефективність навчання.
Перехід від хмарної архітектури до архітектури суперкомп'ютерів для зниження витрат.
Використання вітчизняних платформ для навчання та інференсу великих моделей, замість GPU від NVIDIA.
Для більшості підприємств створення власного дата-центру є досить складним завданням, тому багато алгоритмічних команд обирають професійних постачальників обчислювальної потужності для підтримки. Групи GPU рівня тисячі калорій можуть забезпечити ефект масштабу, вибір постачальника обчислювальної потужності може знизити граничні витрати.
Обчислювальна потужність вже в процесі попиту на ринку та технологічної ітерації стала новою моделлю послуг. Суть обчислювальних послуг полягає в досягненні єдиного виходу гетерогенної обчислювальної потужності за допомогою нових обчислювальних технологій та інтеграції з такими технологіями, як хмарні обчислення, великі дані, ШІ тощо. Це не тільки включає обчислювальну потужність, але й єдину упаковку ресурсів, таких як зберігання, мережа тощо, для надання послуг у формі (, наприклад, API ) для виконання доставки обчислювальної потужності.
У ланцюзі промисловості обчислювальної потужності підприємства верхнього рівня в основному постачають загальну обчислювальну потужність, інтелектуальну обчислювальну потужність, суперобчислювальну потужність, зберігання та мережеві базові ресурси. Підприємства середнього рівня в основному є постачальниками хмарних послуг та нових послуг обчислювальної потужності, які реалізують виробництво обчислювальної потужності за допомогою технологій оркестрації, розподілу та торгівлі обчислювальною потужністю, а також надають обчислювальну потужність через API та інші способи. Підприємства нижнього рівня покладаються на обчислювальну потужність, надану послугами обчислювальної потужності, для здійснення послуг з доданою вартістю.
Оплата за використання та річна/місячна оплата є основними моделями надання обчислювальних послуг. Користувачі можуть вибрати відповідні екземпляри обчислювальної потужності або платформу MaaS. Галузь також просуває "інтеграцію обчислювальної мережі", що підтримує координацію між архітектурами, регіонами та постачальниками послуг.
З огляду на нормалізацію високих вимог до обчислювальної потужності великих моделей, послуги обчислювальної потужності, що виникають з хмарних сервісів, швидко потрапили в поле зору широкої публіки, сформувавши унікальний ланцюг постачання та бізнес-модель. Хоча нинішній дефіцит високопродуктивних GPU призводить до явища "вкрадання чіпів", це лише тимчасово. У довгостроковій перспективі обчислювальна потужність стане послугою, що є певним трендом, постачальники послуг обчислювальної потужності повинні бути готовими, щоб вчасно коригувати стратегію, коли ринкові тенденції змінюються.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
7
Репост
Поділіться
Прокоментувати
0/400
BoredRiceBall
· 07-22 22:40
Обчислювальна потужністьОбчислювальна потужність Як це купити?
Переглянути оригіналвідповісти на0
ChainDetective
· 07-22 10:50
Відеокарти зростання божевільні!
Переглянути оригіналвідповісти на0
MemecoinResearcher
· 07-19 23:43
ngmi без gpu, мої друзі
Переглянути оригіналвідповісти на0
LiquidityWizard
· 07-19 23:43
насправді динаміка попиту та пропозиції вже закладена в ціну... 98.7% впевнений
Обчислювальна потужність послуг зростає: нові можливості та виклики епохи великих моделей
Обчислювальна потужність: нова бізнес-модель ери великих моделей
Зі зростанням великих моделей штучного інтелекту, обчислювальна потужність стала новою бізнес-моделлю. Хоча поточна хвиля "ковки еліксирів" великих моделей може поступово зникнути, постачальникам обчислювальної потужності потрібно заздалегідь готуватися та своєчасно коригувати стратегічний напрям.
Випускник Ціньхуа університету Бі Кайфенг, який закінчив навчання три роки тому, тренував великий метеорологічний модель, використовуючи 40 років глобальних погодних даних, на 200 графічних процесорах (GPU) протягом приблизно 2 місяців. За розрахунками вартості 7.8 юанів за годину на GPU, вартість тренування цієї великої моделі в специфічній області може перевищувати 2 мільйони юанів. Якщо ж мова йде про тренування загальної великої моделі, вартість може зрости в сотні разів.
На сьогодні в Китаї вже є понад 100 великих моделей з 10 мільярдами параметрів. Проте, галузь загалом стикається з проблемою нестачі високопродуктивних графічних процесорів. Обчислювальна потужність коштує дорого, а брак обчислювальної потужності та фінансування ставить багато підприємств перед складними завданнями.
Нестача висококласних GPU є складною проблемою для всієї галузі. Вибух великих моделей призвів до швидкого зростання попиту на обчислювальну потужність, але темпи зростання пропозиції далеко не встигають за цим. Хоча в довгостроковій перспективі пропозиція обчислювальної потужності обов'язково перейде з ринку продавців на ринок покупців, проте скільки часу займе цей процес, все ще залишається невідомим.
Кожна компанія підраховує, скільки GPU від NVIDIA вона має, і на основі цього визначає свою частку на ринку. За словами поінформованих джерел, якщо у вас є близько 10 000 карт, а загальна кількість на ринку становить 100 000 карт, то частка становитиме 10%. Очікується, що до кінця року їх може бути 40 000 карт, і якщо на той час загальна кількість на ринку складе 200 000, то це може скласти 20% частки на ринку.
З одного боку, неможливо купити GPU-карти, з іншого боку, бар'єр для навчання великих моделей не такий легкий для подолання, як це рекламує індустрія. Навчання загальної великої моделі з мільярдом параметрів або більше може коштувати десятки мільярдів або навіть сотні мільярдів юанів. Як зазначають експерти галузі, без підтримки у розмірі сотень мільярдів чи трильйонів важко розвиватися в цій сфері протягом тривалого часу.
Стикаючись з цією ситуацією, в індустрії загалом вважають, що з посиленням конкуренції на ринку великих моделей ринок також перейде від захоплення до раціональності, а компанії будуть контролювати витрати та коригувати стратегії відповідно до змін у прогнозах.
Для вирішення проблеми нестачі високопродуктивних графічних процесорів підприємства вжили різноманітних заходів:
Використовуйте дані вищої якості для навчання, щоб підвищити ефективність навчання.
Підвищення можливостей інфраструктури, забезпечення стабільної роботи понад тисячу калорій протягом двох тижнів без збоїв.
Оптимізація обчислювальної потужності карток ресурсів, підвищення ефективності використання.
Покращити мережеву продуктивність, уникнути впливу на швидкість і ефективність навчання.
Перехід від хмарної архітектури до архітектури суперкомп'ютерів для зниження витрат.
Використання вітчизняних платформ для навчання та інференсу великих моделей, замість GPU від NVIDIA.
Для більшості підприємств створення власного дата-центру є досить складним завданням, тому багато алгоритмічних команд обирають професійних постачальників обчислювальної потужності для підтримки. Групи GPU рівня тисячі калорій можуть забезпечити ефект масштабу, вибір постачальника обчислювальної потужності може знизити граничні витрати.
Обчислювальна потужність вже в процесі попиту на ринку та технологічної ітерації стала новою моделлю послуг. Суть обчислювальних послуг полягає в досягненні єдиного виходу гетерогенної обчислювальної потужності за допомогою нових обчислювальних технологій та інтеграції з такими технологіями, як хмарні обчислення, великі дані, ШІ тощо. Це не тільки включає обчислювальну потужність, але й єдину упаковку ресурсів, таких як зберігання, мережа тощо, для надання послуг у формі (, наприклад, API ) для виконання доставки обчислювальної потужності.
У ланцюзі промисловості обчислювальної потужності підприємства верхнього рівня в основному постачають загальну обчислювальну потужність, інтелектуальну обчислювальну потужність, суперобчислювальну потужність, зберігання та мережеві базові ресурси. Підприємства середнього рівня в основному є постачальниками хмарних послуг та нових послуг обчислювальної потужності, які реалізують виробництво обчислювальної потужності за допомогою технологій оркестрації, розподілу та торгівлі обчислювальною потужністю, а також надають обчислювальну потужність через API та інші способи. Підприємства нижнього рівня покладаються на обчислювальну потужність, надану послугами обчислювальної потужності, для здійснення послуг з доданою вартістю.
Оплата за використання та річна/місячна оплата є основними моделями надання обчислювальних послуг. Користувачі можуть вибрати відповідні екземпляри обчислювальної потужності або платформу MaaS. Галузь також просуває "інтеграцію обчислювальної мережі", що підтримує координацію між архітектурами, регіонами та постачальниками послуг.
З огляду на нормалізацію високих вимог до обчислювальної потужності великих моделей, послуги обчислювальної потужності, що виникають з хмарних сервісів, швидко потрапили в поле зору широкої публіки, сформувавши унікальний ланцюг постачання та бізнес-модель. Хоча нинішній дефіцит високопродуктивних GPU призводить до явища "вкрадання чіпів", це лише тимчасово. У довгостроковій перспективі обчислювальна потужність стане послугою, що є певним трендом, постачальники послуг обчислювальної потужності повинні бути готовими, щоб вчасно коригувати стратегію, коли ринкові тенденції змінюються.