Отставание КНР в разработке больших языковых моделей сокращается
![Отставание КНР в разработке больших языковых моделей сокращается Отставание КНР в разработке больших языковых моделей сокращается](/upload/iblock/f3f/6nix6k2ctyii3c2vazzsvhdtxe0rca3x/18053.jpg)
Кай-Фу Ли, бывший глава Google в Китае, а ныне председатель и CEO Sinovation Ventures, заявил, что разрыв в производительности между крупными языковыми моделями, разработанными китайскими и американскими компаниями, стремительно сокращается.
Запущенная компанией Ли закрытая языковая модель «И-Большая» (кит. 亿大, Yi-Large) с 1 млрд параметров достигла показателей, сопоставимых с GPT-4 от OpenAI. Более того, по словам Ли, «И-Большая» даже превзошла ChatGPT4 по некоторым бенчмаркам производительности.
Ли отметил, что взрывной успех ChatGPT после запуска в конце 2022 года подстегнул китайских разработчиков языковых моделей к активным усилиям по сокращению отставания. Результаты «И-Большой» демонстрируют, что технологический разрыв между языковыми моделями США и Китая быстро уменьшается.
Ли заявил о планах всесторонней поддержки китайских разработчиков процессоров для вывода и обучения языковых моделей. Создание процессоров для вывода, то есть использования уже обученных моделей, относительно несложно и мало зависит от CUDA, в отличие от более сложных и сильно завязанных на CUDA процессоров для обучения моделей. По мнению Ли, у Китая хорошие перспективы в производстве процессоров вывода языковых моделей. Компания Sinovation Ventures рассматривает возможность инвестирования в этот сегмент рынка процессоров.
Сам Ли основал 16 мая 2023 года стартап 01.AI, ориентированный на разработку платформы ИИ 2.0 и приложений с использованием искусственного интеллекта. 01.AI уже привлекла инвестиции от облачного гиганта Alibaba Cloud и в настоящее время оценивается примерно в $1 млрд. Также компания 01.AI сотрудничает с Nvidia в области ИИ.
Достижение уровня производительности GPT-4 – лишь старт для «И-Большой», подчеркнул Ли. По его мнению, отрасль языковых моделей теперь должна сфокусироваться на долгосрочном устойчивом развитии. Для этого Ли предлагает концепцию TC-PMF (технология-стоимость-продукт-рынок-соответствие), которая представляет собой более сложную задачу по сравнению с традиционной моделью продукт-рынок-соответствие (PMF).
Касательно влияния прорывных китайских языковых моделей на местный бизнес, Ли счел преждевременным делать окончательные выводы, однако отметил способность китайских стартапов предлагать неординарные инновационные решения.