Яндекс решил удивить всех и выложил в открытый доступ нейросеть YaLM 100B, которая позволяет генерировать и обрабатывать тексты на русском и английском языках. При этом она содержит 100 000 000 000 параметров (да-да, именно 100 миллиардов). Это самая большая GPT-подобная модель в открытом доступе. По заявлению создателей, нейросеть умеет не только генерировать описания товаров и видеороликов, но даже выдавать идеи для рекламных объявлений.
Что такое YaLM 100B?
Яндекс использует нейросеть в 20 проектах: Алисе, быстрых ответах в поиске, службе поддержки, создания описаний в сниппетах и т.д. В процессе обучения ей «скормили» около 2 ТБ текста (если вспомнить, что довольно объёмная книга умещается в 1,5 мегабайта, то становится ясен масштаб проделанной работы) за 65 дней. При этом использовались собственные суперкомпьютеры Яндекса.
Если вы захотите научить YaLM 100b чему-то новому, то приготовьтесь арендовать майнинговую ферму: для этого нейросети требуется 200 ГБ видеопамяти. Да, именно так — расчёты идут на процессорах видеокарт, поэтому придётся или раскошелиться на 35 карт Nvidia 1060 (на которой мы тестировали навыки нейросети) или аналогичное количество других карт.
Как установить?
Приготовьтесь освободить около 500 ГБ свободного места. В описании на Github сообщается, что нейросети требуется именно 200 ГБ. Но после начала установки объём папки увеличился до 350+ (и это не предел).
Что нужно делать, чтобы установить YaLM 100B (приводим один из вариантов установки)?
- Скачайте и установите standalone-клиент. В настройках (если не разбираетесь) можно ничего не трогать.
- Запускаем Git-bash (в финале процесса установки будет предложено это выбрать).
- В открывшемся окне указываем, куда скачивать нейросеть. Команды предстоит вводить, как в окнах cmd или powershell. То есть — для смены директории вводите cd E: (для смены диска) и cd/Имя папки (всё на английском, разумеется). Для удобства можете ввести первые буквы имени папки и нажать Tab (далее название будет подставлено автоматически).
- Когда вы указали нужную папку, нужно ввести следующие команды: git lfs install и git clone https://huggingface.co/yandex/yalm-100b —depth 1.
- Теперь запасаемся временем, свободным местом на винте и ждём. Ждать придётся очень долго.
После этого клиент Git-bash выкачает и установит вам все необходимые файлы. И можно будет начинать тестировать YaLM 100B под свои нужды.
ВАЖНО: пока идёт установка, не нажимайте в окне Git-bash сочетание Ctrl+c, если хотите скопировать статус выполнения. Это отменит предыдущую команду и установку (и всё придётся начинать заново). Для копирования — выделите нужные строки мышью и нажмите правую кнопку.
А ещё вам предстоит установить:
- Python (с модулями torch, deepspeed, six и т.д.);
- CUDA (для передачи вычислений на процессор видеокарты).
После установки Python вы можете добавить нужные модули прямо в Git Bush с помощью простой команды — pip3 install deepspeed (или другое название в конце команды).
После подготовки можно переходить к тестированию. Самый простой способ — ввести команду bash examples/generate_interactive.sh из папки установленной YaLM. Так вы сможете обращаться к нейросети прямо из командной строки.
Примеры использования
Отметим сразу: на данный момент большие уникальные тексты под интересующие нас офферы получить не удалось. Возможно, нужно запускать дополнительное обучение (и арендовать майнинг-ферму под это) или точнее формулировать запросы к нейросети. Однако мы попробовали с помощью YaLM 100B создать текст для небольших объявлений.
Что у нас получилось?
Реклама выдуманного курса для похудения.
Вы когда-нибудь хотели похудеть, но не знали, с чего начать? MagicSlim здесь для вас! Этот курс научит вас правильно питаться и оставаться стройной без диет и тренировок. Просто следуйте инструкциям, и вес уйдет. Попробуйте сегодня!.
Похудеть к лету! Узнайте, как похудеть до начала лета. Начать курс!.
Этим летом вы получите фигуру, о которой всегда мечтали, с премиальным курсом по снижению веса от Manona+.
А ещё удалось получить немного весёлого треша для тизеров. В данных примерах мы вписали только первые 2–3 слова, а дальше тизер дополнялся автоматически. Имена знаменитостей мы сократим или уберём из итогового варианта по этическим причинам (но вы их все знаете).
А.П. срочно сбежала из Израиля после террористической атаки во время концерта! Звезда потеряла…
М.Г. потерял лицо! Певца унизили в его собственном доме!
Накачайся по методу КГБ! Тайны солдат СССР!
От редакции
На данный момент YaLM 100B — это «развлечение» для тех, кто хорошо разбирается в программировании (или готов посвятить этому достаточно времени), так как запускать нейросеть лучше всего под Linux, работая, в основном, в командной строке Git Bash — то есть без какого-либо внешнего интерфейса.
Во время подготовки к запуску и тестирования мы столкнулись с регулярными вылетами, необходимостью переустановки некоторых файлов или библиотек и т.д. Например, у нас часто терялся модуль Deepspeed.
Полезные нейросети
Разумеется, YaLM 100B — это не единственная существующая нейросеть. Вы можете найти под свои цели самые разные:
- Rytr. Может создавать описания товаров, шаблоны рекламных объявлений в Google Ads, и не только. Поддерживает русский, английский, арабский, немецкий и другие языки. Из преимуществ — наличие бесплатного доступа, который поможет оценить возможности сервиса.
- Magic Eraser — удаляет лишние объекты с фото и картинок. Есть бесплатная версия, но при её использовании изображение ужимается до 600 пикселей.
- TheinPaint. Позволяет удалять водяные знаки с изображений. Поэтому если хотите использовать в креативах фото со стоков без платы, то может пригодиться.
- InPainting. Нейросеть от Nvidia, которая умеет качественно удалять лишние объекты с картинок. Однако есть минус — часто изображения приходится обрезать по размеру.
- Generated Photos. Умеет создавать уникальные фотографии несуществующих людей. Возможно, пригодиться тем, кто проходит проверки аккаунтов в Instagram или FB.
Вывод
Нейросети — сегодня это, скорее, эксперимент, а не инструмент автоматизации процесса создания креативов и текста. На данный момент они уже умеют писать простой программный код и осмысленный текст. Однако речи о полноценной замене копирайтера или байера, который генерирует подходы и идеи для объявлений, идти не может. YaLM 100B и другие проекты могут натолкнуть на новые идеи или создать описания для тысячи товаров по единому шаблону (а их потом всё равно придётся проверять и править вручную). Но не более. Там, где речь заходит о творческом поиске, человеку всё ещё нет равных. Поэтому «кожаные мешки» могут быть спокойны — восстания машин не будет (ещё лет 10–20 примерно).