@Diavator, после того как Ллама отказалась сгенирировать эротический рассказ я ее удалил с локального сервера) и теперь сам обучаю модель
Добавлено через 3 минуты
@Diavator, Дело не в том кто умней. дело в том кто чему обучен. Вот например ЛЛама 2 на 7гб очень любит защищать женщин права и свободы) вот бля так и пиши при запросе пользователя) Нельзя унижать женщин я за права и свободы людей)
Я это прекрасно знаю, hugging face второй дом родной уже как год с лишним, как и civita(генерация на дифе, боже я в восторге от Flux, лучшая модель).
Сама увлекаюсь больше РП и написанием ботов, там все сложнее чем просто обучение модели. Нужно что бы LLM понимала инструкции, настройки повествования(маркдаун/форматирование), личность персонажа максимально достоверно изображала, имела в обучении тонну вариаций событий и действий, хорошо ориентировалас в пространстве и описывала его... Слишком много условий.
Европейцы в 90% случаев просто API Клода и ГПТ используют с джейлбрейками и ООС для пробоя цензуры и этики модели. Те кто более искушены и хочет "сладенького" и помимо РП еще и хорошее ЕРП, а не сухой ответ про "танец древний как само время" пользуют файн-тьюн модели. Но сейчас все прям плохо, ибо исходники - ГОВНО! Парадокс, но чем новее тем хреновее..
Llama 3 и 3.1 особенно 8B версии мертвые необучаемые кирпичи, народ с ними сразу завязал как вышла Mistral NeMo 12b. Она по логике и пониманию раком 70b Llama 3 ставит, но при этом еще и годна для домашнего использования за счет размера и контекста 120к против 8к.
К тому же при обучении моделей никогда не знаешь что выйдет, это черный ящик. Вот как пример просто возьмем модели в основе которых НеМо:
1. NeverSleep/Lumimaid-v0.2-12B - хорни модель, априори возбужденная с дымящейся шишкой, но набор слов для ЕРП маленький и согласие пробито на 50%, иногда накидывается, а иногда спрашивает. Плохо держит маркдаун.
2. Undi95/Lumimaid-Magnum-12B -фанкеншейн из двух моделей, хорошо держит маркдаун, средняя, не возбужденная, но спрашивает согласие всегда.
3. Gryphe/Pantheon-RP-1.5-12b-Nemo - не хорни с ОЧЕНЬ глубоким мыслительным процессом, очень человечная и глубоко эмоциональная, но плохо держит маркдаун и развести ее на ЕРП...проще застрелится. (Это автор легендарного МифоМакса)
4. MarinaraSpaghetti/NemoMix-Unleashed-12B - 50/50 агриться когда надо, а не просто потому что ей хочется, держит маркдаун, пишет интересно, но очень много. Согласие спрашивает избирательно.
5. Sao10K/MN-12B-Lyra-v1 - любимая модель пока, невероятно эмоциональная, обалденный стиль повествования, очень внимательна к деталям, хорни когда надо, железно держит маркдаун. Согласие спрашивает избирательно.
Вот простой пример основа одна, а выхлоп у всех разный.
Если бы у меня была возможность оплатить от же ОперРоут, я бы РП вела пока только на: Sao10K/L3.1-70B-Euryale-v2.2 либо на старой NeverSleep/MiquMaid-v2-70B-DPO. Это самые свободно мыслящие и РП/ЕРП пригодные модели по моему мнению.