Re: Удар по гигантам памяти: технология TurboQuant обрушила акции Micron и Samsung
Вот об этом я и писала уже один раз на вопрос моего знакомого "Куда дальше нейронкам развиваться?".
Ответь простой:
1. Узкоспециализированные нейросети (например на поиск рака по анализам пациента или военные технологии то же визор у дронов)
2. Квантование или новый тип сжатия без потери качества (старый метод это как кувалдой по голове дать, просто отуплял нейронку при снижении квантов, та же Q4 K_L уже работать неприятно, тупит, особенно если сама модель не большая 12B например.)
3. Метод кеширования диалога на стороне нейронки, сейчас вся ваша переписка каждый раз отсылается в чат при нажатии копки "Ввод", а если у вас ограниченное количество токенов оплачено, то лимит можно быстро скушать. (DSV4 это уже реализовали, что бы за 1н запрос не тратился лимит токенов, нейронка помнит диалог и вы просто добавляете к нему новое сообщение, это для тех кто API юзаетпросто спасение и невероятная экономия на выводимых токенах.)
Ожидаемо падение спроса на память, авось DDR5 в цене расти перестанет.
|