Для входа на форум нажмите здесь
Новые комментарии
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Автор темы: Efemische
Дата создания: 18.07.2024 08:00
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.




Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.




Аватар для Red
Red
Забанен
Регистрация:
09.09.2023
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Сообщение от Efemische:
оба этих пака тренировочных данных нарушают правила пользования YouTube
А как они нарушают правила? Всё в открытом доступе, а доказать что они используют эти данные для своих коммерческих целей, будет крайне тяжело. Любой у себя дома может заняться тем же, но в меньших масштабах Что, теперь каждый вшивый ютубер будет со всеми и каждым судиться?
Аватар для aWAtaRko
Знаток
Регистрация:
15.07.2008
Медаль "500 лайков"
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Сообщение от Red:
а доказать что они используют эти данные для своих коммерческих целей, будет крайне тяжело
Вроде как есть нейронки, которые могут проанализировать модель и дать вероятностный анализ, был ли использован конкретный датасет для обучения или нет. Что-то типа днк теста. Но юридически, да, будет сложновато. Сомневаюсь, что уже создали правовую базу для таких случаев.
Аватар для Bullen
Survivor
Регистрация:
26.01.2009
GoHa.Ru II Степени Разбойник
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
800 гб?
мм? чёт как-то мало, нет?
Аватар для Red
Red
Забанен
Регистрация:
09.09.2023
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Сообщение от Bullen:
800 гб?
мм? чёт как-то мало, нет?
Смотря какое качество и сжатие. 1600 обычных 30 мин. видосов вместится спокойно.
Аватар для Tea_Maniac
Пока-геймер
Регистрация:
19.11.2009
20 лет вместе!
Награжден за: 20 лет вместе! GoHa.Ru - 10 лет Герой пустоши
Награжден за: За участие в остановке конвоя в спецпроекте по Rage 2 Победитель конкурса
Награжден за: За 2 место в конкурсе по Battlefield 1
Знатоку игры Albion Online
Награжден за: За участие в конкурсе по игре Albion Online Агент GoHa.Ru
Награжден за: Настоящий Агент - За успехи в охоте на клонов Агента 47
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
@Bullen, там пади ав1, он хорошо сжимает
Аватар для DaOni
Гуру
Регистрация:
11.11.2011
Медаль "500 лайков" GoHa.Ru I Степени
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Там кстати еще не добавили какой нибудь пунктик в лиц соглашению с ютубом, что он может пользовать ваше видео как ему хочется, и вообще видео его, а вы просто его арендуете?
Аватар для Akela3dn
Мастер
Регистрация:
05.07.2011
GoHa.Ru - Старожил Медаль "500 лайков"
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Бля а сколько было бы вони если бы это сделала какая нибудь VK, но ютубу можно и да же никого это не парит )


My pc : AMD Ryzen 7 3700x, MSI GeForce RTX 3060 Ti GAMING X (LHR), MSI MPG X570 GAMING PLUS, HyperX Predator Black 16GB DDR4 RAM 3200 MHz CL15, SSD SATA 128 Gb Transcend SSD340, Intel SSD 660P M.2 PCIe 3.0 x4 QLC 1000Gb, HDD 2 по 1000 Gb Western Digital.
Аватар для ZloiMent
Предводитель
Регистрация:
31.07.2014
GoHa.Ru - 10 лет Просветитель
Награжден за: За полезные темы и материалы по разным играм Медаль "2К лайков"
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Сообщение от DaOni:
Там кстати еще не добавили какой нибудь пунктик в лиц соглашению с ютубом, что он может пользовать ваше видео как ему хочется, и вообще видео его, а вы просто его арендуете?
Да оно скорее всего было, что как бы видео вам принадлежит, но нужно понимать, что свободная платформа все дела
Аватар для PipBoy
Предводитель
Регистрация:
24.05.2005
GoHa.Ru - 10 лет Крафтер
Re: NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады
Ого. Оказывается нейронки обучают данными из интернета. Какая неожиданность.

Тролль-инженер 85го уровня

Ваши права в разделе