Мы в Telegram
Добавить новость
Блог сайта «Хайтек+»
Новости сегодня

Новости от TheMoneytizer

OpenAI нелегально транскрибировала 1 млн часов видео с Ютуба для обучения GPT-4

The New York Times сообщает, что с дефицитом данных OpenAI столкнулась раньше, чем другие компании — ещё во время обучения GPT-4. Тогда разработчики создали модель расшифровки аудио https://interestingengineering.com/culture/why-did-whisper-t..., с помощью которой перевели в текст более 1 миллиона часов подкастов, роликов и лекций на YouTube. Компания знала, что это сомнительно с юридической точки зрения, но считала такое использование добросовестным. Президент OpenAI Грег Брокман лично участвовал в сборе видео.

Также есть сведения о том, что OpenAI использовала контент на YouTube и для обучения нашумевшего видеогенератора Sora. Свои подозрения на этот счёт высказал генеральный директор YouTube Нил Мохан.

В OpenAI на запросы журналистов отвечают достаточно уклончиво: не подтверждают и не отрицают использование видео со сторонней площадки, только говорят, что все было в рамках закона и по согласию авторов. Представитель компании Линдси Хелд сообщила https://www.theverge.com/2024/4/6/24122915/openai-youtube-tr... по электронной почте, что разработчики ChatGPT используют многочисленные источники, включая общедоступные данные и партнерские отношения для получения закрытых данных. Они также рассматривают возможность создавать собственные синтетические данные.

Представитель Google Мэтт Брайант сказал, что сообщении о незаконном использовании видеороликов в OpenAI необоснованны. Google тщательно следит за использованием YouTube и запрещает несанкционированные загрузку и расшифровку видео. По словам источников The New York Times, в Google также собирали стенограммы с YouTube. На это Брайант ответил, что компания обучала свои модели на некоторых видео YouTube в соответствии соглашениями с авторами контента на платформе.

Meta (организация признана экстремистской и запрещена в РФ) также столкнулась с нехваткой обучающих данных и обсуждала возможность использования защищённых авторским правом источников, утверждают информаторы The New York Times. Компания просмотрела почти доступные англоязычные книги, эссе, стихотворения и новостные статьи в Интернете и рассматривала такие меры, как оплата книжных лицензий или даже прямая покупка крупного издательства. Изменения в политике конфиденциальности, которые она внесла после скандала с Cambridge Analytica, также ограничивают её в сборе данных.

Сейчас OpenAI, Google и Meta изучают возможность обучения моделей на синтетических данных — это наилучшие тексты, написанные самим ИИ, которые тщательно отбирают и проверяют на связность, логику повествования и отсутствие грамматических и фактологических ошибок.

 

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

«СВЯТОЙ ЛЕНИН» легально изготавливает армии и спецслужбы. 6 серия. СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

Онколог Марина Шорина: «Раковая опухоль потребляет колоссальное количество энергии из запасов человека»

ЗАПИШИ СЕМЕЙНЫЙ РОЛИК — ПОПАДИ В ЭФИР ТЕЛЕКАНАЛА RU.TV

Международный День защиты детей вместе с LES Art Resort и КидБург

Музыкальные новости

Грандиозный концерт закроет сезон в Бурятском театре оперы и балета

«Россети Новосибирск» продолжает конструктивный диалог с бизнесом по вопросам подключения к электрическим сетям

Загородный банкет: разбираем тонкости, смотрим на лучшее

Почта России помогла ребёнку из Ижевска, подопечному благотворительного фонда, встретиться с футболистами ЦСКА

Новости России

Юлия Миронова стала VIP-участником форума THE TRENDS 2.0

Онколог Марина Шорина: «Раковая опухоль потребляет колоссальное количество энергии из запасов человека»

Дизайнер Наталья Душегрея выпустила капсульные коллекции Весна-Лето 2024

Выгодно ли покупать квартиру в новостройке?

Экология в России и мире

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов

На европейских курортах жители начали обносить улицы цепями, запрещая туристам туда заходить: романтический отдых закончился

В исторических парках покажут любимые мультфильмы от СТС Kids ко Дню защиты детей

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов

Спорт в России и мире

Матч Котова и Вавринки перенесли на корт Сюзанн Ленглен

Касаткина о романе Синнера и Калинской: рада, больше ничего не хочу говорить

Белорусские теннисистки проведут стартовые встречи открытого чемпионата Франции

Пресс-служба WTA мемом отреагировала на тяжёлую победу Свёнтек над Осакой

Moscow.media

Удаленная настройка охранных комплексов StarLine

В Арамиле возбудили уголовное дело из-за "дома-монстра", в котором продолжают жить люди

Денис Сафин перевел 100 миллионов рублей в фонд помощи пострадавшим от паводка

ТСД промышленного класса Saotron RT-T60







Топ новостей на этот час

Rss.plus





СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *