Гарвардский университет опубликует около 1 млн книг для обучения ИИ

Объем новой базы данных примерно в пять раз превышает известный датасет Books3, который ранее использовался для обучения моделей ИИ Гарвардский университет анонсировал создание и скорый выпуск масштабного датасета, который включает около 1 млн книг со статусом общественного достояния. Этот проект предложила Институциональная инициатива данных (Institutional Data Initiative, IDI) и финансируется Microsoft и OpenAI. Все книги в датасете ранее были оцифрованы в рамках проекта Google Books и больше не охраняются авторским правом. Объем новой базы данных примерно в пять раз превышает известный...
Copyright information of photo and video materials was taken from the website «Реальное время» , more details in our Terms of Service
Analysis
×
Shekspir William
Dikkens Charles
Aligyeri Dante
Meta (it is forbidden in RF)
Main activity:Communication and IT
99
Google
Main activity:Science and education
151
Microsoft
Main activity:Communication and IT
134
Harvard university
Main activity:Science and education
18
OpenAI
Main activity:Communication and IT
60