Гарвардский университет опубликует около 1 млн книг для обучения ИИ
Объем новой базы данных примерно в пять раз превышает известный датасет Books3, который ранее использовался для обучения моделей ИИ Гарвардский университет анонсировал создание и скорый выпуск масштабного датасета, который включает около 1 млн книг со статусом общественного достояния. Этот проект предложила Институциональная инициатива данных (Institutional Data Initiative, IDI) и финансируется Microsoft и OpenAI. Все книги в датасете ранее были оцифрованы в рамках проекта Google Books и больше не охраняются авторским правом. Объем новой базы данных примерно в пять раз превышает известный...
Copyright information of photo and video materials was taken from the website «Реальное время» , more details in our Terms of Service