25 миллионов книг в руках одного инженера

25 МИЛЛИОНОВ КНИГ В РУКАХ ОДНОГО ИНЖЕНЕРА, к которым вы никогда не получите доступ

Это история о том, как глупость, жадность и ревность смогли погубить один из величайших проектов современности.


Для тех, кто не хочет много читать - суть истории в трех абзацах.


Google потратила 400млн долларов и почти 15 лет на то, чтобы создать самый грандиозные проект в истории - оцифровать все книги мира.


Сегодня проект заморожен, а доступ к 60 петабайтам оцифрованных книг имеют лишь несколько инженеров Google. В их руках - вся история человечества.


Все, что нужно для того, чтобы мир начал пользоваться книгами всего мира - написать один запрос к базе данных. И доступ переключится с "Выкл" на "Вкл". Для этого нужно пару минут.


Но этого никогда не произойдет.


А теперь тот самый лонгрид со всеми подробностями.


Сразу предупреждаю - текста много. Так что запаситесь попкорном ;-)


15 лет назад Ларри Пейдж и Сергей Брин задумали невозможное. Они обьявили всему миру, что хотят оцифровать все существующие книги в мире. Это бы позволило любому человеку в мире за считанные секунды найти любую информацию, не проводя в библиотеках часы, дни, месяцы....


Проект по оцифровке книг получил кодовое название "Project Ocean". Идея казалась крутой, но мало реалистичной. Но за ней стояли два крутых парня с деньгами, поэтому проект стартовал.


С 2002 года Google начала жадно сканировать все книги, до которых могла дотянуться. Сначала это были книги на английском. Google договаривалась с крупнейшими библиотеками США и организовывала специальные центры сканирования, куда книги из библиотек в прям смысле слова свозили фурами.


Для сканирования книг был разработан специальный софт. Книга жестко фиксировалась, а сверху ее фотографировало несколько камер. Единственное, что страницы переворачивал не робот, а сотрудник. Машины не могли делать это достаточно быстро и нежно. В рамках проекта оцифровывали очень старые книги, и аккуратность была превыше всего.


К августу 2010 года Google потратила на проект в общей сложности 400 млн. долларов. И объявила о том, что по ее подсчетам в мире 129 864 880 книг. И она хочет оцифровать их все.


Изначально Google не планировала открывать доступ к книгам, а давать возможность совершать поиск. И демонстрировать только небольшой отрывок. Юридический отдел Google был уверен, что это попадает под определение "честного использования".


Также стоит сказать, что если в большинстве европейских стран книга становится бесплатно доступной обществу через 50 лет после смерти автора, то в США это так не работает. Закон об авторских правах таков, что уже не публикующиеся книги никто не имеет права опубликовать еще раз, не решив все вопросы с автором, издательством или наследниками их прав. То есть книга просто лежит и собирает пыль, а чтобы дать ей вторую жизнь, даже цифровую, надо потратить столько времени и денег, что проще ничего не делать.


И тут в какой-то момент эта история взбудоражила издателей и авторов. Они начали понимать, что Google уже оцифровала миллионы книг и совсем скоро к ним будет открыт публичный доступ. Начались коллективные иски...


На протяжении 2,5 лет юристы Google, библиотек, издателей и Гильдии авторов вели сложнейшие переговоры, суть которых один из их участников кратко, но емко охарактеризовал как "четырехмерные шахматы" — надо было учесть интересы всех сторон.


Самая главная проблема, с которой столкнулись участники переговоров заключалась вот в чем. Ок, допустим, Google делает грандиозный интернет-магазин цифровых книг, в том числе и тех, авторы которых давно умерли, издательства закрылись и вообще непонятно, кому принадлежат права. Кому платить причитающуюся плату? Установление прав на получение денег в каждом конкретном случае стоило бы намного больше, чем любые возможные выплаты. То есть чисто экономически это было бессмысленно.


Но эту проблему решили, придумав создать единое агентство, которому бы шла плата за все старые книги. Наследники авторов и издателей могли бы в него обращаться за своей долей, а часть полученных средств там бы тратили на установление авторства. Поскольку обращались бы, конечно, далеко не все, то схема имела экономический смысл — кому все равно, "спонсировали" бы тех, кто хотел бы, чтобы ему заплатили. Причем правообладатели и авторы в любом случае получали бы 69% от цены электронной книги, а Google бы довольствовалась остальным.


Грандиозность соглашения привлекла внимание Министерства юстиции США, которое начало расследование и попросило всех, кто возражает против этого соглашения "говорить сейчас или молчать вечно".


Разумеется, возражения поступили. От Microsoft и Amazon с технологической стороны, а также от нескольких тысяч авторов, многие из которых, похоже, не до конца поняли суть соглашения.


В ходе долгой борьбы и недальновидности Конгресса США, сделка не была одобрена.


Формально в итоге победила Google — ей позволено показывать отрывки из оцифрованных книг. Но проиграли — все. Читатели не получили гигантской цифровой библиотеки из всех-всех когда-либо напечатанных книг. Издатели и авторы не получили возможности получать постоянно небольшую денежку от их продажи. А Google "заморозила" траты в размере 400 млн. долларов. Даже выиграв, компания охладела к своему проекту и больше не сканирует книги. Кончился запал.


Сегодня где-то далеко на серверах Google лежат 50-60 петабайтов оцифрованных книг. Вот они, только руку протяни. Но доступ к ним имеют лишь несколько инженеров компании, ответственных за то, чтобы никто другой не получил к этим книгам доступ.


Честно стырено на ФБ

107
Автор поста оценил этот комментарий

Продажа или бесплатное предоставление всех этих книг не было единственной целью для гугла. Эти знания послужат или уже служат пищей для ИИ. Поэтому, они прекрасно знали, на что они идут и ради чего. Вполне вероятно, что сканирование и сейчас продолжается в беспалевном режиме

раскрыть ветку
161
Автор поста оценил этот комментарий

Какое счастье, что есть Флибуста, который пофигу Конгресс США и Госдума РФ.

раскрыть ветку
553
DELETED
Автор поста оценил этот комментарий

Жадные дегенераты, не видящее дальше завтрашнего дня, вставили палку в колесо прогресса человечества

раскрыть ветку
26
Автор поста оценил этот комментарий

"по ее подсчетам в мире 129 864 880 книг" это они ещё столько же книг Донцовой забыли приплюсовать.

раскрыть ветку
37
Автор поста оценил этот комментарий
Гугл уже давно не корпорация добра. Открытый доступ или нет, я думаю, им глубоко пофигу. Основной целью оцифровки было получение огромного корпуса текстов на разных языках, чтобы в дальнейшем улучшать поиск, обучать ИИ и так далее. Думаю, эта цель выполнена на 100%. А остальное им не так важно.