Ответ на пост «Зарабатывает на рыбов»
Как то в далёком 2002 году, работал я в Гидропроекте, и оцифровывали мы документацию по какой-то ГЭС эпохи палеолита... Ну, докомопьютерной... Или компьютерной, но исходники не сохранились, в общем не помню. ГЭС Мерове, в Судане, тендер там был.
Доки прогоняли через prompt (так вроде эта чудо-программа называлась распознающая все подряд) и нам скидывали получившееся и исходники. Надо было превратить тот фарш в "красиво". Прям вот чтоб не просто одним шрифтом, но ещё чтоб оглавление работало, и вообще все табуляции соблюдались.
и это был лютый. ЛЮТЫЙ пипец. Видимо, отсутствие всемогущих "нейросетей" (кстати, интересно, знает ли хоть один из пикабушных нейросетевых инфоцыган, что корректней их называть матмоделями)), кривые исходники, и чуть менее кривые руки тех кто их заправлял в сканеры, создали такое исчадие ада, такой фарш из кусков текста, картинок и каких-то вовсе непонятных артефактов, что проще было бы нахрен все спалить и заново создать документацию с нуля.
Там были слова, в которых русские, английские и просто служебные символы соседствовали друг с другом... Не вполне мирно, т.к. они ещё могли быть разного формата. Более того, какой-нибудь символ мог таить в себе ещё и дополнительные знаки табуляции или форматирования, и случайное изменение или удаление такой "мины" могло приводить к совершенно чудовищным последствиям: да, вот про Саратов, очень точно сказано. Но были другие "интересные" эффекты.
вдруг текст мог вспомнить что он таблица. Причем большая такая, которая на лист не влазит, поэтому а не раскорячить ли весь остальной текст в лоскуты.
и всякое такое.
А это был 2002 год, а в тексте же ещё была куча картинок и "картинок" (тоже текста или формул, которые надо было ручками перепечатывать), компы были зеленее, мониторы ярче, но работало все пипец как медленно.
в общем, домой я приходил измотанный как собака.
и тендер мы не выиграли, вот это было обидно((