Hulkmaster

Hulkmaster

Пикабушник
поставил 357 плюсов и 318 минусов
отредактировал 4 поста
проголосовал за 6 редактирований
Награды:
10 лет на Пикабу
60К рейтинг 18 подписчиков 7 подписок 129 постов 30 в горячем

Ответ на пост «1 из 3»

Ооооо, священные регулярки, сразу вспомнил ответ на вопрос на СО, который закреплен и помечен как (дальше будет мой корявый перевод)

Ответ на пост «1 из 3» Программирование, Разработка, Комиксы, IT юмор, Регулярные выражения, Ответ на пост, Длиннопост

Заметка подератора

Этот пост закреплен дабы избежать некорректных корректировок. Пост выглядит именно так как он и должен выглядеть - с содержанием нет никаких проблем. Пожалуйста не помечайте его никак, чтобы не привлекать наше внимание.


Собствено вопрос довольно прозаичен: (условно) "как парсить хтмл с помощью регулярок"

а вот и ответ (ух, поехали, время устроить челленж моему английскому)
некоторые части перевода скорее всего неверные, а часть - просто отсылки которые я не знаю, но скорее всего суть вы поймете :D

Ответ на пост «1 из 3» Программирование, Разработка, Комиксы, IT юмор, Регулярные выражения, Ответ на пост, Длиннопост

Невозможно распарсить [X]HTML с помощью регеса. Потому что ХТМЛ не может быть распарсен регексом.Регес - не та тулза, которая может быть использована для корректного парса ХТМЛа. Как я уже отвечал много раз в вопросах хтмл-и-регес, использование регеса не позволит процессить хтмл. Регулярки недостаточно утонченная тулза для понимания конструкций используемых в ХТМЛ. ХТМЛ не "регулярный" язык, тем самым он не может быть запарсен регулярками.. У регулярок нет возможности парсить ХТМЛ в имеющие смысл части. так много раз, но оно так и не дошло до меня. Даже улучшенные нерегулярные регулярные выражения используемые в Perl'e не справятся с этой задачей. Вы никогда не расколете меня. ХТМЛ - язык достаточной сложности, который не может быть распарсен регулярками. Даже Jon Skeet не сможет парсить ХТМЛ регулярками. Каждый раз когда вы пытаетесь распарсить ХТМЛ регулярками нечестивое дитя плачет кровью девственниц и русские хакеры взламывают твое веб приложение. Парсинг ХТМЛа регулярками призывает запятнанные души в мир живых. Хтмл и регулярки настолько же хорошая пара, как и "любовь, брак" и "ритуальное детоубийство". <Центр> больше не справляется, слишком поздно. Насильное использование регулярок и ХТМЛа в концептуальном пространстве расплавит твой разум в жижу. Если ты распарсишь ХТМЛ регексом то ты отдашься Им и их дьявольским путям, которые обрекут всех нас к нечеловеческому труду во имя Его кого невозможно назвать используя обычный человеческий язык, он грядёт. ХТМЛ-плюс-регулярки размозжит нервы разумности пока ты наблюдаешь за ними, твоя психика затухнет под натиском ужаса. Парсерсы-ХТМЛа-основанные-на-регексах это рак, который убивает Stackoverflow слишком поздно слишком поздно нас не спасти трансгрессия ребенка гарантирует что регекс поглотит всех живых существ (кроме ХТМЛ, который он не способен переварить, как говорили ранее) господь помоги нам как мы можем пережить это бедствие использование регекса для парсинга ХТМЛа обрекло на человечество на вечные ужасные пытки и дыры в безопасности использование регекса как тулзы для процессинга ХТМЛа дыру между этим миром и миром ужаса испорченных сущностей (как  SGML сущности, только испорченнее) лишь мгновение мира регекс парсеров для ХТМЛА моментально перемещает сознание разработчика в мир нескончаемых криков, он грядет, ядовито-склизская зараза регулярок поглотит твой ХТМЛ парсер, приложение и всё существование вроде Visual Basic только хуже он грядёт он грядёт не борись он грядёт, его нечестивая аура разрушает всё сущее, ХТМЛ теги текут из твоих глаз как жидкость боли, песнь парсинга с помощью регулярных выражений заглушит голоса смертных из сферы я вижу это ты видишь это это прекрасно окончательное гашение  лжи человечества ВСЁ ПОТЕРЯНО ВСЁ ПОТЕРЯНО пони он грядёт он грядет гной проникает всё МОЁ ЛИЦО МОЁ ЛИЦО неееЕЕЕттт НЕТ неТ остановить углы не реально ZALGO ЭТО ТОНИ-ПОНИ ОН ГРЯДЁТ

ФУХ, это было тяжело, там дофига опечаток, неточностей перевода, но я старался

ссылка на пост: https://stackoverflow.com/a/1732454

Показать полностью 1

Эффективные программисты

- Слушай, ты пофиксил багу, что юзеры жаловались, что от нашей приложухи у них адово гудел кулер?
-- Да
- Оптимизировал алгоритмы, чтобы ЦПУ не грузился?
-- Отключил кулер
- Что?
-- Что?

Кому сосисочку?

Кому сосисочку? Скриншот, Комментарии на Пикабу, Сосиски, Длиннопост

#comment_195907720

Показать полностью 1

Новые фичи и старые процы

Новые фичи и старые процы Фича, Процессор
Новые фичи и старые процы Фича, Процессор
Показать полностью 1

Интернет в двух словах

Смотреть со звуком

Загадки для собеседования

Загадки для собеседования Комментарии на Пикабу, Загадка, Мат, Скриншот

#comment_185105868

Показать полностью 1

Ответ на пост «Ну как самим догадаться?)»

Когда-то давным давно знакомый рассказывал как получил работу в ремонте компов:


Сидит в отделе кадров, гоняют вопросами вроде "кем вы видите себя через 5 лет", тут мимо проходит его будущий начальник с системником:

- "К нам собеседуешь? Почему системник не работает?"
- "Потому что не подключен к сети"
- "Оформляй"

Ответ на пост «Арбидол - наше всЁ»

Хоооо, учился в меде (Сеченов), тогда ещё не знал о всяких расстрельных списков препаратов итд, и на кафедре фармы услышал как преподы ходили и обсуждали как им помогают всякие интерфероны

Преподы! На кафедре фармы! В первом меде!

Что вы ожидаете от рядовых терапевтов?

#comment_178436287

Отличная работа, все прочитано!