Улучшение БМ
@admin, можно ли научить баянометр новейшим гугловским алгоритмам распознавания текста на пикче? А то постишь шутку на картинке с реддита/фейсбука/твиттера или скрины комментов, БМ молчит, а они потом в баяны попадают, потому как уже было.
Для этих целей прекрасно подойдет Open Source OCR Engine Tesseract.
Не думаю, что интегрировать его в движок Пикабу будет проблемой.
Баянометр будет работать с текстовыми картинками по принципу обычного антиплагиата.
Нужно только будет заранее распознать и занести в базу ранее запощенные картинки с текстом.
А если раньше это уже было на картинке? Что, при создании любого поста картинки на всех ранее созданных распознавать?
Твоя аватарка БАЯН!!!!
а нехуй баяны постить...