Котаны, а знаете ли вы софт для проверки документов? Не хуитку в Word, а посложнее, чтобы залил текст, а программа ищет наличие нужных фраз, например, или выуживает переменные для другого софта по заданному алгоритму? например, есть куча страниц с фамилиями в разных местах, и чтобы софт прошерстил текст и кинул их в тхтЖелательно попенсорс или хотя бы фривар и чтобы был вывод в CMD.
>>1689167 (OP)Тебе нужны регекспы. Пёрл подойдёт, Питон подойдён, да любой достаточно простой для изучения язык сценариев. Ну а если именно как программа, попробуй sed. Вот тебе хорошее руководство:http://rus-linux.net/lib.php?name=MyLDP/consol/HuMan/sed-ru.html
>>1689203>перл>питонНу ёбаный в рот, мужики, только новое ведро повесил, я тут AHK с трудом осиливаю, а тут ещё пидон с пёрлом пердолить>sedПробежался глазами по ману, вроде похоже на то что надо, мерси.
>>1689220Не спеши уходить. Я тут подумал, что программа для поиска имён/фамилий/названий в тексте мне тоже пригодится. Попробую написать на питоне, если что-то получится за вечер, выложу в тред.
>>1689232О, будет охуительно, заранее благодарствую.
>>1689167 (OP)https://ru.wikipedia.org/wiki/Tesseract
>>1689501Спасибо, знаю про него. Тоже буду использовать, скорее всего в своём наборе из говна и палок.
>>1689167 (OP)Сделал программку, и она даже работает:https://paste.fedoraproject.org/361181/raw/Наконец-то не придётся искать всякую фигню однострочниками на баше.Зацени, ОП, если что не так, сразу говори. Серьёзно переписывать я не собираюсь, но в мелочах (вроде вывод поменять), почему бы и нет, я не злобный. Впрочем, думаю, если ты заинтересовался регулярными выражениями, то легко сможешь нужное подправить — посмотри код, там всего лишь регекспы, обёрнутые функциями. Из оригинального только вывод слов по частоте совпадений, ну, насколько оригинальным может считаться четвёртый по счёту скрипт новичка, толком не читавшего даже официальные доки.Питон действительно несложный язык, попробуй когда-нибудь, базарю, понравится, ещё захочешь.
>>1689663Бля, ты охуенен. Только у меня лыжи, кажется, не едут.
>>1689669А, нет, просто Notepad++ ебанутый, сохранил в ANSI. А можешь, если не западло, сделать чтобы эта штука ещё искала суммы в тексте (с пробелами и без) и ещё проверяла текст на наличие фраз?
>>1689663Альзо, багрепорт, -с в сокращённом виде не работает. --clean пашет.
>>1689679>если не западлоЗападло. Прочитав пару-тройку статьей по регекспам ты сделаешь это сам. Возьми, например, функцию find_names_all да и попробуй несколько примеров.>>1689681Странно, у меня пашет, по крайней мере никаких ошибок не выводит. Ну да ладно, может позже разберусь.
>>1689701Ну ладно, все равно спасибо за идею с питоном, буду пилить, ибо заебало уже одни и те же документы читать, лол.