Функция подсчета частоты слов в тексте

Иногда необходимо подсчитать сколько раз слово встречается в тексте. Вот функция, которая может за вас посчитать частоту вхождения слова в текст:

Граббер: cURL+regexp+"PHP Simple HTML DOM Parser"

Весь день сегодня провел за созданием граббера.

Первый шаг:  необходимо обойти сайт по всем внутренним ссылкам и занести все уникальные в базу.

Для этого я использовал cURL+regexp (сам реджексп не помню где именно нашел — но оказался кстати)

Второй шаг: необходимо вытащить нужные нам данные из вытащенного контента. Для этого я воспользовался наработкой PHP Simple HTML DOM Parser. Очень удобна, но кушает много памяти. У меня с первого раза вылетело из-за недостатка памяти. Для этого я обрезал контент после получения (убрал сайдбары, хедер). В итоге все нормально.
Синтаксис очень схожий с jQuery, по-этому многим будет легко начать.

Дальше уже дело техники и проработки. Можно совершенствовать под свои потребности сколько угодно, чем я и собираюсь завтра заняться 🙂

$argv и запись лога при использовании cron

Если мы запускаем наш сценарий из консоли (например, если мы используем cron) и нам нужно передать какой-либо параметр в наш скрипт, и результат записать в файл лога — то делаем это так

Каждую 50-ую минуту часа будет запускаться php-скрипт под именем my_script.php, внутри которого можно использовать переданные в него параметры, а именно $argv[0] — имя запущенного сценария (в данном случае my_script.php), $argv[1] == «param1«, $argv[2] == «param2«. При этом все что скрипт будет выводить на экран (с помощью есho, например) — будет записываться в файл, путь к которому указан после знака «>«.