- Изучаем PHP: поиск символа в строке
- Поиск символа в строке — использование strpos() для регистрозависимого поиска
- Поиск символа в строке — использование функции stripos() для регистронезависимого поиска
- Поиск символа в строке — использование регулярных выражений
- Использование регулярных выражений для поиска точного вхождения слова
- Использование strstr() для поиска подстроки
- PHP пример парсинга URL для «User Friendly URLs»
Изучаем PHP: поиск символа в строке
В этой статье рассматриваются различные методы поиска слова, символа или подстроки в тексте. Описываются преимущества и недостатки каждого метода.
Поиск символа в строке — использование strpos() для регистрозависимого поиска
Простейшим способом проверить, содержит ли строка определённое слово, является использование PHP функции strpos(). Она возвращает позицию первого вхождения подстроки в строке или FALSE, если соответствия не найдены. Поэтому можно сравнить значение, возвращаемое функцией strpos() с FALSE, чтобы проверить наличие подстроки. Пример:
$the_string = «Я на 5 лет старше тебя.»; $the_word = «лет»; $the_character = «Я»; $the_substring = «5 лет»; // Вывод — Слово «лет» есть в данной строке. if (strpos($the_string, $the_word) !== false) < echo 'Слово "'.$the_word.'" есть в данной строке.'; >// Вывод — Символ «Я» есть в данной строке. if (strpos($the_string, $the_character) !== false) < echo ' Символ "'.$the_character.'" есть в данной строке.'; >// Вывод — Подстрока «5 лет» есть в данной строке. if (strpos($the_string, $the_substring) !== false)
Обратите внимание, что я использовал оператор строгого неравенства (!==). Если искомое слово встречается в начале строки, функция strpos() вернёт 0. Это будет расценено оператором != как значение FALSE. Пример:
// Вывод — Символа «Я» нет в данной строке. if (strpos($the_string, $the_character) != false) < echo 'Символ "'.$the_character.'" есть в данной строке.'; >else
При поиске целого слова (например, “на”) функция также вернёт значение TRUE, если строка содержит такие слова, как “она”, “вена” или “например”.
Также можно использовать > -1 вместо !==. Потому что даже если strpos() вернёт 0 как значение индекса, он всё равно будет больше -1. Но помните, что оператор «больше» (>) работает медленнее оператора строгого неравенства (!==).
Поиск символа в строке — использование функции stripos() для регистронезависимого поиска
Для регистрозависимого поиска можно использовать функцию stripos(). Она работает аналогично функции strpos(). Единственное отличие заключается в том, что она игнорирует регистр при поиске подстроки внутри другой строки.
$the_string = «Ваня любит и яблоки, и апельсины.»; $the_word = «ваня»; $the_character = «Я»; $the_substring = «ЛЮбИт И»; // Вывод — Слово «ваня» есть в данной строке. if (stripos($the_string, $the_word) !== false) < echo 'Слово "'.$the_word.'" есть в данной строке.'; >// Вывод — Символ «Я» есть в данной строке. if (stripos($the_string, $the_character) !== false) < echo 'Символ "'.$the_character.'" есть в данной строке.'; >// Вывод — Подстрока «ЛЮбИт И» есть в данной строке. if (stripos($the_string, $the_substring) !== false)
Функция strpos() вернула бы значение FALSE во всех перечисленных выше случаях. Но функция stripos() проигнорировала регистр и вернула значение TRUE.
Другим способом поиска, независящим от регистра, является преобразование всех строк и подстрок в одинаковый регистр, используя функции strtolower() и strtoupper(). Для проверки можно использовать strpos(). Но проще stripos().
Поиск символа в строке — использование регулярных выражений
Также для поиска можно использовать регулярные выражения. Они лучше подходят для случаев, когда вы ищете в строке более сложные конструкции.
Но помните, что функция strpos() работает в три раза быстрее, чем регулярные выражения. Следующий пример демонстрирует, как с их помощью найти слово, символ в строке:
$the_string = «Я на 5 лет старше тебя.»; $the_word = «лет»; $the_character = «Я»; $the_substring = «5 лет»; // Вывод — Слово «лет» есть в данной строке. if (preg_match(‘/лет/’, $the_string)) < echo 'Слово "'.$the_word.'" есть в данной строке.'; >// Вывод — Символ «Я» есть в данной строке. if (preg_match(‘/Я/’, $the_string)) < echo 'Символ "'.$the_character.'" есть в данной строке.'; >// Вывод — Подстрока «5 лет» есть в данной строке. if (preg_match(‘/5 лет/’, $the_string))
Использование функции preg_match() имеет смысл только при сложном поиске. Например, для проверки того, содержит ли строка слова с десятью и более символами и т.п. Пример:
$the_string = ‘Фотосинтез и рискованный – длинные слова.’; // Вывод — Данная строка содержит слова из 10 и более символов. if (preg_match(‘/w/i’, $the_string))
Чтобы сделать поиск регистронезависимым, добавьте флаг i в конец шаблона. Пример реализации:
$the_string = «Ваня любит и яблоки, и апельсины.»; $the_word = «ваня»; $the_character = «Я»; $the_substring = «ЛЮбИт И»; // Вывод — Слово «ваня» есть в данной строке. if (preg_match(‘/ваня/i’, $the_string)) < echo 'Слово "'.$the_word.'" есть в данной строке.'; >// Вывод — Символ «Я» есть в данной строке. if (preg_match(‘/Я/i’, $the_string)) < echo 'Символ "'.$the_character.'" есть в данной строке.'; >// Вывод — Подстрока «ЛЮбИт И» есть в данной строке. if (preg_match(‘/ЛЮбИт И/i’, $the_string))
Использование регулярных выражений для поиска точного вхождения слова
Функции strpos() и stripos()работают быстрее, чем регулярные выражения. Но их использование для поиска точного вхождения слова может быть проблематичным.
В подобных ситуациях лучше применять регулярные выражения. Можно использовать выражение b в шаблоне регулярного выражения, чтобы обозначить границу слова. Если слово, которое вы ищете, заключено в выражения b, функция preg_match() найдёт только точные вхождения слова и вернет FALSE для частичных совпадений. Вот пример:
$the_string = ‘Фотосинтез и рискованный – длинные слова.’; $the_word = ‘синтез’; // Вывод — Слово «синтез» имеет точное совпадение в данной строке. [ЛОЖНО положительный] if (preg_match(‘/синтез/’, $the_string)) < echo 'Слово "синтез" имеет точное совпадение в данной строке. [ЛОЖНО положительный]'; >// Вывод — Слово «синтез» имеет точное совпадение в данной строке. [ЛОЖНО положительный] if (strpos($the_string, $the_word)) < echo 'Слово "синтез" имеет точное совпадение в данной строке. [ЛОЖНО положительный]'; >// Вывод — Слово «синтез» не имеет точных совпадений в данной строке. [Ожидаемый Результат] if (preg_match(‘/bсинтезb/’, $the_string)) < echo 'Слово "синтез" имеет точное совпадение в данной строке. [ЛОЖНО положительный]'; >else
Использование strstr() для поиска подстроки
PHP функция strstr() может быть использована для проверки вхождения символа или подстроки. Она возвращает часть исходной строки, начиная с первого вхождения искомого слова и до конца. Функция вернёт значение FALSE, если подстрока не найдена. Благодаря этому можно проверить, содержит ли строка подстроку. Вот пример:
$the_string = «Я на 5 лет старше тебя.»; $the_word = «лет»; $the_character = «Я»; $the_substring = «5 лет»; // Вывод — Слово «лет» есть в данной строке. if (strstr($the_string, $the_word) !== false) < echo 'Слово "'.$the_word.'" есть в данной строке.'; >// Вывод — Символ «Я» есть в данной строке. if (strstr($the_string, $the_character) !== false) < echo 'Символ "'.$the_character.'" есть в данной строке.'; >// Вывод — Подстрока «5 лет» есть в данной строке. if (strstr($the_string, $the_substring) !== false)
Для регистронезависимого поиска используйте функцию stristr().
- Лучший метод поиска символа или слова в строке – PHP функции strpos(). Если нужно провести регистронезависимый поиск, применяйтеstripos(). Обе функции просты в использовании и работают быстрее остальных методов.
- Для сложного поиска используйте регулярные выражения. Вы также можете применять их для простого поиска, но они работают медленнее, чем функция strpos().
- Регулярные выражения полезны, когда вы ищете точное вхождение слова. Например, при поиске слова “сто” функция strpos() также вернёт значение TRUE, если строка содержит слово “Место”. С другой стороны, можно использовать выражение b в функции preg_match(), которая в таком случае возвратит FALSE.
- Используйте strstr() для регистрозависимого поиска и stristr() для регистронезависимого.
PHP пример парсинга URL для «User Friendly URLs»
Во многих статьях встречал описание user friendly urls, но ни разу не было приведено простого и понятного примера реализации. В этой статье приведен такой пример.
Итак. Для начала приведу код примера, а далее подробно разберем все встречающиеся в нем функции.
php пример.
Теория. user friendly urls – технология, которая помогает избавится от некрасивых ссылок с параметрами (напр.: http://site.ru/index.php?action=view&id=1&print=true ) и заменить их более понятными человеку (напр.: http://site.ru/1/print/ ). Основное преимущество в том, то, что ссылки «понятного» вида легче запоминаются человеком. Отличным примером реализации этой технологии является сайт nokia, ну и, конечно же, наш php wars. В данный момент использование «понятных ссылок» стандартом и показателем уважения к посетителю. Это неотъемлемый элемент «юзабилити» любого сайта.
Основы практики. Идея данной технологии проста. Это использование вместо стандартной страницы 404 специального срипта, который бы перенаправил (или сам вывел) запрашиваемое содержимое.
Пример. Посетитель вводит в браузере http://phpwars.net/content/index.html. На самом деле на сервере нет никакого каталога «content» и уж тем более файла «index.html» в нем. Все происходит так. Веб-сервер пытается открыть файл «/content/index.html». Не найдя его он отображает страницу 404 (которая как уже говорилось выше является специально подготовленным скриптом). Далее в работу вступает скрипт. Он посылает http заголовок 200 (страница найдена), обрабатывает запрашиваемый пользователем url и, как например на php wars, выбирает нужные данные из базы данных и формирует страницу и выдает ее в браузер посетителя.
В нашем примере рассмотрен как раз самые первые этапы: отправка заголовка и анализ url. Нашей целью будет превратить строку введенную посетителем в массив параметров.
Для отправки http заголовков в php служит функция «header». Ей мы и пользуемся в самом начале, отправляя заголовок «http/1.1 200 ok».
Далее мы проверяем на пустоту элемент супер-глобального массива «$_server». Это необходимо для того, что бы выяснить как обратились к скрипту. Например, Вы настраиваете свой веб-сревер что бы вместо страницы 404 он отображал index.php. Таким образом становятся возможными два варианта. Посетитель зашел по ссылке прямой ссылке http://phpwars.net/index.php или по какой-либо понятной ссылке http://phpwars.net/content/index.html. В первом случае элемент «redirect_url» будет пустым. Во втором он будет равен «/content/index.html». Если элемент пуст, то оставляем массив параметров пустым.
Следующим шагом мы присваиваем значение элемента «redirect_url» переменной «$url». Это делается для того, что бы была возможность в дальнейшем использовать этот элемент.
Готовим «$url» к обработке. Если первым символом в строке является слеш, то удаляем его. Это необходимо для того, что бы при набивке массива у нас не получалось первого пустого элемента («нарезка» массива будет производится по слешам).
Следующим шагом мы удаляем последний слеш в конце строки, если он есть.
if($url[strlen($url)-1]==’/’) $url=substr($url, 0, -1);
Как видно для выделения подстрок в php используется функция «substr». Ей передаются три параметра:
переменная, из которой необходимо выделить подстроку
номер символа, с которого начинается выделяемая подстрока
номер последнего символа выделяемой подстроки
Если передать третий параметр, как отрицательное число, то отсчет будет производится с конца строки. Естественно, что функция возвращает нужную подстроку в случае удачи либо flase в противном случае.
Разделяй и властвуй.
Следующим шагом мы разделяем строку на элементы с помощью функции «explode». В качестве разделителя используем слеш. Как видно функции «explode» передается только два параметра:
переменная, которую надо разделить
разделитель по которому будет производится деление. Заметьте, что в качестве разделителя может использоваться не только один символ, а произвольная строка.
Функция возвращает массив полученный при разделении строки.
Далее мы считаем количество элементов в массиве с помощью функции «count». Если у нас ноль элементов (массив пуст), то присваиваем нашему результирующему массиву параметров также пустой массив. Такая ситуация может сложиться только теоретически, но все же – береженого Бог бережет.
Рассматриваем ситуация, когда у нас больше нуля элементов. Тут все достаточно просто. В цикле мы проходимся по всему массиву и очередной элемент не пуст присваиваем ему соответствующий элемент результирующего массива. Звучит сложно, но как видно в это всего несколько строк кода.
Итог.
Вот и все. Обработка закончена. В результате у нас получился массив с обработанным url. Так например, если посетитель зайдет по ссылке http://phpwars.net/content/index.html, то в нашем массиве будут следующие элементы:
$p[0]=”content”; $p[1]=”index.html”; Дальнейшая реализация user friendly urls уже зависит от того, какие другие технологии используются (mysql например).