Php количество вхождений символов

Php количество вхождений символов

Начнем .. конечно же, с того, как пишется функция в учебнике. :

Синтаксис функции substr_count

substr_count ( string $haystack , string $needle , int $offset = 0 , int|null $length = null ) : int

Расшифровка синтаксиса функции substr_count.

substr_count — название функции.

string $haystack — строка(string) + где ищем haystack

string $needle — строка(string) + что ищем needle

«int $offset = 0» — Смещение начала отсчёта. Если задано отрицательное значение, отсчёт позиции будет произведён с конца строки.

length — максимальная длина строки, в которой будет производится поиск подстроки после указанного смещения. Если сумма смещения и максимальной длины будет больше длины haystack, то будет выведено предупреждение. Отрицательное значение будет отсчитываться с конца haystack.

«: int» — возвращаемое значение число(int)

Пример использования функции substr_count.

Синтаксис substr_count — это конечно супер(думаю, что вы ничего не поняли. собственно и я бы. лет 15 назад. )! Давайте попробуем разобраться! Как это работает.

Разберем вот такой пример:

В переменную поместим некую конструкцию с использованием substr_count — изначально мы знаем, что внутри поиска существует искомая комбинация:

Выведем прямо здесь с помощью echo $result;

Что это значит по вашему!? 1- один. Как уже было выше сказано, что количество вхождение это и есть. «мир» в «Привет мир!» встречается 1 раз.

Пример №2 использования функции substr_count.

Во втором примере использования substr_count в переменную поместим два искомых значения.

Выведем прямо здесь с помощью echo $result_1 ;

Ну и. чего следовало ожидать, что функция substr_count нашла два вхождения в строке!

Что возвращает функция substr_count если нет вхождений?

Рассмотрим такую ситуацию, что в искомой строке нет вхождения и посмотрим, что будет возвращать функция substr_count

Предположим, что у нас вот акая конструкция, в стоге сена нет иглы:

Что будет находится в переменной — $result_2?

Логично было предположить, что функция substr_count вернет ноль.

Ну и. напоследок. посмотрим тип переменной с помощью var_dump

И вернемся к двум предыдущим примерам, когда нам вернули 1 и 2.

В первом случае($result = substr_count(‘Привет мир!’, ‘мир’);):

В втором случае($result_1 = substr_count(‘Привет мир мир!’, ‘мир’);):

Substr_count и mb_substr_count

Я не скажу за всю Одессу, но я очень часто использую функцию substr_count. У меня кодировка Utf-8 и естественно, что периодически приходится использовать функции с mb_ и даже у нас есть отдельная подтема «mb_».

И как бы, из всего выше сказанного, что мне нужна функция «mb_substr_count».

НО! Я не использую «mb_substr_count» — просто потому, что «substr_count» справляется со всеми необходимыми для меня задачами!
Почему так? Дело в том, что возвращает функция «substr_count«.

И когда вы используете многобайтную кодировку, а у нас многобайтовая кодировка, то и «строка поиска» и «элемент поиска» — находятся в одной кодировке.

И ей(функции «substr_count«) все равно, в какой кодировке искать.

Ну. по крайней мере у меня все работает!

Substr_count без учета регистра

Есть ли у Substr_count учет/неучет регистра?

Не буду выводить всякие определения перейдем к примеру, нам потребуется вывести возвращенное значение — нам нужна функция var_dump:

Вывод по приведенному примеру:

Если в искомой строке(haystack) искомое слово(needle) отличаются наличием разницы регистра «Значок» и «значок», то substr_count ничего не найдет пункт №1.

Это свойство изначально никак в функции не меняется!

Поэтому нужна дополнительная функция, которая сможет решить проблему регистра например strtolower, но обращаю ваше внимание, что иногда strtolower не работает для кириллицы, поэтому. нам может помочь функция, которая будет работать вне зависимости ни от кодировок и национальности my_strtolower.

Substr_count с отключенным регистром

Повторим эту же операцию(нам нужен только пункт 1), что мы сделали выше, посмотрим, сможет ли данная функция отключить наличие регистра:

Вывод о результате работы Substr_count с отключенным регистром

Как видим выше строкой. substr_count перестала замечать разницу между двумя словами :

Источник

substr_count

substr_count() возвращает число вхождений подстроки needle в строку haystack . Заметьте, что параметр needle чувствителен к регистру.

Замечание:

Эта функция не подсчитывает перекрывающиеся подстроки. Смотрите пример ниже!

Список параметров

Строка, в которой ведется поиск

Максимальная длина строки в которой будет производится поиск подстроки после указанного смещения. Если сумма смещения и максимальной длины будет больше длины haystack , то будет выведено предупреждение.

Возвращаемые значения

Список изменений

Версия Описание
5.1.0 Добавлены параметры offset и length

Примеры

Пример #1 Пример использования substr_count()

$text = ‘This is a test’ ;
echo strlen ( $text ); // 14

echo substr_count ( $text , ‘is’ ); // 2

// строка уменьшается до ‘s is a test’, поэтому вывод будет 1
echo substr_count ( $text , ‘is’ , 3 );

// текст уменьшается до ‘s i’, поэтому вывод будет 0
echo substr_count ( $text , ‘is’ , 3 , 3 );

// генерирует предупреждение, так как 5+10 > 14
echo substr_count ( $text , ‘is’ , 5 , 10 );

// выводит только 1, т.к. перекрывающиеся подстроки не учитываются
$text2 = ‘gcdgcdgcd’ ;
echo substr_count ( $text2 , ‘gcdgcd’ );
?>

Смотрите также

  • count_chars() — Возвращает информацию о символах, входящих в строку
  • strpos() — Возвращает позицию первого вхождения подстроки
  • substr() — Возвращает подстроку
  • strstr() — Находит первое вхождение подстроки

Источник

substr_count

substr_count() возвращает число вхождений подстроки needle в строку haystack . Заметьте, что параметр needle чувствителен к регистру.

Замечание:

Эта функция не подсчитывает перекрывающиеся подстроки. Смотрите пример ниже!

Список параметров

Строка, в которой ведётся поиск

Смещение начала отсчёта. Если задано отрицательное значение, отсчёт позиции будет произведён с конца строки.

Максимальная длина строки, в которой будет производится поиск подстроки после указанного смещения. Если сумма смещения и максимальной длины будет больше длины haystack , то будет выведено предупреждение. Отрицательное значение будет отсчитываться с конца haystack .

Возвращаемые значения

Эта функция возвращает целое число ( int ).

Список изменений

Версия Описание
8.0.0 length теперь допускает значение null.
7.1.0 Добавлена поддержка отрицательных значений offset и length . length теперь также может быть 0 .

Примеры

Пример #1 Пример использования substr_count()

$text = ‘This is a test’ ;
echo strlen ( $text ); // 14

echo substr_count ( $text , ‘is’ ); // 2

// строка уменьшается до ‘s is a test’, поэтому вывод будет 1
echo substr_count ( $text , ‘is’ , 3 );

// текст уменьшается до ‘s i’, поэтому вывод будет 0
echo substr_count ( $text , ‘is’ , 3 , 3 );

// генерирует предупреждение, так как 5+10 > 14
echo substr_count ( $text , ‘is’ , 5 , 10 );

// выводит только 1, т.к. перекрывающиеся подстроки не учитываются
$text2 = ‘gcdgcdgcd’ ;
echo substr_count ( $text2 , ‘gcdgcd’ );
?>

Смотрите также

  • count_chars() — Возвращает информацию о символах, входящих в строку
  • strpos() — Возвращает позицию первого вхождения подстроки
  • substr() — Возвращает подстроку
  • strstr() — Находит первое вхождение подстроки

User Contributed Notes 10 notes

It’s worth noting this function is surprisingly fast. I first ran it against a ~500KB string on our web server. It found 6 occurrences of the needle I was looking for in 0.0000 seconds. Yes, it ran faster than microtime() could measure.

Looking to give it a challenge, I then ran it on a Mac laptop from 2010 against a 120.5MB string. For one test needle, it found 2385 occurrences in 0.0266 seconds. Another test needs found 290 occurrences in 0.114 seconds.

Long story short, if you’re wondering whether this function is slowing down your script, the answer is probably not.

Making this case insensitive is easy for anyone who needs this. Simply convert the haystack and the needle to the same case (upper or lower).

To account for the case that jrhodes has pointed out, we can change the line to:

substr_count ( implode( ‘,’, $haystackArray ), $needle );

array (
0 => «mystringth»,
1 => «atislong»
);

Which brings the count for $needle = «that» to 0 again.

substr_count ( implode( $haystackArray ), $needle );

instead of the function described previously, however this has one flaw. For example this array:

array (
0 => «mystringth»,
1 => «atislong»
);

If you are counting «that», the implode version will return 1, but the function previously described will return 0.

Yet another reference to the «cgcgcgcgcgcgc» example posted by «chris at pecoraro dot net»:

Your request can be fulfilled with the Perl compatible regular expressions and their lookahead and lookbehind features.

$number_of_full_pattern = preg_match_all(‘/(cgc)/’, «cgcgcgcgcgcgcg», $chunks);

works like the substr_count function. The variable $number_of_full_pattern has the value 3, because the default behavior of Perl compatible regular expressions is to consume the characters of the string subject that were matched by the (sub)pattern. That is, the pointer will be moved to the end of the matched substring.
But we can use the lookahead feature that disables the moving of the pointer:

$number_of_full_pattern = preg_match_all(‘/(cg(?=c))/’, «cgcgcgcgcgcgcg», $chunks);

In this case the variable $number_of_full_pattern has the value 6.
Firstly a string «cg» will be matched and the pointer will be moved to the end of this string. Then the regular expression looks ahead whether a ‘c’ can be matched. Despite of the occurence of the character ‘c’ the pointer is not moved.

a simple version for an array needle (multiply sub-strings):

function substr_count_array ( $haystack , $needle ) $count = 0 ;
foreach ( $needle as $substring ) $count += substr_count ( $haystack , $substring );
>
return $count ;
>
?>

Unicode example with «case-sensitive» option;

function substr_count_unicode ( $str , $substr , $caseSensitive = true , $offset = 0 , $length = null ) if ( $offset ) $str = substr_unicode ( $str , $offset , $length );
>

$pattern = $caseSensitive
? ‘~(?:’ . preg_quote ( $substr ) . ‘)~u’
: ‘~(?:’ . preg_quote ( $substr ) . ‘)~ui’ ;
preg_match_all ( $pattern , $str , $matches );

return isset( $matches [ 0 ]) ? count ( $matches [ 0 ]) : 0 ;
>

function substr_unicode ( $str , $start , $length = null ) return join ( » , array_slice (
preg_split ( ‘~~u’ , $str , — 1 , PREG_SPLIT_NO_EMPTY ), $start , $length ));
>

$s = ‘Ümit yüzüm gözüm. ‘ ;
print substr_count_unicode ( $s , ‘ü’ ); // 3
print substr_count_unicode ( $s , ‘ü’ , false ); // 4
print substr_count_unicode ( $s , ‘ü’ , false , 10 ); // 1

print substr_count_unicode ( $s , ‘üm’ ); // 2
print substr_count_unicode ( $s , ‘üm’ , false ); // 3
?>

This will handle a string where it is unknown if comma or period are used as thousand or decimal separator. Only exception where this leads to a conflict is when there is only a single comma or period and 3 possible decimals (123.456 or 123,456). An optional parameter is passed to handle this case (assume thousands, assume decimal, decimal when period, decimal when comma). It assumes an input string in any of the formats listed below.

function toFloat($pString, $seperatorOnConflict=»f»)
$decSeperator=».»;
$thSeperator=»»;

$pString=str_replace(» «, $thSeperator, $pString);

$firstPeriod=strpos($pString, «.»);
$firstComma=strpos($pString, «,»);
if($firstPeriod!==FALSE && $firstComma!==FALSE) if($firstPeriod <$firstComma) $pString=str_replace(".", $thSeperator, $pString);
$pString=str_replace(«,», $decSeperator, $pString);
>
else $pString=str_replace(«,», $thSeperator, $pString);
>
>
else if($firstPeriod!==FALSE || $firstComma!==FALSE) $seperator=$firstPeriod!==FALSE?».»:»,»;
if(substr_count($pString, $seperator)==1) $lastPeriodOrComma=strpos($pString, $seperator);
if($lastPeriodOrComma==(strlen($pString)-4) && ($seperatorOnConflict!=$seperator && $seperatorOnConflict!=»f»)) $pString=str_replace($seperator, $thSeperator, $pString);
>
else $pString=str_replace($seperator, $decSeperator, $pString);
>
>
else $pString=str_replace($seperator, $thSeperator, $pString);
>
>
return(float)$pString;
>

Источник

Читайте также:  Html external link code
Оцените статью