- Разделение строки в Python
- Что собой представляют строки в Python
- Разделение строки на подстроки
- Разделение строки при помощи функции split()
- Результат разбиения строки – список подстрок
- Токенизация строки
- Разделение строки на символы при помощи функции list()
- Заключение
- Как разделить строку по пробелам python
- Строковые методы split() и join() в Python
- Метод split()
- Примеры использования метода split() в Python
- Метод join()
- Примеры использования метода join() в Python
- Заключение
Разделение строки в Python
При работе над программами иногда возникает необходимость разбить строку на более мелкие части для дальнейшей обработки. В этом руководстве мы подробно рассмотрим, как произвести разделение строки в Python. Разумеется, для большей наглядности разбирать все будем на примерах.
Что собой представляют строки в Python
В Python все является объектом, поэтому даже строка рассматривается как объект.
Строкой называется последовательность символов. Символы могут быть любыми: буквами, цифрами, специальными символами. Компьютер все равно понимает только двоичные числа, т.е. 0 и 1. Перевод символов в нули и единицы мы называем кодированием, а обратный процесс – декодированием. Кодирование осуществляется на основе ASCII.
Строки объявляются с помощью двойных или одинарных кавычек.
имя_переменной = "значение строки"
имя_переменной = 'значение строки'
Пример объявления строки при помощи двойных кавычек:
my_string = "Hello World" print("String is: ", my_string) # Вывод: # String is: Hello World
Пример объявления строки при помощи одинарных кавычек:
my_string = 'Hello Python' print('String is: ', my_string) # Вывод: # String is: Hello Python
Разделение строки на подстроки
Под разделением строки мы понимаем ее разбиение строки на более мелкие части.
Если вам приходилось работать со строками в каком-либо языке программирования, то вы, вероятно, знаете о конкатенации (объединении строк), а разделение строк – это как раз ее противоположность. Для того чтобы выполнять операции разделения строк, Python предоставляет нам встроенную функцию split() .
Примечание редакции: о конкатенации строк можно почитать в статье “Метод join() и объединение строк в Python”.
Разделение строки при помощи функции split()
Метод split() используется для разделения строки на фрагменты. Он принимает один аргумент, называемый разделителем.
Разделителем может быть любой символ или знак. Если разделитель не определен, то по умолчанию будет использоваться пробел.
my_string = "Welcome to Python" result = my_string.split() print(result) # Вывод: # ['Welcome', 'to', 'Python']
В приведенном выше примере мы использовали функцию split() для разделения строки по пробелам.
Давайте теперь попробуем разделить строку по заданным символам. Для этого будем передавать нужные символы в качестве аргумента функции split() .
В качестве разделителя используется запятая:
my_string = "Apple,Orange,Mango" print("Before splitting, the String is: ", my_string) value = my_string.split(",") print("After splitting, the String is: ", value) # Вывод: # Before splitting, the String is: Apple, Orange, Mango # After splitting, the String is: ['Apple', 'Orange', 'Mango']
В качестве разделителя используется символ нуля:
my_string = "Welcome0To0Python" print("Before splitting, the String is: ", my_string) value = my_string.split("0") print("After splitting, the String is: ", value) # Вывод: # Before splitting, the String is: Welcome0To0Python # After splitting, the String is: ['Welcome', 'To', 'Python']
Используем в качестве разделителя запятую, а результат сохраняем в три разных переменных:
my_string = "Apple,Orange,Mango" fruit1, fruit2, fruit3 = my_string.split(",") print("First Fruit is: ", fruit1) print("Second Fruit is: ", fruit2) print("Third Fruit is: ", fruit3)
First Fruit is: Apple Second Fruit is: Orange Third Fruit is: Mango
Результат разбиения строки – список подстрок
При разделении строки на выходе мы всегда получаем список.
Примечание редакции: об обратном преобразовании читайте в статье “Как преобразовать список в строку в Python”.
Как вы знаете, в Python мы не определяем типы данных, в отличие от других языков программирования. Поэтому при использовании функции split() лучше присвоить ее результат какой-нибудь переменной, чтобы впоследствии его можно было перебрать в цикле.
my_string = "Apple,Orange,Mango" value = my_string.split(",") for item in value: print(item)
Разбив строку при помощи функции split() и сохранив результат в какой-нибудь переменной, мы можем обращаться к полученным подстрокам по индексу. Пример:
my_string = "Apple,Orange,Mango" value = my_string.split(",") print("First item is: ", value[0]) print("Second item is: ", value[1]) print("Third item is: ", value[2])
First item is: Apple Second item is: Orange Third item is: Mango
Токенизация строки
Когда мы разделяем строку, она разбивается на более мелкие части, которые называются токенами.
my_string = "Audi,BMW,Ferrari" tokens = my_string.split(",") print("String tokens are: ", tokens) # Вывод: # String tokens are: ['Audi', 'BMW', 'Ferrari']
Здесь Audi, BMW и Ferrari – токены строки «Audi,BMW,Ferrari» .
Разделение строки на символы при помощи функции list()
В Python есть встроенный метод list() для разделения строк на последовательности символов. Функция list() принимает один аргумент – имя переменной, в которой хранится строка.
variable_name = "String value" list(variable_name)
my_string = "Python" tokens = list(my_string) print("String tokens are: ", tokens) # Вывод: # String tokens are: ['P', 'y', 't', 'h', 'o', 'n']
Заключение
В Python разделение строки осуществляется при помощи встроенного метода split() . Строка разбивается по разделителю, переданному split() в качестве аргумента. В результате мы получаем список подстрок. Этот список, как и любой другой, можно перебирать в цикле, а к его элементам можно обращаться по индексам. Также Python предоставляет встроенный метод list() , с помощью которого можно разделить строку на последовательность символов.
Как разделить строку по пробелам python
Такую задачу всегда можно решить с помощью цикла. Но в Python есть метод .split() . Именно его обычно используют для разделения строки на части. В качестве разделителя можно использовать любой символ: пробел, запятую, перенос строки ( \n ) и т.д.
На выходе мы получим список строк:
str = 'how are you' str.split(' ') # ['how', 'are', 'you']
Пробел как разделитель можно не указывать. Метод .split() будет использовать параметр по умолчанию:
str = 'how are you?' str.split() # ['how', 'are', 'you']
Иногда перед тем, как разделить строку, необходимо избавиться от лишних знаков препинания:
str = 'Hi, how are you?' str[:-1].replace(',', '').split() # ['Hi', 'how', 'are', 'you']
Строковые методы split() и join() в Python
При работе со строками в Python вам может потребоваться разбить строку на подстроки или, наоборот, объединить несколько мелких кусочков в одну большую строку. В этой статье мы рассмотрим методы split() и join(), которые как раз и используются для разделения и объединения строк. Мы на примерах разберем, как они помогают легко выполнять необходимые нам задачи.
Важно отметить, что поскольку строки в Python неизменяемы, вы можете вызывать для них методы, не изменяя исходные строки. Итак, давайте начнем!
Метод split()
Когда вам нужно разбить строку на подстроки, вы можете использовать метод split().
Метод split() принимает строку и возвращает список подстрок. Синтаксис данного метода выглядит следующим образом:
Здесь – любая допустимая строка в Python, а sep – это разделитель, по которому вы хотите разделить исходную строку. Его следует указывать в виде строки.
Например, если вы хотите разделить по запятым, нужно установить sep = «,» .
sep – необязательный аргумент. По умолчанию метод split() разбивает строки по пробелам.
maxsplit – еще один опциональный аргумент, указывающий, сколько раз вы хотите разделить исходную строку . По умолчанию maxsplit имеет значение -1. При таком значении метод разбивает строку по всем вхождениям параметра sep.
Если вы хотите разделить исходную строку на две части, по первому вхождению запятой, вы можете установить maxsplit = 1 . Так вы получите две подстроки: части исходной строки до и после первой запятой.
Таким образом, при одном разрезе строки вы получаете 2 подстроки. При двух разрезах — 3 подстроки. то есть, разрезая строку k раз, вы получите k+1 фрагментов.
Давайте рассмотрим несколько примеров, чтобы увидеть метод split() в действии.
Примеры использования метода split() в Python
Зададим строку my_string , как это показанного ниже. После этого вызовем метод split() для my_string без аргументов sep и maxsplit .
my_string = "I code for 2 hours everyday" my_string.split() # ['I', 'code', 'for', '2', 'hours', 'everyday']
Вы можете видеть, что my_string разделена по всем пробелам. Метод возвращает список подстрок.
Рассмотрим следующий пример. Здесь my_string содержит названия фруктов, разделенные запятыми.
Давайте разделим my_string по запятым. Для этого нужно установить sep = «,» или просто передать в метод «,» при вызове.
my_string = "Apples,Oranges,Pears,Bananas,Berries" my_string.split(",") # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']
Как и ожидалось, метод split() вернул список фруктов, где каждый фрукт из my_string стал элементом списка.
Теперь давайте воспользуемся необязательным аргументом maxsplit и установив его равным 2.
my_string.split(",", 2) # ['Apples', 'Oranges', 'Pears,Bananas,Berries']
Попробуем разобрать получившийся список.
Напомним, что my_string = «Apples,Oranges,Pears,Bananas,Berries» , и мы решили разделить эту строку по запятым «,» .
Первая запятая стоит после Apples , и после первого разделения у нас будет две подстроки: Apples и Oranges,Pears,Bananas,Berries .
Вторая запятая стоит после Oranges . Таким образом, после второго деления у нас будет уже три подстроки: Apples , Oranges и Pears,Bananas,Berries .
Сделав два разреза строки, мы достигли установленного максимума, и дальнейшее деление невозможно. Поэтому часть строки после второй запятой объединяется в один элемент в возвращаемом списке.
Надеюсь, теперь вы понимаете, как работает метод split() и для чего нужны аргументы sep и maxsplit .
Метод join()
Теперь, когда вы знаете, как разбить строку на подстроки, пора научиться использовать метод join() для формирования строки из подстрок.
Синтаксис метода Python join() следующий:
Здесь – любой итерируемый объект Python, содержащий подстроки. Это может быть, например, список или кортеж. – это разделитель, с помощью которого вы хотите объединить подстроки.
По сути, метод join() объединяет все элементы в , используя в качестве разделителя.
Примеры использования метода join() в Python
В предыдущем разделе мы разбивали строку my_string по запятым и получали в итоге список подстрок. Назовем этот список my_list .
Теперь давайте сформируем строку, объединив элементы этого списка при помощи метода join(). Все элементы в my_list – это названия фруктов.
my_list = my_string.split(",") # после разделения my_string мы получаем my_list: # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']
Обратите внимание, что разделитель для присоединения должен быть указан именно в виде строки. В противном случае вы столкнетесь с синтаксическими ошибками.
Чтобы объединить элементы в my_list с использованием запятой в качестве разделителя, используйте «,» а не просто , . Это показано во фрагменте кода ниже.
", ".join(my_list) # Output: Apples, Oranges, Pears, Bananas, Berries
Здесь элементы my_list объединяются в одну строку с помощью запятых, за которыми следуют пробелы.
Разделитель может быть любым.
Давайте для примера используем в качестве разделителя 3 символа подчеркивания ___ .
"___".join(my_list) # Output: Apples___Oranges___Pears___Bananas___Berries
Элементы в my_list теперь объединены в одну строку и отделены друг от друга тремя подчеркиваниями ___ .
Теперь вы знаете, как сформировать одну строку из нескольких подстрок с помощью метода join().
Заключение
Итак, мы рассмотрели строковые методы split() и join(). Из этой статьи вы узнали следующее:
- .split (sep, maxsplit) разбивает исходную строку по вхождениям разделителя sep , maxsplit раз.
- .join() объединяет подстроки в итерируемый объект , используя в качестве разделителя.
Надеюсь, вам была полезна данная статья. Успехов в написании кода!
Более 50 задач на строки в нашем телеграм канале Python Turbo. Уютное сообщество Python разработчиков.