Split data in python

Строковые методы split() и join() в Python

При работе со строками в Python вам может потребоваться разбить строку на подстроки или, наоборот, объединить несколько мелких кусочков в одну большую строку. В этой статье мы рассмотрим методы split() и join(), которые как раз и используются для разделения и объединения строк. Мы на примерах разберем, как они помогают легко выполнять необходимые нам задачи.

Важно отметить, что поскольку строки в Python неизменяемы, вы можете вызывать для них методы, не изменяя исходные строки. Итак, давайте начнем!

Метод split()

Когда вам нужно разбить строку на подстроки, вы можете использовать метод split().

Метод split() принимает строку и возвращает список подстрок. Синтаксис данного метода выглядит следующим образом:

Здесь – любая допустимая строка в Python, а sep – это разделитель, по которому вы хотите разделить исходную строку. Его следует указывать в виде строки.

Например, если вы хотите разделить по запятым, нужно установить sep = «,» .

sep – необязательный аргумент. По умолчанию метод split() разбивает строки по пробелам.

maxsplit – еще один опциональный аргумент, указывающий, сколько раз вы хотите разделить исходную строку . По умолчанию maxsplit имеет значение -1. При таком значении метод разбивает строку по всем вхождениям параметра sep.

Если вы хотите разделить исходную строку на две части, по первому вхождению запятой, вы можете установить maxsplit = 1 . Так вы получите две подстроки: части исходной строки до и после первой запятой.

Таким образом, при одном разрезе строки вы получаете 2 подстроки. При двух разрезах — 3 подстроки. то есть, разрезая строку k раз, вы получите k+1 фрагментов.

Давайте рассмотрим несколько примеров, чтобы увидеть метод split() в действии.

Примеры использования метода split() в Python

Зададим строку my_string , как это показанного ниже. После этого вызовем метод split() для my_string без аргументов sep и maxsplit .

my_string = "I code for 2 hours everyday" my_string.split() # ['I', 'code', 'for', '2', 'hours', 'everyday']

Вы можете видеть, что my_string разделена по всем пробелам. Метод возвращает список подстрок.

Рассмотрим следующий пример. Здесь my_string содержит названия фруктов, разделенные запятыми.

Давайте разделим my_string по запятым. Для этого нужно установить sep = «,» или просто передать в метод «,» при вызове.

my_string = "Apples,Oranges,Pears,Bananas,Berries" my_string.split(",") # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']

Как и ожидалось, метод split() вернул список фруктов, где каждый фрукт из my_string стал элементом списка.

Теперь давайте воспользуемся необязательным аргументом maxsplit и установив его равным 2.

my_string.split(",", 2) # ['Apples', 'Oranges', 'Pears,Bananas,Berries']

Попробуем разобрать получившийся список.

Напомним, что my_string = «Apples,Oranges,Pears,Bananas,Berries» , и мы решили разделить эту строку по запятым «,» .

Первая запятая стоит после Apples , и после первого разделения у нас будет две подстроки: Apples и Oranges,Pears,Bananas,Berries .

Вторая запятая стоит после Oranges . Таким образом, после второго деления у нас будет уже три подстроки: Apples , Oranges и Pears,Bananas,Berries .

Сделав два разреза строки, мы достигли установленного максимума, и дальнейшее деление невозможно. Поэтому часть строки после второй запятой объединяется в один элемент в возвращаемом списке.

Надеюсь, теперь вы понимаете, как работает метод split() и для чего нужны аргументы sep и maxsplit .

Метод join()

Теперь, когда вы знаете, как разбить строку на подстроки, пора научиться использовать метод join() для формирования строки из подстрок.

Синтаксис метода Python join() следующий:

Здесь – любой итерируемый объект Python, содержащий подстроки. Это может быть, например, список или кортеж. – это разделитель, с помощью которого вы хотите объединить подстроки.

По сути, метод join() объединяет все элементы в , используя в качестве разделителя.

Примеры использования метода join() в Python

В предыдущем разделе мы разбивали строку my_string по запятым и получали в итоге список подстрок. Назовем этот список my_list .

Теперь давайте сформируем строку, объединив элементы этого списка при помощи метода join(). Все элементы в my_list – это названия фруктов.

my_list = my_string.split(",") # после разделения my_string мы получаем my_list: # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']

Обратите внимание, что разделитель для присоединения должен быть указан именно в виде строки. В противном случае вы столкнетесь с синтаксическими ошибками.

Чтобы объединить элементы в my_list с использованием запятой в качестве разделителя, используйте «,» а не просто , . Это показано во фрагменте кода ниже.

", ".join(my_list) # Output: Apples, Oranges, Pears, Bananas, Berries

Здесь элементы my_list объединяются в одну строку с помощью запятых, за которыми следуют пробелы.

Разделитель может быть любым.

Давайте для примера используем в качестве разделителя 3 символа подчеркивания ___ .

"___".join(my_list) # Output: Apples___Oranges___Pears___Bananas___Berries

Элементы в my_list теперь объединены в одну строку и отделены друг от друга тремя подчеркиваниями ___ .

Теперь вы знаете, как сформировать одну строку из нескольких подстрок с помощью метода join().


Итак, мы рассмотрели строковые методы split() и join(). Из этой статьи вы узнали следующее:

  • .split (sep, maxsplit) разбивает исходную строку по вхождениям разделителя sep , maxsplit раз.
  • .join() объединяет подстроки в итерируемый объект , используя в качестве разделителя.

Надеюсь, вам была полезна данная статья. Успехов в написании кода!

Более 50 задач на строки в нашем телеграм канале Python Turbo. Уютное сообщество Python разработчиков.


Python String split() Method

Split a string into a list where each word is a list item:

txt = «welcome to the jungle»

Definition and Usage

The split() method splits a string into a list.

You can specify the separator, default separator is any whitespace.

Note: When maxsplit is specified, the list will contain the specified number of elements plus one.


Parameter Values

Parameter Description
separator Optional. Specifies the separator to use when splitting the string. By default any whitespace is a separator
maxsplit Optional. Specifies how many splits to do. Default value is -1, which is «all occurrences»

More Examples


Split the string, using comma, followed by a space, as a separator:

txt = «hello, my name is Peter, I am 26 years old»


Use a hash character as a separator:


Split the string into a list with max 2 items:

# setting the maxsplit parameter to 1, will return a list with 2 elements!
x = txt.split(«#», 1)

Python Split String – How to Split a String into a List or Array in Python

Shittu Olumide

Shittu Olumide

Python Split String – How to Split a String into a List or Array in Python

In this article, we will walk through a comprehensive guide on how to split a string in Python and convert it into a list or array.

We’ll start by introducing the string data type in Python and explaining its properties. Then we’ll discuss the various ways in which you can split a string using built-in Python methods such as split() , splitlines() , and partition() .

Overall, this article should be a useful resource for anyone looking to split a string into a list in Python, from beginners to experienced programmers.

What is a String in Python?

A string is a group of characters in Python that are encased in single quotes ( ‘ ‘ ) or double quotes ( » » ). This built-in Python data type is frequently used to represent textual data.

Since strings are immutable, they cannot be changed once they have been created. Any action that seems to modify a string actually produces a new string.

Concatenation, slicing, and formatting are just a few of the many operations that you can perform on strings in Python. You can also use strings with a number of built-in modules and functions, including re , str() , and len() .

There’s also a wide range of string operations, including split() , replace() , and strip() , that are available in Python. You can use them to manipulate strings in different ways.

Let’s now learn how to split a string into a list in Python.

How to Split a String into a List Using the split() Method

The split() method is the most common way to split a string into a list in Python. This method splits a string into substrings based on a delimiter and returns a list of these substrings.

myString = "Hello world" myList = myString.split() print(myList) 

In this example, we split the string «Hello world» into a list of two elements, «Hello» and «world» , using the split() method.

How to Split a String into a List Using the splitlines() Method

The splitlines() method is used to split a string into a list of lines, based on the newline character (\n) .

myString = "hello\nworld" myList = myString.splitlines() print(myList) 

In this example, we split the string «hello\nworld» into a list of two elements, «hello» and «world» , using the splitlines() method.

How to Split a String into a List Using Regular Expressions with the re Module

The re module in Python provides a powerful way to split strings based on regular expressions.

import re myString = "hello world" myList = re.split('\s', myString) print(myList) 

In this example, we split the string «hello world» into a list of two elements, «hello» and «world» , using a regular expression that matches any whitespace character (\s) .

How to Split a String into a List Using the partition() Method

The partition() method splits a string into three parts based on a separator and returns a tuple containing these parts. The separator itself is also included in the tuple.

myString = "hello:world" myList = myString.partition(':') print(myList) 

In this example, we split the string «hello:world» into a tuple of three elements, «hello» , «:» , and «world» , using the partition() method.

Note: The most common method for splitting a string into a list or array in Python is to use the split() method. This method is available for any string object in Python and splits the string into a list of substrings based on a specified delimiter.

When to Use Each Method

So here’s an overview of these methods and when to use each one for quick reference:

  1. split() : This is the most common method for splitting a text into a list. You can use this method when you want to split the text into words or substrings based on a specific delimiter, such as a space, comma, or tab.
  2. partition() : This method splits a text into three parts based on the first occurrence of a delimiter. You can use this method when you want to split the text into two parts and keep the delimiter. For example, you might use partition() to split a URL into its protocol, domain, and path components. The partition() method returns a tuple of three strings.
  3. splitlines() : This method splits a text into a list of strings based on the newline characters ( \n ). You can use this method when you want to split a text into lines of text. For example, you might use splitlines() to split a multiline string into individual lines.
  4. Regular expressions: This is a more powerful method for splitting text into a list, as it allows you to split the text based on more complex patterns. For example, you might use regular expressions to split a text into sentences, based on the presence of punctuation marks. The re module in Python provides a range of functions for working with regular expressions.


These are some of the most common methods to split a string into a list or array in Python. Depending on your specific use case, one method may be more appropriate than the others.

