Python удалить символы по индексу
Строка считывается со стандартного ввода функцией input() . Напомним, что для двух строк определена операция сложения (конкатенации), также определена операция умножения строки на число.
Строка состоит из последовательности символов. Узнать количество символов (длину строки) можно при помощи функции len .
Любой другой объект в Питоне можно перевести к строке, которая ему соответствует. Для этого нужно вызвать функцию str() , передав ей в качестве параметра объект, переводимый в строку.
На самом деле каждая строка, с точки зрения Питона, — это объект класса str. Чтобы получить по объекту другой объект другого класса, как-то ему соответствующий, можно использовать функцию приведения. Имя этой функции совпадает с именем класса, к которому мы приводим объект. (Для знатоков: эта функция — это конструктор объектов данного класса.) Пример: int — класс для целых чисел. Перевод строки в число осуществляется функцией int() .
s = input() print(len(s)) t = input() number = int(t) u = str(number) print(s * 3) print(s + ' ' + u)
2. Срезы (slices)
Срез (slice) — извлечение из данной строки одного символа или некоторого фрагмента подстроки или подпоследовательности.
Есть три формы срезов. Самая простая форма среза: взятие одного символа строки, а именно, S[i] — это срез, состоящий из одного символа, который имеет номер i . При этом считается, что нумерация начинается с числа 0. То есть если , то , , , , .
Заметим, что в Питоне нет отдельного типа для символов строки. Каждый объект, который получается в результате среза S[i] — это тоже строка типа str.
Номера символов в строке (а также в других структурах данных: списках, кортежах) называются индексом.
Если указать отрицательное значение индекса, то номер будет отсчитываться с конца, начиная с номера -1 . То есть , , , , .
Или в виде таблицы:
Строка S | H | e | l | l | o |
Индекс | S[0] | S[1] | S[2] | S[3] | S[4] |
Индекс | S[-5] | S[-4] | S[-3] | S[-2] | S[-1] |
Если же номер символа в срезе строки S больше либо равен len(S) , или меньше, чем -len(S) , то при обращении к этому символу строки произойдет ошибка IndexError: string index out of range .
Срез с двумя параметрами: S[a:b] возвращает подстроку из b — a символов, начиная с символа c индексом a , то есть до символа с индексом b , не включая его. Например, S[1:4] == ‘ell’ , то же самое получится если написать S[-4:-1] . Можно использовать как положительные, так и отрицательные индексы в одном срезе, например, S[1:-1] — это строка без первого и последнего символа (срез начинается с символа с индексом 1 и заканчиватеся индексом -1, не включая его).
При использовании такой формы среза ошибки IndexError никогда не возникает. Например, срез S[1:5] вернет строку ‘ello’ , таким же будет результат, если сделать второй индекс очень большим, например, S[1:100] (если в строке не более 100 символов).
Если опустить второй параметр (но поставить двоеточие), то срез берется до конца строки. Например, чтобы удалить из строки первый символ (его индекс равен 0), можно взять срез S[1:] . Аналогично если опустить первый параметр, то можно взять срез от начала строки. То есть удалить из строки последний символ можно при помощи среза S[:-1] . Срез S[:] совпадает с самой строкой S .
Любые операции среза со строкой создают новые строки и никогда не меняют исходную строку. В Питоне строки вообще являются неизменяемыми, их невозможно изменить. Можно лишь в старую переменную присвоить новую строку.
На самом деле в питоне нет и переменных. Есть лишь имена, которые связаны с какими-нибудь объектами. Можно сначала связать имя с одним объектом, а потом — с другим. Можно несколько имён связать с одним и тем же объектом.
Если задать срез с тремя параметрами S[a:b:d] , то третий параметр задает шаг, как в случае с функцией range , то есть будут взяты символы с индексами a , , и т. д. При задании значения третьего параметра, равному 2, в срез попадет кажый второй символ, а если взять значение среза, равное -1 , то символы будут идти в обратном порядке. Например, можно перевернуть строку срезом S[::-1] .
s = 'abcdefg' print(s[1]) print(s[-1]) print(s[1:3]) print(s[1:-1]) print(s[:3]) print(s[2:]) print(s[:-1]) print(s[::2]) print(s[1::2]) print(s[::-1])
Как удалить символ из строки Python: инструкция
В текстах часто встречаются символы, которые мешают корректной обработке информации. Например, в социальных сетях часто используются смайлы, которые могут мешать анализу текста. В таких случаях удаление символов из строки необходимо для правильной обработки информации. В Python существует несколько способов удаления символов из строк, которые рассмотрим в этой статье.
Удаление символа по индексу
В этом разделе мы рассмотрим способы удаления символов из строки по индексам, а именно:
Как удалить символ из строки с помощью цикла
Вы можете удалить символ из строки в Python, используя цикл:
my_string = "Timeweb 0 cloud"
result_string = ""
index = 8
for i in range(len(my_string)):
if i != index:
result_string += my_string[i]
print(result_string)
В этом примере мы хотим удалить из строки символ «0» c индекс 8. Для этого мы используем цикл for для прохода по символам строки my_string . Затем мы проверяем, совпадает ли i с переменной index , на котором находится элемент, который мы хотим удалить. Если i и index не совпадают, то мы добавляем текущий символ к новой строке result_string . В конце цикла новая строка result_string будет содержать все символы из строки my_string , за исключением символа с индексом 8.
Теперь рассмотрим, как в Python удалить последний символ в строке:
my_string = "Timeweb cloud."
result_string = ""
index = len(my_string)
for i in index-1:
result_string += my_string[i]
print(result_string)
В качестве index можно использовать массив и удалять таким образом не один, а несколько символов:
my_string = "1Timeweb 0cloud"
result_string = ""
index = [0,9]
for i in range(len(my_string)):
if i not in index:
result_string += my_string[i]
print(result_string)
Работа этого отрывка кода аналогична предыдущему, за исключением того, что в этот раз мы проверяем, содержит ли index число i . К слову, точно таким же образом мы можем удалять конкретные символы:
my_string = "1Timeweb 0cloud"
result_string = ""
index = ["0","1"]
for i in my_string:
if i not in index:
result_string += i
print(result_string)
Как удалить символы с помощью среза
Чтобы удалить символы из строки в Python по индексу, можно использовать срезы (slices). Срезы позволяют выбрать часть строки по начальному и конечному индексу. Если вы хотите удалить символы из строки, вы можете воспользоваться срезом.
Например, чтобы удалить символ в строке my_string с индексом n , можно использовать следующую конструкцию:
my_string = my_string[:n] + my_string[n+1:]
Эта конструкция создает новую строку, состоящую из части строки my_string до индекса n , после чего добавляет часть строки my_string после индекса n+1 . Это эквивалентно удалению символа с индексом n :
my_string = "Timeweb 0cloud"
n =8
my_string = my_string[:n] + my_string[n+1:]
print(my_string)
Также с помощью срезов можно удалить несколько подряд идущих символов. Например, чтобы удалить символы с индекса n по m , используйте такую конструкцию:
my_string = my_string[:n] + my_string[m+1:]
В результате вы получите новую строку, состоящую из начальной и конечной частей:
my_string = "Timeweb1111 0 cloud"
n = 7
m = 12
my_string = my_string[:n] + my_string[m+1:]
print(my_string)
replace()
Метод replace() позволяет заменить одни символы в строке на другие. В качестве замены может выступать пустая строка, что будет эквивалентно удалению. Например:
my_string = "Timeweb1111 cloud"
my_string = my_string.replace("1","")
print(my_string)
Чтобы удалить несколько разных символов из строки с помощью replace() , вы можете вызвать этот метод несколько раз, передав в качестве аргументов разные символы. Например:
my_string = "Timeweb1111 0000cloud"
my_string = my_string.replace("1", "").replace("0", "")
print(my_string)
Вы также можете использовать цикл for и функцию replace() , чтобы удалить несколько символов из строки. Например:
my_string = "Timeweb1111 0000cloud"
chars_to_remove = ["1", "0"]
for char in chars_to_remove:
my_string = my_string.replace(char, "")
print(my_string)
translate()
Для удаления символа из строки в Python вы можете использовать метод translate() .
Метод принимает на вход словарь или таблицу перевода и заменяет, в соответствии с входными аргументами, символы в строке. Чтобы удалить символ, вы можете указать пустую строку в качестве значения для этого символа.
Например, это может быть полезно, чтобы удалить сразу несколько символов:
def remove_commas(string):
trans_table =
return string.translate(trans_table)
my_string = "В этой, строке, нет: знаков препинания."
print(remove_commas(my_string))
В этой строке нет знаков препинания
Регулярные выражения
Чтобы удалить символы из строки с помощью регулярных выражений в Python, вы можете использовать метод re.sub() . Этот метод, как и два предыдущих, заменяет символы в строке. На вход он принимает три аргумента: регулярное выражение, строку замены и исходную строку. В качестве результата метод возвращает новую строку, в которой все совпадения регулярного выражения будут заменены. Если нужно удалить символы из строки, то можно использовать пустую строку в качестве строки замены.
Например, этот код удалит все цифры из строки:
import re
my_string = "Hello, World! 123"
my_string = re.sub(r'\d', '', my_string)
print(my_string)
Регулярное выражение \d соответствует любой цифре. Поэтому метод re.sub() заменяет каждую цифру в my_string пустой строкой.
Вы можете также использовать регулярные выражения, чтобы удалить другие типы символов. Например, чтобы оставить в строке только цифры и буквы, можно воспользоваться регулярным выражением \W . Оно соответствует любому символу, который не является буквой или цифрой.
Вот пример, как вы можете использовать это:
import re
string = "Hello, World! 123"
string = re.sub(r'\W', '', string)
print(string)
join()
Последняя функция Python, с помощью которой мы будем удалять символы из строки — join() .
На вход метод join() принимает итерируемые объекты, которыми являются в том числе и строки, и объединяет их в строку. Обычно этот метод применяется для объединения списка в одну строку, но мы воспользуемся им для удаления символа. Например, удалим из строки все цифры с помощью join() :
my_string = '1czech2, prague3'
numbers = "123456789"
result_string = ''.join([char for char in my_string if char not in numbers])
print(result_string)
В этом примере на основе строки my_string создается список из символов, который содержит все символы, кроме цифр. Затем метод join() объединяет элементов списка в одну строку. В результате получается строка czech, prague , в которой все вхождения цифр удалены.
Заключение
В этой статье мы рассмотрели различные способы удаления символов из строки в языке Python. Выделять один конкретный метод из всех перечисленных не имеет смысла. В зависимости от условий стоящей перед вами задачи и потребностей, разные методы будут демонстрировать разную эффективность. Так, например, метод replace() будет наиболее удобен в простых случаях, а регулярные выражения подойдут для более сложных ситуаций.