Перевернуть строку си шарп

How to reverse a string in C#

Many candidates are rejected or down-leveled due to poor performance in their System Design Interview. Stand out in System Design Interviews and get hired in 2023 with this popular free course.

The algorithm to reverse a string in C# is as follows:

  1. Convert the string into an array of characters using the ToCharArray() method.
  2. Reverse the character array using Array.Reverse method.
  3. Create a new string from the reversed array. This will result in reversing the original string.

Example

Let’s write the C# program to reverse the string.

using System;
class ReverseString
static void Main(string[] args)
string str = "Educative";
char[] stringArray = str.ToCharArray();
Array.Reverse(stringArray);
string reversedStr = new string(stringArray);
Console.Write($"Actual String is : \n");
Console.Write($"Reversed String is : ");
>
>

Explanation

Here’s the explanation for the code above.

  • Line 6: We’ll create a string variable with the name str and assign it a value Educative .
  • Line 7: We’ll use the ToCharArray() method to convert the string to a character array and store it in the variable stringArray .
  • Line 8: We’ll use the Array.reverse() method to reverse the stringArray .
  • Line 9: We’ll create a new string variable reversedStr from the stringArray . The reversedStr contains the original string in reverse.

Learn in-demand tech skills in half the time

Источник

О разворачивании строк в .Net/C# и не только

Давайте поговорим о строках, точнее об их переворачивании средствами .Net/C#. Так уж сложилось, что в стандартной библиотеке соответсвующей функции не наблюдается. И как мне подсказывают, написание функции обращения строки довольно популярный вопрос на собеседованиях при приеме на работу. Давайте посмотрим, как можно эффективно перевернуть строку средствами данной платформы.

Под катом приведен сравнительный анализ быстродействия разных методов переворачивания строки.

Кхрр-р-р… — сказала бензопила.
Тююю… — сказали мужики.
© Старый анекдот.

Ну что ж, начнем. Все реализации проверялись на быстродействие с одной строкой размером 256 мегабайт (128×1024×1024 символа) и 1024×1024 строками размером 256 байт (128 символов). Перед каждым замером форсировалась сборка мусора (что важно при таком размере тестовых данных), замер проводился 50 раз, 20 крайних отбрасывались, остальные значения усреднялись. Условными попугаями было выбрано количество тиков, выдаваемое объектом класса Stopwatch.

Тест проводился на двух компьютерах: Athlon64 x2 4200+, 2GB Dual-Channel DDR2 RAM и Pentium4 HT 3GHz, 3GB DDR RAM. Главным отличием между конфигурациями в данном тесте является быстродействие связки память-кэш — вторая система в этом отношении заметно медленнее.

С техническими формальностями покончено, теперь перейдем к собственно реализациям. Для большей наглядности, здесь не учтены unicode surrogate code points. Рассматривать подходы будем в порядке логичности и «красивости» реализации в контексте окружающей ее «экосистемы».

Сравнительные результаты замеров находятся в последней части этой заметки. Оптимальной в общем случае оказалась функция ReverseUnsafeCopy, если же ограничиваться только safe code — ReverseArrayManual. Если необходим safe code и огромные строки — прийдется мучаться с ReverseStringBuilder.

Часть первая: «нормальные» методы.

1. ReverseStringBuilder

Будем следовать рекомендациям и для построения «большой» строки возьмем специальный инструмент — класс StringBuilder. Идея проста до ужаса: создаем builder нужного размера и идем по строке в обратном порядке, добавляя символы в новую строку.

Пробуем, запускаем, да… Как-то медленно работает это все, будем копать дальше.

2. ReverseArrayFramework

Ха! Так этот билдер же обставлен проверками для обеспечения потокобезопасности со всех сторон, не, нам такое не надо. Но строка — это ведь массив сиволов. Так давайте его и перевернем, а результат преобразуем обратно в строку:

Совсем другое дело, получилось в 3.5 раза быстрее. Хм, а может можно еще лучше?

3. ReverseArrayManual

Так, думаем. Во-первых у нас данные копируются дважы: сначала из строки в массив, потом внутри массива. Во-вторых Array.Reverse — библиотечный метод, значит в нем есть проверки входных данных. Более того, для атомарных типов он явно реализован в виде native метода, а это дополнительное переключение контекста выполнения. Попробуем перевернуть строку в массив вручную:

  1. static string ReverseArrayManual( string originalString)
  2. char [] reversedCharArray = new char [originalString.Length];
  3. for ( int i = originalString.Length — 1 ; i > — 1 ; i—)
  4. reversedCharArray[originalString.Length — i — 1 ] = originalString[i];
  5. return new string (reversedCharArray);
  6. >
4. ReverseManualHalf

Идем дальше. У нас же действия симметричны относительно середины строки, значит можно пустить два индекса навстречу и ученьшить количество итераций вдвое:

  1. static string ReverseManualHalf( string originalString)
  2. char [] reversedCharArray = new char [originalString.Length];
  3. int i = 0 ;
  4. int j = originalString.Length — 1 ;
  5. while (i
  6. reversedCharArray[i] = originalString[j];
  7. reversedCharArray[j] = originalString[i];
  8. i++; j—;
  9. >
  10. return new string (reversedCharArray);
  11. >

Хм… Что-то пошло не так, на системе с медленной памятью скорость упала в полтора раза. Учитывая специфику конфигураций и реализации, можем предположить, что виноваты скорость памяти и кэш процессора: раньше мы работали с двумя отдаленными областями памяти одновременно, теперь их стало четыре, соответсвенно подхват данных выполняется чаще.

LINQ и метод Reverse

Есть еще относительно красивый и короткий способ с LINQ, но он не выдерживает никакой критики в плане производительности — работает в 3-3.5 раза медленнее метода на базе StringBuilder. Виной тому прокачивание данных через IEnumerable и виртуальный вызов на каждую итерацию. Для желающих, ниже приведена реализация:

Использование памяти

Проблема не столь критичная в большинстве случаев, но все «быстрые» из рассмотренных методов делают промежуточную копию строки в виде массива символов. На синтетических тестах это проявляется в том, что обернуть строку размером 512МБ смог только первый метод, остальные свалились по System.OutOfMemoryException. Также, не следует забывать, что лишние временные объекты повышают частоту срабатывания GC, а он хоть и оптимизирован до ужаса, но все-равно время кушает. В следующей части будем кроме скоростных оптимизаций также искать решение этой проблемы.

Часть вторая: когда хочется быстрее и эффективнее, или unsafe code.

Использование unsafe кода дает нам одно интересное преимущество: строки, которые раньше были immutable, теперь можно менять, но нужно быть предельно осторожным и изменять только копии строк — библиотека минимизирует количество копий одной строки, а вместе с интернированием строк это может привести к печальным последствиями для приложения.

Итак, создав новую строку нужного размера, мы можем смотреть на нее, как на массив и заполнить нужными данными. Ну и не стоит забывать об отстутствии проверок на валидность индексов, что тоже ускорит работу кода. Однако в силу специфики строк в .Net, мы не можем вот так просто создать строку нужной длины. Можно либо сделать строку из повторяющегося символа (например проблела) при помощи конструктора String(char, int), либо скопировать исходную строку используя String.Copy(String).

Вооружившись этими знаниями пишем следующие две реализации.

5. ReverseUnsafeFill

Делаем строку из пробелов и заполняем ее в обратном порядке:

  1. static unsafe string ReverseUnsafeFill( string str)
  2. if (str.Length
  3. String copy = new String ( ‘ ‘ , str.Length);
  4. fixed ( char * buf_copy = copy)
  5. fixed ( char * buf = str)
  6. int i = 0 ;
  7. int j = str.Length — 1 ;
  8. while (i
  9. buf_copy[i] = buf[j];
  10. buf_copy[j] = buf[i];
  11. i++; j—;
  12. >
  13. >
  14. >
  15. return copy;
  16. >
6. ReverseUnsafeCopy

Копируем и переворачиваем строку:

  1. static unsafe string ReverseUnsafeCopy( string str)
  2. if (str.Length
  3. char tmp;
  4. String copy = String .Copy(str);
  5. fixed ( char * buf = copy)
  6. char * p = buf;
  7. char * q = buf + str.Length — 1 ;
  8. while (p < q)
  9. tmp = *p;
  10. *p = *q;
  11. *q = tmp;
  12. p++; q—;
  13. >
  14. >
  15. return copy;
  16. >

Как показали замеры, вторая версия работает заметно быстрее на медленной памяти и слегка медленнее на быстрой 🙂 Причин видимо несколько: оперирование двумя отдаленными областями памяти вместо четырех и различие в скорости копирования блока памяти и простого его заполнения в цикле. Желающие могут попробовать сделать версию ReverseUnsafeFill с полным проходом (это может уменьшить число захватов данных из памяти в кэш) и испытать ее на медленной памяти, однако у меня есть основания считать, что это будет все-равно медленнее ReverseUnsafeCopy (хотя могу и ошибаться).

7. ReverseUnsafeXorCopy

А что дальше? Ходят слухи, что обмен при помощи оператора XOR работает быстрее копирования через третью переменную (кстати в плюсах это еще и смотрится довольно красиво: «a ^= b ^= a ^= b;», в C#, увы, такая строка не cработает). Ну что, давайте проверим на деле.

  1. static unsafe string ReverseUnsafeXorCopy( string str)
  2. if (str.Length
  3. String copy = String .Copy(str);
  4. fixed ( char * buf = copy)
  5. char * p = buf;
  6. char * q = buf + str.Length — 1 ;
  7. while (p < q)
  8. *p ^= *q;
  9. *q ^= *p;
  10. *p ^= *q;
  11. p++; q—;
  12. >
  13. >
  14. return copy;
  15. >

В итоге получается в 1.2-1.5 раза медленнее обмена копированием. Трюк, работавший для быстрого обмена значений на регистрах, для переменных себя не оправдал (что характено, во многих компиляторах С/С++ он тоже выиграша не дает).

В поисках объяснения этого факта полезем внутрь приложения и почитаем результирующий CIL код.

Часть третья: лезем в CIL и коды библиотек .Net.

Почему обмен через XOR оказался хуже

Для получения ответа на этот вопрос стоит посмотреть на CIL-код, сгенерированный для двух способов обмена. Чтоб эти инструкции казались понятнее, поясню их назначение: ldloc.N — загружает на стек локальную переменную под номером N, stloc.N — считывает верхушку стека в локальную переменную номер N, xor — вычисляет значение операции XOR для двух значений наверху стека и загружает результат на стек вместо них.

  1. int a, b;
  2. int tmp = a;
  3. a = b;
  4. b = tmp;
  1. int a, b;
  2. a ^= b;
  3. b ^= a;
  4. a ^= b;
Как работает Array.Reverse?

Ну и пока мы смотрим на внутренности сборок рефлектором, есть смысл взглянуть на реализацию библиотечных методов, использованных в первой части. Особняком здесь стоит Array.Reverse, который опирается на некую функцию Array.TrySZReverse, реализованную в виде native метода. Итак качаем Shared Source Common Language Infrastructure 2.0 — исходник .net 2.0 и смотрим, что ж это за зверь такой 🙂 После недолгих поисков, в файле «sscli20\clr\src\vm\comarrayhelpers.h» находится шаблонная функция Reverse (в данном случае KIND будет соответствовать UINT16), которая (сюрприз!) до ужаса похожа на реализацию ReverseUnsafeCopy.

  1. static void Reverse( KIND array[], UNIT32 index, UNIT32 count)
  2. LEAF_CONTRACT;
  3. _ASSERTE(array != NULL);
  4. if (count == 0)
  5. return ;
  6. >
  7. UNIT32 i = index;
  8. UNIT32 j = index + count — 1 ;
  9. while (i < j)
  10. KIND temp = array[i];
  11. array[i] = array[j];
  12. array[j] = temp;
  13. i++;
  14. j—;
  15. >
  16. >

Часть четвертая: результаты бинарного марафона.

Анализ результатов замеров приведен в первых двух частях, здесь же изображены лишь сравнительные диаграммы отображающие отношение быстродействия рассмотренных выше функций. Точные числа в «ticks» слишком зависят от конфигурации и вряд-ли представляют особый интерес, все желающие могут самостоятельно замерить быстродействие используя предоставленные куски кода.

Сравнение лучших методов из первых двух частей

На быстрой памяти
Image and video hosting by TinyPic
На медленной памяти
Image and video hosting by TinyPic

Сравнение всех методов в Debug и Release конфигурациях на быстрой памяти

Большие строки
Image and video hosting by TinyPic
Короткие строки
Image and video hosting by TinyPic

Сравнение всех методов в Debug и Release конфигурациях на медленной памяти

Большие строки
Image and video hosting by TinyPic
Короткие строки
Image and video hosting by TinyPic

Источник

Читайте также:  Javascript xmlhttprequest post json
Оцените статью