- Как создать DataFrames Pandas в Python – 7 методов
- Пустой фрейм данных
- Метод – 2: создать фрейм данных с помощью списка
- Метод – 3: Dataframe из dict ndarray / lists
- Метод – 4: Создание фрейма данных индексов с использованием массивов
- Метод – 5: Dataframe из списка dicts
- Метод – 6: с помощью функции zip()
- Метод – 7: из Dicts серии
Как создать DataFrames Pandas в Python – 7 методов
Фрейм данных – это двухмерный набор данных, структура, в которой данные хранятся в табличной форме. Наборы данных упорядочены по строкам и столбцам; мы можем хранить несколько наборов данных во фрейме данных. Мы можем выполнять различные арифметические операции, такие как добавление выбора столбца или строки и столбцов или строк во фрейме данных.
Мы можем импортировать DataFrames из внешнего хранилища; эти хранилища могут быть базой данных SQL, файлом CSV или файлом Excel. Мы также можем использовать списки, словарь, список словаря и т. д.
В этом руководстве мы научимся создавать фрейм данных несколькими способами. Давайте разберемся как создать DataFrames Pandas в Python. Во-первых, нам нужно установить библиотеку pandas в среду Python.
Пустой фрейм данных
Мы можем создать базовый пустой фрейм данных. Для создания DataFrame необходимо вызвать конструктор фрейма данных.
# import pandas as pd import pandas as pd # Calling DataFrame constructor df = pd.DataFrame() print(df)
Empty DataFrame Columns: [] Index: []
Метод – 2: создать фрейм данных с помощью списка
Мы можем создать фрейм данных, используя простой список или список списков. Давайте разберемся в следующем примере.
# importing pandas library import pandas as pd # string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe)
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go
Метод – 3: Dataframe из dict ndarray / lists
Dict ndarray / lists можно использовать для создания фрейма данных, все ndarray должны иметь одинаковую длину. По умолчанию индекс будет диапазоном(n); где n обозначает длину массива.
import pandas as pd # assign data of lists. data = # Create DataFrame df = pd.DataFrame(data) # Print the output. print(df)
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18
Метод – 4: Создание фрейма данных индексов с использованием массивов
Давайте разберемся в примере создания фрейм данных индексов с использованием массивов.
# DataFrame using arrays. import pandas as pd # assign data of lists. data = <'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]># Creates pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # print the data print(df)
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0
В приведенном выше коде мы определили имя столбца с различными названиями автомобилей и их рейтингами. Мы использовали массив для создания индексов.
Метод – 5: Dataframe из списка dicts
Мы можем передать списки словарей в качестве входных данных для создания фрейма данных Pandas. Имена столбцов по умолчанию используются в качестве ключей.
# the example is to create # Pandas DataFrame by lists of dicts. import pandas as pd # assign values to lists. data = [, ] # Creates DataFrame. df = pd.DataFrame(data) # Print the data print(df)
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0
Давайте разберемся в другом примере создания фрейма данных pandas из списка словарей с индексом строки и индексом столбца.
import pandas as pd # assigns values to lists. data = [, ] # With two column indices, values same # as dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # With two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # print the first data frame print(dframe1, "\n") # Print the second DataFrame. print(dframe2)
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN
Рассмотрим пример создания фрейма данных путем передачи списков словарей и строк.
# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # assign values to lists data = [, ] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe)
x y z first 2 NaN 3 second 10 20.0 30
Мы обсудили три способа создания фрейма данных с использованием списков словаря.
Метод – 6: с помощью функции zip()
Функция zip() используется для объединения двух списков. Давайте разберемся в следующем примере.
# The example is to create # pandas dataframe from lists using zip. import pandas as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
[('john', 95),('krish', 63),('arun', 54),('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47
Метод – 7: из Dicts серии
Словарь можно передать для создания фрейма данных. Мы можем использовать Dicts of series, где последующий индекс представляет собой объединение всех серий переданного значения индекса. Давайте разберем на примере.
# Pandas Dataframe from Dicts of series. import pandas as pd # Initialize data to Dicts of series. d = # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe)
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96
В этом руководстве мы обсудили различные способы создания DataFrames.