Файлы к уроку:
Ссылки:
Описание
В этом уроке:
- Операции над столбцами датафрейма
- Импорт данных из DataFrame
- Переименование столбцов
- Добавление новых столбцов
- Изменение существующего столбца
- Удаление столбцов
Решение
Чтение CSV
# Чтение CSV
rus_alc = pd.read_csv('data.csv')
rus_alc[:4]
Переименование столбцов
# Создадим новую переменную
rus_alc_2 = rus_alc.rename(columns={'region': 'federal_subject'})
rus_alc_2[:2]
# Переименовать без создания новых переменных
rus_alc.rename(columns={'region': 'federal_subject'},
inplace=True)
rus_alc[:2]
Добавление новых столбцов
# Добавим новый столбец
rus_alc_c['total_spirit'] = (rus_alc_c['wine']
+ rus_alc_c['beer']
+ rus_alc_c['vodka']
+ rus_alc_c['champagne']
+ rus_alc_c['brandy'])
rus_alc_c[:4]
# Создать столбец с указанием места для этого столбца
rus_alc_c.insert(7, 'soft_total', (rus_alc_c['wine']
+ rus_alc_c['beer']
+ rus_alc_c['champagne']))
rus_alc_c[:2]
Изменить существующий столбец
# Изменить существующий столбец
rus_alc_c['total_spirit'] = rus_alc_c['total_spirit'].round()
rus_alc_c[:4]
Создать столбец из серии
# Создать серию со случайными значениями
np.random.seed(123456)
s_random = pd.Series(np.random.normal(size=1615),
index=rus_alc_c.index)
# Добавить столбец из серии
rus_alc_c.loc[:, 'sample_col'] = s_random
Расположить столбцы в обратном порядке
# Имена столбцов в обратном порядке
cols = rus_alc_c.columns[::-1]
# Расположить столбцы в обратном порядке
rus_alc_c[cols][:4]
Удаление столбцов
del удаляет серию из объекта DataFrame.
pop() удаляет и возвращает в результате серию.
drop() возвращает новый датафрейм с удаленным столбцом.
# Удаляем столбец
del rus_alc_c_1['sample_col']
rus_alc_c_1[:3]
# pop
poped_s = rus_alc_c_2.pop('sample_col')
poped_s[:3]
# Получим новый датафрейм с удаленным столбцом sample_col
dropped_df = rus_alc_c_3.drop(['sample_col'],
axis=1)
dropped_df[:3]
Примененные функции
- pandas.read_csv
- pandas.DataFrame.rename
- pandas.DataFrame.insert
- pandas.DataFrame.round
- pandas.Series
- numpy.random.seed
- numpy.random.normal
- pandas.DataFrame.copy
- pandas.DataFrame.pop
- del
- pandas.DataFrame.drop
Курс Pandas Базовый
Номер урока | Урок | Описание |
---|---|---|
1 | Pandas Базовый №1. Создание DataFrame и запись в CSV | Познакомимся с объектом DataFrame. Научимся его создавать двумя разными способами и научимся записывать его в файл. |
2 | Pandas Базовый №2. Создание DataFrame 2 | Изучим еще несколько способов создания объекта DataFrame. В этом уроке мы создадим DataFrame из массива numpy, Series, словаря Series. |
3 | Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV | Получить информацию о размере DataFrame, отбор строк и столбцов, индексация. |
4 | Pandas Базовый №4. Операции со столбцами DataFrame | Операции со столбцами в Pandas. Переименование столбцов, добавление новых столбцов, изменить существующий столбец, удаление столбцов. |
5 | Pandas Базовый №5. Операции со строками | Объединение по вертикали методами append и concat, Создание строк вручную, Удаление строк методом drop, Фильтрация строк условием или срезом. |
6 | Pandas Базовый №6. Индексы | Зачем нужны индексы, Как задать индекс, Как пользоваться индексами. |
7 | Pandas Базовый №7. Категории | Что такое категориальные переменные. |