Файлы к уроку:
Ссылки:
Описание
В этом уроке:
- Почему нужно использовать индекс
- Какие бывают типы индексов
- Как работать с индексами
- Иерархическая индексация
Решение
Почему может пригодиться индекс
Если требуется отбор строк по значениям в столбце, то если этот столбец назначить индексом, то отбор будет выполняться в разы быстрее.
Типы индексов
- Названия столбцов — это индекс столбцов
- Int64Index
- RangeIndex
- Float64Index
- CategoricalIndex
- DatetimeIndex
- PeriodIndex
Отбор строк по значениям индекса
# Ищем по индексу
games.loc['Sports']
# Срез
usdrub_mean['2010-01':'2020-12']
# Срез с использованием loc
usdrub_mean.loc['2015-01':'2020-12']
# Отбор нескольких строк по метке
usdrub_mean.loc[['2010-12', '2015-12', '2020-12']]
Убрать из индекса / Добавить в индекс
# Убрать индекс
games = games.reset_index()
# Назначить Genre индексом
games = games.set_index('Genre')
Индексация сразу двумя столбцами
# Индексация сразу двумя столбцами
games_multi_idxs = games.set_index(['Genre', 'Platform'])
games_multi_idxs = games_multi_idxs.sort_index()
# Получаем все строки со вторым индексом PC
games_multi_idxs.xs('PC',
level=1)
# То же самое, но оставляя столбец индекса на своем месте
games_multi_idxs.xs('PC',
level=1,
drop_level=False)
# Отбираем по двум индексам
games_multi_idxs.xs('Strategy').xs('PC')
# То же самое с использованием кортежей
games_multi_idxs.xs(('Strategy', 'PC'))
Примененные функции
- pandas.read_csv
- pandas.DataFrame.set_index
- numpy.arange
- pandas.DataFrame.fillna
- pandas.DataFrame.astype
- pandas.DataFrame.drop_duplicates
- pandas.Series.tolist
- pandas.Series.cat.set_categories
- pandas.to_datetime
- pandas.DataFrame.resample
- pandas.DatetimeIndex.to_period
- pandas.DataFrame.reset_index
- pandas.DataFrame.sort_index
- pandas.Index.get_level_values
- pandas.DataFrame.xs
Курс Pandas Базовый
Номер урока | Урок | Описание |
---|---|---|
1 | Pandas Базовый №1. Создание DataFrame и запись в CSV | Познакомимся с объектом DataFrame. Научимся его создавать двумя разными способами и научимся записывать его в файл. |
2 | Pandas Базовый №2. Создание DataFrame 2 | Изучим еще несколько способов создания объекта DataFrame. В этом уроке мы создадим DataFrame из массива numpy, Series, словаря Series. |
3 | Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV | Получить информацию о размере DataFrame, отбор строк и столбцов, индексация. |
4 | Pandas Базовый №4. Операции со столбцами DataFrame | Операции со столбцами в Pandas. Переименование столбцов, добавление новых столбцов, изменить существующий столбец, удаление столбцов. |
5 | Pandas Базовый №5. Операции со строками | Объединение по вертикали методами append и concat, Создание строк вручную, Удаление строк методом drop, Фильтрация строк условием или срезом. |
6 | Pandas Базовый №6. Индексы | Зачем нужны индексы, Как задать индекс, Как пользоваться индексами. |
7 | Pandas Базовый №7. Категории | Что такое категориальные переменные. |