Файлы к уроку:
Ссылки:
Описание
В этом уроке:
- Импорт CSV
- Получить список столбцов DataFrame
- Узнать количество строк, столбцов и значений в DataFrame
- Отбор строк и столбцов DataFrame
- Срезы DataFrame
Решение
Сначала импортируем модуль pandas.
import pandas as pd
Импортируем данные из двух CSV файлов.
rus_alc = pd.read_csv('alc.csv')
kino = pd.read_csv('kino.csv',
index_col='movie')
Получить названия столбцов и строк.
rus_alc.columns
rus_alc.index
Информация о размерности датафрейма.
# Количество строк
len(rus_alc)
# Количество строк и столбцов
rus_alc.shape
# Количество значений
rus_alc.size
2 способа извлечь столбец по его названию.
# Получить столбец
rus_alc['year'][:3]
rus_alc.year[:3]
Таким образом мы получаем серию.
# Получаем столбец в виде серии
type(rus_alc['year'])
Получить более 1 столбца. Результат будет уже не серией, а датафреймом.
# Получить более 1 столбца
rus_alc[['year', 'region', 'vodka', 'brandy']][:2]
Получить 1 строку по индекса. Результат тоже будет серией.
# Отбор строк по индексу
kino.loc['Брат']
Отобрать более 1 строки.
# Отбираем более 1 строки
kino.loc[['Иди и смотри', 'Иван Васильевич меняет профессию']]
Отбор строк по индексу позиции.
# Отбор строк по позициям
kino.iloc[[0, 9]]
Получаем позицию по значению индекса.
# Получаем позиции по значению индекса
kino.index.get_loc('Москва слезам не верит')
Создание срезов.
# Первые 3 строки
rus_alc[:3]
# Последние 3 строки
rus_alc[-3:]
# Только последняя строка
rus_alc[-1:]
# Срез по значению индекса
kino['Иван Васильевич меняет профессию':'Иди и смотри']
Логический отбор строк.
# Пример bool серии
rus_alc['year'] >= 2000
# Отбор строк
rus_alc[rus_alc['year'] >= 2000]
# Более 1 условия
rus_alc[(rus_alc['year'] >= 2000) &
(rus_alc['region'] == 'Moscow Oblast')]
Отбор строк и столбцов одновременно.
kino.loc[['Иван Васильевич меняет профессию', 'Москва слезам не верит'],
['year', 'country']]
Примененные функции
- pandas.read_csv
- pandas.Series.str.rstrip
- len
- type
Курс Pandas Базовый
Номер урока | Урок | Описание |
---|---|---|
1 | Pandas Базовый №1. Создание DataFrame и запись в CSV | Познакомимся с объектом DataFrame. Научимся его создавать двумя разными способами и научимся записывать его в файл. |
2 | Pandas Базовый №2. Создание DataFrame 2 | Изучим еще несколько способов создания объекта DataFrame. В этом уроке мы создадим DataFrame из массива numpy, Series, словаря Series. |
3 | Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV | Получить информацию о размере DataFrame, отбор строк и столбцов, индексация. |
4 | Pandas Базовый №4. Операции со столбцами DataFrame | Операции со столбцами в Pandas. Переименование столбцов, добавление новых столбцов, изменить существующий столбец, удаление столбцов. |
5 | Pandas Базовый №5. Операции со строками | Объединение по вертикали методами append и concat, Создание строк вручную, Удаление строк методом drop, Фильтрация строк условием или срезом. |
6 | Pandas Базовый №6. Индексы | Зачем нужны индексы, Как задать индекс, Как пользоваться индексами. |
7 | Pandas Базовый №7. Категории | Что такое категориальные переменные. |