Download - Работа с данными в Google таблицах
![Page 1: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/1.jpg)
Таблицы Google как наиболее удобный инструмент для
начинающих дата-журналистов
Мастер-класс
19 сентября 2013 г.
![Page 2: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/2.jpg)
Таблицы:
• Google (бесплатное ПО)
• Open/Libre Office (бесплатное ПО)
• MS Excel (платное ПО)
![Page 3: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/3.jpg)
Чтобы работать с Google таблицами, необходимо завести аккаунт Google
![Page 4: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/4.jpg)
Google документы:
Допускают совместную работу над таблицей онлайн.
Если вдруг оборвалась связь с
интернетом, то работать с документом невозможно.
Можно включить возможность автономной работы.
![Page 5: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/5.jpg)
![Page 7: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/7.jpg)
![Page 8: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/8.jpg)
Форматы, с которыми можно работать в таблицах:
![Page 9: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/9.jpg)
Импорт файла в Google таблицу
![Page 10: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/10.jpg)
Импорт файла в Google таблицу
![Page 11: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/11.jpg)
Готово
Примечание: Если таблица отказывается импортировать файл .xls, ссылаясь на то, что это неизвестный ей формат, можно попробовать открыть этот файл в таблице Excel или Open/Libre Calc и сохранить его, например, в версии 97-2003.
![Page 12: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/12.jpg)
Важно: До начала обработки данных обязательно нужно сделать копию документа, чтобы исходный вариант на всякий случай тоже сохранился.
![Page 13: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/13.jpg)
Как правило, данные в таблице бывают отформатированы. Удобства ради уберем форматирование, чтобы видеть таблицу в чистом виде.
![Page 14: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/14.jpg)
![Page 15: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/15.jpg)
Готово
![Page 16: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/16.jpg)
Теперь смотрим на данные
![Page 17: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/17.jpg)
Продолжаем смотреть на данные
Что делать?
![Page 18: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/18.jpg)
Что делать с отсутствующими данными?
• Это всегда зависит от конкретной ситуации.
• Отсутствие данных может быть поводом провести расследование именно по этому вопросу.
• Можно попробовать обратиться в ведомства, отвечающие за публикацию этих данных, и запросить недостающую информацию.
• Можно попробовать поискать наборы данных по той же теме в других источниках.
![Page 19: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/19.jpg)
Что делать с отсутствующими данными?
• В ряде случаев, когда речь идет об общих тенденциях и соотношениях, отсутствием данных можно пренебречь: например, вообще не рассматривать данные за определенный период, а исследовать тот период, для которого все данные есть.
• Аналитики в применении к некоторым случаям могут сопоставлять просто последние имеющиеся данные для каждого случая.
![Page 20: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/20.jpg)
Важно: все допущения в работе с данными желательно фиксировать в
таблице – например, в форме комментария.
![Page 21: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/21.jpg)
В нашем случае данных за 2010 и 2011 гг. существенно меньше, чем за прочие годы. Попробуем посмотреть тот период, за который у нас больше данных.
![Page 22: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/22.jpg)
Выделяем нужную область, копируем её (Ctrl+C), создаем новую вкладку в таблице и вставляем туда то, что скопировали (Ctrl+V)
![Page 23: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/23.jpg)
Подсчёты
![Page 24: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/24.jpg)
Сортировка
![Page 25: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/25.jpg)
В нашем случае рассортируем страны по признаку общей численности самоубийств от максимальных показателей к минимальным.
![Page 26: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/26.jpg)
![Page 27: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/27.jpg)
Теперь у нас есть рассортированные данные, и мы можем сосредоточиться на странах с максимальными и минимальными значениями. К примеру, можно сопоставить эти показатели с другими индикаторами благополучия/неблагополучия. Например, ВВП, продолжительность жизни, уровень безработицы и т.д.
![Page 28: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/28.jpg)
Забегая вперед, скажу, что во многих случаях из тех, с которыми мы хотим сопоставить наши данные, отсутствуют значения за 2004 г. Также по ряду стран некоторые данные представлены очень неполно. Набор стран, с которыми мы в дальнейшем будем работать, обусловлен и этими факторами.
![Page 29: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/29.jpg)
За 2005 год отсутствуют данные по Италии. В порядке допущения внесем в ячейку тот же показатель, что в 2006 г. (необходимо это указать).
![Page 30: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/30.jpg)
Теперь попробуем соотнести это с другими показателями, как-то:
• Продолжительность жизни
• ВВП
• Уровень безработицы
• Бюджет на социальные нужды
• Бюджет на пособия по безработице
![Page 31: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/31.jpg)
Проблема:
Как представить несколько измерений в одной таблице, а в дальнейшем – и в виде двухмерной визуализации?
![Page 32: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/32.jpg)
Одно из возможных решений – представить данные в виде интерактивной динамической схемы
https://docs.google.com/spreadsheet/ccc?key=0AofhFA7uQyz0dEwxMGE2QWpsNUtpbDhmN0U3cXJ0MXc#gid=0
![Page 33: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/33.jpg)
Динамическую схему (motion chart) разработал Ханс Рослинг (Hans Rosling), шведский врач и статистик.
Выступления Рослинга (в том числе презентация динамической схемы) на конференции TED:
http://www.ted.com/speakers/hans_rosling.html
![Page 34: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/34.jpg)
В свою очередь, сводная таблица должна выглядеть примерно так:
![Page 35: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/35.jpg)
Задача: преобразовать нашу таблицу в таблицу такого вида
![Page 36: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/36.jpg)
Data Wrangler
Это можно легко сделать при помощи бесплатной программы Data Wrangler, которая работает онлайн.
http://vis.stanford.edu/wrangler/
![Page 37: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/37.jpg)
Data Wrangler
1. Для удобства в дальнейшем вернем сортировку стран по алфавиту. После чего копируем таблицу.
2. Включаем Data Wrangler:
![Page 38: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/38.jpg)
Data Wrangler
3.Вставляем скопированное в открывшееся окно и нажимаем “Wrangle”.
![Page 39: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/39.jpg)
Data Wrangler
![Page 40: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/40.jpg)
Data Wrangler
4. Фиксируем заглавную строку
![Page 41: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/41.jpg)
Data Wrangler
5. Перераспределяем данные
![Page 42: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/42.jpg)
Data Wrangler 6. Экспортируем (для вставки в таблицу – лучше всего в виде Tab-Separated Values)
![Page 43: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/43.jpg)
Data Wrangler
![Page 44: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/44.jpg)
7. Вставляем результат в таблицу
Data Wrangler
![Page 45: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/45.jpg)
Дальнейшие шаги
• Аналогичным образом обрабатываем нужные нам данные из других таблиц.
• Всё нужное собираем в единую сводную таблицу.
![Page 46: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/46.jpg)
Визуализация
Выделяем таблицу и вызываем диалог построения диаграмм.
![Page 47: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/47.jpg)
Выбираем динамическую схему и нажимаем «Вставить»
![Page 48: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/48.jpg)
Если щелкнуть по белому полю диаграммы, то в правом верхнем углу появится треугольник, щелкнув по которому можно вызвать меню.
![Page 49: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/49.jpg)
В частности, можно получить код для публикации схемы на html-странице
![Page 50: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/50.jpg)
Можно также переместить диаграмму на отдельный лист
![Page 51: Работа с данными в Google таблицах](https://reader031.vdocuments.us/reader031/viewer/2022013102/54778f83b4af9f261c8b473b/html5/thumbnails/51.jpg)
Ссылки:
• Таблица, которая была создана в итоге: https://docs.google.com/spreadsheet/ccc?key=0AofhFA7uQyz0dEwxMGE2QWpsNUtpbDhmN0U3cXJ0MXc#gid=0
• Google Диск: https://drive.google.com
• Data Wrangler: http://vis.stanford.edu/wrangler/