Карау Х., Конвински Э., Венделл П., Захария М. - Изучаем Spark (2015)
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Предисловие 10
Вступление 11
Глава 1. Введение в анализ данных с помощью Spark 18
Глава 2. Загрузка и настройка Spark 27
Глава 3. Программирование операций с RDD 42
Глава 4. Работа с парами ключ/значение 69
Глава 5. Загрузка и сохранение данных 97
Глава 6. Дополнительные возможности Spark 130
Глава 7. Выполнение в кластере 150
Глава 8. Настройка и отладка Spark 178
Глава 9. Spark SQL 202
Глава 10. Spark Streaming 226
Глава 11. Машинное обучение с MLlib 261
Предметный указатель 293
Название: Изучаем Spark
Автор: Карау Х., Конвински Э., Венделл П., Захария М.
Год: 2015
Жанр: программирование
Издательство: ДМК Пресс
Язык: Русский
Формат: pdf
Качество: Отсканированные страницы + слой распознанного текста
Страниц: 303
Размер: 16 MB
Скачать Карау Х., Конвински Э., Венделл П., Захария М. - Изучаем Spark (2015)
Скачать Skymonk по прямой ссылке