Перейти к основному разделу
Чат
  • Укр
  • Рус

Уведомления

Подать объявление
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
Книга Big Data Большие данные - системы в реальном времени Марц Уоррен
РекламироватьПоднять

Частное лицо

Состояние: Б/у

OLX Доставка

Описание

Книга в твердой обложке, увеличенного формата, издательство Вильямс Манниг.

  • Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени, Натан Марц, Джеймс Уоррен — 368 страниц, читалась (слегка б/у состояние)


  • О книге Большие данные: принципы и практика построения масштабируемых систем обработки данных в реальном времени
    Содержание
    Глава 1. Новая парадигма для больших данных
    Глава 2. Модель данных для больших данных
    Глава 3. Иллюстрация модели данных для больших данных
    Глава 4. Хранение данных на уровне пакетной обработки
    Глава 5. Иллюстрация хранения данных на уровне пакетной обработки
    Глава 6. Уровень пакетной обработки
    Глава 7. Иллюстрация уровня пакетной обработки
    Глава 8. Пример построения уровня пакетной обработки: архитектура и алгоритмы
    Глава 9. Пример реализации уровня пакетной обработки
    Глава 10. Организация уровня обслуживания
    Глава 11. Иллюстрация уровня обслуживания
    Глава 12. Представления в реальном времени
    Глава 13. Иллюстрация представлений в реальном времени
    Глава 14. Организация очередей и обработка потоков
    Глава 15. Иллюстрация организации очередей и обработки потоков
    Глава 16. Микропакетная обработка потоков
    Глава 17. Иллюстрация микропакетной обработки потоков
    Глава 18. Лямбда-архитектура в деталях
    Предметный указатель

    В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.
    Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике.
    В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур.
    Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб.
    В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL.
    В этой рассматриваются следующие темы:
    Введение в системы больших данных.
    Описание особенностей обработки данных масштаба веб в реальном времени.
    Применение инструментальных средств вроде Hadoop, Cassandra и Storm.
    Возможность расширить свои знания и навыки за пределы традиционных баз данных.
    Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.

    О книге Анализ больших наборов данных
    Краткое содержание

    Предисловие

    Глава 1. Добыча данных – вводные понятия: статистическое моделирование, машинное обучение, выделение признаков, статистические ограничения (принцип Бонферрони), базовые математические сведения.
    Глава 2. MapReduce и программный стек – распределённые файловые системы, основы MapReduce, примеры применения (матрицы, реляционная алгебра), обобщения (Pregel), модель коммуникационных затрат и теория сложности MapReduce.
    Глава 3. Поиск похожих объектов – метрики сходства (Жаккар, косинусное, Хэмминга и др.), шинглы, минхэш, локально-чувствительное хэширование (LSH), приложения (сравнение документов, отпечатков, новостей).
    Глава 4. Анализ потоков данных – потоковая модель, выборка, фильтр Блума, подсчёт различных элементов, моменты, алгоритмы для скользящих и затухающих окон.
    Глава 5. Анализ ссылок – PageRank и его варианты, эффективные вычисления, тематический PageRank, борьба со ссылочным спамом, TrustRank, HITS (хабы и авторитетные страницы).
    Глава 6. Частые предметные наборы – модель корзины покупок, алгоритмы Apriori, PCY, SON, методы для больших данных и потоков.
    Глава 7. Кластеризация – методы кластеризации (иерархическая, k-средних, BFR, CURE, GRGPF), работа в потоковых и параллельных средах, проклятие размерности.
    Глава 8. Реклама в Интернете – постановка задач онлайн-рекламы, алгоритмы размещения объявлений, задача о ключевых словах, алгоритмы типа Balance, реализация Adwords.
    Глава 9. Рекомендательные системы – матрица предпочтений, рекомендации на основе содержимого и коллаборативной фильтрации, понижение размерности (UV-декомпозиция), задача Netflix.
    Глава 10. Анализ графов социальных сетей – представление социальных сетей как графов, методы поиска сообществ (кластеризация, разрезание, алгоритм Гирвана-Ньюмана), SimRank, подсчёт треугольников, транзитивное замыкание, анализ окрестностей.
    Глава 11. Понижение размерности – собственные значения и векторы, метод главных компонент (PCA) и его использование.

    Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining).
    В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых редметных наборов и кластеризация.
    Во второе издание включен дополнительный материал о социальных сетях,
    машинном обучении и понижении размерности.
    ID: 898753687

    Связаться с продавцом

    Андрій

    на OLX с июль 2019 г.

    Онлайн 14 января 2026 г.

    Опубликовано 01 января 2026 г.

    Книга Big Data Большие данные - системы в реальном времени Марц Уоррен

    440 грн.

    Местоположение

    Возвраты

    Уверенность в каждой покупке

    Вы можете бесплатно вернуть товар при получении, если он не соответствует вашим ожиданиям. Подробнее

    Бесплатное приложение для твоего телефона