Три дня чтения в подарок
Зарегистрируйтесь и читайте бесплатно
  • По популярности
  • По новизне
  • Книга Судного дня (1086 год) — одно из самых почитаемых сокровищ Британии — была беспрецедентным, всеобъемлющим источником экономических и демографических сведений об английском народе.
    3
  • Система полагается не на причинно-следственные связи, а на корреляции. Она сообщает, что происходит, а не почему. И это вполне отвечает ее назначению.
  • Сбор информации имеет решающее, но не исчерпывающее значение
  • Есть четыре мощных способа раскрыть альтернативную ценность данных: основное повторное использование, слияние наборов данных, поиск данных «2 в 1» и учет «амортизации» ценности данных.
  • процесс представления явлений в количественном формате для дальнейшего сведения в таблицу и анализа.
  • Мы склонны предполагать причины даже там, где их нет.
  • Датчики, GPS-системы мобильных телефонов, действия на веб-страницах и Twitter пассивно собирают данные, а компьютеры могут с легкостью обрабатывать их.
  • Это временные данные. Просто продолжайте собирать их — и со временем вы станете все лучше и лучше понимать их закономерности», — делится Эциони24.
  • случайность компенсирует размер выборки, стало настоящим открытием, проложившим путь новому подходу к сбору информации.
  • Большие данные диктуют три основных шага к новому образу мышления.
  • Корреляции не могут сказать нам точно, почему происходит то или иное событие, зато предупреждают о том, какого оно рода. И в большинстве случаев этого вполне достаточно.
  • Принимая во внимание гораздо больший объем данных, мы можем снизить свои претензии к точности — и это второй шаг, который будет рассмотрен в третьей главе. Когда возможность измерения ограничена, подсчитываются только самые важные показатели, и стремление получить точное число вполне целесообразно. Вряд ли вы сумеете продать скот покупателю, если он не уверен, сколько голов в стаде — 100 или только 80. До недавнего времени все наши цифровые инструменты были основаны на точности: мы считали, что системы баз данных должны извлекать записи, идеально соответствующие нашим запросам, равно как числа вносятся в столбцы электронных таблиц.
  • Вместо этого рассматривается применение математических приемов к большому количеству данных для прогноза вероятностей
  • То же самое и с большими данными: изменяя количество, мы меняем суть.
  • ценность данных не уменьшается по мере их потребления. Данные можно обрабатывать снова и снова.