1С-Предприятие 8.0. Практическое пособие разработчика

       

Общие сведения об анализе и прогнозировании данных


В общем случае анализ и прогнозирование данных связаны следующим образом. Анализ данных позволяет найти неочевидные закономерности в анализируемых данных, и представить их в виде легко воспринимаемого результата.

Прогнозирование позволяет, на основе проведенного анализа данных, предсказать последующие события или значения некоторых характеристик для новых исходных данных.

Таким образом, результаты анализа являются основой, на которой строятся последующие прогнозы.

Например, в нашей базе имеются данные о том, какие товары и когда приобретались нашими клиентами. Было замечено, что если клиент приобретал, скажем, диван "Сказка", то через некоторое время он, зачастую, приобретал и кресло "Сказка", из того же набора мягкой мебели.

Мы хотим проанализировать данные нашей базы в следующем виде: какие существуют наиболее вероятные последовательности покупок товаров одним и тем же клиентом? Иначе говоря – "как обстоят дела сейчас, если взять текущие данные и попробовать определить, какие существуют последовательности покупаемых товаров"? [445]

В терминах 1С:Предприятия 8.0 такой процесс анализа данных можно представить следующей схемой:

Источник данных – представляет исходные данные для анализа. В качестве источника данных может выступать результат запроса, область ячеек табличного документа или таблица значений.

Тип анализа – определяет вид результата, к которому должны быть сведены исходные данные. Система поддерживает пять различных типов анализа:

·общая статистика – позволяет получить общую статистическую информацию об источнике данных для его предварительного исследования (количество значений и количество уникальных значений, минимальное, максимальное и среднее значение, размах, стандартное отклонение, медиана, мода, частота появления каждого значения в источнике), [446]
·поиск ассоциаций предназначен для поиска часто встречаемых групп характеристик объектов и создания правил ассоциации "Если ... To ..." (например, такой анализ может быть использован для поиска групп товаров, часто покупаемых вместе),
·поиск последовательностей – применяется для выявления цепочек событий часто наблюдаемых в источнике данных (например, это может быть цепочка товаров или услуг, которые часто последовательно приобретают клиенты),
·дерево решений – предназначен для выявления закономерностей того, что объект относится к тому или иному классу (например, при помощи дерева решения можно проанализировать какие характеристики клиента влияют на то, что он перейдет к другому поставщику),
·кластерный анализ – при помощи кластерного анализа можно объединить объекты в группы (кластеры), в которых будут находиться объекты, наиболее схожие по ряду характеристик. Например, можно сгруппировать клиентов по их характеристикам и деятельности, чтобы в дальнейшем проанализировав полученные кластеры принять решение о стратегии работы с клиентами определенных групп.




Анализ данных – объект встроенного языка (АнализДанных), непосредственно выполняющий анализ данных. Объекту устанавливается источник данных, задаются параметры, настраиваются колонки анализа данных. Результатом работы данного объекта является результат анализа данных, тип которого зависит от типа анализа. Каждому типу анализа соответствует свой тип результата анализа.



Результат анализа – объект встроенного языка, содержащий информацию о результате анализа. Для каждого типа анализа предусмотрен свой тип результата. Например, результатом анализа данных типа АнализДанныхДеревоРешений будет объект типа РезультатАнализаДанныхДеревоРешений.

В дальнейшем результат может быть выведен в табличный Документ при помощи построителя отчета анализа данных (о нем будет рассказано далее), может быть выведен посредством программного доступа к его содержимому, может быть использован [447] для создания модели прогноза. Любой результат анализа данных может быть сохранен для последующего использования.

Теперь рассмотрим, как выглядит прогнозирование данных Прогнозирование является попыткой предсказать новый результат, на основе некоторой совокупности новых данных и определенной ранее модели. Иными словами, прогнозирование позволяет ответить на вопрос: "как будут обстоять дела, если мы будем иметь такие данные при такой модели их взаимосвязи"?

Возвращаясь к нашему примеру – "какой товар, с большой долей вероятности, клиент приобретет в следующий раз, если до этого он совершал вот такие покупки, и текущие последовательности покупок товаров выглядят следующим образом"?

В терминах 1С:Предприятия 8.0 этот процесс прогнозирования данных можно представить следующей схемой:

[448]

Источник данных – таблица значений, результат запроса или область табличного документа, содержащая информацию, по которой необходимо построить прогноз. Например, для модели прогноза МодельПрогнозаПоискАссоциаций, выборка может содержать перечень товаров документа продажи. Результат же работы модели может рекомендовать, какие товары можно еще предложить покупателю.



Модель прогноза – специальный объект, позволяющий выполнять прогноз на основании входных данных. Тип модели зависит от типа анализа данных. Например, модель, созданная для анализа данных АнализДанныхПоискАссоциаций будет иметь тип МодельПрогнозаПоискАссоциаций. Такая модель сможет выдавать прогнозы типа: "т.к. данный покупатель купил заданный набор товаров, то с определенной вероятностью он должен купить и другой набор товаров". На вход модели прогноза передается источник данных для прогноза. Результатом является таблица значений, содержащая прогнозируемые значения.

Таблица значений – таблица значений, состоящая из колонок, согласно настройкам результирующих колонок модели прогноза, содержащая прогнозируемые данные. Конкретное содержание таблицы определяется типом анализа данных. [449]

Если обобщить обе схемы, представленные выше, то анализ и прогнозирование данных в терминах 1С:Предприятия 8.0 можно представить следующим образом:



[450]

Как вы видите, на этой схеме появились новые прямоугольники. Мы рассмотрим их назначение в следующем разделе.


Содержание раздела