Оценка стоимости недвижимости (Нейросеть)

Особенностью процесса оценки стоимости недвижимости является его рыночный характер. Это означает, что этот процесс не ограничивается учетом одних только затрат на создание или приобретение оцениваемого объекта собственности — необходим учет совокупности рыночных факторов, экономических особенностей оцениваемого объекта, а также макро- и микроэкономического окружения. Кроме того, рынок недвижимости очень динамичный, поэтому требуется периодическая переоценка объектов собственности. Создание моделей на основе искусственных нейронных сетей для оценки стоимости недвижимости могут существенно повысить эффективность работы организаций, занимающихся риэлтерской деятельностью.

Исходные данные

Имя поля Метка поля
 ID ID объекта
 District Район
 TypePlan Тип планировки
 Rooms Количество комнат
 FirstLast Первый/Последний этаж
 Total Общая площадь (м2)
 Live Жилая площадь (м2)
 Kitchen Площадь кухни (м2)
 Agency Наличие агентства
 Condition Состояние
 Price Стоимость (т.руб.)

Алгоритм

  1. Импорт входных данных.
  2. Анализ выбросов и экстремальных значений.
  3. Настройка Нейросети.
  4. Интерпретация полученных результатов.

Сценарий

Сценарий оценки стоимости недвижимости
Рисунок 1. Сценарий оценки стоимости недвижимости

 Недвижимость

В этом узле импортируются данные из файла MS Excel. В Мастере настройки нужно настроить Тип и Вид данных в соответствии с таблицей, также можно задать Имена полям.

 Редактирование выбросов

Проведем предварительный анализ данных на аномальные значения, например, очень большая или маленькая площадь квартиры, или очень высокая стоимость. По умолчанию предлагается ограничить найденные выбросы и экстремальные значения. Переопределим это действие: для выбросов выберем пункт «Оставить без изменения», для экстремальных значений — «Удалять записи».

Экстремальные значения
Рисунок 2. Экстремальные значения

Модели, построенные на нейронных сетях, достаточно устойчивы к выбросам и экстремальным значениям, поэтому предпринимать особых усилий по подготовке выборки для них не требуется. Тем не менее, экстремальные значения лучше удалить для улучшения качества обучения модели.

 Нейросеть (регрессия)

Первый шаг к обучению (настройке) Нейросети — определение того, какие данные подаются на вход и что должно быть на выходе. В этом примере на выходе должна прогнозируемая стоимость недвижимости, соответственно на вход подаем данные, от которых напрямую зависит цена объекта.

Входные и выходные данные и их вид
Рисунок 3. Входные и выходные данные и их вид

Далее приводим данные к нормализованному виду для приведения всех величин к одному интервалу. Если не произвести нормализацию, то входные данные разных порядков будут оказывать неодинаковое влияние на нейроны, что может привести к некорректным расчетам алгоритма. Также необходимо помнить, что для непрерывных и дискретных видов данных применяются разные методы нормализации.

Нормализация входных данных
Рисунок 4. Нормализация входных данных

Следующий этап — разделение данных на обучающую и тестовую выборки (множества) и выбор метода валидации прогноза Нейросети.

Разделение входных данных
Рисунок 5. Разделение входных данных

В остальных шагах настройки оставим все параметры по умолчанию и воспользуемся Автонастройкой Нейросети.

Важно: при изменении каких-либо настроек Нейросеть необходимо переобучать - в контекстном меню узла выбрать пункт "Переобучить узел".

 Ошибка аппроксимации

С помощью встроенной в калькулятор функции рассчитаем ошибку аппроксимации для каждого объекта. Полученные значения показывают насколько расчетные значения отличаются от фактических, и таким образом дают представление о качестве модели.

 Средняя ошибка аппроксимации

Рассчитанная средняя среди всех объектов ошибка аппроксимации получилась в районе 8%, что считается хорошим результатом (ошибка до 10-12% приемлема).

Для наглядного представления результатов работы можно настроить Визуализаторы Диаграмма и Статистика в узле Нейросеть. В Диаграмме нужно перетащить в область построения исходную и прогнозируемую стоимость, осью абсцисс будет исходная стоимость, тип графиков в обоих случаях «Разброс».

Визуализатор Диаграмма
Рисунок 6. Визуализатор Диаграмма

Разброс значений прогнозируемой стоимости сосредоточено вблизи значений исходной стоимости. Это показывает качество обучения Нейросети и применимость расчета для использования.

Визуализатор Статистика
Рисунок 7. Визуализатор Статистика

В Статистике никаких предварительных настроек не требуется. Смещение гистограммы влево говорит о том, что Нейросеть занижает прогноз для некоторой части объектов, соответственно, эта недвижимость упадет в цене. Детальные значения прогноза стоимости представлены в выходных данных.

Выходные данные — прогноз стоимости
Рисунок 8. Выходные данные — прогноз стоимости

Компоненты

Файлы

Скачать

results matching ""

    No results matching ""