Студопедия — Порядок выполнения работы. Для выполнения работы используется файл Кластерный анализ.xls.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Порядок выполнения работы. Для выполнения работы используется файл Кластерный анализ.xls.






Для выполнения работы используется файл Кластерный анализ.xls.

На Лист2 этой книги находятся данными о 78 объектах РФ (6 показателей).

На Лист1 реализован метод цепочечной кластеризации и производятся сами расчеты. Здесь же указан список объектов, которые необходимо разбить на группы.

Таблица 7.1

N п/п N по списку Объект X1 X2
    Кировская обл.    
    Нижегородская обл.   2045,3
    Оренбургская обл.   1774,4
    Пензенская обл.   1440,5
    Республика Башкортостан   2339,7
    Республика Бурятия   1765,2
    Республика Дагестан    
    Республика Ингушетия   1008,2
    Республика Марий Эл   1052,3
    Республика Мордовия   1497,7
    Республика Татарстан   2362,4
    Удмуртская Республика    
    Ульяновская обл.   1558,9
    Чувашская Республика   1326,2

 

Для имеющихся 14 объектов необходимо провести двумерную кластеризацию по двум первым показателям (Численность населения (тыс. чел.) и Средний доход на душу населения (руб/мес)). Эти показатели отражаются на имеющейся на этом же листе точечной диаграмме.

Для получения цепочки расстояний достаточно щелкнуть по кнопке «Расчет». В результате будут получены следующие результаты.

Таблица 7.2

 

    E F G H
           
    N Расстояния Номер1 Номер2
      1,580785941    
      4,172284936    
      5,684705731    
      10,00815363    
      13,21538863    
      9,05471484    
      14,89015946    
      7,960007134    
      16,191226    
      18,44375842    
      39,5504765    
      11,1579027    
      8,939773259    

 

Для 14 объектов получена цепочка, состоящая из 13 расстояний.

 

Процедура выделения кластеров производится следующим образом:

– просмотр начинается с первого расстояния. Оно сравнивается со вторым и третьим расстояниями. Все они пока одного порядка. Но четвертое расстояние подозрительно велико по сравнению с первыми тремя.

– для объективного принятия решения о «подозрительности» четвертого расстояния используется технология выявления промахов в ряду наблюдений (см. работу «Случайные величины»).

При этом для расстояний 1 – 4 вычисляются среднее и дисперсия и на их основе V-критерий.

Для этого:

- в ячейку B24 вводится формула =СРЗНАЧ(F11:F14);

- в ячейку B25 вводится формула =ДИСПРА(F11:F14);

- в ячейку B26 вводится формула =ABS(B24-F14)/(3/4*B25)^(1/2).

 

В результате получено следующее:

  A B
  Среднее 5,36148256
  Дисперсия 9,350970798
  V-критерий 1,754619489

 

Далее необходимо сравнить вычисленный критерий с табличным. При уровне значимости, равном 0,05, для четырех измерений этот критерий равен 1,69. Таким образом, вычисленное значение критерия больше табличного. Поэтому делается вывод о том, что проверяемое значение (10,00815363), действительно является промахом, т.е. резко отличается от остальных значений.

 

В табл. 7.2 эти строки выделены.

Применительно к рассматриваемой теме это означает, что данное расстояние (между 12 и 13 объектами) действительно является границей между кластерами.

В результате:

к первому кластеру можно отнести объекты входящий в перечень до этого расстояния – объекты 1, 4, 13 и 14.

Аналогично должны быть рассмотрены оставшиеся расстояния.

Для этого:

– просмотр начинается с 5 расстояния. Очевидно, что расстояния 5 – 10 одного порядка. А расстояние 11 «подозрительно» большое.

Для его проверки выполним аналогичные вычисления:

- в ячейку C24 вводится формула =СРЗНАЧ(F15:F21);

- в ячейку C25 вводится формула =ДИСПРА(F15:F21);

- в ячейку C26 вводится формула =ABS(C24-F21)/(6/7*C25)^(1/2).

Результат вычислений:

 

  A B C
  Среднее 5,36148256 17,043676
  Дисперсия 9,350970798 96,410418
  V-критерий 1,754619489 2,4758548

 

Вычисленное значение V-критерия также больше табличного (V=2,09 для семи измерений и уровня значимости, равного 0,05. Поэтому делаем вывод о том, что расстояние 11 является границей между кластерами и ко второму кластеру следует отнести объекты 12, 10, 6, 9, 8, 3 и 7.

Для оставшихся объектов (2, 5 и 11) проверку можно не производить и их можно отнести к третьему кластеру.

На рис. 7.5 приведены визуализированные результаты кластеризации (исходная диаграмма построена в Excel, а кластеры обведены вручную в Paint).

 

Рис.7.5. Визуализация результатов кластеризации

 







Дата добавления: 2015-08-12; просмотров: 430. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Тактика действий нарядов полиции по предупреждению и пресечению правонарушений при проведении массовых мероприятий К особенностям проведения массовых мероприятий и факторам, влияющим на охрану общественного порядка и обеспечение общественной безопасности, можно отнести значительное количество субъектов, принимающих участие в их подготовке и проведении...

Тактические действия нарядов полиции по предупреждению и пресечению групповых нарушений общественного порядка и массовых беспорядков В целях предупреждения разрастания групповых нарушений общественного порядка (далееГНОП) в массовые беспорядки подразделения (наряды) полиции осуществляют следующие мероприятия...

Механизм действия гормонов а) Цитозольный механизм действия гормонов. По цитозольному механизму действуют гормоны 1 группы...

Ситуация 26. ПРОВЕРЕНО МИНЗДРАВОМ   Станислав Свердлов закончил российско-американский факультет менеджмента Томского государственного университета...

Различия в философии античности, средневековья и Возрождения ♦Венцом античной философии было: Единое Благо, Мировой Ум, Мировая Душа, Космос...

Характерные черты немецкой классической философии 1. Особое понимание роли философии в истории человечества, в развитии мировой культуры. Классические немецкие философы полагали, что философия призвана быть критической совестью культуры, «душой» культуры. 2. Исследовались не только человеческая...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия