Uzante Cluster-Analizon en Microsoft Excel

Pin
Send
Share
Send

Unu el la iloj por solvi ekonomiajn problemojn estas analizo. Kun ĝia helpo, kluzoj kaj aliaj objektoj de la datumaro estas klasifikitaj en grupojn. Ĉi tiu tekniko povas esti aplikita en Excel. Ni vidu kiel tio praktikas.

Uzante Cluster-Analizon

Kun la helpo de kluster-analizo eblas aranĝi specimenojn laŭ la atributo studata. Ĝia ĉefa tasko estas dividi multidimensian tabelon en homogenajn grupojn. Kiel grupiga kriterio, paro-korelacia koeficiento aŭ eŭklida distanco inter objektoj per donita parametro estas uzataj. La valoroj plej proksimaj unu al la alia estas grupigitaj.

Kvankam ĉi tiu speco de analizo estas plej ofte uzita en ekonomiko, ĝi ankaŭ povas esti uzata en biologio (por klasifiki bestojn), psikologio, medicino kaj en multaj aliaj areoj de homa aktiveco. Kluster-analizo povas esti aplikata uzante la norman Excel-ilaron por ĉi tiuj celoj.

Uza ekzemplo

Ni havas kvin objektojn, kiuj karakterizas du studitajn parametrojn - x kaj y.

  1. Ni aplikas la eŭklidan distancan formulon al ĉi tiuj valoroj, kiu estas kalkulita laŭ la ŝablono:

    = ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Ĉi tiu valoro estas kalkulita inter ĉiu el la kvin objektoj. La kalkulrezultoj estas metitaj en la distanca matrico.
  3. Ni rigardas inter kiuj valoroj la distanco estas la malpli. En nia ekzemplo, ĉi tiuj estas celoj 1 kaj 2. La distanco inter ili estas 4.123106, kio estas malpli ol inter iuj aliaj elementoj de ĉi tiu loĝantaro.
  4. Kombinu ĉi tiujn datumojn en grupon kaj formu novan matricon, en kiu la valoroj 1,2 agi kiel aparta elemento. Kompilante la matricon, ni lasas la plej malgrandajn valorojn de la antaŭa tabelo por la kombinita elemento. Denove ni rigardas, inter kiuj elementoj la distanco estas minimuma. Ĉi-foje estas 4 kaj 5tiel kiel la objekto 5 kaj grupo de objektoj 1,2. La distanco estas 6.708204.
  5. Ni aldonas la specifitajn elementojn al la ĝenerala areto. Ni formas novan matricon laŭ la sama principo kiel la antaŭa tempo. Tio estas, ke ni serĉas la plej malgrandajn valorojn. Tiel, ni vidas, ke nia datumaro povas esti dividita en du grupojn. La unua amaso enhavas la elementojn plej proksimajn unu al la alia - 1,2,4,5. En la dua areto en nia kazo, nur unu elemento estas prezentita - 3. Ĝi estas relative for de aliaj objektoj. La distanco inter la amaso estas 9,84.

Ĉi tio kompletigas la procedon por dividi la loĝantaron en grupojn.

Kiel vi povas vidi, kvankam ĝenerale ĝenerala analizo povas ŝajni komplika proceduro, fakte kompreni la nuancojn de ĉi tiu metodo ne estas tiel malfacila. La ĉefa afero estas kompreni la bazan skemon de grupiĝo.

Pin
Send
Share
Send