Iris dataset – clusters visualiseren / visualising clusters

==== English text below ===

Na meer dan twee jaar stilte ineens weer een post. De meesten van u weten dat ik mijn bedrijf Scientassist samen met het product VRBI heb overgedaan aan één van mijn zoons. Na een periode waarin ik nog wat doorblogde ging ik verder met mijn eigen nieuwe bedrijf, AnRep3D met bijbehorende blog.

Gedurende het afgelopen jaar kwam ik echter een openbare dataset tegen die heel goed met behulp van VRBI kan worden gevisualiseerd, aangezien er clusters in zitten.

Natuurlijk kunnen clusters in 2D-grafieken worden bekeken, bijvoorbeeld m.b.v Excel. Tegelijk is een 3D-grafiek zoveel krachtiger en in feite is VRBI min of meer 4D. Niet op de Einsteiniaanse manier met tijd als vierde dimensie, maar met de afmeting van de ballen als vertegenwoordiger van de vierde coördinaat.

Iris flower

Foto door Abelke op Pixabay

Fishers of Andersons Iris dataset (de eerste deed de analyse, de laatste zorgde voor de data) is een verzameling van vier maten van veerschillende onderdelen van de bloemen van drie soorten: Iris setosa, Iris versicolor and Iris virginica. Aangezien deze bloemen heel verschillende eigenschappen hebben, kunnen de gegevens worden geclusterd. Als er nieuwe metingen binnenkomen, kan de soort worden vastgesteld door de waarden met één van de clusters te matchen. De waarden kelklad length, kelkblad breedte, kroonblad lengte, kroonblad breedte en de soort die beschikbaar is in de dataset (de dataset wordt niet getoond, maar als er wordt geklikt op “show” in de sectie dataset wordt deze zichtbaar.

Om een indruk te geven van de parameters en de data is het bovenste deel van de input-file hieronder weergegeven.

De verschillende waarden starten niet bij nul, maar zijn min of meer verspreid rondom een bepaalde waarde. Om een duidelijke weergave van de clusters te lrijgen,  werd de laagste waarde van alle waarden afgetrokken (per as verschillend) en de rest werd vermenigvuldigd met een rekfactor. Dit werd automatisch gedaan aangezien VRBI parameters kent die de generator dergelijke aanpassingen door laat voeren, zoals beschreven in de handleiding.

Drie waarden kelkbladlengte, kelkbladbreedte and en kroonbladlengte werden als X-, Y- en Z-waarden genomen. kroonbladbreedte werd weergegeven als afmeding van de bol en de kleur geeft aan om welke soort het gaat.

Een screenshot van het resultaat wordt hieronder getoond (wees erop bedacht dat de 3D-grafiek wordt gehost bij AnRep3D).

Dubbel-klikken zal de 3D-grafiek in uw browser openen. Om deze 3D-grafiek te manipuleren: Rechter muisknop klikken en tegelijkertijd omhoog of omlaag bewegen zoomt in of uit. Links klikken en tegelijk de muis bewegen, laat de 3D-grafiek in verschillende richtingen kantelen. Dubbel klikken in de grafiek verplaatst deze en verlegt het centrum. Probeer het gewoon – als niet duidelijk is hoe de normale positie weer kan worden bereikt, ververs dan gewoon het scherm.

Bent u geïnteresseerd? download dan s.v.p. de gratis VRBI-demo of schaf een licentie aan.

========= English section ==============

After more than two years of silence, yet another post. Most of you will know that I handed over the company Scientassist to one of my sons, together with the product VRBI. After a period of sustained blogging, I left for my own new company, AnRep3D with its related blog.

During last year however, I encountered a very interesting public dataset which can be visualised very well with the help of VRBI as it holds clusters. Of course clusters can be viewed in a series of 2D-graphs, e.g. with the help of Excel. At the same time a 3D-graph is much more powerful and as a matter of fact VRBI is more or less 4D. Not in the Einsteinian way with time as a fourth dimension, but with the size of the balls representing the fourth coordinate in a dataset.

Iris flower

Photo by Abelke on Pixabay

Fisher’s or Anderson’s Iris data set (the former did the analysis, the latter collected the data) is a collection of four sizes of different parts of flowers from three species: Iris setosa, Iris versicolor and Iris virginica. As these flowers have very different properties, the data can be clustered. For new data coming in, the species can be derived by matching the values with one of the clusters. The values petal length, petal width, sepal length, sepal width and the species are available in the dataset (the dataset is hidden, but when clicking on “show” in the section dataset it will become visible).

To give an impression of the parameters and the data, the upper part of the input-file is shown below.

The different sizes don’t start at zero, but are more or less scattered around a value. To have a clear presentation of the clusters, the lowest values were subtracted from all values (for each axis separately) and the remainder was multiplied by a stretching factor. This was done automatically, since VRBI reads parameters allowing the generator to readjust ranges of values as explained in the manual.

Three values sepal length, sepal width and petal length were used as X-, Y- and Z-values. Petal width was represented by the ball size and the colour indicated the Iris species.

A screenshot of the result is shown below (be aware that the actual 3D-graph is hosted by AnRep3D).

 

 

Double-clicking the screenshot will open the 3D-graph in your browser. For maniputalion of this 3D-graph: Clicking the right mouse-button and moving the mouse up and down at the same time, will zoom the graph in and out. Clicking left while moving the mouse will tilt the graph in different directions. Double clicking in the graph translates it and readjusts the centre at the same time. Just try it – If you don’t know how to get the normal position back, refresh the page in your browser.

If you are interested, please download the free VRBI-demo or order a licence.

Over AnRep3D

AnRep3D is the new company, founded after the handover of Scientassist (together with VRBI) to one of my sons. From now I will focus on three-dimensional graphs for the financial markets, showing the main figures from annual reports in comparison. As per 2021 a second product is available: EnRep3D. It is meant to visualise energy. Although the engine is the same, the texts, manual, website and examples (including blogposts) are focused at energy.
Dit bericht werd geplaatst in Virtual Reality Business Intelligence en getagged met , , , , , , , , , , , , , , , , , , , . Maak dit favoriet permalink.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s