==== English text below ===
Na meer dan twee jaar stilte ineens weer een post. De meesten van u weten dat ik mijn bedrijf Scientassist samen met het product VRBI heb overgedaan aan één van mijn zoons. Na een periode waarin ik nog wat doorblogde ging ik verder met mijn eigen nieuwe bedrijf, AnRep3D met bijbehorende blog.
Gedurende het afgelopen jaar kwam ik echter een openbare dataset tegen die heel goed met behulp van VRBI kan worden gevisualiseerd, aangezien er clusters in zitten.
Natuurlijk kunnen clusters in 2D-grafieken worden bekeken, bijvoorbeeld m.b.v Excel. Tegelijk is een 3D-grafiek zoveel krachtiger en in feite is VRBI min of meer 4D. Niet op de Einsteiniaanse manier met tijd als vierde dimensie, maar met de afmeting van de ballen als vertegenwoordiger van de vierde coördinaat.
Foto door Abelke op Pixabay
Fishers of Andersons Iris dataset (de eerste deed de analyse, de laatste zorgde voor de data) is een verzameling van vier maten van veerschillende onderdelen van de bloemen van drie soorten: Iris setosa, Iris versicolor and Iris virginica. Aangezien deze bloemen heel verschillende eigenschappen hebben, kunnen de gegevens worden geclusterd. Als er nieuwe metingen binnenkomen, kan de soort worden vastgesteld door de waarden met één van de clusters te matchen. De waarden kelklad length, kelkblad breedte, kroonblad lengte, kroonblad breedte en de soort die beschikbaar is in de dataset (de dataset wordt niet getoond, maar als er wordt geklikt op “show” in de sectie dataset wordt deze zichtbaar.
Om een indruk te geven van de parameters en de data is het bovenste deel van de input-file hieronder weergegeven.
De verschillende waarden starten niet bij nul, maar zijn min of meer verspreid rondom een bepaalde waarde. Om een duidelijke weergave van de clusters te lrijgen, werd de laagste waarde van alle waarden afgetrokken (per as verschillend) en de rest werd vermenigvuldigd met een rekfactor. Dit werd automatisch gedaan aangezien VRBI parameters kent die de generator dergelijke aanpassingen door laat voeren, zoals beschreven in de handleiding.
Drie waarden kelkbladlengte, kelkbladbreedte and en kroonbladlengte werden als X-, Y- en Z-waarden genomen. kroonbladbreedte werd weergegeven als afmeding van de bol en de kleur geeft aan om welke soort het gaat.
Een screenshot van het resultaat wordt hieronder getoond (wees erop bedacht dat de 3D-grafiek wordt gehost bij AnRep3D).
Dubbel-klikken zal de 3D-grafiek in uw browser openen. Om deze 3D-grafiek te manipuleren: Rechter muisknop klikken en tegelijkertijd omhoog of omlaag bewegen zoomt in of uit. Links klikken en tegelijk de muis bewegen, laat de 3D-grafiek in verschillende richtingen kantelen. Dubbel klikken in de grafiek verplaatst deze en verlegt het centrum. Probeer het gewoon – als niet duidelijk is hoe de normale positie weer kan worden bereikt, ververs dan gewoon het scherm.
Bent u geïnteresseerd? download dan s.v.p. de gratis VRBI-demo of schaf een licentie aan.
========= English section ==============
After more than two years of silence, yet another post. Most of you will know that I handed over the company Scientassist to one of my sons, together with the product VRBI. After a period of sustained blogging, I left for my own new company, AnRep3D with its related blog.
During last year however, I encountered a very interesting public dataset which can be visualised very well with the help of VRBI as it holds clusters. Of course clusters can be viewed in a series of 2D-graphs, e.g. with the help of Excel. At the same time a 3D-graph is much more powerful and as a matter of fact VRBI is more or less 4D. Not in the Einsteinian way with time as a fourth dimension, but with the size of the balls representing the fourth coordinate in a dataset.
Photo by Abelke on Pixabay
Fisher’s or Anderson’s Iris data set (the former did the analysis, the latter collected the data) is a collection of four sizes of different parts of flowers from three species: Iris setosa, Iris versicolor and Iris virginica. As these flowers have very different properties, the data can be clustered. For new data coming in, the species can be derived by matching the values with one of the clusters. The values petal length, petal width, sepal length, sepal width and the species are available in the dataset (the dataset is hidden, but when clicking on “show” in the section dataset it will become visible).
To give an impression of the parameters and the data, the upper part of the input-file is shown below.
The different sizes don’t start at zero, but are more or less scattered around a value. To have a clear presentation of the clusters, the lowest values were subtracted from all values (for each axis separately) and the remainder was multiplied by a stretching factor. This was done automatically, since VRBI reads parameters allowing the generator to readjust ranges of values as explained in the manual.
Three values sepal length, sepal width and petal length were used as X-, Y- and Z-values. Petal width was represented by the ball size and the colour indicated the Iris species.
A screenshot of the result is shown below (be aware that the actual 3D-graph is hosted by AnRep3D).
Double-clicking the screenshot will open the 3D-graph in your browser. For maniputalion of this 3D-graph: Clicking the right mouse-button and moving the mouse up and down at the same time, will zoom the graph in and out. Clicking left while moving the mouse will tilt the graph in different directions. Double clicking in the graph translates it and readjusts the centre at the same time. Just try it – If you don’t know how to get the normal position back, refresh the page in your browser.
If you are interested, please download the free VRBI-demo or order a licence.