Tiedoston article.pdf liitteissä on esimerkkejä käytöstä ja ennen kaikkea tarvittavien Ruby-kirjastojen asentamisesta. Puukottelin lisäksi pikaisesti mukaan päätteettömän moodin (ei näytä tai tallenna kuvia), joka aktivoituu vivulla -n, ja lisäsin klusterien tallennuksen datapisteiden ohella vivulla -c. Siis esimerkiksi seuraavasti: [vilikki@juhta rykelma]$ ./run.rb s3.txt -n -p Eps 15000 -p MinPts 3 -c out_%n.csv ********************************** * * * Initializing DBSCAN for s3.txt * * * ********************************** ********************************** * * * Starting clustering for s3.txt * * * ********************************** Total running time: 6 seconds [vilikki@juhta rykelma]$ head out_s3.csv 453320.0,606542.0,1 520651.0,594591.0,1 516664.0,660290.0,1 570023.0,570741.0,1 524035.0,518443.0,1 544957.0,505968.0,1 503105.0,577815.0,1 515747.0,601704.0,1 588509.0,666153.0,2 533602.0,584471.0,1 Ohjelmakoodi on tosiaan vapaasti käytettävissä ja muokkailtavissa X11-lisenssillä, mikäli tahtoo kyhäillä esimerkiksi DBSCAN-variantteja. Nimeämiskäytännöt näköjään ovat lipsuneet hieman aikoinaan ohjelmaa kehittäessä, Rubyn konventiot tuntien kannattanee pyristellä camelCasesta eroon mahdollisessa jatkokehityksessä. Ajatuksena oli, että clustering.rb asettaa yleiset puitteet klusterointimenetelmälle, jotka laaditaan clustering-hakemistoon. Toteutettavia metodeja on ainakin iterate, joka suorittaa seuraavan iteraation, ja happy?, joka ilmaisee, onko klusterointimenetelmä mielestään saavuttanut valmiin lopputuloksen. Vastaavasti dataset.rb asettaa yleiset puitteet datasäiliölle. Toteutettuna on tästä peritty simple_dataset.rb, joka on simppeli taulukkototeutus, joka tehostaa naapurihakuja pitämällä indeksiä tietyn koordinaatin mukaan järjestetyistä havainnoista. Jalona ajatuksena oli, että dataset voisi yhtä hyvin olla vaikkapa R*-puu- tai tietokantatoteutus.