Clustering Algorithms

Pure TypeScript implementations of common clustering algorithms.

1. Interface | 2. Algorithms | 3. Utilities

Interface

import * as clA from "t-ski/clustering-algorithms"

type TVector = number[]
type TMatrix[] = number[][]
type TCluster = TVector[]

interface AClustering<O = TCluster> {
    clusters: O[]
}

Algorithms

clA.<algorithm>(data: I[], ...args): AClustering<I>

Centroid-based

clA.<algorithm>(data: number[]|TVector[], k: number = 2): AClustering

new clA.KMeans(DATA, 3).clusters;

k-Means

O(n²) | Θ(n)

clA.KMeans(data, k?)

k-Means++

O(n²) | Θ(n)

clA.KMeansPP(data, k?)

k-Medoids

O(n²) | Θ(n)

clA.KMedoids(data, k?)

Density-based

clA.<algorithm>(data: number[]|TVector[], epsilon?: number): AClustering

If not defined, the epsilon parameter is estimated from the given data.

new clA.MeanShift(DATA, 2).clusters;

MeanShift

O = Θ(n²)

clA.MeanShift(data, epsilon?): AClustering & { noise: TCluster }

DBSCAN

O(n²) | Θ(n log n)

clA.DBSCAN(data, epsilon?, minPoints: number = 4): AClustering & { noise: TCluster }

OPTICS

O(n²) | Θ(n log n)

clA.OPTICS(data, epsilon?, minPoints: number = 4): AClustering & { noise: TCluster }

Graph-based

clA.<algorithm>(adjacencyMatrix: TMatrix, k: number = 2): AClustering<number[]>

Input to graph-based clustering is a target graph's adjacency matrix. Output corresponds to clusters of related graph node indexes.

new clA.ConnectedComponents(DATA).clusters;

Connected Components

O = Θ(n³)

clA.ConnectedComponents(adjacencyMatrix)

Divisive Clustering

O = Θ(n³)

clA.Divisive(adjacencyMatrix, k: number = 2)

Markov Clustering (MCL)

O = Θ(n³)

clA.Markov(adjacencyMatrix, e: number = 2, r: number = 2)

Hierarchy-based

clA.<algorithm>(data: number[]|TVector[], k: number = 2): AClustering

new clA.AverageLinkage(DATA, 4).clusters;

Average Linkage

O = Θ(n³)

clA.AverageLinkage(data, k?)

Centroid Linkage

O = Θ(n³)

clA.CentroidLinkage(data, k?)

Complete Linkage

O = Θ(n³)

clA.CompleteLinkage(data, k?)

Hausdorff Linkage

O = Θ(n³)

clA.HausdorffLinkage(data, k?)

Median Linkage

O = Θ(n³)

clA.MedianLinkage(data, k?)

Single Linkage

O = Θ(n³)

clA.SingleLinkage(data, k?)

Ward

O = Θ(n³)

clA.Ward(data, k?)

Utilities

Distance Metrics

f: (ℝ×…×ℝ)² ↦ ℕ

clA.util.distance.<metric>(p1: TVector, p2: TVector = []): number

clA.AClustering.setDistanceMetric(util.distance.manhattan);

const clusters = new clA.KMeans(DATA, 3).clusters;

Euclidean (2-Norm) `default`

clA.util.distance.euclidean(p1: TVector, p2: TVector = []): number

Manhattan

clA.util.distance.manhattan(p1: TVector, p2: TVector = []): number

Chebyshev

clA.util.distance.chebyshev(p1: TVector, p2: TVector = []): number

Cosine (normal)

clA.util.distance.cosine(p1: TVector, p2: TVector = []): number

Quality Metrics

clA.util.quality.<metric>(clusters: TCluster[]): number

const clusters = new clA.KMeans(DATA, 3).clusters;

const clusteringQuality = clA.util.quality.silhouetteCoefficient(clusters);

Silhouette Coefficient

f: ℕ×(ℝ×…×ℝ) ↦ [-1,1] → 1

clA.util.quality.silhouetteCoefficient(clusters: TCluster[]): number

Dunn Index

f: ℕ×(ℝ×…×ℝ) ↦ [0,∞) → ∞

clA.util.quality.dunnIndex(clusters: TCluster[]): number

Davies-Bouldin Index

f: ℕ×(ℝ×…×ℝ) ↦ [0,∞) → 0

clA.util.quality.daviesBouldinIndex(clusters: TCluster[]): number

Vector Data Map

The VectorDataMap utility class helps with associating arbitrary entites with data points (view example).

type TDataPoint<T> = [ TVector, T ]

new clA.util.VectorDataMap<T>(data: TDataPoint<T>[]): {
    vectors: TVector[];
    
    getEntity: (vector: TVector) => T|T[];
    getVector: (entity: T) => TVector;
    getCluster: (clusters: TCluster[], vector: TVector) => number|number[];
    getCluster: (clusters: TCluster[], entity: T) => number|number[];
}

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
.husky		.husky
example		example
plots		plots
scripts		scripts
src		src
test		test
.editorconfig		.editorconfig
.gitignore		.gitignore
.lintstagedrc		.lintstagedrc
LICENSE		LICENSE
README.md		README.md
eslint.config.mjs		eslint.config.mjs
examples.graph.png		examples.graph.png
examples.vector.png		examples.vector.png
package.json		package.json
tsconfig.build.json		tsconfig.build.json
tsconfig.debug.json		tsconfig.debug.json
tsconfig.json		tsconfig.json

License

t-ski/clustering-algorithms

Folders and files

Latest commit

History

Repository files navigation

Clustering Algorithms

Interface

Algorithms

Centroid-based

k-Means

k-Means++

k-Medoids

Density-based

MeanShift

DBSCAN

OPTICS

Graph-based

Connected Components

Divisive Clustering

Markov Clustering (MCL)

Hierarchy-based

Average Linkage

Centroid Linkage

Complete Linkage

Hausdorff Linkage

Median Linkage

Single Linkage

Ward

Utilities

Distance Metrics

Euclidean (2-Norm) default

Manhattan

Chebyshev

Cosine (normal)

Quality Metrics

Silhouette Coefficient

Dunn Index

Davies-Bouldin Index

Vector Data Map

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Uh oh!

Languages

Euclidean (2-Norm) `default`