We build one embedding vector per English term using the term name, definition, key intuition, and (if present) use cases.
Think of an embedding as semantic coordinates: terms with similar meaning end up in nearby regions.
Similarity is computed with angular distance:
d(i,j) = acos(cosine(i,j)) / pi.
Intuition: cosine measures how aligned two vectors are in direction (1 = same direction, 0 = unrelated, -1 = opposite).
Taking acos turns that alignment into an angle, then dividing by pi rescales it to 0-1.
Smaller distance means stronger semantic similarity.
For each term, we rank all other terms by this distance and keep the top 3 nearest neighbors.
The lines in the map are exactly those neighbor links.
Node positions are then projected to 2D for visualization (MDS): this helps us draw an interpretable map,
but neighbor links are computed in embedding space, not from 2D screen distance.
Il sistema genera un vettore di embedding per ogni termine inglese, elaborando dati quali il nome, la definizione,
l'intuizione chiave e gli eventuali casi d'uso. Questi embedding fungono da "coordinate semantiche": concetti con
significati affini vengono collocati in regioni contigue dello spazio vettoriale.
Calcolo della Distanza e Connessioni
La similarità tra i termini viene determinata attraverso la distanza angolare, calcolata secondo la formula:
d(i,j) = arccos(cosine(i,j)) / π.
Logica: La similarità cosinusoidale misura l'allineamento direzionale tra due vettori (dove 1 indica
la medesima direzione e 0 l'assenza di correlazione).
Normalizzazione: L'arcocoseno trasforma tale allineamento in un angolo, mentre la divisione per π
normalizza il valore in una scala compresa tra 0 e 1.
Risultato: Minore è la distanza, maggiore è la prossimità semantica tra i termini.
Per ogni termine vengono individuati i tre concetti più vicini in base alla distanza calcolata. Le linee che compongono
la mappa rappresentano esattamente questi legami di prossimità.
Visualizzazione
Infine, le posizioni dei nodi vengono proiettate in uno spazio bidimensionale tramite Multidimensional Scaling (MDS)
per garantire la leggibilità della mappa. È importante notare che i collegamenti tra i vicini sono stabiliti nello spazio
multidimensionale degli embedding e non dipendono dalla semplice distanza visiva sul piano 2D.