Семантичний простір
Ембедінги корпусу
2D-проєкція речень BUDOVA — регістри чисто кластеризуються, бо доменна лексика надто характерна.
Превʼю · синтетична розкладка до v1.0Поточна розкладка — seeded synthetic scatter з центроїдами, що повторюють спостережену separability регістрів. Справжній UMAP замінить це після v1.0, коли навчений encoder пройде по повному корпусу.