Цей сайт використовує лише необхідне сховище браузера для автентифікації та налаштувань. Файли cookie для відстеження не використовуються. Політика конфіденційності
Семантичний простір

Ембедінги корпусу

2D-проєкція речень BUDOVA — регістри чисто кластеризуються, бо доменна лексика надто характерна.

Превʼю · синтетична розкладка до v1.0
НормативиКошторисПольоваКорпоративніОсвіта

Поточна розкладка — seeded synthetic scatter з центроїдами, що повторюють спостережену separability регістрів. Справжній UMAP замінить це після v1.0, коли навчений encoder пройде по повному корпусу.

Співпраця

Приєднуйтесь до BUDOVA

Шукаємо дослідників, будівельних фахівців та мовних спеціалістів для участі у проєкті.

За підтримки
Microsoft AI for Good Lab