Цей сайт використовує лише необхідне сховище браузера для автентифікації та налаштувань. Файли cookie для відстеження не використовуються. Політика конфіденційності
Контроль версій

Що змінилось

Кожен реліз виходить з git-style diff-ом даних — щоб дослідники могли відтворити чи відкотити свої бенчмарки.

Превʼю · diff генерується при релізі
diff --corpusv0.3v0.4Квіт 2026
+812
Додано фрагментів
−63
Видалено фрагментів
~148
Перерозмічено
+12
Нових джерел
+lexicon"захисний шар арматури" — новий канонічний термін, 42 входження
+sourceДБН В.1.2-7:2008 — сейсмічна класифікація, 47 фрагментів
+speech+3.2 години мовлення із Закарпаття
~nerперекласифіковано 38 "material" → "structure" (оздоблення)
sourceВидалено 12 фрагментів з відкликаної статті
+lexicon"двокамерний склопакет" — brand-qualified варіант додано
~nerстиснуто межі спанів у 61 "measurement" записі
+estimate+14 зразків польового кошторису з проєктів у Дніпрі
corporateВидалено 51 приватний рядок на запит партнера
~speechПеретранскрибовано 7 аудіо після feedback анотаторів

Релізи після v1.0 генеруватимуть цей diff автоматично з dataset-versioning snapshot table. До того — вручну від release manager BUDOVA.

Співпраця

Приєднуйтесь до BUDOVA

Шукаємо дослідників, будівельних фахівців та мовних спеціалістів для участі у проєкті.

За підтримки
Microsoft AI for Good Lab