технологија|НабавкиДата Тим

Семантичко пребарување на тендери со AI

Традиционалното пребарување на тендери бара да го погодите точниот збор кој е употребен во тендерот. Ако тендерот вели "канцелариски материјали" а вие пребарувате "хартија и тонери", нема да го најдете. НабавкиДата го решава овој проблем со семантичко пребарување - пребарување по значење, не по точен текст.

Што е семантичко пребарување?

Семантичкото пребарување е AI технологија која го разбира значењето на вашето барање и го споредува со значењето на содржината на тендерите. Наместо да бара точно совпаѓање на зборовите, системот разбира дека:

  • "градежни работи" и "изградба на објект" значат слично
  • "медицинска опрема" и "апарати за болница" се поврзани
  • "IT услуги" вклучува "софтверски развој", "одржување на сервери" и "мрежна инфраструктура"

Како функционира технологијата?

RAG (Retrieval-Augmented Generation)

Нашиот систем користи RAG архитектура - модерен AI пристап кој комбинира пребарување со генерирање. Процесот е следен:

  1. Индексирање: Текстот од сите тендерски документи (PDF, HTML) се претвора во вектори
  2. Пребарување: Вашето барање исто така се претвора во вектор
  3. Споредба: Системот ги наоѓа тендерите чии вектори се најблиски до вашиот
  4. Рангирање: Резултатите се рангираат по релевантност

Вектори и ембедингс

Јадрото на семантичкото пребарување се ембедингс (embeddings) - нумерички репрезентации на текст во повеќедимензионален простор. Ние користиме Google Gemini за генерирање на ембедингс, кој е тренирај на огромна количина текст и го разбира значењето на зборовите на повеќе јазици, вклучително и македонски.

Секој тендер е претставен како вектор со стотици димензии. Кога пребарувате, вашето барање се претвора во истиот тип вектор, и системот ги наоѓа тендерите чии вектори се најблиски по косинусна сличност.

Билингвално пребарување

Едно од најголемите предности на нашиот систем е поддршката за билингвално пребарување. Можете да пребарувате на:

  • Кирилица: "градежни работи" - стандардно македонско писмо
  • Латиница: "gradezni raboti" - системот автоматски ја транслитерира
  • Мешано: Комбинација од кирилица и латиница

Системот автоматски ги препознава двете писма и ги конвертира за оптимални резултати. Ова е особено корисно за корисници кои користат тастатура без кирилица.

Предности над обичното пребарување

Карактеристика Обично пребарување Семантичко (AI)
Точно совпаѓање Задолжително Не е потребно
Синоними Не ги разбира Ги разбира
Контекст Игнориран Земен предвид
Повеќејазичност Ограничена Целосна поддршка
Пребарување во PDF Невозможно Поддржано

Практични примери

Еве неколку примери како семантичкото пребарување наоѓа тендери кои обичното пребарување би ги пропуштило:

  • Барање: "компјутерска опрема за училишта" → Наоѓа: тендери за "набавка на лаптопи и таблети за образовни институции"
  • Барање: "чистење на улици" → Наоѓа: тендери за "одржување на хигиена на јавни површини" и "зимско одржување на патишта"
  • Барање: "храна за болници" → Наоѓа: тендери за "услуги за исхрана во здравствени установи" и "готвење и дистрибуција на оброци"

Испробајте го

Семантичкото пребарување е достапно за сите корисници на пребарувајте тендери. Едноставно внесете го вашето барање на македонски или латиница и системот ќе ги најде најрелевантните тендери.

За повеќе информации за AI технологијата зад НабавкиДата, прочитајте го нашиот технички водич за AI детекција на корупција и методологијата за ризик-скор.