Семантичко пребарување на тендери со AI
Традиционалното пребарување на тендери бара да го погодите точниот збор кој е употребен во тендерот. Ако тендерот вели "канцелариски материјали" а вие пребарувате "хартија и тонери", нема да го најдете. НабавкиДата го решава овој проблем со семантичко пребарување - пребарување по значење, не по точен текст.
Што е семантичко пребарување?
Семантичкото пребарување е AI технологија која го разбира значењето на вашето барање и го споредува со значењето на содржината на тендерите. Наместо да бара точно совпаѓање на зборовите, системот разбира дека:
- "градежни работи" и "изградба на објект" значат слично
- "медицинска опрема" и "апарати за болница" се поврзани
- "IT услуги" вклучува "софтверски развој", "одржување на сервери" и "мрежна инфраструктура"
Како функционира технологијата?
RAG (Retrieval-Augmented Generation)
Нашиот систем користи RAG архитектура - модерен AI пристап кој комбинира пребарување со генерирање. Процесот е следен:
- Индексирање: Текстот од сите тендерски документи (PDF, HTML) се претвора во вектори
- Пребарување: Вашето барање исто така се претвора во вектор
- Споредба: Системот ги наоѓа тендерите чии вектори се најблиски до вашиот
- Рангирање: Резултатите се рангираат по релевантност
Вектори и ембедингс
Јадрото на семантичкото пребарување се ембедингс (embeddings) - нумерички репрезентации на текст во повеќедимензионален простор. Ние користиме Google Gemini за генерирање на ембедингс, кој е тренирај на огромна количина текст и го разбира значењето на зборовите на повеќе јазици, вклучително и македонски.
Секој тендер е претставен како вектор со стотици димензии. Кога пребарувате, вашето барање се претвора во истиот тип вектор, и системот ги наоѓа тендерите чии вектори се најблиски по косинусна сличност.
Билингвално пребарување
Едно од најголемите предности на нашиот систем е поддршката за билингвално пребарување. Можете да пребарувате на:
- Кирилица: "градежни работи" - стандардно македонско писмо
- Латиница: "gradezni raboti" - системот автоматски ја транслитерира
- Мешано: Комбинација од кирилица и латиница
Системот автоматски ги препознава двете писма и ги конвертира за оптимални резултати. Ова е особено корисно за корисници кои користат тастатура без кирилица.
Предности над обичното пребарување
| Карактеристика | Обично пребарување | Семантичко (AI) |
|---|---|---|
| Точно совпаѓање | Задолжително | Не е потребно |
| Синоними | Не ги разбира | Ги разбира |
| Контекст | Игнориран | Земен предвид |
| Повеќејазичност | Ограничена | Целосна поддршка |
| Пребарување во PDF | Невозможно | Поддржано |
Практични примери
Еве неколку примери како семантичкото пребарување наоѓа тендери кои обичното пребарување би ги пропуштило:
- Барање: "компјутерска опрема за училишта" → Наоѓа: тендери за "набавка на лаптопи и таблети за образовни институции"
- Барање: "чистење на улици" → Наоѓа: тендери за "одржување на хигиена на јавни површини" и "зимско одржување на патишта"
- Барање: "храна за болници" → Наоѓа: тендери за "услуги за исхрана во здравствени установи" и "готвење и дистрибуција на оброци"
Испробајте го
Семантичкото пребарување е достапно за сите корисници на пребарувајте тендери. Едноставно внесете го вашето барање на македонски или латиница и системот ќе ги најде најрелевантните тендери.
За повеќе информации за AI технологијата зад НабавкиДата, прочитајте го нашиот технички водич за AI детекција на корупција и методологијата за ризик-скор.