ResearchBib Share Your Research, Maximize Your Social Impacts
Sign for Notice Everyday Sign up >> Login

O`ZBEK STEMASINI YARATISH

Journal: Science and Education (Vol.1, No. 4)

Publication Date:

Authors : ;

Page : 136-141

Keywords : Stemming; Text-mining; algoritm; o'zbek tili;

Source : Downloadexternal Find it from : Google Scholarexternal

Abstract

Ushbu maqolada an'anaviy qoidalarga asoslangan tizimning simli o'xshashlik yondashuvidan iborat yangi kontekstsiz bepul stemmer taklif etiladi. Ushbu algoritmni gibrid algoritm deb atash mumkin. Bu tilga bog'liq algoritm. Kontekstdagi bepul stemmer degani, kontekstga asoslanmagan so'zni ishlatadigan stemmer degan ma'noni anglatadi, har bir kontekst uchun bunday qoida qo'llaniladi. An'anaviy kontekst bo'yicha erkin qoidaga asoslangan yondashuv yordamida so'zlarni olib tashlaganimizdan so'ng, u dinamik dasturlashning simli o'xshashlik funktsiyasini qo'llash orqali engib o'tilgan so'zlarning tagiga yoki tagiga tushishi mumkin. Satrlarning o'xshashligi funktsiyasini o'lchash uchun tahrirlash masofasidan foydalaniladi. O'chirilgan inflatsiya qilingan so'z matn bazasida mavjud bo'lgan so'zlar bilan taqqoslanadi. Minimal masofaga ega bo'lgan so'z, olib tashlangan inflatsiya qilingan so'zning o'rnini egallaydi, bu esa uning kelib chiqishiga olib keladi. Ushbu yondashuvda an'anaviy qoidalarga asoslangan tizim va korpusga asoslangan yondashuv tushunchalari keng qo'llaniladi. Ushbu algoritm o'zbek tili uchun sinovdan o'tkaziladi.

Last modified: 2020-07-25 13:36:21