O`ZBEK STEMASINI YARATISH
Journal: Science and Education (Vol.1, No. 4)Publication Date: 2020-07-25
Authors : Ismailov Alisher Shakirovich;
Page : 136-141
Keywords : Stemming; Text-mining; algoritm; o'zbek tili;
Abstract
Ushbu maqolada an'anaviy qoidalarga asoslangan tizimning simli o'xshashlik yondashuvidan iborat yangi kontekstsiz bepul stemmer taklif etiladi. Ushbu algoritmni gibrid algoritm deb atash mumkin. Bu tilga bog'liq algoritm. Kontekstdagi bepul stemmer degani, kontekstga asoslanmagan so'zni ishlatadigan stemmer degan ma'noni anglatadi, har bir kontekst uchun bunday qoida qo'llaniladi. An'anaviy kontekst bo'yicha erkin qoidaga asoslangan yondashuv yordamida so'zlarni olib tashlaganimizdan so'ng, u dinamik dasturlashning simli o'xshashlik funktsiyasini qo'llash orqali engib o'tilgan so'zlarning tagiga yoki tagiga tushishi mumkin. Satrlarning o'xshashligi funktsiyasini o'lchash uchun tahrirlash masofasidan foydalaniladi. O'chirilgan inflatsiya qilingan so'z matn bazasida mavjud bo'lgan so'zlar bilan taqqoslanadi. Minimal masofaga ega bo'lgan so'z, olib tashlangan inflatsiya qilingan so'zning o'rnini egallaydi, bu esa uning kelib chiqishiga olib keladi. Ushbu yondashuvda an'anaviy qoidalarga asoslangan tizim va korpusga asoslangan yondashuv tushunchalari keng qo'llaniladi. Ushbu algoritm o'zbek tili uchun sinovdan o'tkaziladi.
Other Latest Articles
- INTERACTIVE METHODS TO TEACH CULTURAL DIFFERENCES
- ONA TILI DARSLARIDA YUKLAMALARNING O`QITILISHI
- TA’LIM TIZIMINI MODERNIZATSIYALASH SHAROITIDA INNOVATSIYALARNI JORIY ETISH VA ULARDAN SAMARALI FOYDALANISH ISTIQBOLLARI
- ТАРЖИМАНИНГ ЛИНГВОКУЛЬТУРОЛОГИК МУАММОЛАРИ
- INGLIZ VA O’ZBEK TILLARIDA VATAN VA ONA DIYOR GURUHIGA MANSUB MAQOLLARNING SEMANTIK AHAMIYATI VA TEMATIK KLASSIFIKATSIYASI
Last modified: 2020-07-25 13:36:21