Please use this identifier to cite or link to this item:
https://openscience.ge/handle/1/1598
Title: | ქართული ენის ამომცნობი სისტემა | Authors: | კობახიძე, დავით | Advisor: | არჩუაძე, მაია | Degree Name: | Master of Information Technology მაგისტრი ინფორმაციულ ტექნოლოგიებში |
Degree Discipline: | ინფორმაციული ტექნოლოგიები. Information Technology | Degree Level (0 - Undergraduate, 1 - Masters, 2 - Doctoral or post-doctoral): | 1 | Institution: | Ivane Javakhishvili Tbilisi State University ივანე ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტი |
Faculty: | Faculty of Exact and Natural Sciences ზუსტ და საბუნებისმეტყველო მეცნიერებათა ფაკულტეტი |
Keywords: | ქართული ენის ამომცნობი სისტემა | Issue Date: | 2019 | Publisher: | Ivane Javakhishvili Tbilisi State University ივანე ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტი |
Abstract: | In this thesis has been examined a system which implements recognition and processing of the Georgian language from various information sources, for example, such as for all well known Wikipedia, Facebook and other numerous social and information networks, but for recognition and processing are not used the algorithms of standard stemming and lemmatization, as the Georgian language and its peculiarities make use of the standard algorithms impossible, that is why a new stemming algorithm became necessary which would implement the processing of the text and which in this concrete case is based exclusively on the base of the initial forms of conjunctions, pronouns and nouns. It should also be mentioned that similar systems are not so many for the Georgian language and in this thesis the positive sides of all existing systems, one way or another, are stipulated and their negative sides are improved. Exactly thus and so, this system gave us certain results, these results give us the basis of the positive outcome and that is why we can say with certainty that this system can be an initial stage of commencement, development and creation of a full-fledged system that will implement complete recognition and processing of the Georgian language. ამ ნაშრომში განხილულია სისტემა, რომელიც ახდენს ქართული ენის ამოცნობას და დამუშავებას სხვადასხვა ინფორმაციული წყაროდან. მაგალითისთვის, როგორიცაა ყველასათვის კარგად ნაცნობი ვიკიპედია, ფეისბუქი და სხვა მრავალი სოციალური და საინფორმაციო ქსელი, მაგრამ ამოცნობისთვის და დამუშავებისთვის არ გამოიყენება სტანდარტული სტემინგის და ლემატიზაციის ალგორითმები, ვინაიდან ქართული ენა და მისი თავისებურებები შეუძლებელს ხდის სტანდარტული ალგორითმების გამოყენებას, ამიტომ საჭირო გახდა სტემინგის ახალი ალგორითმი, რომელიც მოახდენდა ტექსტის დამუშავებას და რომელიც ამ კონკრეტულ შემთხვევაში ეფუძნება მხოლოდ და მხოლოდ სიტყვების საწყისი ფორმების ბაზას. ასევე უნდა აღინიშნოს რომ ქართული ენისთვის მსგავსი სისტემები არც თუ ისე ბევრია და ამ ნაშრომში ყველა არსებული სისტემის დადებითი მხარე ასე თუ ისე გათვალისწინებულია და გაუმჯობესებულია მათი უარყოფითი მხარეები. სწორედ ამიტომ ამ სისტემამ მოგვცა გარკვეული შედეგები, რომელი შედეგებიც იძლევა პოზიტივის საფუძველს და ამიტომაც შეგვიძლია თამამად ვთქვათ, რომ ეს სისტემა შეიძლება იყოს საწყისი ეტაპი იმისა, რომ დაიწყოს, განვითარდეს და მოხდეს სრულყოფილი სისტემის შექმნა, რომელიც მოახდენს ქართული ენის სრულად ამოცნობას და დამუშავებას. |
URI: | https://openscience.ge/handle/1/1598 |
Appears in Collections: | ზუსტ და საბუნებისმეტყველო მეცნიერებათა ფაკულტეტი (დისერტაციები, სამაგისტრო ნაშრომები) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MA Thesis Kobaxidze Davit.pdf | ქართული ენის ამომცნობი სისტემა | 1.14 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
237
checked on Jul 22, 2024
Download(s)
738
checked on Jul 22, 2024
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.