არჩუაძე, მაიაკობახიძე, დავითდავითკობახიძე2020-01-272020-01-272019https://openscience.ge/handle/1/1598In this thesis has been examined a system which implements recognition and processing of the Georgian language from various information sources, for example, such as for all well known Wikipedia, Facebook and other numerous social and information networks, but for recognition and processing are not used the algorithms of standard stemming and lemmatization, as the Georgian language and its peculiarities make use of the standard algorithms impossible, that is why a new stemming algorithm became necessary which would implement the processing of the text and which in this concrete case is based exclusively on the base of the initial forms of conjunctions, pronouns and nouns. It should also be mentioned that similar systems are not so many for the Georgian language and in this thesis the positive sides of all existing systems, one way or another, are stipulated and their negative sides are improved. Exactly thus and so, this system gave us certain results, these results give us the basis of the positive outcome and that is why we can say with certainty that this system can be an initial stage of commencement, development and creation of a full-fledged system that will implement complete recognition and processing of the Georgian language.ამ ნაშრომში განხილულია სისტემა, რომელიც ახდენს ქართული ენის ამოცნობას და დამუშავებას სხვადასხვა ინფორმაციული წყაროდან. მაგალითისთვის, როგორიცაა ყველასათვის კარგად ნაცნობი ვიკიპედია, ფეისბუქი და სხვა მრავალი სოციალური და საინფორმაციო ქსელი, მაგრამ ამოცნობისთვის და დამუშავებისთვის არ გამოიყენება სტანდარტული სტემინგის და ლემატიზაციის ალგორითმები, ვინაიდან ქართული ენა და მისი თავისებურებები შეუძლებელს ხდის სტანდარტული ალგორითმების გამოყენებას, ამიტომ საჭირო გახდა სტემინგის ახალი ალგორითმი, რომელიც მოახდენდა ტექსტის დამუშავებას და რომელიც ამ კონკრეტულ შემთხვევაში ეფუძნება მხოლოდ და მხოლოდ სიტყვების საწყისი ფორმების ბაზას. ასევე უნდა აღინიშნოს რომ ქართული ენისთვის მსგავსი სისტემები არც თუ ისე ბევრია და ამ ნაშრომში ყველა არსებული სისტემის დადებითი მხარე ასე თუ ისე გათვალისწინებულია და გაუმჯობესებულია მათი უარყოფითი მხარეები. სწორედ ამიტომ ამ სისტემამ მოგვცა გარკვეული შედეგები, რომელი შედეგებიც იძლევა პოზიტივის საფუძველს და ამიტომაც შეგვიძლია თამამად ვთქვათ, რომ ეს სისტემა შეიძლება იყოს საწყისი ეტაპი იმისა, რომ დაიწყოს, განვითარდეს და მოხდეს სრულყოფილი სისტემის შექმნა, რომელიც მოახდენს ქართული ენის სრულად ამოცნობას და დამუშავებას.kaქართული ენის ამომცნობი სისტემაქართული ენის ამომცნობი სისტემაmaster thesis