Бидний тухай
Багш ажилтан
Элсэлтийн ерөнхий шалгалтын дүнг урьдчилан таамаглах нь шалгалтанд бэлтгэгчид болон шийдвэр гаргах түвшний байгуулагад үнэтэй мэдээлэл болдог. Судалганы ажлын зорилго нь ЕБС-ийн сурагчийн сурлагын дүн болон бусад хувийн өгөгдөлд тулгуурлан шалгалтын дүнг урьдчилан таамаглах боломжийг судлах юм. Ерөнхий боловсролын сургуулийн сүүлийн 3 жилийн сурлагын дүн, амьдрах орчны судалгаа, элсэлтийн ерөнхий шалгалтын дүнгээс тохирох онцлогийг тодорхойлж, хэд хэдэн регресс болон машин сургалтын техникийг ашигласан. Туршилтаар бидний боловсруулсан хамгийн сайн загвар нь 78.5 хувийн зөв таамагласан үр дүн үзүүлсэн.
Энэхүү судалгааны ажлаар гүн сургалтын арга ашиглан нэг унц алтны үнэ НьюИоркийн арилжааны мөчлөг эхэлснээс хойш эхний 4 цагт өсөх, буурах, тогтмол төлөвт байх гэсэн гурван ангиллаар таамаглал дэвшүүлэх туршилт хийлээ. Сүүлийн 8 жилийн хугацааны нийт 2.8 сая минутын алтны үнийн тоон өгөгдлөөс онцлогуудыг ялган 1694 өдрийн мэдээллийг сургалтын өгөгдлөөр түүвэрлэн авсан. Загварын нууц давхаргын нейроны тоог бууруулахад загварын сургалтын болон баталгаажуулах түүврийн алдааны утгуудын зөрүү 0.02-оор буурч, загварын үнэлгээ сайжирсан. Судлаачийн үүсгэсэн алтны үнийн 3 ангиллыг 60 хувийн магадлалтай зөв таамагласан байна. Цаашид үнийн таамаглал дэвшүүлэх загварыг боловсронгуй болгосноор санхүүгийн эрсдэл, ашигт ажиллагаа зэрэг өргөн хэрэглээнд нэвтрүүлэх боломжтой юм.
Судалгааны ажлаар ажил олгогч болон ажил горилогчийн мэдээллийг ажлын зар болон анкетаас задлаж тухайн ажил олгогчид тохирох ажил горилогчийг олж санал болгох, нөгөө талаас ажил горилогчид хамгийн тохирох ажлын байрыг санал болгож чадах загварыг машин сургалт болон хайлтын алгоритмуудыг ашиглан бий болгох зорилго тавин ажиллалаа.
The research aims to create a model using machine learning and search algorithms that can parse information from job postings, and applicant resumes to recommend suitable candidates to employers and the most suitable jobs to applicants.
Блокчэйн гэж юу болох, монгол улсад ямар түвшинд хөгжиж байгаа болон блокчэйн суурилсан гарааны бизнесийн туршлага.
Хуурамч диплом, гэрчилгээтэй холбоотой асуудал монголд төдийгүй олон улсад байнга үүсч байдаг. Харин цахим шилжилтийн үед аливаа цахим баримт болон өгөгдлийг баталгаажуулах суурь технологи нь блокчэйн болоод байна. Монголын ИДС-ийн диплом, гэрчилгээг гадаад улсын ажил олгогч, их дээд сургуулиудад үнэн зөв эсэхийг баталгаажуулхад цаасан хүсэлт тухайн улс дахь элчин сайд, монгол улсын гадаад хэргийн яам, боловсролын яамаар дамжаад диплом олгосон их, дээд сургуульд ирж баталгаажаад уг дарааллаар буцдаг. Энэ нь цаг хугацааны хувьд 14-45 хоног, цаасан архив шалгах, шуудангийн зардал гээд олон хүндрэлийг дагуулдаг. Тэгвэл энэ хүндрэлийг байхгүй болгож дэлхийн хаанаас ч хормын дотор, нээлттэй, ямар ч зардалгүйгээр баталгаажуулж чадах блокчэйн шийдлийг энэ ажлаар санал болгож байна.
Цахим валютыг ашиглах нь улам бүр нэмэгдсээр төв банкнууд өөрсдийн цахим валютыг (Central Bank Digital Currency) гаргах боломжийг дэлхий даяар эрэлхийлж байна. Энэ ажлаар олон улсын төв банкуудын цахим валютуудын өнөөгийн байдал, ирээдүй хэтийн төлөв, туршлагыг судалж, орчны ялгаа, гол хөдөлгөгч хүчин зүйлсийг онцлов. Түүнчлэн CBDC-ийн технологийн шийдэл, систем архитектурын талаар практик ойлголтыг өгөхийн сацуу Монгол улсад хэрэглэж болох шийдлийг санал болгож байна.
Хуурамч диплом, гэрчилгээтэй холбоотой асуудал монголд төдийгүй олон улсад байнга үүсч байдаг. Харин цахим шилжилтийн үед аливаа цахим баримт болон өгөгдлийг баталгаажуулах суурь технологи нь блокчэйн болоод байна. Монголын ИДС-ийн диплом, гэрчилгээг гадаад улсын ажил олгогч, их дээд сургуулиудад үнэн зөв эсэхийг баталгаажуулхад цаасан хүсэлт тухайн улс дахь элчин сайд, монгол улсын гадаад хэргийн яам, боловсролын яамаар дамжаад диплом олгосон их, дээд сургуульд ирж баталгаажаад уг дарааллаар буцдаг. Энэ нь цаг хугацааны хувьд 14-45 хоног, цаасан архив шалгах, шуудангийн зардал гээд олон хүндрэлийг дагуулдаг. Тэгвэл энэ хүндрэлийг байхгүй болгож дэлхийн хаанаас ч хормын дотор, нээлттэй, ямар ч зардалгүйгээр баталгаажуулж чадах блокчэйн шийдлийг энэ ажлаар санал болгож байна.
Энэхүү судалгааны ажлын хүрээнд бид машин сургалтын аргад суурилан бүтээсэн монгол хэл боловсруулалтын хэрэглүүрүүд болон нээлттэй эхийн программуудыг ашиглан сурах бичгийн нэг ангийн (монгол хэлний 5 дугаар анги) өгөгдлийг боловсруулж, үеийн давтамж, үгийн сангийн давтамж болон үгийн аймгийн хэрэглээ, хэлзүйн хувилал, өгүүлбэрийн бүтэц, хэв шинжийн давтамж зэрэг цогц тоон шинжилгээ хийж, үр дүнг танилцуулахыг зорьсон болно. Сурах бичгийн өгөгдлийн шинжилгээ нь түүний агуулга, стандарт, сургалтын хөтөлбөрийн удирдамж боловсруулах болон анги дэвших бүрд агуулга, үгийн сан, хэл найруулгын талаас ямар ахиц дэвшил гарч байгааг тогтоох зэрэгт чухал ач холбогдолтой юм.
Goal of research work is to determine the most important features on predicting the grade of the General Entrance Exam (GEE). The features are high school student’s grade, personal information, and state exam results. We collected 96,827 high school students data and compared the F1 measures with different classification techniques such as decision tree, logistic regression, artificial neural network, and support vector machine. Among these techniques, the SVM provided the best F1 measure that is 0.70.
Asinformationflowintheelectroniconlineenvironmentisincreasing, the need for automated processing is increasing. Every minute, 456,000 tweets were written on Twitter. The data in the Mongolian language is already joined in that stream and created their own space since a long time ago. However, in the Mongolian language, there is a lack of research, language resources, and an implemented system by now. In this work, we tried to classify the document level sentiment polarity of Mongolian tweets based on the RNN method of deep learning. The model was tested at the 62,917 SemEval English data, the highest F1 score of 64.7.
As education becomes increasingly digital, all educational institutions are collecting a lot of data, including quarterly exams, homework scores, and student personal information. But all this information used to make the final result of the student whether to pass or fail the particular examination. If student data is analyzed timely then definitely it will help the student to improve their performance in academics. Now a day's educational system is not limited to any formal teaching within a classroom but it goes beyond that like online MOOC course, Web-based education system (WBS), an intelligent tutorial system (ITS), Project-based learning (PBL), webinar, Seminar, Workshops and many more. All these teaching methods make the education system more attractive and provide lots of knowledge and learning through a different source. If all these methods do not properly check and evaluate then it adversely affect the education system. So for making any education system to have a success, then a proper evaluation check should be maintained. The ML techniques are used to analyze the historical data of any organization by using an inbuilt algorithm, which further finds the hidden information from that data which is not possible to find manually. By periodically evaluating the student progress, timely help and support are provided to those students who are on the risk of failure or dropout, so that they can improve their performance in the future.
As information flow in the electronic online environment is increasing, the need for automated processing is increasing. Every minute, 456,000 tweets were written on Twitter. The data in the Mongolian language is already joined in that stream and created their own space since a long time ago. Business and research organizations from the UK, US, China, Germany, France, Russia, Italy and Spain get decision helping data automatically of unlimited data streams by using sentiment analysis systems. However, in the Mongolian language, there is a lack of research, language resources, and an implemented system. In this work, we tried to classify the document level sentiment polarity of Mongolian tweets on the Twitter social network based on the RNN method of deep learning. The model was tested at the 62917 SemEval English data, the highest F1 score of 64.7.
Өгүүллээр монгол хэлний "ижил үг" буюу бичлэг ижил ч утга нь өөр үгс өгүүлбэрт аль утгаараа орсныг графт суурилсан статистик аргаар тодорхойлохыг оролдлоо. Бид 1.6 сая орчим үгтэй гар тэмдэглэгээт хөмрөгөөс 440 мянга орчим оройтой утгын граф байгуулсан ба уг графаас туршилтын хөмрөгт орсон ижил үгсийн утгыг хайхад 55.4 хувь зөв тодорхойлсон. Энэ нь олон улсын жишигтэй харьцуулахуйц үр дүн юм.
Ярианы технологид үгийн дуудлагыг бичвэрээс нь гаргаж өгдөг дуудлагын хөрвүүлэг нь чухал үүрэгтэй. Энэ өгүүлэлд дүрэмд суурилсан аргад тулгуурлан хөгжүүлсэн бичвэрээс дуудлагад хөрвүүлэх хэрэгслийн алгоритм, хэрэгжүүлэлт болон туршилтын үр дүнг танилцуулав. Энэхүү ажлаар хийж буй бичвэрийг дуудлагад хөрвүүлэх хэрэгсэл нь ижил бичлэгтэй боловч өөр дуудлагатай үгс (омограф)- ийн дуудлагыг ялгах боломжтой ба мөн өвөрмөц буюу дүрмийн бус үгс, гадаад үгсийн дуудлагыг дуудлагын толь бичгээс авах боломжтойгоороо өмнөх ижил төстэй ажлуудаас ялгаатай, шинэлэг юм. Монгол хэлэнд өргөн хэрэглэгддэг үгсээс омограф үгсийг тоолох туршилт хийж нийт 75 мянган үгсээс 92 омограф үг олсон.
Өгүүллээр монгол хэлний "ижил үг" буюу бичлэг ижил ч утга нь өөр үгс өгүүлбэрт аль утгаараа орсныг графт суурилсан статистик аргаар тодорхойлохыг оролдлоо. Бид 1.6 сая орчим үгтэй гар тэмдэглэгээт хөмрөгөөс 440 мянга орчим оройтой утгын граф байгуулсан ба уг графаас туршилтын хөмрөгт орсон ижил үгсийн утгыг хайхад 55.4 хувь зөв тодорхойлсон. Энэ нь олон улсын жишигтэй харьцуулахуйц үр дүн юм.
Тус өгүүллээр бид Twitter нийгмийн сүлжээнд монгол хэлээр бичигдсэн жиргээний сэтгэгдлийг (эерэг, сөрөг, саармаг г.м.) тодорхойлох гүн сургалтын LSTM загвар байгуулахыг зорилоо. Урьдчилан сургасан 300 хэмжээст Word Embedding матрицыг загварынхаа анхны жингээр өгч LSTM давхарга бүхий гүн сургалтын загвар тодорхойллоо. Уг загвараар 2509 өгөгдөлд сургаж, үр дүнг үнэлэхэд F1 оноо 66.9 болсон. Энэ нь олон улсын жишигтэй харьцуулахуйц үр дүн юм.
This paper presents a pioneering work on building a Named Entity Recognition (NER) system for the Mongolian language. While state-of-the-art NER methods have produced results close to human performance for well-studied languages, the approaches that work in, typically fare much worse when applied directly to languages such as Mongolian, with an agglutinative morphology and a subject-object -verb word order. Our work explores a fittest feature set from a wide range of features. As well as we tried to apply various existing machine learning methods and find optimal ensemble of classifiers based on genetic algorithm. The classifiers used different feature representations. The resulting system constitutes the first-ever usable software package for Mongolian NER, while our experimental evaluation will also serve as a much- needed basis of comparison for further research.
This paper presents a graph-based word sense disambiguation(WSD) method for Mongolian and its results. WSD automatically identifying the meaning of ambiguous words in context, is an important stage of text processing. The results indicate that the right combination of similarity metrics algorithms can lead to a performance comparable with the state-of-the-art in unsupervised word sense disambiguation, as measured on hand annotated sentences.
This paper presents a graph-based word sense disambiguation(WSD) method for Mongolian and its results. WSD automatically identifying the meaning of ambiguous words in context, is an important stage of text processing. The results indicate that the right combination of similarity metrics algorithms can lead to a performance comparable with the state-of-the-art in unsupervised word sense disambiguation, as measured on hand annotated sentences.
This paper describes the development of finite state morphological transducer for Mongolian and presents some issues in Mongolian morphology, linguistic issues encountered and how they were dealt with. The work done here includes all the morphophonological rules needed for all Mongolian nominal and verb. Nominal morphotactic is implemented completely and verbal morphotactic covers one level continuation lexica. An evaluation is done via analysis on two separate corpora, which shows high-level and medium-level coverage respectively. It is more elaborate and accurate than previous implementations of its kinds.