5/03/2016

Log. Интернет дэх сэтгэгдэлүүдийг ангилах програм хангамжийн шийдэл

[log]
Миний бичсэн анхны судалгааны өгүүлэл. Алдсан юм их байгаа цаашдаа улам сайн, чанартай өгүүлэл бичихийг хичээнээ. Судалгааны ажлыг маань удирдсан Хүдэр багш болон программын үр дүнг шалгах өгөгдөл цуглуулахад тусалсан Пүүжээ (Пүрэвбаатар), зөвлөгөө өгсөн дискрет математикын Лутбат багш нарт маш баярлалаа.
Мэдээж энэ судалгааны ажил маань ямар ч амжилт гаргаагүй хэхэ. Сургуулийн эрдэм шинэжилгээний хуралд хоцорсон учраас оролцож чадалгүй зөвхөн presentation л тавьсан. Сая Голомт банкны эрдэм шинэжилээний хуралд оролцохоор материалаа явуулсан ч 1-н даваанд нь бүдэрчээ хөөрхий. 

Голомт банкных аль дээр заргалдсан байсан ч орох хүсэлгүй байснаа гэнэт 4, 5 хоног дутуу байхад ормоор санагдаад. Тэгээд л нойр хоолгүй суусан даа. Сургууль дээр оо сойзтойгоо 3 хонож эн тэр. Пүүжээ сүүлд хоолтой, хар кофетой, мөнгөтэй ирдэг бас л ... хаха.

Судалгааны явцад python хэл дээр бас л овоо юм хийж сурлаа. Их олон янзын програм хөгжүүлсэн ч ажилладаг нь ганцхан байсан тул тэрийгээ л ашигласан. Миний хийж байгаа ажилтай холбогдох монгол хэл дээрх материалууд надад олдоогүй учраас англи хэл дээрх материалуудыг уншиж судалахаас өөр сонголтгүй болсон. Заримыг нь буруу зөрүү ойлгоод бантанг нь их хутгасан. Дискрет математикийн хичээлийг англи хэл дээрх сурах бичгээс үзэж байсан болхоор дискретийн багшаас холбогдох зарим ойлгомжгүй зүйлүүдээ сайн лавласан. Бие даалтын цаг дээр багш ихэнхдээ ганцаараа л сууж байдаг юм дөө. Асуухад их амар. Сүүлийн өдөр 18 цагаас өмнө өгөх ёстой гээд бичсээр байгаад, удирдаж байсан Хүдэр багшдаа ч шалгуулж амжилгүй аваачаад өгчихсөн. Ер нь бол манай салбарын эрдэм шинэжилгээний өгүүлэл ихдээ л 8,9 хуудас маш товч тодорхой байх ёстой байдаг юм байна лээ. Би ч 17 хуудас бичсэн л дээ хаха. Яагаад вэ гэвэл Голомт банкных доод тал нь 20 хуудас дээд тал нь 50 гэсэн байсан. Хуудасны тоонд нь хүргэх гээд элдэв бусын юм хамж бичсээр байгаад 17 болгосон нь тэр. 
Ингээд судалгааныхаа ажлын зарим оршил хэсгээс нь хуваалцая. (Судагааны ажлаа өгсөнийхөө дараа алдаа эн тэрийг нь засаагүй)


**********

Хураангуй:
Интернет дэх мэдээллийн веб сайтууд болон олон нийтийн сүлжээнд хүмүүс нээлттэй харилцаж, үзэл бодлоо илэрхийлэхдээ сэтгэгдлийг түгээмэл ашигладаг. Сэтгэгдлүүд утга агуулгын хувьд янз бүр байж болно. Тухайн мэдээлэл, сэдэв хүмүүст хүрэхийн хэрээр сэтгэгдлийн тоо ихсэдэг. Иймд их хэмжээний сэтгэгдэлтэй мэдээллийн бүх сэтгэгдлийг уншиж уншигчдын хандлагыг тодорхойлоно гэдэг хүнд хүчир ажил. Харин сэтгэгдэлүүдийг тодорхой ангилалын хүрээнд программын тусламжтайгаар ялгаж чадвал дээрхи ажлийг хөнгөвчлөхөөс гадна сэтгэгдлүүдээс хамааралтай байж болох өгөгдлийн олонлогийг гарган авах боломжтой. Энэ эрдэм шинжилгээний өгүүллээр сэтгэгдлүүдийг ангилах алгоритмын шийдэл, программыг хэрхэн хөгжүүлж болох тухай өгүүлэх болно.

Түлхүүр үг: хиймэл оюун ухаан, машин суралцах алгоритм, компьютерийн ухаан, мэдээллийг ангилах, магадлал, статистик, их өгөгдөл

Оршил
Интернетийн хэрэглээ жил ирэх тусам өсөн нэмэгдэж байгаа хэрээр хүмүүс харилцаа холбоондоо интернет ашиглан текст, видео, аудио хэлбэрээр мэдээлэл дамжуулах болсон. Тэр дундаас текстэн мэдээлэл нь хадгалах болоод дамжуулахад хялбар учир түгээмэл ашиглагддаг. Мэдээллийн веб сайтуудболон олон нийтийн сүлжээнд хүмүүс харилцахдаа сэтгэгдэл үлдээж их хэмжээний өгөгдлийг бий болгодог. Сэтгэгдэл нь тухайн мэдээлэл, сэдэв хэр их хүнд хүрсэн, хүмүүс хэрхэн хүлээж авч байгааг илтгэнэ. Мөн бүх сэтгэгдлийг уншиж нягтлахаас нааш агуулгийг нь мэдэх боломжгүй. Харин сэтгэгдлүүдийг задлан нягтлаж агуулгаар нь тодорхой ангилалын хүрээнд ангилаж чадвал тухайн мэдээлэл, сэдэвт хүмүүс хэрхэн хандаж байгааг статистик байдлаар дүрслэх боломжтой. Мөн сэтгэгдлүүдийг задлан боловсруулах явцад гарч ирсэн өгөгдлүүдийг цуглуулж статистик магадлал гарган бизнес загвар, нийгмийн инженерчлэл зэрэг өөр бусад зорилгоор ашиглаж болох юм.

1. Сэтгэгдэл
Интернет орчинд форумын сэдэв, олон нийтийн сүлжээн дэх нийтлэл, мэдээллийн веб сайтууд дээрхи нийтлэл текст байдлаар хэрэглэгчид сэтгэгдэлээ хуваалцдаг. [...]

2. Алгоритм
Их хэмжээний өгөгдөл боловсруулах, ангилах програм хангамж хөгжүүлэхэд алгоритмын шийдэл маш чухал нөлөөтэй. Текст баримт, бичиг ангилахад ашиглагддаг “Нуугдмал Марковийн загвар”, “Неюрал сүлжээ”, “Гэнэн Байес”, “Хамгийн ойр орших к хөрш”, “Шийдвэрийн мод” гэх мэт олон алгоритмууд байдаг. Мөн эдгээр алгоритмууд нь бүгд машин суралцах төрөлд хамаарагдана. Машин суралцах гэдэг нь компьютерийн ухааны хиймэл оюуны ойлголт бөгөөд машинийг тухайн нөхцөлд тодорхой програмчлахгүйгээр суралцах чадвар эзэмшүүлэх тухай судалдаг ухагдахуун юм. [...]


1 comment :

1 comment :

  1. mundag amjilt hvsie tsaashdaa mash olon sudalgaa hiigeerei :)







    ReplyDelete