การประมวลผลภาษาธรรมชาติเชิงสถิติ


ประกาศ

  • การนำเสนอโปรแกรมตัดคำเริ่มเวลา 15.00 น. (วันที่ 28 กันยายน 2554)
  • สอบปลายภาควันที่ 30 กันยายน 2554 เวลา. 9.00 - 11.00 น. ห้อง SMC 101
  • การนำเสนอโปรแกรมตัดคำ (รอบสอง) วันที่ 7 ตุลาคม 2554 ตั้งแต่วัน 13.00 - 16.00 น.
    • ถ้าใครไม่นำเสนอในครั้งแรกและไม่มานำเสนอในรอบที่สอง จะไม่มีคะแนนในส่วนนี้

คะแนน


การบ้านและโครงงาน


ข้อมูลที่จำเป็นสำหรับการตัดคำ


รายละเอียด

  • ผู้สอน
    • อ.สุธี สุดประเสริฐ
  • เนื้อหาวิชา
    • เน้นการปฏิบัติและเรื่องรู้จากการใช้ NLTK และ สอนการโปรแกรมโดยใช้ภาษา Python ควบคู่ไปด้วย
  • วันเวลาและสถานที่
    • วันพุธ เวลา 15.00 ถึง 19.00 น. ห้อง SMC 101
  • สัดส่วนคะแนน
    • โครงงาน 20%
    • การบ้าน 20%
    • สอบ 50%
    • จิตพิสัย 10%
  • การตัดเกรด
    • อิงเกณฑ์มาตรฐาน
  • หนังสือประกอบการสอน
    • Foundations of Statistical Natural Language Processing - Manning and Schutze
    • Natural Language Processing with Python - Bird, Klein, and Loper
  • เว็บไซด์แนะนำ

โปรแกรมที่จำเป็น


ตารางการเรียนการสอน


สัปดาห์ที่
เนื้อหา
เอกสารประกอบการสอน
กิจกรรมการเรียนการสอน
1
บทนำ
โปรแกรมภาษา Python เบื้องต้น
บทนำ
บรรยาย
2
การโปรแกรมภาษา Python (ต่อ)

บรรยาย
3
การประมวลผลภาษาโดยใช้ Python และ NLTK
การประมวลผลภาษากับไพธอน
บรรยาย
4
ทฤษฎีทางภาษาศาสตร์
ทฤษฎีทางภาษาศาสตร์เบืี้องต้น
บรรยาย
5
ทฤษฎีความน่าจะเป็นและทฤษฎีข้อมูล
ทฤษฎีความน่าจะเป็น
ทฤษฎีข้อมูล
บรรยาย
6
การเกิดคู่ของคำ (Collocation)
การเกิดคู่ของคำ
บรรยาย
7
การตัดคำในภาษาไทย
การตัดคำในภาษาไทย
บรรยาย
8
นิพจน์ปกติโดยใช้ Python
การใช้งานทรัพยากรทางภาษา
นิพจน์ปกติในภาษา Python
การใช้งานทรัพยากรทางภาษา
คลังประโยค
บรรยาย
(ควรนำคอมพิวเตอร์มาด้วย)
9
แบบจำลองทางภาษา
N-gram model
บรรยาย
10
การกำกับวจีวิภาค
Part of Speech Taging
บรรยาย
11
แบบจำลองมาร์คอฟแบบซ่อนเร้น
Hidden Markov Models
Markov Model Taggers
บรรยาย
12
ความคลุมเครือทางความหมาย
Word Sense Disambiguation
บรรยาย
13
การรวบรวมข้อมูลเชิงคำศัพท์
Lexical Acquisition
บรรยาย
14
-
-
บรรยาย
15
นำเสนอโครงงาน

บรรยาย
หมายเหตุ: ตารางการเรียนการสอนอาจมีการเปลี่ยนแปลงภายหลังตามความเหมาะสม