การบ้านครั้งที่ 4: Markov Model Tagger (Bigram Tagger)


คำอธิบาย


ให้เขียน class ชื่อ MarkovModelTagger ซึ่งประกอบด้วย methods ดังนี้
  • train(corpus): โดยที่ corpus คือชื่อไฟล์ที่ต้องใช้ในการสอนระบบ (ให้ทดสอบการไฟล์ news_cp874)
  • tag(text): โดยที่ text คือ ข้อความที่ถูกตัดคำแล้ว (ใช้ช่องว่างในการแบ่งคำ) และ return เป็นข้อความที่ถูกกำกับ POS แล้ว (ใช้รูปแบบการกำกับแบบเดียวกับที่ใช้ในไฟล์ news_cp874)

ให้ใช้วิธีการตามที่สอนในชั่วโมงเรียน

การส่งงาน


ให้เขียนฟังก์ชั่นทั้งสองลงในไฟล์ชื่อว่า tagger.py จากนั้นจึงบีบอัดโดยวิธีการ zip แล้วตั้งชื่อไฟล์ว่า tagger-xxx.zip (xxx คือรหัสนิสิต) แล้วส่งมาที่ sutee.s@gmail.com โดยใช้หัวเรื่องว่า NLP Homework 04 ส่งภายในวันที่ 21 กันยายน 2554