Idea

โดยให้ input method จัดการแทรกรหัสแบ่งคำให้โดยอัตโนมัติ (เหมือนกับที่ถ้าเราสามารถทำ input sequence correction ได้ ก็ใช้วิธีเดียวกัน) ทีนี้ โค้ดแบ่งคำก็จะมาอยู่ที่เดียวจริงๆ และผู้ใช้ยังสามารถควบคุมการแบ่งคำระหว่าง input ได้เลยรวมทั้งไม่ต้องไป localize โปรแกรมต่างๆ (ที่ support unicode) ในส่วนของการตัดคำอีก โปรแกรมก็จะสามารถตัดคำได้ “off-the-shelf” เลย
เทพพิทักษ์ การุญบุญญานันท์

 

PyICU

หลังจากพยายามนั่งทำ Binding ของ libthai ให้เป็น Python อยู่หลายวัน พบว่ามีคนทำ PyICU อยู่ก่อนแล้ว T_T แต่ก็นับว่าได้ความรู้การใช้งาน Python ระดับล่างๆ ได้ดีขึ้นเยอะ

pyicu

ถึงตอนนี้โครงการ ZWSP คงเห็นทางเสร็จทันปลายปี

 

ทำไมถึงต้อง ZWSP

ผมพูดถึงเรื่อง ZWSP มาเป็นปีๆ แม้จะไม่ได้รับความสนใจนัก นอกจากที่ไปพูดในงาน BTD ที่ผ่านมา จนหลา่ยคนอาจจะสงสัยว่าหมอนี่มันเป็นอะไร?

คำตอบคือ การใช้การตัดคำในทุกวันนี้ไม่เป็นมาตรฐานเปิด

การตัดคำไทยในทุกวันนี้อาศัยการรู้กันของเหล่านักพัฒนาว่าควรจะตัดคำไทยอย่างไรจึงจะเหมาะสม ขณะที่ไม่มีอะไรเป็นหลักประกันเลยว่าโปรแกรมหนึ่งๆ จะเวิร์คกับภาษาไทยในอนาคต

ที่ร้ายกว่านั้นคือเอกสารที่เราทำในทุกวันนี้ก็อาจจะใช้งานไม่ได้ในอนาคตด้วยซ้ำไป ลองนึกภาพคุณจัดหน้าหนังสือเล่มหนึ่ง ในโอเพนออฟฟิศหรือไมโครซอฟท์เวิร์ดในวันนี้ ทุกอย่างมันถูกต้องสวยงามดี แล้ววันหนึ่ง สามสี่ปีผ่านไป คุณใช้โปรแกรมเดิม (เวอร์ชั่นใหม่) เปิดไฟล์เดิม ด้วยฟอนต์เดิม แต่การจัดหน้ากลับเละเทะจนคุณต้องทำงานจัดหน้าใหม่อีกครั้ง

นี่ไม่ต้องพูดถึงต่างโปรแกรม ต่างบราวเซอร์ ฯลฯ

การใส่ ZWSP เป็นมาตรฐานที่ทั่วโลกรองรับกันอยู่แล้ว ไม่ว่าจะเป็น OpenType หรือ Unicode แม้ในทุกวันนี้โปรแกรมและฟอนต์ยังรองรับในวงแคบ แต่มีแนวโน้มที่ชัดเจนว่าจะขยายตัวขึ้นอย่างต่อเนื่อง

ขณะที่มันเป็นไปได้ว่าเราจะไปแจ้งกับนักพัฒนาโอเพนซอร์ส ขอให้เพิ่มความสามารถในการรองรับ ZWSP เนื่องจากเป็นมาตรฐานของ Unicode มันจะถูกรับเรื่องไปไม่ยากนัก ขณะที่การขอให้มีการตัดคำไทยนั้นไม่ใช่เรื่องง่ายเลย

อีกประเด็นคือเรื่องของภาษา

ภาษาที่ยังมีการใช้งานเช่นภาษาไทย จะมีการเปลี่ยนแปลงไปตามกาลเวลาเสมอ เราจะเห็นคำว่า จ๊าบ ทำมัย โลกานุวัตร ฯลฯ ไม่ว่าเราชอบหรือไม่ คำเหล่านี้มีใช้จริงในภาษาไทย เช่นเดียวกับคำอื่นๆ จำนวนมากที่เกิดขึ้นและหายไปตามกาลเวลา

ประเด็นนี้คือต้นเหตุของความล้มเหลวในการรักษาความสามารถในการตัดคำในอนาคต เราไม่สามารถบอกได้เลยว่าคำใดจะเพิ่มเข้ามาหรือหายไป เราได้แต่ภาวนาว่ามันจะไม่เกิดขึ้นบ่อยเกินไปนัก และเอกสารหลายร้อยหน้าของเราจะพร้อมใช้งาน เมื่อเราจะพิมพ์ออกมาในห้าปีข้างหน้า

แต่อย่างไรก็ตาม ZWSP ยังไม่พร้อมในวันนี้ มันต้องการการปูทางความพร้อมอีกหลายๆ ด้าน โดยเฉพาะอย่างยิ่งสองประเด็นคือการรองรับเอกสารเก่าๆ ที่ไม่มี ZWSP และการปรับตัวของผู้ใช้ที่ไม่ควรรู้สึกแตกต่างกับการทำงานก่อนหน้านี้