NLP หรือ Natural Language Processing คือ เทคโนโลยีประมวลผลภาษาธรรมชาติ เป็นศาสตร์หนึ่งของ “AI” หรือเทคโนโลยี ปัญญาประดิษฐ์ ที่พัฒนามาเพื่อช่วยให้คอมพิวเตอร์สามารถเข้าใจและวิเคราะห์ภาษาแชททั่วไปของคนเราได้มากขึ้น
จริงๆ แล้ว NLP นี้เป็น AI ที่เกิดขึ้นมาบนโลกเป็นเวลากว่าหลายทศวรรษแล้ว แต่มีเพียงบางภาษาเท่านั้นที่สามารถนำมาใช้และถูกพัฒนาได้เรื่อยๆ เช่น ภาษาอังกฤษ, ภาษาจีน และภาษาญี่ปุ่น ส่วนภาษาไทยเรานั้นเพิ่งจะพัฒนาตามมาในช่วงปี 2010 เป็นต้นมา
เหตุผลหลักๆก็ด้วยปัจจัยของโครงสร้างทางภาษาที่ซับซ้อนกว่าภาษาอังกฤษ ทั้งสระ วรรณยุกต์ คำๆ เดียวอ่านได้หลายรูปแบบ มีรูปแบบประโยคที่เขียนติดกันหมด หากลองสลับคำนิดหน่อยความหมายก็เปลี่ยนได้อีก เช่น คำว่า “ขอบอก” อ่านได้ทั้ง ขอ-บอก และ ขอบ-อก หรือ ประโยคที่ว่า “คนขับรถไปตั้งแต่เช้า” มีความหมายทั้ง “คน-ขับรถ-ไปตั้งแต่เช้า” หรือ “คนขับรถ-ไปตั้งแต่เช้า” เป็นต้น
แล้วยิ่งถ้าเป็นภาษาแชทที่ใช้กันปกติในอินเตอร์เน็ตนั้น บ้านเราก็มีคำวิจิตรพิศดารใหม่ๆ ให้ใช้เพิ่มขึ้นทุกวัน จึงเป็นเรื่องยากที่คอมพิวเตอร์จะเข้าใจภาษาไทยเราได้ง่ายๆ ซึ่งถ้าหากเราพัฒนาเรื่องนี้ได้ดีเท่าไหร่ โอกาสเติบโตของวงการเทคโนโลยีบ้านเราก็จะไปได้ไกลมากขึ้นเท่านั้น
ด้วยเหตุผลนี้เอง ธนาคารกสิกรไทยจึงได้จับมือกับจุฬาลงกรณ์มหาวิทยาลัย ศูนย์เทคโนโลยีอิเลคทรอนิกส์และคอมพิวเตอร์แห่งชาติ(NECTEC) และบริษัท กสิกรไทยบิซิเนส-เทคโนโลยี กรุ๊ป (KBTG) พัฒนานวัตกรรมการประมวลผลภาษาไทย เรียกว่า Thai NLP ในส่วนของภาษาทางการเงินธนาคารและธุรกิจ
งานวิจัยในครั้งนี้มีจุฬาลงกรณ์มหาวิทยาลัย ที่เป็นสถาบันการศึกษาที่แข็งแกร่งทางด้านภาษาศาสตร์และคอมพิวเตอร์ รวมถึง NECTEC สถาบันวิจัยด้านเทคโนโลยีที่เชี่ยวชาญด้านปัญญาประดิษฐ์(AI)มาตลอด 30 ปี และธนาคารกสิกรไทยผู้นำด้านธุรกิจการเงินการธนาคารที่พร้อมสนับสนุนข้อมูลเพื่อให้งานวิจัยออกมาใช้ได้จริงกับภาคธุรกิจ เกิดเป็นความสำเร็จในการพัฒนา Thai NLP ครั้งนี้
วันนี้เราจะมาแชร์กระบวนการประมวลผลของ ThaiNLP เบื้องต้นให้คุณรู้จักกันว่า ThaiNLP มีขั้นตอนการประมวลผลอย่างไร คนไทยจะได้รับประโยชน์อะไรบ้าง และเราจะได้รับบริการที่ดีขึ้นจากธนาคารอย่างไร?
Thai NLP มีประโยชน์อย่างไร
ระหว่างการทำวิจัยที่ผ่านมา KBank ก็ได้มีการนำ ThaiNLP ไปทดลองใช้งานในแชทบอทอัจฉริยะ เพื่อตอบโต้บนแพลตฟอร์มต่างๆ ที่ให้บริการในช่องทางออนไลน์ของ KBank เนื่องจากในปัจจุบันคนรุ่นใหม่สบายใจที่จะพูดคุยกับแชทบอท ก่อนโทรหา Call Center หรือเดินทางไปที่ธนาคาร หลังจากทดลองใช้ก็สามารถรับรู้ Feedback ของลูกค้าจากการใช้บริการได้รวดเร็วมากขึ้นเป็น 10 เท่า
ซึ่งถ้าหาก ThaiNLP สามารถพัฒนา AI ให้คอมพิวเตอร์ฉลาดและแม่นยำยิ่งขึ้น ธนาคารจะช่วยเหลือลูกค้าให้ได้รับบริการที่ได้รับความพึงพอใจได้มากยิ่งขึ้น ซึ่งจะเปลี่ยนรูปแบบการดำเนินธุรกิจทั้งของธนาคารและธุรกิจอื่น ๆ ได้อีกมากมาย เช่น ช่วยวิเคราะห์และจัดการเอกสาร ช่วยคัดกรองผู้สมัครเข้าทำงานกับธนาคาร ช่วยสรุปเนื้อหาสำคัญที่จำเป็นต่อการอนุมัติสินเชื่อ รวมทั้งนำไปใช้ในการตรวจสอบเอกสารสัญญาและธุรกรรมต่างๆ ได้ในอนาคต
Thai NLP ทำงานอย่างไร?
สำหรับการทดลองใช้งาน ThaiNLP ในแชทบอท ของ KBank นั้น ThaiNLP จะทำงานร่วมกับ API หรือ Application Programming Interface ทั้ง 12 คำสั่ง
เริ่มต้นจากทันทีที่มีลูกค้าแชทเข้ามาหาในแชทบอท ตัวอย่างข้อความแชทมาว่า “สวัสดีค่ะ สมัครบัดเครดิตต้องมีเงินเท่าไหร่หรอ”
ระบบ AI ในแชทจะเริ่มตรวจสอบว่าเป็นข้อความทางการเงินหรือไม่ (Spam Detection) จากนั้นระบบจะแบ่งคำในข้อความประโยคนั้นออก(Word Segmentation) โดยแยกออกมาเป็นคำๆเพื่อให้คอมพิวเตอร์เริ่มประมวลผล
หลังจากแยกคำออกมาแล้ว ระบบแชทจะวิเคราะห์ชนิดของคำในประโยคนั้น (Part of Speech Tagging) พร้อมทั้งแก้ไขคำสะกดผิดในข้อความ (Error Correction) รวมถึงแก้ไขรูปแปรของคำในข้อความ (Variant Correction)
เปลี่ยนรูปคำในประโยคจากภาษาพิมพ์แชททั่วไป ให้เป็นคำภาษาเขียน เพื่อให้ง่ายในการค้นหาข้อมูลได้ตรงใจลูกค้า
เมื่อระบบแก้ไขข้อความทั้งประโยคจากภาษาพิมพ์แชทเป็นภาษาเขียนแล้ว ระบบจะตรวจหาชื่อเฉพาะในข้อความ(Named Entity) จากนั้นแบ่งข้อความตามรูปประโยค(Sentence Segmentation) และแบ่งข้อความตามใจความสำคัญ (EDU Segmentation) เพื่อให้คอมพิวเตอร์สามารถทำความเข้าใจได้ง่ายขึ้น
นอกจากนี้ ระบบ ThaiNLP ยังทำงานใกล้เคียงมนุษย์มากขึ้นอีก ด้วยความสามารถในการแยกประเภทเจตนาในข้อความได้อีก (Intention Classification) คอมพิวเตอร์สามารถเข้าใจคุณได้ว่า แชทมาเพื่อสอบถาม ติชม หรือต้องการทำอะไร รวมถึงวัดความรู้สึกในข้อความ (Feeling Classification) ว่าคุณพึงพอใจกับบริการนี้แค่ไหน และตรวจหาเอนทิติในข้อความ(Entities Extraction) เพื่อบันทึกข้อมูลการใช้บริการของเรา เพื่อหยิบไปพัฒนาต่อไปได้อีกด้วย
นี่ก็คือตัวอย่างการทำงานของ Thai NLP ข้างต้นที่เกิดขึ้นในแชทบอทของธนาคารกสิกรไทยแล้ว ซึ่งเทคโนโลยีนี้ถือเป็นก้าวที่สำคัญกับวงการเทคโนโลยีในเมืองไทย จึงควรแบ่งปันความรู้ให้ความสนับสนุนกับทุกวงการทั่วประเทศ
ล่าสุดเนคเทค-สวทช.จึงได้เปิดตัวแพลตฟอร์มบริการ AI ในชื่อว่า AI FOR THAI รองรับการประมวลผลภาษาไทย เสียงและรูปภาพ อาทิ การวิเคราะห์ความคิดเห็น, การสร้างแชทบอท, การแปลเสียงพูดให้เป็นข้อความ, การแปลข้อความให้เป็นเสียงพูด, การวิเคราะห์ภาพ ใบหน้าและวัตถุ ให้นักพัฒนาโปรแกรมสามารถเข้ามาทดลองใช้งานและร่วมพัฒนาบริการใหม่ๆ เพื่อมาวางบนแพล็ตฟอร์ม AI FOR THAI ต่อไปได้ รวมถึงองค์ความรู้จากการวิจัยในครั้งนี้ ส่วนหนึ่งก็จะถูกนำไปใช้แพร่หลายผ่าน AI FOR THAI เพื่อประโยชน์สาธารณะต่อไปอีกด้วย