BDI เร่งปั้น ‘ThaiLLM’ โมเดลภาษาไทยหวังดัน สู่โครงสร้างพื้นฐาน AI แห่งชาติ

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI ภายใต้การนำของ ธีรณี อจลากุล เผยโครงการ ThaiLLM (Thai Large Language Model) ซึ่งมีสถานะความพร้อมแล้วกว่า 70 % โดยในเวอร์ชันแรกโมเดลได้ถูกติดตั้งไว้ในระบบคลาวด์ของบริษัท โทรคมนาคมแห่งชาติ (NT) เพื่อให้สตาร์ทอัพ นักพัฒนา และหน่วยงานที่เกี่ยวข้องเข้าถึงและใช้งานฟรีได้ทันที ช่วงต่อมาคาดว่าจะเปิดให้ประชาชนทั่วไปใช้งานได้ภายในเดือนกุมภาพันธ์ 2569

โดยในเฟสแรก BDI ได้ตั้งงบประมาณไว้ที่ 89 ล้านบาท ใช้เวลากว่า 1.5 ปี โดยจะเน้นนำร่องใช้งานใน 2 อุตสาหกรรมหลักของไทย คือ การแพทย์ และ การท่องเที่ยว 

ซึ่งถือเป็นจุดแข็งสำคัญของประเทศ ก่อนจะเปิดโอกาสระดมทุนเพิ่มเติมสำหรับการใช้งานคลาวด์และฝึกปรับปรุงโมเดลในระยะยาว ปัจจุบันเอง มีผู้ให้บริการคลาวด์และภาคเอกชนจำนวนหนึ่งแสดงความสนใจเข้าร่วมสนับสนุนในเฟสถัดไปแล้ว

นอกจากนี้ BDI ได้เริ่มรับบริจาคข้อมูลจากหน่วยงานต่าง ๆ เช่น ข้อมูลจากหน่วยงานภาครัฐ ธนาคาร (ข้อมูลที่ไม่เกี่ยวข้องกับลูกค้า) และสื่อมวลชน เพื่อใช้ฝึกโมเดลให้เข้าใจบริบทภาษาไทยในวงกว้าง รวมถึงร่วมมือในการพัฒนาระบบตรวจจับข่าวปลอม (Fake News Detection) เพื่อให้โมเดลสามารถแยกแยะระหว่างข่าวจริงและข่าวปลอมได้แม่นยำยิ่งขึ้น

นอกจากนี้ BDI ยังเปิดโอกาสให้ภาคสื่อมวลชนและกลุ่มผู้ใช้งานเสนอโจทย์หรือคำถามที่ต้องการให้ระบบตอบได้ถูกต้องและมีเหตุผล ซึ่งจะเป็นหนึ่งในกระบวนการที่ช่วยให้โมเดล “เรียนรู้” ภาษาไทยได้ลึกซึ้งมากขึ้นและปรับตัวให้เข้าใจบทสนทนาหรือคำถามในชีวิตจริงได้ดีกว่าเดิม

เธอ เสริมว่า ภายในปี 2570 โมเดล ThaiLLM จะเริ่มสร้างรายได้ โดยเปิดให้หน่วยงานรัฐและเอกชนใช้บริการ custom training เพื่อสร้างแชตบอทเฉพาะทาง เช่น แชตบอทด้านกฎหมาย ระบบตอบคำถามนโยบายรัฐ หรือแชตบอทให้บริการภายในองค์กร โดยไม่จำเป็นต้องฝึกโมเดลตั้งต้น ช่วยประหยัดต้นทุนและเวลาในการพัฒนาได้อย่างมาก

ThaiLLM ถือเป็นครั้งแรกที่ภาครัฐลุกขึ้นมาสร้างโมเดลภาษาไทยโดยพลังร่วมจากทุกภาคส่วน เป้าหมายไม่ใช่แข่งขันกับ ChatGPT หรือ Gemini แต่เป็นการสร้างระบบเปิด ที่ทุกคนสามารถต่อยอดได้ เป็นโครงสร้างพื้นฐานด้านภาษาแห่งชาติ ไม่ต้องเสียค่าบริการรายเดือน และไม่มุ่งหวังกำไร

ในด้านความเสี่ยงและอุปสรรค โครงการ ThaiLLM เคยถูกตั้งคำถามว่าอาจโดน “หั่นงบ” ถึง 20% ในบางช่วง ซึ่งอาจกระทบต่อแผนดำเนินงานโดยรวมของโครงการ AI ภาษาไทย อย่างไรก็ตาม BDI ยืนยันว่า โครงการดังกล่าวอยู่ระหว่างการประสานความร่วมมือกับหน่วยงานภาคเอกชน เพื่อประคองการลงทุนและเสริมสร้างความยั่งยืน

นอกจากนี้ ยังมีแนวทางที่จะเปิดให้ใช้งานแบบ โอเพ่นซอร์ส เพื่อให้หน่วยงาน สถาบันการศึกษา นักวิจัย และผู้ประกอบการสามารถนำโมเดลไปพัฒนา ปรับแต่ง หรือใช้งานต่อได้อย่างอิสระ

เธอ เสริมว่า BDI กำลังดำเนินการเตรียมงานแถลงเปิดตัว ThaiLLM ซึ่งคาดว่าจะจัดขึ้นในช่วงกลางเดือนธันวาคม 2568 ถึงต้นเดือนมกราคม 2569 ขึ้นอยู่กับความพร้อมของหน่วยงานที่เกี่ยวข้อง โดยถือเป็นอีกหนึ่งก้าวสำคัญสำหรับประเทศไทยในการเข้าสู่ยุค AI ที่ขับเคลื่อนด้วยโมเดลภาษาไทยของตัวเองอย่างเต็มรูปแบบ

ในภาพรวม โครงการ ThaiLLM คือการเดินหน้าเปลี่ยนแนวคิด “ผู้ใช้งานไทยต้องพึ่งโมเดลต่างประเทศ” ไปสู่ยุคที่ประเทศไทยมีโครงสร้างพื้นฐาน AI ภาษาของตัวเอง โดยมุ่งหวังว่าจะช่วยลดต้นทุน สร้างนวัตกรรมใหม่ ๆ และเพิ่มศักยภาพการแข่งขันทางเทคโนโลยีของประเทศในระยะยาว

ที่มา<<<https://www.bangkokbiznews.com/tech/gadget/1202061

LEAVE A REPLY

Please enter your comment!
Please enter your name here