สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI ภายใต้การนำของ ธีรณี อจลากุล เผยโครงการ ThaiLLM (Thai Large Language Model) ซึ่งมีสถานะความพร้อมแล้วกว่า 70 % โดยในเวอร์ชันแรกโมเดลได้ถูกติดตั้งไว้ในระบบคลาวด์ของบริษัท โทรคมนาคมแห่งชาติ (NT) เพื่อให้สตาร์ทอัพ นักพัฒนา และหน่วยงานที่เกี่ยวข้องเข้าถึงและใช้งานฟรีได้ทันที ช่วงต่อมาคาดว่าจะเปิดให้ประชาชนทั่วไปใช้งานได้ภายในเดือนกุมภาพันธ์ 2569
โดยในเฟสแรก BDI ได้ตั้งงบประมาณไว้ที่ 89 ล้านบาท ใช้เวลากว่า 1.5 ปี โดยจะเน้นนำร่องใช้งานใน 2 อุตสาหกรรมหลักของไทย คือ การแพทย์ และ การท่องเที่ยว
ซึ่งถือเป็นจุดแข็งสำคัญของประเทศ ก่อนจะเปิดโอกาสระดมทุนเพิ่มเติมสำหรับการใช้งานคลาวด์และฝึกปรับปรุงโมเดลในระยะยาว ปัจจุบันเอง มีผู้ให้บริการคลาวด์และภาคเอกชนจำนวนหนึ่งแสดงความสนใจเข้าร่วมสนับสนุนในเฟสถัดไปแล้ว
นอกจากนี้ BDI ได้เริ่มรับบริจาคข้อมูลจากหน่วยงานต่าง ๆ เช่น ข้อมูลจากหน่วยงานภาครัฐ ธนาคาร (ข้อมูลที่ไม่เกี่ยวข้องกับลูกค้า) และสื่อมวลชน เพื่อใช้ฝึกโมเดลให้เข้าใจบริบทภาษาไทยในวงกว้าง รวมถึงร่วมมือในการพัฒนาระบบตรวจจับข่าวปลอม (Fake News Detection) เพื่อให้โมเดลสามารถแยกแยะระหว่างข่าวจริงและข่าวปลอมได้แม่นยำยิ่งขึ้น
นอกจากนี้ BDI ยังเปิดโอกาสให้ภาคสื่อมวลชนและกลุ่มผู้ใช้งานเสนอโจทย์หรือคำถามที่ต้องการให้ระบบตอบได้ถูกต้องและมีเหตุผล ซึ่งจะเป็นหนึ่งในกระบวนการที่ช่วยให้โมเดล “เรียนรู้” ภาษาไทยได้ลึกซึ้งมากขึ้นและปรับตัวให้เข้าใจบทสนทนาหรือคำถามในชีวิตจริงได้ดีกว่าเดิม
เธอ เสริมว่า ภายในปี 2570 โมเดล ThaiLLM จะเริ่มสร้างรายได้ โดยเปิดให้หน่วยงานรัฐและเอกชนใช้บริการ custom training เพื่อสร้างแชตบอทเฉพาะทาง เช่น แชตบอทด้านกฎหมาย ระบบตอบคำถามนโยบายรัฐ หรือแชตบอทให้บริการภายในองค์กร โดยไม่จำเป็นต้องฝึกโมเดลตั้งต้น ช่วยประหยัดต้นทุนและเวลาในการพัฒนาได้อย่างมาก
ThaiLLM ถือเป็นครั้งแรกที่ภาครัฐลุกขึ้นมาสร้างโมเดลภาษาไทยโดยพลังร่วมจากทุกภาคส่วน เป้าหมายไม่ใช่แข่งขันกับ ChatGPT หรือ Gemini แต่เป็นการสร้างระบบเปิด ที่ทุกคนสามารถต่อยอดได้ เป็นโครงสร้างพื้นฐานด้านภาษาแห่งชาติ ไม่ต้องเสียค่าบริการรายเดือน และไม่มุ่งหวังกำไร
ในด้านความเสี่ยงและอุปสรรค โครงการ ThaiLLM เคยถูกตั้งคำถามว่าอาจโดน “หั่นงบ” ถึง 20% ในบางช่วง ซึ่งอาจกระทบต่อแผนดำเนินงานโดยรวมของโครงการ AI ภาษาไทย อย่างไรก็ตาม BDI ยืนยันว่า โครงการดังกล่าวอยู่ระหว่างการประสานความร่วมมือกับหน่วยงานภาคเอกชน เพื่อประคองการลงทุนและเสริมสร้างความยั่งยืน
นอกจากนี้ ยังมีแนวทางที่จะเปิดให้ใช้งานแบบ โอเพ่นซอร์ส เพื่อให้หน่วยงาน สถาบันการศึกษา นักวิจัย และผู้ประกอบการสามารถนำโมเดลไปพัฒนา ปรับแต่ง หรือใช้งานต่อได้อย่างอิสระ
เธอ เสริมว่า BDI กำลังดำเนินการเตรียมงานแถลงเปิดตัว ThaiLLM ซึ่งคาดว่าจะจัดขึ้นในช่วงกลางเดือนธันวาคม 2568 ถึงต้นเดือนมกราคม 2569 ขึ้นอยู่กับความพร้อมของหน่วยงานที่เกี่ยวข้อง โดยถือเป็นอีกหนึ่งก้าวสำคัญสำหรับประเทศไทยในการเข้าสู่ยุค AI ที่ขับเคลื่อนด้วยโมเดลภาษาไทยของตัวเองอย่างเต็มรูปแบบ
ในภาพรวม โครงการ ThaiLLM คือการเดินหน้าเปลี่ยนแนวคิด “ผู้ใช้งานไทยต้องพึ่งโมเดลต่างประเทศ” ไปสู่ยุคที่ประเทศไทยมีโครงสร้างพื้นฐาน AI ภาษาของตัวเอง โดยมุ่งหวังว่าจะช่วยลดต้นทุน สร้างนวัตกรรมใหม่ ๆ และเพิ่มศักยภาพการแข่งขันทางเทคโนโลยีของประเทศในระยะยาว
ที่มา<<<https://www.bangkokbiznews.com/tech/gadget/1202061