นิทรรศการ

NSTDA ANNUAL CONFERENCE 2025

คลังข้อมูลสำหรับทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์

ติดต่อสอบถาม
ฝ่ายพัฒนาเครือข่ายเชิงกลยุทธ์และประเมินผล (SPE) ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
112 อุทยานวิทยาศาสตร์ประเทศไทย ถ.พหลโยธิน ต.คลองหนึ่ง อ.คลองหลวง จ.ปทุมธานี 12120
AI Corpus for benchmark task

คลังข้อมูลสำหรับทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ จัดทำขึ้นโดยมีวัตถุประสงค์ให้เป็นชุดข้อมูลแบบเปิดสาธารณะ เพื่อใช้เป็นชุดข้อมูลทดสอบที่เป็นมาตรฐาน ในการทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ สำหรับแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์ โดยมุ่งยกระดับขีดความสามารถของการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ให้ตอบโจทย์ความต้องการใช้งานในประเทศไทย

คุณลักษณะ

คลังข้อมูลสำหรับทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ ประกอบด้วย ชุดข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ จำนวน 4 ชุดข้อมูล ที่เป็นมาตรฐานในการเปรียบเทียบประสิทธิภาพของการพัฒนาระบบปัญญาประดิษฐ์ที่เกี่ยวข้องกับการประมวลผลภาษาไทย ได้แก่

  • ชุดข้อมูลสำหรับสร้างต้นไม้ไวยากรณ์ภาษาไทย 
  • ชุดข้อมูลแปลภาษาอังกฤษ-ไทย ประกอบด้วย ไฟล์ข้อความคู่ภาษา 
  • ชุดข้อมูลสำหรับการสร้างบทกำกับภาพ ประกอบด้วย ไฟล์ภาพ และไฟล์ข้อความคำบรรยายภาพ 
  • ชุดข้อมูลเสียงการสนทนา ประกอบด้วย ไฟล์เสียง (.wav) และไฟล์ข้อความถอดเสียง 
ประโยชน์ของการพัฒนาชุดข้อมูลปัญญาประดิษฐ์
  • ยกระดับขีดความสามารถและคุณภาพของการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ ทั้งในส่วนการพัฒนาบุคลากร และการสร้างผลงานต่อยอดในรูปแบบ Open innovation
  • บริษัทเอกชน start-up ประเทศไทยมีความเข้มแข็งมากขึ้น สามารถพัฒนาผลงานให้กับคนไทยนำไปใช้งาน ได้ทัดเทียมกับต่างประเทศ
  • ประชาชนจะได้รับบริการที่เกี่ยวข้องกับการประมวลผลภาษาไทยและภาพ ที่มีคุณภาพมากขึ้น
  • มีชุดข้อมูลทดสอบที่เป็นมาตรฐาน ในการทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ สำหรับแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์
ขอบเขตการใช้งาน 
  • เปิดให้ผู้ที่สนใจงานด้านปัญญาประดิษฐ์ นำชุดข้อมูลไปใช้เพื่อการพัฒนาผลงานต่อยอดในรูปแบบ Open innovation รวมถึงการใช้บริการแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์ เพื่อวัดประสิทธิภาพของผลงานที่พัฒนาขึ้นด้วย
กลุ่มลูกค้า/ผู้ใช้งานเทคโนโลยีเป้าหมาย
  • บริษัทเอกชนที่สนใจ หรือทำงานทางด้านปัญญาประดิษฐ์ที่ใช้การประมวลผลภาษาไทย
  • นักวิจัย นักพัฒนา นักศึกษา หน่วยงานวิจัย สถาบันการศึกษาที่สนใจงานวิจัย และพัฒนาปัญญาประดิษฐ์ที่ใช้การประมวลผลภาษาไทย
  • บุคคลทั่วไปผู้สนใจด้านปัญญาประดิษฐ์ รวมถึงสนใจด้านภาษา และภาษาศาสตร์ 
สถานภาพการพัฒนา

ผลงานปัจจุบันอยู่ระหว่างการตรวจสอบความถูกต้องซ้ำก่อนที่จะเปิดชุดข้อมูลทั้งหมด โดยเปิดรับผู้ที่จะนำไปต่อยอดเพื่อพัฒนาแอปพลิเคชัน และผู้ที่ต้องการนำไปเผยแพร่ในองค์กร

หน่วยงานพันธมิตร
  • สมาคมปัญญาประดิษฐ์ประเทศไทย
  • สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย
ภาพประกอบ
วิจัยพัฒนาโดย
  • กลุ่มวิจัยปัญญาประดิษฐ์ (AINRG) 

Keyword: AI Corpus, Benchmark

SHARE:
Facebook
X
LinkedIn
Email