AI Corpus for benchmark task
คลังข้อมูลสำหรับทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ จัดทำขึ้นโดยมีวัตถุประสงค์ให้เป็นชุดข้อมูลแบบเปิดสาธารณะ เพื่อใช้เป็นชุดข้อมูลทดสอบที่เป็นมาตรฐาน ในการทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ สำหรับแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์ โดยมุ่งยกระดับขีดความสามารถของการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ให้ตอบโจทย์ความต้องการใช้งานในประเทศไทย
คุณลักษณะ
คลังข้อมูลสำหรับทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ ประกอบด้วย ชุดข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ จำนวน 4 ชุดข้อมูล ที่เป็นมาตรฐานในการเปรียบเทียบประสิทธิภาพของการพัฒนาระบบปัญญาประดิษฐ์ที่เกี่ยวข้องกับการประมวลผลภาษาไทย ได้แก่
- ชุดข้อมูลสำหรับสร้างต้นไม้ไวยากรณ์ภาษาไทย
- ชุดข้อมูลแปลภาษาอังกฤษ-ไทย ประกอบด้วย ไฟล์ข้อความคู่ภาษา
- ชุดข้อมูลสำหรับการสร้างบทกำกับภาพ ประกอบด้วย ไฟล์ภาพ และไฟล์ข้อความคำบรรยายภาพ
- ชุดข้อมูลเสียงการสนทนา ประกอบด้วย ไฟล์เสียง (.wav) และไฟล์ข้อความถอดเสียง
ประโยชน์ของการพัฒนาชุดข้อมูลปัญญาประดิษฐ์
- ยกระดับขีดความสามารถและคุณภาพของการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ ทั้งในส่วนการพัฒนาบุคลากร และการสร้างผลงานต่อยอดในรูปแบบ Open innovation
- บริษัทเอกชน start-up ประเทศไทยมีความเข้มแข็งมากขึ้น สามารถพัฒนาผลงานให้กับคนไทยนำไปใช้งาน ได้ทัดเทียมกับต่างประเทศ
- ประชาชนจะได้รับบริการที่เกี่ยวข้องกับการประมวลผลภาษาไทยและภาพ ที่มีคุณภาพมากขึ้น
- มีชุดข้อมูลทดสอบที่เป็นมาตรฐาน ในการทดสอบประสิทธิภาพของเทคโนโลยีปัญญาประดิษฐ์ สำหรับแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์
ขอบเขตการใช้งาน
- เปิดให้ผู้ที่สนใจงานด้านปัญญาประดิษฐ์ นำชุดข้อมูลไปใช้เพื่อการพัฒนาผลงานต่อยอดในรูปแบบ Open innovation รวมถึงการใช้บริการแพลตฟอร์มบริการทดสอบเทคโนโลยีปัญญาประดิษฐ์ เพื่อวัดประสิทธิภาพของผลงานที่พัฒนาขึ้นด้วย
กลุ่มลูกค้า/ผู้ใช้งานเทคโนโลยีเป้าหมาย
- บริษัทเอกชนที่สนใจ หรือทำงานทางด้านปัญญาประดิษฐ์ที่ใช้การประมวลผลภาษาไทย
- นักวิจัย นักพัฒนา นักศึกษา หน่วยงานวิจัย สถาบันการศึกษาที่สนใจงานวิจัย และพัฒนาปัญญาประดิษฐ์ที่ใช้การประมวลผลภาษาไทย
- บุคคลทั่วไปผู้สนใจด้านปัญญาประดิษฐ์ รวมถึงสนใจด้านภาษา และภาษาศาสตร์
สถานภาพการพัฒนา
ผลงานปัจจุบันอยู่ระหว่างการตรวจสอบความถูกต้องซ้ำก่อนที่จะเปิดชุดข้อมูลทั้งหมด โดยเปิดรับผู้ที่จะนำไปต่อยอดเพื่อพัฒนาแอปพลิเคชัน และผู้ที่ต้องการนำไปเผยแพร่ในองค์กร
หน่วยงานพันธมิตร
- สมาคมปัญญาประดิษฐ์ประเทศไทย
- สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย
ภาพประกอบ

วิจัยพัฒนาโดย
- กลุ่มวิจัยปัญญาประดิษฐ์ (AINRG)
Keyword: AI Corpus, Benchmark