27/11/2025
เปลี่ยนเอกสารไทยให้เป็น Markdown อัตโนมัติ ด้วย Typhoon OCR
OCR ที่ไม่ใช่แค่อ่านตัวหนังสือ แต่มอง “โครงสร้างทั้งเอกสาร” Typhoon OCR คือ vision–language model สำหรับ OCR และ document parsing ที่โฟกัสเอกสารไทยแบบเต็มตัว คืนผลเป็น Markdown/HTML พร้อมใช้งานต่อกับ LLM และระบบหลังบ้านทันที
🚀 ออกแบบมาสำหรับเอกสาร ไทย + อังกฤษ โดยเฉพาะ ทั้งงบการเงิน ฟอร์มราชการ รายงานวิชาการ
🚀 Layout-aware: table พร้อม merged cells, figure พร้อม caption, header/footer ครบ
🚀 คืน Markdown/HTML โครงสร้างเนียน ใช้ต่อกับระบบ BI หรือ LLM ได้เลย
🚀 เทียบ benchmark แล้วทำได้ดีกว่า GPT-4o และ Gemini 2.5 Flash บนงานเอกสารไทย
🚀 ใช้กับ Ollama + Python ได้ง่าย ๆ รองรับ self-host เพื่อความเป็นส่วนตัวของข้อมูล
⛔️ ข้อจำกัด: เอกสารยาวมากต้องวาง pipeline เอง, figure parsing ยังต้องเสริม logic เพิ่ม
🔗 อ่านเพิ่มเติมได้ที่: https://aideta.com/blog/fx8sb0nwne5z9qgkp1uku300
---
Ai Deta พร้อมเป็นพันธมิตรในการขับเคลื่อน Transformation อย่างแท้จริงให้กับธุรกิจ หากคุณมองหาโซลูชันไอทีที่ “ออกแบบมาเฉพาะสำหรับองค์กรของคุณ” ติดต่อทีมของเราได้ที่ [email protected] หรือเยี่ยมชมเว็บไซต์เพื่อดูรายละเอียดเพิ่มเติมได้ที่ aideta.com