Ocriva Logo

Documents

โมเดล AI และโหมดดึงข้อมูล

เลือก AI Provider ตั้งค่าโมเดล และทำความเข้าใจโหมดการดึงข้อมูล

Published: 3/31/2026

โมเดล AI และโหมดดึงข้อมูล

การเลือกโมเดล AI

ส่วน Assistant Config ช่วยให้คุณเลือกโมเดล AI ที่จะประมวลผลเอกสารและวิธีที่จะทำงาน

AI Provider ที่รองรับ

Providerโมเดลที่ใช้ได้จุดเด่น
OpenAIgpt-4o, gpt-4o-mini, o4-miniความแม่นยำสูงสุด รองรับหลายภาษาดีเยี่ยม
Google Geminigemini-2.0-flash, gemini-2.5-proประมวลผลเร็ว เหมาะกับเอกสารยาว
Anthropicclaude-sonnet-4-5, claude-haiku-4-5เหตุผลเชิงตรรกะดี ทำตามคำสั่งซับซ้อนได้ดี
DeepSeekdeepseek-chat, deepseek-reasonerประหยัดงบประมาณ เหมาะกับ Structured Extraction
Qwenqwen-plus, qwen-turboเหมาะกับเอกสารภาษาจีนและหลายภาษา
Kimimoonshot-v1-8k, moonshot-v1-32kรองรับเอกสารยาวมาก

การเขียนคำสั่ง (Instructions) ที่มีประสิทธิภาพ

ฟิลด์ Instructions เป็นการตั้งค่าที่สำคัญที่สุดใน Template ของคุณ เขียนคำสั่งที่ชัดเจนและเฉพาะเจาะจง:

ตัวอย่างที่ดี:

คุณเป็นผู้ช่วยดึงข้อมูลใบกำกับภาษีไทย
 
ดึงข้อมูลทุกฟิลด์จากใบกำกับตามที่ปรากฏในเอกสารให้ครบถ้วน กฎดังนี้:
- วันที่ต้องอยู่ในรูปแบบ YYYY-MM-DD เป็นปี ค.ศ. หากพบวันที่เป็นปี พ.ศ. ให้ลบ 543 เพื่อแปลงเป็น ค.ศ.
- ค่าทางการเงินทั้งหมดต้องเป็นตัวเลขล้วนๆ ไม่มีเครื่องหมายจุลภาคหรือสัญลักษณ์สกุลเงิน
- หากฟิลด์ใดไม่มีอยู่ในเอกสาร ให้ส่งคืน null
- สำหรับเลขประจำตัวผู้เสียภาษีของผู้ขายและผู้ซื้อ ให้ดึงเลข 13 หลัก
- รายการสินค้าต้องรวมทุกแถวในตาล รายการแม้ว่าจำนวนจะไม่ชัดเจน

หลีกเลี่ยงคำสั่งที่คลุมเครือแบบนี้:

ดึงข้อมูลใบกำกับ

เคล็ดลับการเขียนคำสั่ง

  1. ระบุประเภทเอกสาร — บอก AI ว่ากำลังประมวลผลเอกสารประเภทใด
  2. ระบุกฎ Output — รูปแบบวันที่ รูปแบบตัวเลข การจัดการกับ Null
  3. จัดการกรณีพิเศษ — AI ควรทำอะไรเมื่อฟิลด์ขาดหายหรือกำกวม?
  4. คำแนะนำด้านภาษา — หากเอกสารเป็นภาษาไทย ให้ระบุและบอกว่าจะแปลหรือเก็บข้อความต้นฉบับ
  5. กฎการตรวจสอบ — เช่น "ยอดรวมทั้งสิ้นต้องเท่ากับราคาก่อนภาษีบวกภาษีมูลค่าเพิ่ม"

Temperature และ TopP

พารามิเตอร์เหล่านี้ควบคุมความสุ่มของ Output จาก AI:

พารามิเตอร์ช่วงคำแนะนำ
Temperature0.0 – 2.0ใช้ 0.10.3 สำหรับงาน Extraction ค่าต่ำ = ผลลัพธ์คงที่สม่ำเสมอมากขึ้น
TopP0.0 – 1.0ปล่อยไว้ที่ 1.0 เว้นแต่มีเหตุผลเฉพาะในการเปลี่ยน

สำหรับการดึงข้อมูลจากเอกสาร ควรใช้ Temperature ต่ำ เสมอ (0.1 ถึง 0.3) Temperature สูงทำให้ AI "hallucinate" ค่าฟิลด์ที่ไม่มีในเอกสาร


โหมดการดึงข้อมูล

Ocriva รองรับโหมดการดึงข้อมูลสองแบบที่ควบคุมวิธีที่ AI ส่งคืนผลลัพธ์

Structured Mode

AI ส่งคืน JSON Object ที่ตรงกับ Schema ที่กำหนดไว้ นี่คือโหมดเริ่มต้นและแนะนำสำหรับการใช้งานส่วนใหญ่

เมื่อไรควรใช้ Structured Mode:

  • คุณต้องการข้อมูลที่อ่านได้โดยเครื่องสำหรับฐานข้อมูลหรือ API
  • คุณต้องการชื่อฟิลด์ที่สม่ำเสมอในทุกเอกสารที่ประมวลผล
  • คุณใช้รูปแบบ Output แบบ JSON, CSV, XML หรือ DOCX
  • คุณต้องการเปรียบเทียบหรือรวมข้อมูลจากหลายเอกสาร

วิธีทำงาน: AI จะได้รับ JSON Schema ของคุณและถูกสั่งให้เติมค่าจากเอกสาร ฟิลด์ที่ขาดหายจะส่งคืน null Output จะเป็น JSON ที่ถูกต้องตาม Schema ของคุณเสมอ

Free Text Mode

AI ส่งคืนคำตอบเป็นข้อความธรรมดาโดยไม่มีข้อจำกัดของ Schema เทียบเท่ากับการขอให้ AI สรุปหรืออธิบายเอกสารในภาษาธรรมชาติ

เมื่อไรควรใช้ Free Text Mode:

  • คุณต้องการสรุปที่อ่านได้สำหรับมนุษย์
  • โครงสร้างเอกสารไม่แน่นอน
  • คุณต้องการสร้างคำอธิบายในรูปแบบเรื่องราวมากกว่าข้อมูล
  • คุณใช้รูปแบบ Output แบบ text หรือ html

วิธีทำงาน: AI ประมวลผลเอกสารโดยใช้เฉพาะคำสั่งของคุณเป็นแนวทาง การตอบสนองเป็นข้อความที่ไม่มีโครงสร้าง

รูปแบบ Result Format ส่งผลต่อ Extraction Mode อย่างไร

รูปแบบ Output ที่คุณเลือกจะกำหนดโหมดการดึงข้อมูลโดยอัตโนมัติ รูปแบบที่ต้องการ Schema ที่กำหนดไว้จะใช้ Structured Mode ส่วนรูปแบบที่สร้าง Output แบบอิสระจะใช้ Free Text Mode:

Result FormatExtraction Modeการกำหนดฟิลด์
jsonStructuredJSON Schema (มี Preset ให้เลือก 19 แบบ)
csvStructuredชื่อคอลัมน์
textFree Textไม่จำเป็น
pdfFree Textไม่จำเป็น
docxFree Textไม่จำเป็น
xmlFree Textไม่จำเป็น
htmlFree Textไม่จำเป็น
imageImage Generationตัวเลือกรูปภาพ

รูปแบบ Structured (JSON, CSV) ต้องการให้คุณกำหนด Schema — รายชื่อฟิลด์และประเภทข้อมูล AI จะอ่านเอกสารและเติมค่าในแต่ละฟิลด์จากสิ่งที่พบ ทำให้ได้ Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องทุกครั้ง

รูปแบบ Free Text (Text, PDF, DOCX, XML, HTML) ไม่ต้องการ Schema คุณเพียงระบุคำสั่ง แล้ว AI จะสร้างเนื้อหาตามสิ่งที่พบในเอกสารอย่างอิสระ แม้ว่า XML โดยทั่วไปจะถือเป็นรูปแบบที่มีโครงสร้าง แต่ Ocriva ใช้โหมด Free Text สำหรับ Output แบบ XML เพราะ AI จะสร้าง XML Markup จากคำสั่งของคุณ แทนที่จะ Map ค่าเข้า Schema ที่กำหนดไว้ล่วงหน้า

NOTE

เมื่อคุณเลือก Text, PDF, DOCX, XML หรือ HTML เป็น Result Format ระบบจะสลับไปใช้โหมด Free Text Extraction โดยอัตโนมัติ — ไม่จำเป็นต้องมี Field Schema AI จะตอบสนองตามคำสั่งของคุณเพียงอย่างเดียว

TIP

หากต้องการดึงข้อมูลแบบ Structured ให้ใช้ JSON หรือ CSV เป็น Result Format รูปแบบเหล่านี้บังคับใช้ Schema ที่รับประกัน Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องในทุกเอกสาร สำหรับรายละเอียดตัวเลือกการตั้งค่ารูปแบบ ดูที่ Result Formats & Output

การเลือกระหว่างสองโหมด

สถานการณ์โหมดที่แนะนำ
ดึงข้อมูลฟิลด์เดิมซ้ำจากทุกเอกสาร (เช่น ใบแจ้งหนี้ ใบเสร็จ)Structured (JSON หรือ CSV)
เอกสารมีโครงสร้างหรือเนื้อหาที่หลากหลายมากFree Text
ต้องการสรุป แปลภาษา หรือคำอธิบายเชิงเรื่องราวFree Text
Output จะถูกใช้งานโดย API ฐานข้อมูล หรือ SpreadsheetStructured (JSON หรือ CSV)
ต้องการรายงานที่พิมพ์ได้หรือเอกสารที่อ่านง่ายสำหรับมนุษย์Free Text (PDF หรือ DOCX)

ใช้ Structured Mode เมื่อต้องการดึงข้อมูลฟิลด์เดิมจากทุกเอกสาร เช่น การประมวลผลใบแจ้งหนี้ที่ต้องการ invoice_number, date และ total_amount เสมอ Schema จะบังคับความสม่ำเสมอและทำให้การประมวลผลต่อเนื่องคาดเดาได้

ใช้ Free Text Mode เมื่อเอกสารมีความหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอได้ หรือเมื่อต้องการให้ AI สร้างสรุป การแปลภาษา หรือคำอธิบายเชิงเรื่องราว แทนที่จะเติมข้อมูลในฟิลด์แยก

คำแนะนำเบื้องต้น: เริ่มต้นด้วยรูปแบบ JSON และ Structured Mode สำหรับกรณีการใช้งานส่วนใหญ่ เปลี่ยนไปใช้ Free Text เฉพาะเมื่อเอกสารของคุณหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอ หรือเมื่อ Output มีไว้สำหรับมนุษย์อ่าน ไม่ใช่การประมวลผลด้วยเครื่อง