โมเดล AI และโหมดดึงข้อมูล

การเลือกโมเดล AI

ส่วน Assistant Config ช่วยให้คุณเลือกโมเดล AI ที่จะประมวลผลเอกสารและวิธีที่จะทำงาน

AI Provider ที่รองรับ

Provider	โมเดลที่ใช้ได้	จุดเด่น
OpenAI	`gpt-4o`, `gpt-4o-mini`, `o4-mini`	ความแม่นยำสูงสุด รองรับหลายภาษาดีเยี่ยม
Google Gemini	`gemini-2.0-flash`, `gemini-2.5-pro`	ประมวลผลเร็ว เหมาะกับเอกสารยาว
Anthropic	`claude-sonnet-4-5`, `claude-haiku-4-5`	เหตุผลเชิงตรรกะดี ทำตามคำสั่งซับซ้อนได้ดี
DeepSeek	`deepseek-chat`, `deepseek-reasoner`	ประหยัดงบประมาณ เหมาะกับ Structured Extraction
Qwen	`qwen-plus`, `qwen-turbo`	เหมาะกับเอกสารภาษาจีนและหลายภาษา
Kimi	`moonshot-v1-8k`, `moonshot-v1-32k`	รองรับเอกสารยาวมาก

การเขียนคำสั่ง (Instructions) ที่มีประสิทธิภาพ

ฟิลด์ Instructions เป็นการตั้งค่าที่สำคัญที่สุดใน Template ของคุณ เขียนคำสั่งที่ชัดเจนและเฉพาะเจาะจง:

ตัวอย่างที่ดี:

คุณเป็นผู้ช่วยดึงข้อมูลใบกำกับภาษีไทย
 
ดึงข้อมูลทุกฟิลด์จากใบกำกับตามที่ปรากฏในเอกสารให้ครบถ้วน กฎดังนี้:
- วันที่ต้องอยู่ในรูปแบบ YYYY-MM-DD เป็นปี ค.ศ. หากพบวันที่เป็นปี พ.ศ. ให้ลบ 543 เพื่อแปลงเป็น ค.ศ.
- ค่าทางการเงินทั้งหมดต้องเป็นตัวเลขล้วนๆ ไม่มีเครื่องหมายจุลภาคหรือสัญลักษณ์สกุลเงิน
- หากฟิลด์ใดไม่มีอยู่ในเอกสาร ให้ส่งคืน null
- สำหรับเลขประจำตัวผู้เสียภาษีของผู้ขายและผู้ซื้อ ให้ดึงเลข 13 หลัก
- รายการสินค้าต้องรวมทุกแถวในตาล รายการแม้ว่าจำนวนจะไม่ชัดเจน

หลีกเลี่ยงคำสั่งที่คลุมเครือแบบนี้:

ดึงข้อมูลใบกำกับ

เคล็ดลับการเขียนคำสั่ง

ระบุประเภทเอกสาร — บอก AI ว่ากำลังประมวลผลเอกสารประเภทใด
ระบุกฎ Output — รูปแบบวันที่ รูปแบบตัวเลข การจัดการกับ Null
จัดการกรณีพิเศษ — AI ควรทำอะไรเมื่อฟิลด์ขาดหายหรือกำกวม?
คำแนะนำด้านภาษา — หากเอกสารเป็นภาษาไทย ให้ระบุและบอกว่าจะแปลหรือเก็บข้อความต้นฉบับ
กฎการตรวจสอบ — เช่น "ยอดรวมทั้งสิ้นต้องเท่ากับราคาก่อนภาษีบวกภาษีมูลค่าเพิ่ม"

Temperature และ TopP

พารามิเตอร์เหล่านี้ควบคุมความสุ่มของ Output จาก AI:

พารามิเตอร์	ช่วง	คำแนะนำ
Temperature	0.0 – 2.0	ใช้ `0.1` – `0.3` สำหรับงาน Extraction ค่าต่ำ = ผลลัพธ์คงที่สม่ำเสมอมากขึ้น
TopP	0.0 – 1.0	ปล่อยไว้ที่ `1.0` เว้นแต่มีเหตุผลเฉพาะในการเปลี่ยน

สำหรับการดึงข้อมูลจากเอกสาร ควรใช้ Temperature ต่ำ เสมอ (0.1 ถึง 0.3) Temperature สูงทำให้ AI "hallucinate" ค่าฟิลด์ที่ไม่มีในเอกสาร

โหมดการดึงข้อมูล

Ocriva รองรับโหมดการดึงข้อมูลสองแบบที่ควบคุมวิธีที่ AI ส่งคืนผลลัพธ์

Structured Mode

AI ส่งคืน JSON Object ที่ตรงกับ Schema ที่กำหนดไว้ นี่คือโหมดเริ่มต้นและแนะนำสำหรับการใช้งานส่วนใหญ่

เมื่อไรควรใช้ Structured Mode:

คุณต้องการข้อมูลที่อ่านได้โดยเครื่องสำหรับฐานข้อมูลหรือ API
คุณต้องการชื่อฟิลด์ที่สม่ำเสมอในทุกเอกสารที่ประมวลผล
คุณใช้รูปแบบ Output แบบ JSON, CSV, XML หรือ DOCX
คุณต้องการเปรียบเทียบหรือรวมข้อมูลจากหลายเอกสาร

วิธีทำงาน: AI จะได้รับ JSON Schema ของคุณและถูกสั่งให้เติมค่าจากเอกสาร ฟิลด์ที่ขาดหายจะส่งคืน null Output จะเป็น JSON ที่ถูกต้องตาม Schema ของคุณเสมอ

Free Text Mode

AI ส่งคืนคำตอบเป็นข้อความธรรมดาโดยไม่มีข้อจำกัดของ Schema เทียบเท่ากับการขอให้ AI สรุปหรืออธิบายเอกสารในภาษาธรรมชาติ

เมื่อไรควรใช้ Free Text Mode:

คุณต้องการสรุปที่อ่านได้สำหรับมนุษย์
โครงสร้างเอกสารไม่แน่นอน
คุณต้องการสร้างคำอธิบายในรูปแบบเรื่องราวมากกว่าข้อมูล
คุณใช้รูปแบบ Output แบบ text หรือ html

วิธีทำงาน: AI ประมวลผลเอกสารโดยใช้เฉพาะคำสั่งของคุณเป็นแนวทาง การตอบสนองเป็นข้อความที่ไม่มีโครงสร้าง

รูปแบบ Result Format ส่งผลต่อ Extraction Mode อย่างไร

รูปแบบ Output ที่คุณเลือกจะกำหนดโหมดการดึงข้อมูลโดยอัตโนมัติ รูปแบบที่ต้องการ Schema ที่กำหนดไว้จะใช้ Structured Mode ส่วนรูปแบบที่สร้าง Output แบบอิสระจะใช้ Free Text Mode:

Result Format	Extraction Mode	การกำหนดฟิลด์
`json`	Structured	JSON Schema (มี Preset ให้เลือก 19 แบบ)
`csv`	Structured	ชื่อคอลัมน์
`text`	Free Text	ไม่จำเป็น
`pdf`	Free Text	ไม่จำเป็น
`docx`	Free Text	ไม่จำเป็น
`xml`	Free Text	ไม่จำเป็น
`html`	Free Text	ไม่จำเป็น
`image`	Image Generation	ตัวเลือกรูปภาพ

รูปแบบ Structured (JSON, CSV) ต้องการให้คุณกำหนด Schema — รายชื่อฟิลด์และประเภทข้อมูล AI จะอ่านเอกสารและเติมค่าในแต่ละฟิลด์จากสิ่งที่พบ ทำให้ได้ Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องทุกครั้ง

รูปแบบ Free Text (Text, PDF, DOCX, XML, HTML) ไม่ต้องการ Schema คุณเพียงระบุคำสั่ง แล้ว AI จะสร้างเนื้อหาตามสิ่งที่พบในเอกสารอย่างอิสระ แม้ว่า XML โดยทั่วไปจะถือเป็นรูปแบบที่มีโครงสร้าง แต่ Ocriva ใช้โหมด Free Text สำหรับ Output แบบ XML เพราะ AI จะสร้าง XML Markup จากคำสั่งของคุณ แทนที่จะ Map ค่าเข้า Schema ที่กำหนดไว้ล่วงหน้า

NOTE

เมื่อคุณเลือก Text, PDF, DOCX, XML หรือ HTML เป็น Result Format ระบบจะสลับไปใช้โหมด Free Text Extraction โดยอัตโนมัติ — ไม่จำเป็นต้องมี Field Schema AI จะตอบสนองตามคำสั่งของคุณเพียงอย่างเดียว

TIP

หากต้องการดึงข้อมูลแบบ Structured ให้ใช้ JSON หรือ CSV เป็น Result Format รูปแบบเหล่านี้บังคับใช้ Schema ที่รับประกัน Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องในทุกเอกสาร สำหรับรายละเอียดตัวเลือกการตั้งค่ารูปแบบ ดูที่ Result Formats & Output

การเลือกระหว่างสองโหมด

สถานการณ์	โหมดที่แนะนำ
ดึงข้อมูลฟิลด์เดิมซ้ำจากทุกเอกสาร (เช่น ใบแจ้งหนี้ ใบเสร็จ)	Structured (JSON หรือ CSV)
เอกสารมีโครงสร้างหรือเนื้อหาที่หลากหลายมาก	Free Text
ต้องการสรุป แปลภาษา หรือคำอธิบายเชิงเรื่องราว	Free Text
Output จะถูกใช้งานโดย API ฐานข้อมูล หรือ Spreadsheet	Structured (JSON หรือ CSV)
ต้องการรายงานที่พิมพ์ได้หรือเอกสารที่อ่านง่ายสำหรับมนุษย์	Free Text (PDF หรือ DOCX)

ใช้ Structured Mode เมื่อต้องการดึงข้อมูลฟิลด์เดิมจากทุกเอกสาร เช่น การประมวลผลใบแจ้งหนี้ที่ต้องการ invoice_number, date และ total_amount เสมอ Schema จะบังคับความสม่ำเสมอและทำให้การประมวลผลต่อเนื่องคาดเดาได้

ใช้ Free Text Mode เมื่อเอกสารมีความหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอได้ หรือเมื่อต้องการให้ AI สร้างสรุป การแปลภาษา หรือคำอธิบายเชิงเรื่องราว แทนที่จะเติมข้อมูลในฟิลด์แยก

คำแนะนำเบื้องต้น: เริ่มต้นด้วยรูปแบบ JSON และ Structured Mode สำหรับกรณีการใช้งานส่วนใหญ่ เปลี่ยนไปใช้ Free Text เฉพาะเมื่อเอกสารของคุณหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอ หรือเมื่อ Output มีไว้สำหรับมนุษย์อ่าน ไม่ใช่การประมวลผลด้วยเครื่อง

Documents

โมเดล AI และโหมดดึงข้อมูล

โมเดล AI และโหมดดึงข้อมูล

การเลือกโมเดล AI

AI Provider ที่รองรับ

การเขียนคำสั่ง (Instructions) ที่มีประสิทธิภาพ

เคล็ดลับการเขียนคำสั่ง

Temperature และ TopP

โหมดการดึงข้อมูล

Structured Mode

Free Text Mode

รูปแบบ Result Format ส่งผลต่อ Extraction Mode อย่างไร

การเลือกระหว่างสองโหมด

Table of Contents