โมเดล AI และโหมดดึงข้อมูล
การเลือกโมเดล AI
ส่วน Assistant Config ช่วยให้คุณเลือกโมเดล AI ที่จะประมวลผลเอกสารและวิธีที่จะทำงาน
AI Provider ที่รองรับ
| Provider | โมเดลที่ใช้ได้ | จุดเด่น |
|---|---|---|
| OpenAI | gpt-4o, gpt-4o-mini, o4-mini | ความแม่นยำสูงสุด รองรับหลายภาษาดีเยี่ยม |
| Google Gemini | gemini-2.0-flash, gemini-2.5-pro | ประมวลผลเร็ว เหมาะกับเอกสารยาว |
| Anthropic | claude-sonnet-4-5, claude-haiku-4-5 | เหตุผลเชิงตรรกะดี ทำตามคำสั่งซับซ้อนได้ดี |
| DeepSeek | deepseek-chat, deepseek-reasoner | ประหยัดงบประมาณ เหมาะกับ Structured Extraction |
| Qwen | qwen-plus, qwen-turbo | เหมาะกับเอกสารภาษาจีนและหลายภาษา |
| Kimi | moonshot-v1-8k, moonshot-v1-32k | รองรับเอกสารยาวมาก |
การเขียนคำสั่ง (Instructions) ที่มีประสิทธิภาพ
ฟิลด์ Instructions เป็นการตั้งค่าที่สำคัญที่สุดใน Template ของคุณ เขียนคำสั่งที่ชัดเจนและเฉพาะเจาะจง:
ตัวอย่างที่ดี:
คุณเป็นผู้ช่วยดึงข้อมูลใบกำกับภาษีไทย
ดึงข้อมูลทุกฟิลด์จากใบกำกับตามที่ปรากฏในเอกสารให้ครบถ้วน กฎดังนี้:
- วันที่ต้องอยู่ในรูปแบบ YYYY-MM-DD เป็นปี ค.ศ. หากพบวันที่เป็นปี พ.ศ. ให้ลบ 543 เพื่อแปลงเป็น ค.ศ.
- ค่าทางการเงินทั้งหมดต้องเป็นตัวเลขล้วนๆ ไม่มีเครื่องหมายจุลภาคหรือสัญลักษณ์สกุลเงิน
- หากฟิลด์ใดไม่มีอยู่ในเอกสาร ให้ส่งคืน null
- สำหรับเลขประจำตัวผู้เสียภาษีของผู้ขายและผู้ซื้อ ให้ดึงเลข 13 หลัก
- รายการสินค้าต้องรวมทุกแถวในตาล รายการแม้ว่าจำนวนจะไม่ชัดเจนหลีกเลี่ยงคำสั่งที่คลุมเครือแบบนี้:
ดึงข้อมูลใบกำกับเคล็ดลับการเขียนคำสั่ง
- ระบุประเภทเอกสาร — บอก AI ว่ากำลังประมวลผลเอกสารประเภทใด
- ระบุกฎ Output — รูปแบบวันที่ รูปแบบตัวเลข การจัดการกับ Null
- จัดการกรณีพิเศษ — AI ควรทำอะไรเมื่อฟิลด์ขาดหายหรือกำกวม?
- คำแนะนำด้านภาษา — หากเอกสารเป็นภาษาไทย ให้ระบุและบอกว่าจะแปลหรือเก็บข้อความต้นฉบับ
- กฎการตรวจสอบ — เช่น "ยอดรวมทั้งสิ้นต้องเท่ากับราคาก่อนภาษีบวกภาษีมูลค่าเพิ่ม"
Temperature และ TopP
พารามิเตอร์เหล่านี้ควบคุมความสุ่มของ Output จาก AI:
| พารามิเตอร์ | ช่วง | คำแนะนำ |
|---|---|---|
| Temperature | 0.0 – 2.0 | ใช้ 0.1 – 0.3 สำหรับงาน Extraction ค่าต่ำ = ผลลัพธ์คงที่สม่ำเสมอมากขึ้น |
| TopP | 0.0 – 1.0 | ปล่อยไว้ที่ 1.0 เว้นแต่มีเหตุผลเฉพาะในการเปลี่ยน |
สำหรับการดึงข้อมูลจากเอกสาร ควรใช้ Temperature ต่ำ เสมอ (0.1 ถึง 0.3) Temperature สูงทำให้ AI "hallucinate" ค่าฟิลด์ที่ไม่มีในเอกสาร
โหมดการดึงข้อมูล
Ocriva รองรับโหมดการดึงข้อมูลสองแบบที่ควบคุมวิธีที่ AI ส่งคืนผลลัพธ์
Structured Mode
AI ส่งคืน JSON Object ที่ตรงกับ Schema ที่กำหนดไว้ นี่คือโหมดเริ่มต้นและแนะนำสำหรับการใช้งานส่วนใหญ่
เมื่อไรควรใช้ Structured Mode:
- คุณต้องการข้อมูลที่อ่านได้โดยเครื่องสำหรับฐานข้อมูลหรือ API
- คุณต้องการชื่อฟิลด์ที่สม่ำเสมอในทุกเอกสารที่ประมวลผล
- คุณใช้รูปแบบ Output แบบ JSON, CSV, XML หรือ DOCX
- คุณต้องการเปรียบเทียบหรือรวมข้อมูลจากหลายเอกสาร
วิธีทำงาน: AI จะได้รับ JSON Schema ของคุณและถูกสั่งให้เติมค่าจากเอกสาร ฟิลด์ที่ขาดหายจะส่งคืน null Output จะเป็น JSON ที่ถูกต้องตาม Schema ของคุณเสมอ
Free Text Mode
AI ส่งคืนคำตอบเป็นข้อความธรรมดาโดยไม่มีข้อจำกัดของ Schema เทียบเท่ากับการขอให้ AI สรุปหรืออธิบายเอกสารในภาษาธรรมชาติ
เมื่อไรควรใช้ Free Text Mode:
- คุณต้องการสรุปที่อ่านได้สำหรับมนุษย์
- โครงสร้างเอกสารไม่แน่นอน
- คุณต้องการสร้างคำอธิบายในรูปแบบเรื่องราวมากกว่าข้อมูล
- คุณใช้รูปแบบ Output แบบ
textหรือhtml
วิธีทำงาน: AI ประมวลผลเอกสารโดยใช้เฉพาะคำสั่งของคุณเป็นแนวทาง การตอบสนองเป็นข้อความที่ไม่มีโครงสร้าง
รูปแบบ Result Format ส่งผลต่อ Extraction Mode อย่างไร
รูปแบบ Output ที่คุณเลือกจะกำหนดโหมดการดึงข้อมูลโดยอัตโนมัติ รูปแบบที่ต้องการ Schema ที่กำหนดไว้จะใช้ Structured Mode ส่วนรูปแบบที่สร้าง Output แบบอิสระจะใช้ Free Text Mode:
| Result Format | Extraction Mode | การกำหนดฟิลด์ |
|---|---|---|
json | Structured | JSON Schema (มี Preset ให้เลือก 19 แบบ) |
csv | Structured | ชื่อคอลัมน์ |
text | Free Text | ไม่จำเป็น |
pdf | Free Text | ไม่จำเป็น |
docx | Free Text | ไม่จำเป็น |
xml | Free Text | ไม่จำเป็น |
html | Free Text | ไม่จำเป็น |
image | Image Generation | ตัวเลือกรูปภาพ |
รูปแบบ Structured (JSON, CSV) ต้องการให้คุณกำหนด Schema — รายชื่อฟิลด์และประเภทข้อมูล AI จะอ่านเอกสารและเติมค่าในแต่ละฟิลด์จากสิ่งที่พบ ทำให้ได้ Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องทุกครั้ง
รูปแบบ Free Text (Text, PDF, DOCX, XML, HTML) ไม่ต้องการ Schema คุณเพียงระบุคำสั่ง แล้ว AI จะสร้างเนื้อหาตามสิ่งที่พบในเอกสารอย่างอิสระ แม้ว่า XML โดยทั่วไปจะถือเป็นรูปแบบที่มีโครงสร้าง แต่ Ocriva ใช้โหมด Free Text สำหรับ Output แบบ XML เพราะ AI จะสร้าง XML Markup จากคำสั่งของคุณ แทนที่จะ Map ค่าเข้า Schema ที่กำหนดไว้ล่วงหน้า
NOTE
เมื่อคุณเลือก Text, PDF, DOCX, XML หรือ HTML เป็น Result Format ระบบจะสลับไปใช้โหมด Free Text Extraction โดยอัตโนมัติ — ไม่จำเป็นต้องมี Field Schema AI จะตอบสนองตามคำสั่งของคุณเพียงอย่างเดียว
TIP
หากต้องการดึงข้อมูลแบบ Structured ให้ใช้ JSON หรือ CSV เป็น Result Format รูปแบบเหล่านี้บังคับใช้ Schema ที่รับประกัน Output ที่สม่ำเสมอและอ่านได้ด้วยเครื่องในทุกเอกสาร สำหรับรายละเอียดตัวเลือกการตั้งค่ารูปแบบ ดูที่ Result Formats & Output
การเลือกระหว่างสองโหมด
| สถานการณ์ | โหมดที่แนะนำ |
|---|---|
| ดึงข้อมูลฟิลด์เดิมซ้ำจากทุกเอกสาร (เช่น ใบแจ้งหนี้ ใบเสร็จ) | Structured (JSON หรือ CSV) |
| เอกสารมีโครงสร้างหรือเนื้อหาที่หลากหลายมาก | Free Text |
| ต้องการสรุป แปลภาษา หรือคำอธิบายเชิงเรื่องราว | Free Text |
| Output จะถูกใช้งานโดย API ฐานข้อมูล หรือ Spreadsheet | Structured (JSON หรือ CSV) |
| ต้องการรายงานที่พิมพ์ได้หรือเอกสารที่อ่านง่ายสำหรับมนุษย์ | Free Text (PDF หรือ DOCX) |
ใช้ Structured Mode เมื่อต้องการดึงข้อมูลฟิลด์เดิมจากทุกเอกสาร เช่น การประมวลผลใบแจ้งหนี้ที่ต้องการ invoice_number, date และ total_amount เสมอ Schema จะบังคับความสม่ำเสมอและทำให้การประมวลผลต่อเนื่องคาดเดาได้
ใช้ Free Text Mode เมื่อเอกสารมีความหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอได้ หรือเมื่อต้องการให้ AI สร้างสรุป การแปลภาษา หรือคำอธิบายเชิงเรื่องราว แทนที่จะเติมข้อมูลในฟิลด์แยก
คำแนะนำเบื้องต้น: เริ่มต้นด้วยรูปแบบ JSON และ Structured Mode สำหรับกรณีการใช้งานส่วนใหญ่ เปลี่ยนไปใช้ Free Text เฉพาะเมื่อเอกสารของคุณหลากหลายเกินกว่าจะกำหนด Schema ที่สม่ำเสมอ หรือเมื่อ Output มีไว้สำหรับมนุษย์อ่าน ไม่ใช่การประมวลผลด้วยเครื่อง
