วิสัยทัศน์และแนวคิด DAT

มากกว่า OCR: Document Automation Transformer คืออะไร

หลายคนมาหา Ocriva โดยคาดหวังว่าจะได้เครื่องมือ OCR — ซอฟต์แวร์ที่อ่านข้อความจากรูปภาพหรือไฟล์ PDF แล้วจบ นั่นเป็นส่วนหนึ่งของสิ่งที่เราทำ แต่อธิบายได้เพียงก้าวแรกของเส้นทางที่ยาวกว่านั้นมาก

Ocriva คือ Document Automation Transformer (DAT)

DAT ไม่ใช่เครื่องมือ แต่คือแพลตฟอร์มที่จัดการวงจรชีวิตทั้งหมดของเอกสาร ตั้งแต่ช่วงแรกที่เอกสารเข้าสู่องค์กร จนถึงช่วงที่ข้อมูลถูกส่งไปยังที่ที่ควรจะอยู่ ในรูปแบบที่ถูกต้อง เชื่อมต่อกับระบบที่ถูกต้อง โดยไม่ต้องให้มนุษย์เข้ามาแทรกแซงเลย

หัวใจของ Ocriva คือ 4 ขั้นตอน: รับ → เข้าใจ → เปลี่ยนแปลง → ส่งต่อ — รับข้อมูลจากทุกช่องทาง ใช้ AI ทำความเข้าใจเนื้อหา เปลี่ยนให้เป็นรูปแบบที่ต้องการ แล้วส่งต่อไปยังปลายทางที่ถูกต้องโดยอัตโนมัติ

เอกสารนี้จะอธิบายว่านั่นหมายความว่าอะไร ทำไมมันจึงสำคัญ และแนวคิด DAT เปลี่ยนวิธีที่องค์กรคิดเรื่องการจัดการเอกสารอย่างไร

NOTE

DAT ไม่ใช่แค่ OCR — แต่เป็น pipeline อัตโนมัติครบวงจร ตั้งแต่รับเอกสารเข้าจนถึงส่งข้อมูลเข้าระบบของคุณ

NOTE

DAT ไม่ใช่แค่ OCR แต่เป็น pipeline อัตโนมัติครบวงจร ตั้งแต่รับเอกสารเข้า ไปจนถึงส่งข้อมูลออกสู่ระบบปลายทางโดยไม่ต้องมีมนุษย์เข้ามาแทรกแซง

Document Automation Transformer คืออะไร?

คำว่า "Transformer" ในที่นี้มีความหมายเฉพาะ มันอธิบายระบบที่ไม่ได้แค่อ่านเอกสาร แต่ เปลี่ยนรูป เอกสาร

DAT นำเอกสารที่ไม่มีโครงสร้าง รกรุงรัง อ่านได้โดยมนุษย์ มาแปลงให้กลายเป็นข้อมูลที่เครื่องจักรพร้อมใช้งาน มีโครงสร้างชัดเจน นำไปใช้ต่อได้ทันที และไหลเข้าสู่ระบบที่ต้องการมันโดยอัตโนมัติ

คำนิยามฉบับเต็มมีห้าส่วน:

Ingest (รับเข้า) — รับเอกสารจากทุกแหล่งที่มา
Extract (สกัด) — เข้าใจเนื้อหาด้วย AI ไม่ใช่แค่จดจำตัวอักษร
Transform (แปลง) — แปลงเป็นรูปแบบที่ระบบปลายทางต้องการ
Automate (อัตโนมัติ) — ประมวลผลในปริมาณเท่าไรก็ได้ ตามกำหนดเวลา หรือแบบเรียลไทม์
Integrate (เชื่อมต่อ) — ส่งผลลัพธ์ตรงเข้าระบบของคุณผ่าน API, Webhook หรือ Notification

เมื่อทั้งห้าขั้นตอนทำงานร่วมกัน การประมวลผลเอกสารจะไม่ใช่งานอีกต่อไป แต่กลายเป็น Pipeline ที่เชื่อถือได้ วัดผลได้ และปรับขนาดได้

OCR กับ DAT: ความแตกต่างที่สำคัญ

OCR แบบดั้งเดิม (Optical Character Recognition) ถูกออกแบบมาเพื่อตอบคำถามเดียว: "ข้อความบนหน้านี้คืออะไร?"

นั่นเป็นความสามารถที่มีประโยชน์ แต่มันไม่ใช่ระบบอัตโนมัติ ลองดูว่าเกิดอะไรขึ้นหลังจาก OCR อ่านเอกสาร:

มนุษย์ได้รับข้อความดิบ
มนุษย์ตัดสินใจว่าฟิลด์ไหนสำคัญ
มนุษย์คัดลอกฟิลด์เหล่านั้นไปยังระบบอื่น
มนุษย์ตรวจสอบข้อผิดพลาด
มนุษย์ส่งต่อผลลัพธ์ไปยังขั้นตอนถัดไป

OCR กำจัดการพิมพ์ไป แต่ไม่ได้กำจัดการคิด การส่งต่อ หรืองาน Integration ทุกอย่างหลังจากขั้นตอนการอ่านยังคงทำโดยมนุษย์อยู่

DAT กำจัดทั้งสายโซ่ที่ต้องทำมือทั้งหมด

ความสามารถ	OCR แบบดั้งเดิม	Document Automation Transformer
อ่านข้อความจากรูปภาพ	ใช่	ใช่
เข้าใจบริบทของเอกสาร	ไม่	ใช่ — AI Vision Models
รับมือ Layout ที่หลากหลาย	ไม่ — ต้อง Template ตำแหน่งตายตัว	ใช่ — AI อนุมานโครงสร้าง
หลายภาษาในเอกสารเดียว	จำกัด	ใช่ — ไทย + อังกฤษในการผ่านครั้งเดียว
Output เป็น Structured Format	ไม่ — แค่ข้อความดิบ	ใช่ — JSON, CSV, XML, PDF, DOCX
ส่งผลลัพธ์ไปยังระบบอื่น	ไม่	ใช่ — Webhooks, API, Notifications
ประมวลผลเป็น Batch	จำกัด	ใช่ — Batch สูงสุด 50 ไฟล์
กำหนดตารางงาน	ไม่	ใช่ — Cron-based Queue
ติดตามความแม่นยำ	ไม่	ใช่ — Analytics และประวัติ
รองรับ AI หลายค่าย	ไม่	ใช่ — 6 ค่าย, เปลี่ยนได้ต่อ Template

การเปลี่ยนจาก OCR เป็น DAT ไม่ใช่การปรับปรุงทีละขั้น แต่คือซอฟต์แวร์ประเภทที่แตกต่างกันโดยสิ้นเชิง

ห้าขั้นตอนของ Document Automation

ทุกเอกสารที่เข้าสู่ Ocriva จะผ่านห้าขั้นตอน การเข้าใจขั้นตอนเหล่านี้เป็นสิ่งจำเป็นสำหรับการออกแบบ Workflow อัตโนมัติที่ครบวงจร

ขั้นตอนที่ 1: Ingest (รับเข้า)

ระบบอัตโนมัติสำหรับเอกสารจะมีประโยชน์ก็ต่อเมื่อสามารถรับเอกสารได้อย่างน่าเชื่อถือ จากทุกที่ที่มาของเอกสาร

Ocriva รับเอกสารผ่านช่องทางหลายทาง:

อัปโหลดไฟล์เดียว — ลากวางจาก Web Interface
Batch Upload — อัปโหลดสูงสุด 50 ไฟล์พร้อมกัน
REST API — ส่งเข้าระบบแบบ Programmatic จากแอปพลิเคชันใดก็ได้
Webhook Triggers — การรับเข้าแบบ Event-driven จากระบบต้นทาง
LINE Integration — ถ่ายรูปและส่งเอกสารผ่านอุปกรณ์มือถือ

รูปแบบไฟล์ที่รองรับ: PDF, JPG, PNG, WebP, BMP

ความยืดหยุ่นนี้หมายความว่า Ocriva เข้ากับ Workflow ที่มีอยู่ของคุณได้โดยไม่ต้องให้ทีมเปลี่ยนวิธีจัดการเอกสาร พนักงานสามารถถ่ายรูปใบเสร็จด้วยโทรศัพท์ ระบบการเงินสามารถส่งใบแจ้งหนี้ผ่าน API งาน Batch สามารถวางไฟล์ลงในคิวประมวลผลข้ามคืนได้

ขั้นตอนที่ 2: Extract (สกัด)

การสกัดคือจุดที่ Ocriva แสดงความแตกต่างจาก OCR แบบดั้งเดิมได้ชัดเจนที่สุด

แทนที่จะจับคู่รูปแบบตัวอักษรกับกริด Ocriva ส่งเอกสารไปยัง AI Vision Models — โมเดลภาษาขนาดใหญ่ที่ฝึกมาเพื่อเข้าใจความหมายของเอกสาร ไม่ใช่แค่รูปแบบตัวพิมพ์

นั่นหมายความว่า:

ใบสั่งซื้อจากผู้จำหน่าย ก และ ข อาจมี Layout ต่างกันโดยสิ้นเชิง แต่ Ocriva จะสกัดฟิลด์เดิมจากทั้งสอง — เพราะมันเข้าใจว่า "ยอดที่ต้องชำระ" หมายถึงอะไร ไม่ว่าจะอยู่ที่ไหนในหน้า
บันทึกลายมือภายในเอกสารพิมพ์ก็อ่านได้
ภาษาไทยและอังกฤษในเอกสารเดียวกันจัดการได้โดยไม่ต้องตั้งค่าแยก
ตาราง, ฟิลด์ที่ซ้อนกัน และรายการต่างๆ เข้าใจในเชิงโครงสร้าง ไม่ใช่แค่ข้อความธรรมดา

Ocriva เชื่อมต่อกับ AI ผู้ให้บริการ 6 ราย: OpenAI, Google Gemini, Anthropic, DeepSeek, Qwen และ Kimi Template ต่างๆ สามารถใช้ผู้ให้บริการต่างกันได้ ทำให้คุณปรับแต่งเพื่อความแม่นยำ ความเร็ว หรือต้นทุนตามประเภทเอกสาร

การสกัดถูกนำทางโดย Templates — คำนิยามที่นำมาใช้ซ้ำได้ ซึ่งบอก AI ว่าจะสกัดฟิลด์อะไร ในรูปแบบอะไร และด้วยคำสั่งอะไร เมื่อสร้าง Template สำหรับใบแจ้งหนี้แล้ว มันจะประมวลผลใบแจ้งหนี้ทุกใบในลักษณะเดิม อย่างสม่ำเสมอ

ขั้นตอนที่ 3: Transform (แปลง)

ข้อมูลดิบที่สกัดมามักไม่ตรงกับรูปแบบที่ระบบปลายทางต้องการ ขั้นตอน Transform แปลงข้อมูลสกัดเป็นรูปแบบที่ระบบของคุณรับได้

Ocriva รองรับ 7 รูปแบบ Output:

รูปแบบ	เหมาะสำหรับ
JSON	API Integration, ฐานข้อมูลที่มีโครงสร้าง
CSV	สเปรดชีต, Data Pipeline, Analytics
PDF	รายงานที่มนุษย์อ่านได้, การจัดเก็บ
DOCX	เอกสาร Word ที่แก้ไขได้, Workflow ตรวจสอบ
XML	ระบบ Enterprise เก่า
HTML	แสดงผลบนเว็บ, ฝังใน Email
Text	Pipeline ง่ายๆ, Logging

ขั้นตอน Transform ทำให้ Ocriva ไม่สร้าง Data Silo ใหม่ แต่ผลิตข้อมูลในรูปแบบที่เครื่องมือที่มีอยู่ของคุณเข้าใจแล้ว

ขั้นตอนที่ 4: Automate (อัตโนมัติ)

การประมวลผลเอกสารทีละฉบับด้วยมือเป็นเรื่องไม่ยาก แต่การประมวลผล 10,000 ฉบับต่อเดือนอย่างสม่ำเสมอ น่าเชื่อถือ ไม่มีข้อผิดพลาด — นั่นคือปัญหา Automation

ขั้นตอน Automate จัดการปริมาณ, กำหนดเวลา และความน่าเชื่อถือ:

Batch Processing — ส่ง 50 เอกสารแล้วตรวจสอบความคืบหน้าแบบเรียลไทม์
Processing Queue — เอกสารถูก Queue และประมวลผลอย่างน่าเชื่อถือ
Cron Scheduling — ตั้งค่างาน Batch ข้ามคืนสำหรับการประมวลผลปริมาณมาก
Real-time Status Tracking — ทุกเอกสารมีสถานะ: pending, in_progress, completed หรือ failed
WebSocket Updates — UI อัพเดทสดๆ ขณะประมวลผล ไม่ต้อง Refresh
Credit Management — ติดตามและ Billing การใช้งานอัตโนมัติ พร้อมแจ้งเตือนเมื่อใกล้หมด

ในขั้นตอนนี้ การประมวลผลเอกสารกลายเป็น Infrastructure — สิ่งที่ทำงานอยู่เบื้องหลังโดยไม่ต้องมีคนดูแล

ขั้นตอนที่ 5: Integrate (เชื่อมต่อ)

ข้อมูลที่สกัดและแปลงแล้วต้องถึงปลายทาง ขั้นตอน Integrate คือสิ่งที่ทำให้ DAT แตกต่างจากโปรแกรมดูเอกสาร

Ocriva ส่งผลลัพธ์ไปยังระบบของคุณผ่านช่องทางหลายทาง:

Webhooks — HTTP POST ไปยัง Endpoint ของคุณเมื่อเอกสารถูกประมวลผล, Batch เสร็จสมบูรณ์ หรือเกิดข้อผิดพลาด
REST API — ดึงผลลัพธ์แบบ Programmatic ได้ตลอดเวลา
WebSocket — Push แบบเรียลไทม์ไปยัง Web Client
LINE Notifications — แจ้งเตือนผู้ใช้ LINE เมื่อประมวลผลเสร็จ
Email Notifications — แจ้งเตือนที่ตั้งค่าได้สำหรับการเสร็จสมบูรณ์และข้อผิดพลาด

นั่นหมายความว่าใบแจ้งหนี้ที่ประมวลผลแล้วจะไม่นั่งรอใน Ocriva ให้ใครมาเข้าสู่ระบบและดาวน์โหลด แต่ไหลเข้าสู่ระบบบัญชีโดยอัตโนมัติ ทริกเกอร์ Workflow อนุมัติ หรือเพิ่มข้อมูลลงในฐานข้อมูล — ทั้งหมดนี้โดยไม่ต้องมีมนุษย์เข้ามาเกี่ยวข้อง

ภาพรวม DAT Pipeline

เอกสารเข้า → [Ingest] → [Extract] → [Transform] → [Automate] → ข้อมูลออก
   PDF          API         AI          JSON         Webhook      ERP
   ภาพถ่าย      Batch      Multi-AI     CSV          API          CRM  
   สแกน         LINE       Templates    PDF          Notify       ฐานข้อมูล

แต่ละขั้นตอนเพิ่มคุณค่า แต่ละขั้นตอนกำจัดงานมือ รวมกันแล้วสร้าง Pipeline ต่อเนื่องตั้งแต่รับเอกสารเข้าไปจนถึงการ Integration กับระบบ

TIP

หากยังใหม่กับแพลตฟอร์ม เริ่มต้นที่คู่มือ Getting Started เพื่อสร้าง Organization, Project และ Template แรกของคุณ

ทำไมเรื่องนี้สำคัญต่อธุรกิจ

องค์กรส่วนใหญ่ที่ประมวลผลเอกสารด้วยมือได้ปรับตัวเข้ากับความยุ่งยากแล้ว พวกเขามีพนักงานที่งานคือการพิมพ์, ตรวจสอบ, พิมพ์ซ้ำ, และส่งต่อ พวกเขายอมรับว่าเอกสารใช้เวลาหนึ่งหรือสองวันในการประมวลผล พวกเขาสร้าง Workflow อนุมัติบนสมมติฐานของคอขวดที่เป็นมนุษย์

DAT กำจัดคอขวดเหล่านั้น ผลกระทบต่อธุรกิจวัดได้:

ความเร็ว: เอกสารประมวลผลในไม่กี่วินาทีแทนที่จะเป็นชั่วโมง
ความแม่นยำ: ข้อผิดพลาดการสกัดของ AI ต่ำกว่าข้อผิดพลาดการถอดความของมนุษย์ และสม่ำเสมอกว่า
ต้นทุน: ต้นทุนการประมวลผลไม่เติบโตเป็นสัดส่วนโดยตรงกับปริมาณ — คุณจ่ายค่า Credit ไม่ใช่ค่าพนักงาน
Scalability: การประมวลผล 10 เอกสารกับ 10,000 เอกสารใช้ Infrastructure เดิม
ตรวจสอบได้: การสกัดทุกครั้งถูกบันทึกพร้อมเอกสารต้นฉบับ, ผลลัพธ์, โมเดลที่ใช้ และ Timestamp

ตำแหน่งของ Ocriva

Ocriva ไม่ได้แข่งกับเครื่องมือ OCR แบบง่ายๆ เครื่องมือเฉพาะทางที่สกัดข้อความแล้วหยุดมีประโยชน์ในบางบริบท

Ocriva สำหรับองค์กรที่ผ่านพ้นคำถาม "เราอ่านเอกสารนี้ได้ไหม?" และกำลังถามว่า "เราสามารถทำให้ทุกอย่างที่เกิดขึ้นกับเอกสารนี้หลังจากที่เราอ่านมันเป็นอัตโนมัติได้ไหม?"

นั่นคือคำถาม DAT และ Ocriva ถูกสร้างมาเพื่อตอบคำถามนั้น

Documents

วิสัยทัศน์และแนวคิด DAT

วิสัยทัศน์และแนวคิด DAT

มากกว่า OCR: Document Automation Transformer คืออะไร

Document Automation Transformer คืออะไร?

OCR กับ DAT: ความแตกต่างที่สำคัญ

ห้าขั้นตอนของ Document Automation

ขั้นตอนที่ 1: Ingest (รับเข้า)

ขั้นตอนที่ 2: Extract (สกัด)

ขั้นตอนที่ 3: Transform (แปลง)

ขั้นตอนที่ 4: Automate (อัตโนมัติ)

ขั้นตอนที่ 5: Integrate (เชื่อมต่อ)

ภาพรวม DAT Pipeline

ทำไมเรื่องนี้สำคัญต่อธุรกิจ

ตำแหน่งของ Ocriva

Table of Contents