ภาพรวม
เอกสาร air waybill ที่สแกนมักมี 2 ถึง 4 หน้าในไฟล์ PDF หรือ TIFF เดียว แต่ละหน้าอาจหมุน เอียง หรือสแกนที่ความละเอียดต่างกัน KabyTech จัดการทั้งหมดนี้โดยอัตโนมัติ: API ตรวจจับหน้า ปรับทิศทาง และรวมผลลัพธ์ OCR เป็นระเบียน AWB เดียวโดยไม่ต้องมีการกำหนดค่าเพิ่มเติมจากคุณ
บทเรียนนี้ครอบคลุมขั้นตอนทั้งสาม: อัปโหลดเอกสาร ให้ pipeline ตรวจจับและปรับแต่งหน้าอัตโนมัติ และเรียกดูผลลัพธ์ที่รวมแล้ว เราจะใช้ตัวอย่างจาก AWB กระดาษสแกน 3 หน้าที่ประกอบด้วยสำเนาต้นฉบับ สำเนาผู้ขนส่ง และสำเนาผู้ส่ง
ขั้นตอนที่ 1 — อัปโหลดเอกสาร
API รับ 3 วิธีการอัปโหลด: multipart form data, base64-encoded payloads และ URL สาธารณะ สำหรับเอกสารหลายหน้า multipart มักเป็นตัวเลือกที่ดีที่สุดเนื่องจากช่วยหลีกเลี่ยงค่าใช้จ่ายของ base64 encoding สำหรับไฟล์ขนาดใหญ่ ขีดจำกัดคือ 50 MB ต่อคำขอ
ตั้ง Content-Type เป็น multipart/form-data และแนบไฟล์ในฟิลด์ document API ยอมรับ PDF, TIFF, PNG และ JPEG ลบฟิลด์ page ออก API จะประมวลผลทุกหน้าโดยอัตโนมัติ ผลลัพธ์จะรวมทุกหน้าเข้าด้วยกันใน response เดียว
ขั้นตอนที่ 2 — การตรวจจับและปรับแต่งอัตโนมัติ
เมื่อได้รับไฟล์ pipeline จะแยกเป็นภาพหน้าเดี่ยว สำหรับ PDF ใช้การ rasterize ที่ 300 DPI สำหรับ TIFF ดึงเฟรมแต่ละเฟรม จากนั้นทุกหน้าจะถูกปรับแต่ง: แก้ไขการหมุน (0/90/180/270 องศา) แก้ไขการเอียง (สูงสุด 15 องศา) และปรับ DPI ให้เป็นมาตรฐานที่ 300
ตัวจำแนก AWB ที่ฝึกด้วย deep learning จะรันบนทุกหน้า โมเดลระบุว่าหน้าใดมีข้อมูล AWB ข้อมูล house manifest หรือสำเนาที่ซ้ำกัน หน้าซ้ำจะถูกแจ้งเตือนแต่ยังคงถูกประมวลผลเพื่อเปรียบเทียบแบบ cross-page ความมั่นใจในการตรวจจับหน้าจะรายงานในฟิลด์ pages ของ response
ขั้นตอนที่ 3 — การรวมผลลัพธ์ข้ามหน้า
หลังจาก OCR รันบนแต่ละหน้า merge engine จะรวมฟิลด์เป็นระเบียน AWB เดียว ใช้คะแนนความมั่นใจระดับฟิลด์เพื่อแก้ไขข้อขัดแย้ง ตัวอย่างเช่น หากหน้า 1 มีหมายเลข AWB ด้วยความมั่นใจ 0.98 และหน้า 3 มี 0.72 ระบบจะเลือกค่าจากหน้า 1
สำหรับฟิลด์ที่ปรากฏบนหลายหน้าด้วยค่าที่ตรงกัน ระบบจะเลือกค่าที่มีคะแนนความมั่นใจรวมสูงสุด สำหรับฟิลด์ที่ปรากฏเฉพาะหน้าเดียว ค่านั้นจะถูกใช้โดยตรง ผลลัพธ์สุดท้ายจะรวม merge metadata ที่แสดงว่าแต่ละฟิลด์มาจากหน้าไหนและมีคะแนนความมั่นใจเท่าใด
สรุป
การสแกน AWB หลายหน้าเป็นขั้นตอนง่ายๆ 3 ขั้นตอน: อัปโหลดเอกสาร (multipart, base64 หรือ URL) ให้ API ตรวจจับหน้าและปรับทิศทางอัตโนมัติ แล้วเรียกดูผลลัพธ์ที่รวมแล้วเป็นระเบียน AWB ที่มีโครงสร้าง ทุกอย่างเกิดขึ้นภายในการเรียก API ครั้งเดียว
ประเด็นสำคัญ: ทุกหน้าจะถูกประมวลผลอิสระและรวมด้วยความมั่นใจระดับฟิลด์ ไม่มี configuration ต่อหน้าที่จำเป็น และ API จัดการสำเนาที่ซ้ำกันอย่างสง่างามโดยเลือกค่าที่มีความมั่นใจสูงสุด สำหรับงาน production ให้ตรวจสอบ overall_confidence ใน response เพื่อตัดสินใจว่าจำเป็นต้องตรวจสอบด้วยมือหรือไม่
พร้อมแยกวิเคราะห์ AWB หลายหน้าใบแรกของคุณหรือยัง?
เริ่มต้นด้วย API call ฟรี 50 ครั้ง — ไม่ต้องใช้บัตรเครดิต