บทเรียน

วิธีแยกวิเคราะห์ AWB สแกนหลายหน้า

ใบตราส่งสินค้าทางอากาศจำนวนมากมาในรูปแบบสแกนหลายหน้า — ต้นฉบับ สำเนาสายการบิน และสำเนาผู้ส่ง บทเรียนนี้แสดงวิธีที่ KabyTech จัดการโดยอัตโนมัติ

ภาพรวม

เอกสาร air waybill ที่สแกนมักมี 2 ถึง 4 หน้าในไฟล์ PDF หรือ TIFF เดียว แต่ละหน้าอาจหมุน เอียง หรือสแกนที่ความละเอียดต่างกัน KabyTech จัดการทั้งหมดนี้โดยอัตโนมัติ: API ตรวจจับหน้า ปรับทิศทาง และรวมผลลัพธ์ OCR เป็นระเบียน AWB เดียวโดยไม่ต้องมีการกำหนดค่าเพิ่มเติมจากคุณ

บทเรียนนี้ครอบคลุมขั้นตอนทั้งสาม: อัปโหลดเอกสาร ให้ pipeline ตรวจจับและปรับแต่งหน้าอัตโนมัติ และเรียกดูผลลัพธ์ที่รวมแล้ว เราจะใช้ตัวอย่างจาก AWB กระดาษสแกน 3 หน้าที่ประกอบด้วยสำเนาต้นฉบับ สำเนาผู้ขนส่ง และสำเนาผู้ส่ง

ขั้นตอนที่ 1 — อัปโหลดเอกสาร

API รับ 3 วิธีการอัปโหลด: multipart form data, base64-encoded payloads และ URL สาธารณะ สำหรับเอกสารหลายหน้า multipart มักเป็นตัวเลือกที่ดีที่สุดเนื่องจากช่วยหลีกเลี่ยงค่าใช้จ่ายของ base64 encoding สำหรับไฟล์ขนาดใหญ่ ขีดจำกัดคือ 50 MB ต่อคำขอ

ตั้ง Content-Type เป็น multipart/form-data และแนบไฟล์ในฟิลด์ document API ยอมรับ PDF, TIFF, PNG และ JPEG ลบฟิลด์ page ออก API จะประมวลผลทุกหน้าโดยอัตโนมัติ ผลลัพธ์จะรวมทุกหน้าเข้าด้วยกันใน response เดียว

ขั้นตอนที่ 2 — การตรวจจับและปรับแต่งอัตโนมัติ

เมื่อได้รับไฟล์ pipeline จะแยกเป็นภาพหน้าเดี่ยว สำหรับ PDF ใช้การ rasterize ที่ 300 DPI สำหรับ TIFF ดึงเฟรมแต่ละเฟรม จากนั้นทุกหน้าจะถูกปรับแต่ง: แก้ไขการหมุน (0/90/180/270 องศา) แก้ไขการเอียง (สูงสุด 15 องศา) และปรับ DPI ให้เป็นมาตรฐานที่ 300

ตัวจำแนก AWB ที่ฝึกด้วย deep learning จะรันบนทุกหน้า โมเดลระบุว่าหน้าใดมีข้อมูล AWB ข้อมูล house manifest หรือสำเนาที่ซ้ำกัน หน้าซ้ำจะถูกแจ้งเตือนแต่ยังคงถูกประมวลผลเพื่อเปรียบเทียบแบบ cross-page ความมั่นใจในการตรวจจับหน้าจะรายงานในฟิลด์ pages ของ response

ขั้นตอนที่ 3 — การรวมผลลัพธ์ข้ามหน้า

หลังจาก OCR รันบนแต่ละหน้า merge engine จะรวมฟิลด์เป็นระเบียน AWB เดียว ใช้คะแนนความมั่นใจระดับฟิลด์เพื่อแก้ไขข้อขัดแย้ง ตัวอย่างเช่น หากหน้า 1 มีหมายเลข AWB ด้วยความมั่นใจ 0.98 และหน้า 3 มี 0.72 ระบบจะเลือกค่าจากหน้า 1

สำหรับฟิลด์ที่ปรากฏบนหลายหน้าด้วยค่าที่ตรงกัน ระบบจะเลือกค่าที่มีคะแนนความมั่นใจรวมสูงสุด สำหรับฟิลด์ที่ปรากฏเฉพาะหน้าเดียว ค่านั้นจะถูกใช้โดยตรง ผลลัพธ์สุดท้ายจะรวม merge metadata ที่แสดงว่าแต่ละฟิลด์มาจากหน้าไหนและมีคะแนนความมั่นใจเท่าใด

สรุป

การสแกน AWB หลายหน้าเป็นขั้นตอนง่ายๆ 3 ขั้นตอน: อัปโหลดเอกสาร (multipart, base64 หรือ URL) ให้ API ตรวจจับหน้าและปรับทิศทางอัตโนมัติ แล้วเรียกดูผลลัพธ์ที่รวมแล้วเป็นระเบียน AWB ที่มีโครงสร้าง ทุกอย่างเกิดขึ้นภายในการเรียก API ครั้งเดียว

ประเด็นสำคัญ: ทุกหน้าจะถูกประมวลผลอิสระและรวมด้วยความมั่นใจระดับฟิลด์ ไม่มี configuration ต่อหน้าที่จำเป็น และ API จัดการสำเนาที่ซ้ำกันอย่างสง่างามโดยเลือกค่าที่มีความมั่นใจสูงสุด สำหรับงาน production ให้ตรวจสอบ overall_confidence ใน response เพื่อตัดสินใจว่าจำเป็นต้องตรวจสอบด้วยมือหรือไม่

พร้อมแยกวิเคราะห์ AWB หลายหน้าใบแรกของคุณหรือยัง?

เริ่มต้นด้วย API call ฟรี 50 ครั้ง — ไม่ต้องใช้บัตรเครดิต